2021年4月6日
摘要: 一、标签为数值变量 一般常见于回归相关的问题。 1.1类别变量+数值标签 关于类别变量与数值标签的关系,我们一般会观察下面的结果。 每个类别情况下对应的均值,这个可以直接使用pandas进行绘制; 均值反映的信息并不十分详细,如果希望得到更加具体的分布,可以使用boxplot进行绘制。 如果不同类别 阅读全文
posted @ 2021-04-06 18:30 小小喽啰 阅读(616) 评论(0) 推荐(0) 编辑
摘要: 数据来源:https://www.kaggle.com/usdot/flight-delays 该数据集完整数据量有500多万条航班记录数据,特征有31个 感觉这个数据不是很好,如果我们将ARRIVAL_DELAY作为y值,但是后面的空气系统延误,安全延误感觉又像是延误的原因,我们首先看一下数据怎么 阅读全文
posted @ 2021-04-06 15:50 小小喽啰 阅读(1322) 评论(1) 推荐(0) 编辑