摘要: 转载:https://blog.csdn.net/IqqIqqIqqIqq/article/details/78857411 1 基于sklearn的实现 输出为 基于不纯度对模型进行排序有几点需要注意: (1)基于不纯度降低的特征选择将会偏向于选择那些具有较多类别的变量(bias)。 (2)当存在 阅读全文
posted @ 2018-08-22 21:40 迷茫的计算机呆 阅读(4991) 评论(0) 推荐(0) 编辑
摘要: 用类型 用函数返回值 嵌套的dict 输出为: 阅读全文
posted @ 2018-08-22 21:28 迷茫的计算机呆 阅读(219) 评论(0) 推荐(0) 编辑
摘要: 转载:https://blog.csdn.net/wangzhenling/article/details/59702845 1.时间花费多:递归由于是函数调用自身,而函数调用是有时间和空间的消耗的:每一次函数调用,都需要在内存栈中分配空间以保存参数、返回地址以及临时变量,而往栈中压入数据和弹出数据 阅读全文
posted @ 2018-08-22 16:26 迷茫的计算机呆 阅读(651) 评论(0) 推荐(0) 编辑
摘要: 转载自:https://www.sohu.com/a/100676249_425850 一、描述性统计 描述性统计是一类统计方法的汇总,揭示了数据分布特性。它主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布以及一些基本的统计图形。 1、缺失值填充:常用方法有剔除法、均值法、决 阅读全文
posted @ 2018-08-03 11:59 迷茫的计算机呆 阅读(817) 评论(0) 推荐(0) 编辑
摘要: 转载自:https://blog.csdn.net/ms_lan/article/details/73920384 1.分类 分类分析的目标是:给一批人(或者物)分成几个类别,或者预测他们属于每个类别的概率大小。 举个栗子:“京东的用户中,有哪些会在618中下单?”这就是个典型的二分类问题:买or不 阅读全文
posted @ 2018-08-03 11:55 迷茫的计算机呆 阅读(358) 评论(0) 推荐(0) 编辑
摘要: 1. 描述型分析:发生了什么? 这是最常见的分析方法。在业务中,这种方法向数据分析师提供了重要指标和业务的衡量方法。 例如,每月的营收和损失账单。数据分析师可以通过这些账单,获取大量的客户数据。了解客户的地理信息,就是“描述型分析”方法之一。利用可视化工具,能够有效的增强描述型分析所提供的信息。 2 阅读全文
posted @ 2018-08-03 11:54 迷茫的计算机呆 阅读(579) 评论(0) 推荐(0) 编辑
摘要: set_index() 官方定义: 使用一个或多个现有列设置索引, 默认情况下生成一个新对象 DataFrame.set_index(keys, drop=True, append=False, inplace=False, verify_integrity=False) drop:默认为true, 阅读全文
posted @ 2018-07-28 00:23 迷茫的计算机呆 阅读(13373) 评论(0) 推荐(1) 编辑
摘要: 用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列,同时列出数据和数据下标,一般用在 for 循环当中。 阅读全文
posted @ 2018-07-26 21:59 迷茫的计算机呆 阅读(234) 评论(0) 推荐(0) 编辑
摘要: 简单的模型有较大的偏差和较小的方差,复杂的模型在预测中有更大的方差。 交叉验证 使用更多数据 删除无用特征 正则化 集成学习 阅读全文
posted @ 2018-07-26 08:15 迷茫的计算机呆 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 两个list合并,从小到大排序,不用功sorted函数 阅读全文
posted @ 2018-07-25 16:39 迷茫的计算机呆 阅读(159) 评论(0) 推荐(0) 编辑