06 2019 档案

摘要:如果没有传递索引值,那么默认的索引将是范围(n),n是数组长度 如果指定了索引,那么输出的是自定义的索引值 字典可以作为输入传递,如果没有指定索引,则按排序顺序取得字典以构造索引 如果指定了索引,索引中与标签对应的数据中的值将被拉出,注意:索引顺序不变,缺少的元素使用NaN(不是数字) 阅读全文
posted @ 2019-06-13 10:24 魔仙小丽丽 阅读(1319) 评论(0) 推荐(0)
摘要:梯度下降算法的大家族: ①批量梯度下降:有N个样本,求梯度的时候就用了N个样本的梯度数据 优点:准确 缺点:速度慢 ②随机梯度下降:和批量梯度下降算法原理相似,区别在于求梯度时没有用所有的N歌样本数据,而是仅仅选取1个来求梯度 优点:速度快 缺点:准去率地 ③小批量梯度下降:批量梯度下降算法和随机梯 阅读全文
posted @ 2019-06-12 17:28 魔仙小丽丽 阅读(784) 评论(0) 推荐(0)
摘要:pandas简介 pandas全称python Data Analysis Library,是基于numpy的一种工具,pandas纳入了大量库和一些标准的数据模型,提供了高效的操作大型数据集所需的工具。 pandas最初由AQR Captal Management于2008年4月开发,并于2009 阅读全文
posted @ 2019-06-11 15:52 魔仙小丽丽 阅读(854) 评论(0) 推荐(0)
摘要:决策树 1.决策树算法:在训练阶段,通过训练集数据构造出一个决策树模型。在分类阶段,即测试数据时,按照决策树的分类属性逐层往下划分,直到找到预测的结果 2.决策树的术语:根节点,叶节点,内部节点 3.熵:熵表示纯度\不纯度;即不确定性。熵值越大,说明不确定性越大,表示时间发生的概率越小。 4.基尼不 阅读全文
posted @ 2019-06-05 11:37 魔仙小丽丽 阅读(331) 评论(0) 推荐(0)