上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 58 下一页
摘要: 全球食品数据分析 项目参考:https://www.kaggle.com/bhouwens/d/openfoodfacts/world-food-facts/how-much-sugar-do-we-eat/discussion 阅读全文
posted @ 2018-11-04 18:53 zhangqi0828 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 聚类模型:K-Means 聚类(clustering)属于无监督学习(unsupervised learning) 无类别标记 在线 demo:http://syskall.com/kmeans.js 聚类(clustering)属于无监督学习(unsupervised learning) 无类别标 阅读全文
posted @ 2018-11-04 18:53 zhangqi0828 阅读(592) 评论(0) 推荐(0) 编辑
摘要: Matplotlib 是一个 Python 的 2D绘图库,通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等。 http://matplotlib.org 用于创建出版质量图表的绘图工具库 目的是为Python构建一个Matlab式的绘图 阅读全文
posted @ 2018-11-04 18:53 zhangqi0828 阅读(811) 评论(0) 推荐(0) 编辑
摘要: 数据清洗 数据清洗是数据分析关键的一步,直接影响之后的处理工作 数据需要修改吗?有什么需要修改的吗?数据应该怎么调整才能适用于接下来的分析和挖掘? 是一个迭代的过程,实际项目中可能需要不止一次地执行这些清洗操作 处理缺失数据:pd.fillna(),pd.dropna() 数据清洗是数据分析关键的一 阅读全文
posted @ 2018-11-04 18:52 zhangqi0828 阅读(1174) 评论(0) 推荐(0) 编辑
摘要: Pandas统计计算和描述 示例代码: 运行结果: 常用的统计计算 sum, mean, max, min… axis=0 按列统计,axis=1按行统计 skipna 排除缺失值, 默认为True 示例代码: 运行结果: 常用的统计描述 describe 产生多个统计数据 示例代码: 运行结果: 阅读全文
posted @ 2018-11-04 18:49 zhangqi0828 阅读(718) 评论(0) 推荐(0) 编辑
摘要: Pandas分组与聚合 分组 (groupby) 对数据集进行分组,然后对每组进行统计分析 SQL能够对数据进行过滤,分组聚合 pandas能利用groupby进行更加复杂的分组运算 分组运算过程:split->apply->combine 拆分:进行分组的根据 应用:每个分组运行的计算规则 合并: 阅读全文
posted @ 2018-11-04 18:49 zhangqi0828 阅读(4588) 评论(0) 推荐(0) 编辑
摘要: 层级索引(hierarchical indexing) 下面创建一个Series, 在输入索引Index时,输入了由两个子list组成的list,第一个子list是外层索引,第二个list是内层索引。 示例代码: 运行结果: MultiIndex索引对象 打印这个Series的索引类型,显示是Mul 阅读全文
posted @ 2018-11-02 21:20 zhangqi0828 阅读(199) 评论(0) 推荐(0) 编辑
摘要: Pandas的函数应用 apply 和 applymap 1. 可直接使用NumPy的函数 示例代码: 运行结果: 2. 通过apply将函数应用到列或行上 示例代码: 运行结果: 注意指定轴的方向,默认axis=0,方向是列 示例代码: 运行结果: 3. 通过applymap将函数应用到每个数据上 阅读全文
posted @ 2018-11-02 18:32 zhangqi0828 阅读(191) 评论(0) 推荐(0) 编辑
摘要: http://bokeh.pydata.org/en/latest Bokeh 是一个专门针对Web浏览器的呈现功能的交互式可视化Python库。这是Bokeh与其它可视化库最核心的区别。 专门针对Web浏览器的交互式、可视化Python绘图库 可以做出像D3.js简洁漂亮的交互可视化效果,但是使用 阅读全文
posted @ 2018-11-02 18:29 zhangqi0828 阅读(2545) 评论(2) 推荐(0) 编辑
摘要: Pandas的对齐运算 是数据清洗的重要过程,可以按索引对齐进行运算,如果没对齐的位置则补NaN,最后也可以填充NaN Series的对齐运算 1. Series 按行、索引对齐 示例代码: 运行结果: 2. Series的对齐运算 示例代码: 运行结果: DataFrame的对齐运算 1. Dat 阅读全文
posted @ 2018-11-02 18:29 zhangqi0828 阅读(6573) 评论(0) 推荐(0) 编辑
上一页 1 ··· 31 32 33 34 35 36 37 38 39 ··· 58 下一页