摘要:
pandas 是 python 的数据分析处理库import pandas as pd 1、读取CSV、TXT文件 2、查看前N条、后N条信息 3、查看数据框的格式,是DataFrame还是ndarray 4、查看有哪些列 5、查看有几行几列 6、打印某一行、某几行数据 7、打印某一列、某几列数据 阅读全文
随笔档案-2017年06月
Python的Numpy库简述
2017-06-28 15:18 by 猎手家园, 3452 阅读, 收藏, 编辑
摘要:
numpy 是 python 的科学计算库import numpy as np 1、使用numpy读取txt文件 2、ayyay数组,数据类型是必须相同。 3、numpy的数据类型,一般用到四种数据类型 bool、 int32/64、 float32/64、 string 4、获取第1行的第4个数 阅读全文
Python的Matplotlib库简述
2017-06-28 15:07 by 猎手家园, 1397 阅读, 收藏, 编辑
摘要:
Matplotlib 库是 python 的数据可视化库import matplotlib.pyplot as plt 1、字符串转化为日期 2、拆线图 3、多图拼切 4、一图多线 5、一图多线 - 自动跑代码(带图例) 6、条形图 7、条形图 - 横向 8、散点图 9、直方图 10、多图 11、四 阅读全文
随机森林算法原理剖析
2017-06-01 10:59 by 猎手家园, 13924 阅读, 收藏, 编辑
摘要:
随机森林算法 集成学习有两个流派,一个是boosting派系,它的特点是各个弱学习器之间有依赖关系。另一种是bagging流派,它的特点是各个弱学习器之间没有依赖关系,可以并行拟合。 随机森林是集成学习中可以和梯度提升树GBDT分庭抗礼的算法,尤其是它可以很方便的并行训练,在如今大数据大样本的的时代 阅读全文