摘要: 数据分析: 1.基本统计:describe() 常用的统计函数: size:计数 sum:求和 mean:均值 var:方差 std:标准差 2.分组分析:groupby() groupby(by=[分组列1,分组列2....])[统计列1,统计列2,...].agg({统计列别名1:统计函数;统计 阅读全文
posted @ 2019-10-09 23:54 是四不是十 阅读(138) 评论(0) 推荐(0) 编辑
摘要: 数据可视化:模块(matplotlib) 1.散点图:plot()函数 plot(x,y,'.',color= (r,g,b)) plt.xlabel('x轴标签') plt.ylabel('y轴标签') plt.grid(True) plot参数说明:'.'、'o',小点还是大点 color,散点 阅读全文
posted @ 2019-10-09 23:00 是四不是十 阅读(88) 评论(0) 推荐(0) 编辑
摘要: 数据处理:(主要使用的模块为:pandas、numpy) 1.数据的存在形式:文件和数据库 文件的存在形式分为:Csv(用,分割列的文本),Excel,Txt (1)read_table导入文本文件 read_table(file,names=[列名],sep="",encoding) names列 阅读全文
posted @ 2019-10-09 01:00 是四不是十 阅读(317) 评论(0) 推荐(0) 编辑