随笔分类 - 数据分析
摘要:一:随机事件 概率:随机事件发生的可能性的度量 范围:0 ~ 1 二:排列和组合 1.不重复的排列:从n个不同的元素中每次抽取m个不同的元素,按照一定的顺序排成一列,m<n 选排,m = n全排 计算公式: P(n,n) = n! , p(m,n) = n(n-1)...(n-m+1) = n!/(
阅读全文
摘要:数据分析: 1.基本统计:describe() 常用的统计函数: size:计数 sum:求和 mean:均值 var:方差 std:标准差 2.分组分析:groupby() groupby(by=[分组列1,分组列2....])[统计列1,统计列2,...].agg({统计列别名1:统计函数;统计
阅读全文
摘要:数据可视化:模块(matplotlib) 1.散点图:plot()函数 plot(x,y,'.',color= (r,g,b)) plt.xlabel('x轴标签') plt.ylabel('y轴标签') plt.grid(True) plot参数说明:'.'、'o',小点还是大点 color,散点
阅读全文
摘要:数据处理:(主要使用的模块为:pandas、numpy) 1.数据的存在形式:文件和数据库 文件的存在形式分为:Csv(用,分割列的文本),Excel,Txt (1)read_table导入文本文件 read_table(file,names=[列名],sep="",encoding) names列
阅读全文