https://pan.baidu.com/s/1bpVv3Ef 67bd 模块安装文件下载地址
pip install "numpy-1.12.0b+mkl-cp35-cp35m-win_amd64.whl" 注意 安装带mkl的包
pip install pandas
matplotlib
statsmodels (使用这种方式并没有正确的安装成功)
首先更新了vc++ 的各种版本 ,然后参照的这篇文章 https://blog.csdn.net/EaShion1994/article/details/56671269。安装成功
最后发现,其实这种方法适用于各种安装不成功的情况
Gensim
import numpy #创建数组 x=numpy.array(["a","b","9","8"])#一维数组 y=numpy.array([[3,4,8,1],[2,3,6,11],[9,3,0,6]])#二维数组 x[2]#9 y[1][2]#6 x.sort()#排序sort() array(['8', '9', 'a', 'b']) y1=y.max()#取最大值 11 y2=y.min()#取最小值 0 #切片 x1=x[1:3]#array(['9','a']) x2=x[:2]#array['8','9']) x3=x[1:]#array(['9','a','b'])
import pandas as pda #Series 某一串数字 a=pda.Series([8,9,2,1]) b=pda.Series([8,9,2,1],index=["one","two","three","four"]) #指定索引 #DataFrame 数据框 d=pda.DataFrame([[5,6,2,3],[8,4,5,3],[13,76,23,91]],columns=["one","two","three","four"]#指定列名 e=pda.DataFrame({ #根据字典形式创建,按列创建 "one":4,#如果下面有3个数字,那么补全为[4,4,4] "two":[6,2,3,], "three":list(str(982))#将一串字符串转化为3个元素 }) d.head(2) #取前几行,默认取前5行 d.tail(2) #尾部数据,默认后5行 d.describle()#统计 d.T #转置 行变成列,列变成行
import pandas as pda #导入csv i=pda.read_csv("c:/路径") i.describe() i.sort_values(by="第一列的值")#例如第一列是1,2,3,4 。如果按4排序就是by=4 #导入excel j=pda.read_excel("c:/路径") #导入mysql中的数据 import pymysql conn=pymysql.connect("host=127.0.0.1",user="root",passwd="root",db="db_name") sql="select * from db_name" k=pda.read_sql(sql,conn); #加载html 中的 表格read_html(),首先安装html5lib,beautifulsoup4 o=pda.read_html()#可以是本地的html文件,也可以是网址,会读取其中的table标签的内容 #倒入文本的数据 pda.read_table("c:/路径")
#折线图/散点图 plot import matplotlib.pylab as pyl import numpy as npy x=[1,2,3,4,8] y=[5,7,2,1,5] pyl.plot(x,y,"o")#plot(x轴数据,y轴数据,展现形式) pyl.title("图表名")#图表名 pyl.ylable("y轴的名")#y轴的名 pyl.xlable("x轴的名")#x轴的名 pyl.xlim(0,20)#x轴的范围 pyl.ylim(0,15)#y轴的范围 #显示两个图表 x2=[8,4,2,11,15,22] y2=[5,32,0,6,12,16] pyl.plot(x2,y2)#这样就可以显示两个线了 pyl.show() ''' 第三个参数可以同时添加的 pyl.plot(x,y,"oy") #颜色 c-cyan--青色 r-red--红色 m-magente--品红 g-green--绿色 b-blue--蓝色 y-yello--黄色 k-black--黑色 w-white--白色 #线条 pyl.plot(x,y,"--") - 直线 -- 虚线 -. -.的形式 : 细小虚线 #点的样式 pyl.plot(x,y,"*") s-- 方形 h-- 六角形 H-- 另一种六角形 *-- 星型 + -- 加号 x-- x型 d-- 细薄菱形 D-- 正常菱形 p-- 五角形 '''
#随机数的生成 import numpy as npy npy.random.rndom_integers()#生产随机数(最小值,最大值,个数) #具有 正态分布 的随机数 #正太分布,越接近平均值的地方,数量越大 npy.random.normal(5,0,10)#参数(均数,西格玛,个数) #直方图hist data3=npy.random.normal(10.0,1.0,1000) pyl.hist(data3)#建立直方图 sty=npy.arange(2,17,4)#2到17的范围 每个宽度为4 pyl.hist(data3,sty,histtype='stepfilled')#(数据,样式,取消了直方图轮廓) pyl.show()#显示直方图
#在同一个图片内绘制多个图片 pyl.subplot(2,2,3)#(拆成多少行,拆成多少列,当前区域) 2行2列第三个区域 pyl.show()