可视化绘图前提,Numpy和Pandas

# 生成numpy数组的方法array() array()生成的是二维数组,非常方便统计

 1 import csv
 2 
 3 import numpy
 4 
 5 # arr1 = numpy.zeros(5)
 6 #
 7 # arr2 = numpy.zeros([5,3],dtype=int)
 8 #
 9 # print(arr1)
10 # print(arr1)
11 
12 # 生成numpy数组的方法array() array()生成的是二维数组,非常方便统计
13 import pandas as pandas
14 
15 arr6 = numpy.array([['zhang',22,172],['li','23',175],['xi',25,173]])        #输出一个三行三列的数组
16 
17 print(arr6)

1 [['zhang' '22' '172']
2  ['li' '23' '175']
3  ['xi' '25' '173']]


# 生成numpy数组的方法arange() 参数为开始位置,结束位置,步长

1 # 生成numpy数组的方法arange()  参数为开始位置,结束位置,步长
2 
3 arr3 = numpy.arange(6)
4 
5 arr4 = numpy.arange(2,8.1,0.5)      #arange的操作对象不包括结束位置
6 
7 print(arr3)
8 
9 print(arr4)
1 [0 1 2 3 4 5]
2 [2.  2.5 3.  3.5 4.  4.5 5.  5.5 6.  6.5 7.  7.5 8. ]

# 生成numpy数组的方法linspace() 参数为开始位置,结束位置,输出元素个数 endpoint=False表示不包括结束值本身

1 # 生成numpy数组的方法linspace()        参数为开始位置,结束位置,输出元素个数 endpoint=False表示不包括结束值本身
2 arr5= numpy.linspace(0,10,11,endpoint=False)
3 
4 print(arr5)
1 [0.         0.90909091 1.81818182 2.72727273 3.63636364 4.54545455
2  5.45454545 6.36363636 7.27272727 8.18181818 9.09090909]

# pandas使用,根据二维数组,DataFrame()输出dataframe

1 arr6 = numpy.array([['zhang',22,172],['li','23',175],['xi',25,173]])        #输出一个三行三列的数组

2 df = pandas.DataFrame(arr6,index=[1,2,3],columns=['name','old','height'])       #参数分别为输入二维数组,index设置行编号,默认为1,2,3.。。column设置列名
 
1 arr7 = {'name':['zhang','li','xi'],'old':[22,23,25],'height':[172,174,173]}     #也能根据字典类型数据创建dataframe

2
df2 = pandas.DataFrame(arr7,index=[1,2,3],columns=['name','old','height']) #参数分别为输入二维数组,index设置行编号,默认为1,2,3.。。column设置列名

# 第三种方法是直接从CSV文件创建

 1 # 第三种方法是直接从CSV文件创建
 2 with open('test_dataframe.csv','w',encoding="utf-8",newline='') as wd:
 3     wcsv = csv.writer(wd)
 4 
 5     wcsv.writerow(['name','old','height'])
 6     i = 3
 7     for x in range(i):
 8         wcsv.writerow(["zhang",'22','172'])
 9     wd.close()
10 
11 
12 df3 = pandas.read_csv('test_dataframe.csv')         #直接从CSV文件scdataframe

按指定格式输出dataframe

1 df3.index = [1,2,3] #指定index输出
2 
3 df3['address'] = ['shengzhen','nanjing','shanghai']     #添加一列输出
4 
5 print(df3.loc[1])   #read_csv对象可以只输出某一行的值
6 
7 print(df3.name)     #单独输出某一列的值

 

posted @ 2021-08-08 12:16  搬砖在路上  阅读(51)  评论(0编辑  收藏  举报