Numpy和Pandas
NumPy是高性能科学计算和数据分析的基础包。数据结构为ndarray,一般有三种方式来创建。ndarray是N-Dimensions-Array(N维数组)的简称,ndarray要求元素数据类型一致.
ndarry和list的同:
1 都可以进行切片操作
异:
ndarry和list的外在区别是ndarry没有逗号分隔,而list有。
内在区别:
1 ndarry可以直接进行数据筛选,list不能。
1 arr1 = np.array([1,2,3,4,44,3243,43,8678]) 2 print(arr1[arr1 != 44 ]) 3 list1 = [1,2,3,4,44,3243,43,8678] 4 print(list1[ list1 !=44 ]) # list会对[]内的进行判断,为真,所以输出list1[1]
输出:
1 [ 1 2 3 4 3243 43 8678] 2 2
2 ndarry内为数字时,可直接进行算术运算,list不能,想要用list计算时,要先将list转化为ndarry。
Pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。数据结构有一维的Series,二维的DataFrame