初步理解Numpy, Scipy, matplotib, pandas,

Numpy, Scipy, matplotib, pandas,

Numpy:

  numpy是科学计算的基础包之一,其功能包括多维数组,高等数学函数等,以及伪随机数生成器,

  scikit-learn接受numpy的数组格式数据,所用到的说有的数据都必须转换成Numpy数组,

Scipy

  scipy是用于科学计算的函数集合,scipy最重要的就是scipy。sparse,他可以给出稀疏矩阵,

matplotlib:

  matpoltlib是python的绘图库,如折线图,直方图,散点图等等

pandas:

  pandas是用于处理和分析数据的库,numpy要求所有数组中元素类型必须相同,而pandas中可以互不相同。

  pandas可以从文件格式和数据库中提取数据,

 

CSR格式的稀疏矩阵: 

  在scikit_learn 中 scipy的稀疏矩阵是非常重要的,稀疏矩阵会节省很多不必要的空间,只保留矩阵的非零部分和不重复部分,

  import numpy as np
  from scipy import sparse
  n = np.eye(4)
  spare = sparse.csr_matrix(n)

COO格式的稀疏矩阵  

  eye = sparse.coo_matrix((date, (row, col)))  为稀疏矩阵的coo格式,coo格式可与csr格式相互转换,

  coo_matrix 一经定义后shape就不可更改了! 但data, row, col 可更改。 

  

 

  

 

 

posted on 2018-10-25 19:53  本名边境  阅读(558)  评论(0编辑  收藏  举报

导航