08 2021 档案
摘要:一、前沿技术 Dask包 数据量大、内存不足、复杂并行处理 计算图、并行、扩展分布式节点、利用GPU计算 类似 TensorFlow 对神经网络模型的处理 CUDF包 CUDF在GPU加速Pandas 缺点:GPU贵! 二、原始Apply import pandas as pd import num
阅读全文
摘要:在 Jupyter Notebook 编码中,有时需要查看 DataFrame 中的数据,可默认只显示10行数据,中间以“省略号”代替。 可在导入 pandas 模块时加入 pd.set_option 参数进行配置。 设置行 import pandas as pd pd.set_option('di
阅读全文
摘要:一、解释 变异系数(coefficient of variation)又称离散系数,是一个衡量数据离散程度的、没有量纲的统计量。 其值(CV)为标准差与平均值之比。 变异系数取值一般为:[0, +无穷) 二、实现 import numpy as np def coefficient_of_varia
阅读全文