摘要:
在学习机器学习之前熟悉一下机器学习相关的词,对今后的机器学习有一定的帮助,使得我们能够更为清晰的认识机器学习 此次的笔记只是一种简要的概括,具体的可以参照博客https://www.csdn.net/gather_27/MtTacg5sOTg2Ni1ibG9n.html 当然还有其它的,只要我们能够 阅读全文
摘要:
数据结构的起源 计算机从解决数值计算问题到解决生活中的问题 现实生活中的问题涉及不同个体间的复杂关系 需要在计算机程序中描述生活中个体间的联系 数据结构主要研究非数值计算程序问题中的操作对象以及它们之间的关系 不是研究复杂的算法 数据结构中的基本概念 数据—程序的操作对象,用于描述客观事物 数据的特 阅读全文
摘要:
1. 大数据时代究竟改变了什么? 思维方式 数据重要性:数据资源-->数据资产(增值) 方法论:基于知识的理论完美主义、基于数据的历史经验主义 数据分析: 统计学(抽样).......数据科学(大数据)、数据科学家(大数据+算法+更加丰富的业务知识) 计算智能: 复杂算法 简单算法(MapReduc 阅读全文
摘要:
下面的图型是在一幅画布上建立的四个球员相关数据的极坐标图 关于这个图的代码如下: 上述代码也可以利用for循环简化一下 阅读全文
摘要:
关于matplotlib的绘制图形的基本代码,我们可以参照下面的连接 https://matplotlib.org/gallery/index.html https://matplotlib.org/api/_as_gen/matplotlib.pyplot.subplot.html#matplot 阅读全文
摘要:
周期由高频率转向低频率称为降采样:例如5分钟股票交易数据转换为日交易数据 相反,周期也可以由低频转向高频称为升采样 其他重采样:例如每周三(W-WED)转换为每周五(W-FRI) 阅读全文
摘要:
时间戳tiimestamp:固定的时刻->pd.Timestamp 固定时期period:比如2016年3月份,再如2015年销售额->pd.Period 时间间隔interval:由起始时间和结束时间来表示,固定时期是时间间隔的一个特殊 时间日期在Pandas里的作用:分析金融数据,如股票交易数据 阅读全文
摘要:
pandas在进行数据存储与输出时会做一些相应的操作 1.*索引:将一个列或多个列读取出来构成DataFrame,其中涉及是否从文件中读取索引以及列名 2 *类型推断和数据转换:包括用户自定义的转换以及缺失值标记 3 *日期解析 4*迭代:针对大文件进行逐块迭代。这个是Pandas和Python原生 阅读全文
摘要:
通过聚合运算可以得到我们比较感兴趣的数据以方便处理 阅读全文
摘要:
分组计算三部曲:拆分-->应用-->合并 分组:就是按照行或列把相同索引的部分分到一起 分组的关键词为groupby,分组后我们就可以对每组数据进行同一操作,返回的是每组数据分别计算后的结果 阅读全文