随笔分类 - 数据分析
摘要:一、环境配置 主要使用的包如下: Package Version ... pandas 0.23.4 xlrd 1.2.0 ... pandas的版本比较重要,因为我们主要使用的是pandas中的read_excel函数中的nrow和skiprows参数,有的版本没有nrows参数。 二、实现过程
阅读全文
摘要:一、安装 Elasticsearch是一个基于Apache Lucene(TM)的开源搜索引擎。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。 (一)Elasticsearch下载与安装 1、Elasticsearch的下载 官网下载有时太慢,这里分享一个链接:链接:h
阅读全文
摘要:一、Pandas基础 Pandas是基于NumPy的一套数据分析工具,该工具是为了解决数据分析任务而创建的,所以它至少有以下特点或用途: 基于NumPy,提供了矩阵运算 强大的分析结构化数据的工具集 提供数据清洗功能 (一)数据结构 1、Series 是带标签的一维数组,可存储整数、浮点数、字符串、
阅读全文
摘要:一、Matplotlib的简单使用 Python底层绘图库,主要做数据可视化图表。 (一)Matplotlib的安装 可通过pip进行安装 (二)简单使用 1、气温实例 假设一天24小时,每间隔2小时统计一次气温,这样就统计了12个气温,假设分别为[12,25,13,6,8,20,23,10,15,
阅读全文
摘要:一、什么是NumPy (一)工作环境的安装 使用的是Anaconda环境,它是一个集成的工作环境,方便管理各种包,这里提供一个版本的链接: https://pan.baidu.com/s/1pHqRTy_uwKMArtt8SvY6Tw 提取码: 3922 。在下载后按照指示进行安装即可。 注意安装完
阅读全文