摘要:
分析1880到2017年出生的美国婴儿姓名 获取数据 数据规整 分析数据 1、获取数据 Copy链接:https://pan.baidu.com/s/1wIyRZfgR7EjQ_KFP5-cnaA 提取码:g0zy 2、数据规整 因为获取到的数据是根据出生年份分为了多个文件,其中文件内部的数据也是简 阅读全文
摘要:
六、数据操作 本章学习内容: 数据导入、存储 数据处理 数据操作最重要的一步也是第一步就是收集数据,而收集数据的方式有很多种,第一种就是我们已经将数据下载到了本地,在本地通过文件进行访问,第二种就是需要到网站的API处获取数据或者网页上爬取数据,还有一种可能就是你的公司里面有自己的数据库,直接访问数 阅读全文
摘要:
五、Matplotlib:绘图和可视化 简介 简单绘制线形图 plot函数 支持图类型 保存图表 1、简介 Matplotlib是一个强大的Python绘图和数据可视化的工具包。数据可视化也是我们数据分析的最重要的工作之一,可以帮助我们完成很多操作,例如:找出异常值、必要的一些数据转换等。完成数据分 阅读全文
摘要:
四、Pandas 简介 Series DataFrame 时间对象处理 数据分组和聚合 其他常用方法 1、简介 pandas是一个强大的Python数据分析的工具包,它是基于Numpy构建的,正因pandas的出现,让Python语言也成为使用最广泛而且强大的数据分析环境之一。 Pandas的主要功 阅读全文
摘要:
三、Numpy 简介 ndarray 通用函数 其他 1、简介 Numpy是高性能科学计算和数据分析的基础包。它也是pandas等其他数据分析的工具的基础,基本所有数据分析的包都用过它。NumPy为Python带来了真正的多维数组功能,并且提供了丰富的函数库处理这些数组。它将常用的数学函数都支持向量 阅读全文
摘要:
二、开发环境部署 Anaconda 下载安装 配置环境变量 管理包 管理环境 运行anaconda 补充 1、Anaconda Anaconda是Python的一个开源的发行版本,里面包含了很多科学计算相关的包,它和Python的关系就像linux系统中centos和Ubuntu的关系一样,不冲突, 阅读全文