摘要:
MongoDB是由C++ 语言编写的,它是一个基于分布式文件存储的开源数据库系统。在高负载的情况下,添加更多的节点,开源保证服务器的性能。MongoDB旨在为Web服务器提供可扩展性的存储解决方案。它将数据存储为一个文档,数据由键值(key => value)组成。MongoDB文档类似于JSON对 阅读全文
摘要:
MongoDB是基于分布式文件存储的数据库。由C++ 编写,旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。 MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。 安装步骤 1. 官网下载安装包。 MongoDB 提供了可用于 32 阅读全文
摘要:
当数据量大,并且需要使用数据进行后期操作时,需要用到数据库。下面讲解在Python中使用MySQL 存储。 MySQL 数据库安装 详见官方文档或:https://www.cnblogs.com/luyj00436/p/15476678.html。 MySQL 数据驱动安装 mysql-connec 阅读全文
摘要:
系统环境 window10 64bit 步骤 下载并解压安装包。打开MySQL 下载中心https://dev.mysql.com/downloads/mysql/ ,然后选择合适的版本下载到本地目录。 点击 Download 按钮进入下载页面,点击下图中的 No thanks, just star 阅读全文
摘要:
说明 数据清洗是对一些没有用的数据进行处理的过程。 很多数据集存在数据缺失、数据格式错误、错误数据或重复数据的情况,如果要对使数据分析更加准确,就需要对这些没有用的数据进行处理。 在这个教程中,我们将利用 Pandas包来进行数据清洗。 本文使用到的测试数据 property-data.csv 如下 阅读全文
摘要:
JSON(JavaScript Object Notation,JavaScript 对象表示法),是存储和交换文本信息的语法,类似 XML。 Pandas 可以很方便的处理 JSON 数据。 读取JSON数据 假设site.json文件内容如下: [ { "id": "A001", "name": 阅读全文
摘要:
1. 定义 CSV(Comma-Separated Values,逗号分隔值,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。 CSV 是一种通用的、相对简单的文件格式,被用户、商业和科学广泛应用。 Pandas 可以很方便的处理 CSV 文件,本文 阅读全文
摘要:
1. 定义 DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。 2. 构造方法 pandas.DataFrame( data, ind 阅读全文
摘要:
1. 定义 Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。 Series 由索引(index)和列组成,函数如下: pandas.Series( data, index, dtype, name, copy) 2. 参数 参数 说明 data 阅读全文
摘要:
安装Pandas 安装 pandas 需要基础环境是 Python,开始前我们假定你已经安装了 Python 和 Pip。 使用 pip 安装 pandas: pip install pandas 导入Pandas 安装成功后,我们就可以导入 pandas 包使用: import pandas 查看 阅读全文