摘要: 处理缺失值 通过isnull和notnull方法,可以返回布尔值的对象。 这时通过求和可以获取每列的缺失值数量,再通过求和就可以获得整个DataFrame的缺失值数量 侦查缺失值 创建有缺失值的DataFeame >>> from pandas import Series,DataFrame >>> 阅读全文
posted @ 2019-10-28 23:29 tunan96 阅读(195) 评论(0) 推荐(0) 编辑
摘要: CSV文件的读取 pandas库提供了将表格型数据读取为DataFrame数据结构的函数 文本解析函数: read_csv 从文件中加载带分隔符的数据,默认分隔符为逗号 read_table 从文件中加载带分隔符的数据,默认分隔符为制表符 写入csv文件 使用read_csv读取csv文件 使用re 阅读全文
posted @ 2019-10-28 15:59 tunan96 阅读(363) 评论(0) 推荐(0) 编辑
摘要: 线形图 线形图通常用于描述两组数据之间的趋势 Series数据 通过s.plot方法可以绘制线形图 DataFrame数据 柱状图 柱状图常描述各类别之间的关系。 用法是在plot函数中加入kind=”bar”,如果类别较多,可绘制水平柱状图(kind=”barh”)。 简单柱状图 班级学生性别分布 阅读全文
posted @ 2019-10-28 15:52 tunan96 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 层次化索引简介 简单的说,层次化索引就是轴上有多个级别的索引 Series层次化索引 MultiIndex对象 数据选取 DataFrame层次化索引 数据选取 重排分级顺序 通过swaplevel方法可以对层次化索引重新排序 汇总统计 在对层次化索引的pandas数据进行汇总时统计时,可以通过le 阅读全文
posted @ 2019-10-28 15:48 tunan96 阅读(962) 评论(0) 推荐(0) 编辑
摘要: 算术运算 pandas的数据对象在进行算术运算时,如果有相同索引对则进行算术运算,如果没则会引入缺失值,这就是算术对齐 Series数据的算术运算 DataFrame数据的算术运算 DataFrame和Series的算术运算 函数应用和映射 map函数,将函数套用在Series的每个元素中 appl 阅读全文
posted @ 2019-10-28 15:46 tunan96 阅读(347) 评论(0) 推荐(0) 编辑
摘要: 重新索引 索引对象是无法进行修改的,重新索引并不是给索引重新命名,而是对索引重新排序 Series重新排序后的索引 填充缺失值(method参数实现,ffill为向前填充,bfill为向后填充) DataFrame重新索引行 DataFrame重新索引列 reindex函数参数 index 用于索引 阅读全文
posted @ 2019-10-28 15:44 tunan96 阅读(1949) 评论(0) 推荐(0) 编辑
摘要: 创建Series数据 Series是由一组数据和一组对应的索引组成的 数组创建Series 指定索引创建Series 获取数组和索引对象 通过索引来获取Series的单个或者一组值 通过字典创建Series Series的简单运算(比较运算符,数值运算符,取绝对值) 给Series对象和索引定义名称 阅读全文
posted @ 2019-10-28 15:41 tunan96 阅读(124) 评论(0) 推荐(0) 编辑
摘要: 数据的存储 数据的读取 阅读全文
posted @ 2019-10-28 15:39 tunan96 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 数组和标量间的运算 相同维度的数组的算术运算都可以直接应用到元素中,也就是元素级运算 矢量化 元素级运算 通用函数 通用函数(ufunc)是一种对数组中的数据执行元素级别运算的函数 一元函数 abs: 求绝对值 square: 求平方 二元函数 add: 两个数组相加 minimum: 计算元素最小 阅读全文
posted @ 2019-10-28 15:38 tunan96 阅读(969) 评论(0) 推荐(0) 编辑
摘要: 数组的索引 重点: 数组的切片和索引返回的都是原始数组的视图,视图上的操作会使原始数组发生改变 数组的索引1 数组的索引2 数组的索引3 二维数组的索引1 二维数组的索引2 高维数组索引1 高维数组索引2 高维数组索引3 数组的切片 一维数组切片 多维数组索引1 多维数组索引2 布尔类型的索引 数组 阅读全文
posted @ 2019-10-28 15:34 tunan96 阅读(369) 评论(0) 推荐(0) 编辑
摘要: 创建ndarray数组 1. 通过列表创建ndarray数组 2. 通过元祖创建ndarray数组 3. 创建多维数组 4. zeros函数 5. ones函数 6. empty函数 7. arange函数 ndarray对象属性 .ndim 数据轴的个数 .shape 数组的维度 .size 元素 阅读全文
posted @ 2019-10-28 15:32 tunan96 阅读(381) 评论(0) 推荐(0) 编辑
摘要: 索引 MongoDB是基于集合建立索引(index),索引的作用类似于传统关系型数据库,目前是为了提高查询速度。 MongoDB的索引基于B-tree数据结构及对应算法形成。 默认情况下,在建立集合的同时,MongoDB数据库自动为集合_id建立唯一索引,可以避免重复插入同一_id值的文档记录 单一 阅读全文
posted @ 2019-10-28 15:21 tunan96 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 删除文档 在集合里删除一条或多条符合条件的文档 语法: 删除一个集合里的所有文档记录 要删除所有记录,采用db.tests.drop()方法效率更高,它会把整个集合和索引一起删除 删除符合条件的所有文档记录 自定义写出错确认级别 删除满足条件的单个文档记录 阅读全文
posted @ 2019-10-28 15:15 tunan96 阅读(125) 评论(0) 推荐(0) 编辑
摘要: 更新文档 语法: 命令参数 返回值: 更新成功: 返回WriterResult({“nUpdated”:n})对象 更新失败: 返回结果中会包含WriterResult.writeConcernError 修改一条简单文档 1. 插入 2. 单值修改 3. 查看 4. 数值修改(加法) 5. 数值修 阅读全文
posted @ 2019-10-28 15:13 tunan96 阅读(141) 评论(0) 推荐(0) 编辑
摘要: 1.文档查询命令格式: 2.查询集合的所有文档 find()的pretty()方法提供了格式化查询结果的效果 3.等价条件查询 公共查询条件: {<key1>:<value1>,…},多条件时进行与(and)条件查询 多条件and查询 多条件or查询 指定显示的值(0不显示,1显示) 4.嵌套文档查 阅读全文
posted @ 2019-10-28 15:08 tunan96 阅读(121) 评论(0) 推荐(0) 编辑
摘要: 插入一条简单的文档 插入一条复杂的文档 插入多条文档 用变量方式插入文档 有序插入多条文档 自定义写出错确认级别(含insert命令出错返回对象显示) 简化的插入命令 1. 单条插入 2. 多条插入 阅读全文
posted @ 2019-10-28 15:05 tunan96 阅读(110) 评论(0) 推荐(0) 编辑
摘要: 创建自定义的数据库(use) 查看数据库(show dbs) 统计某数据库的信息(db.stats())—>指的是当前的数据库 删除数据库(db.dropDatabase()) 查看当下数据库下的集合名称(db.getCollectionNames()) 查看数据库用户角色权限(show roles 阅读全文
posted @ 2019-10-28 15:01 tunan96 阅读(97) 评论(0) 推荐(0) 编辑