摘要:2) pandas中NoneSnp.nan的操作 isnull () notnull () dropna () :过滤丢失数据 fillna () :填充丢失数据 (1)判断函数 isnull () . notnull() (2)过滤函数
阅读全文
随笔分类 - 自动化办公必备numpy、pandas数据处理
摘要:1. pandas. 构造: Series一维数组,类似字典 Series (data, index) Series (data=dic, index) 读取DataFrame的一列 索引访问: 字典访问: s[key] 下标访问: s[index] loc访问:s. loc [key] iloc访
阅读全文
摘要:(1) DataFrame之间的运算同Series一样: . 在运算中自动对齐相同索引的数据. 如果索引不对应,则补NaN DataFrame和一个数、numpy 广播机制 DataFrame和数组(Series) 索引对齐, axis控制方向 DataFrameDataFrame 索引对齐,不分方
阅读全文
摘要:2) DataFrame的索引 (1)对列进行索引 -通过类似字典的方式 -通过属性的方式 可以将DataFrame的列获取为一个Series。返回的Series拥有原DataFrame相同的索引,且name属性也已经设置好了,就是相应的列名。 (2)对行进行索引 -使用.ix[]来进行行索引使用.
阅读全文
摘要:1) DataFrame的创建 最常用的方法是传递一个字典来创建。DataFrame以字典的键作为每一【列】的名称,以字典的值(一个数组)作为每一列。 此外,DataFrame会自动加上每一行的索引(和Series一样)。 同Series一样,若传入的列与字典的键不匹配,则相应的值为NaN。 #数据
阅读全文
摘要:4) Series的运算 (1)适用于numpy的数组运算也适用于Series (2) Series之间的运算. 在运算中自动对齐不同索引的数据. 如果索引不对应,则补NaN 注意:要想保留所有的index,则需要使用 (意思是没有相同的显示索引时,前面数有值,后面数无值导致无法计算输出NaN,如果
阅读全文
摘要:3) Series的基本概念 可以把Series看成一个定长的有序字典 可以通过shape, size, index,values等得到series的属性 可以使用head(),tail()分别查看前n个和后n个值 当索引没有对应的值时,可能出现缺失数据显示NaN (not a number )的情
阅读全文
摘要:#其他访问方式,列表和numpy的访问方式完全适用于Series arr =np.random.randint(0,100,size=5) arr array([38, 15, 10, 85, 81]) s=Series(data=arr,index=["tom", "lucy", "mery",
阅读全文
摘要:1.Series Series是一种类似于一维数组的对象,由下面两个部分组成: #values :-组数据(ndarray类型) #index :相关的数据索引标签 一维数组:有序的数据类型相同的集合 Series: 一维数组的强化版,增加了像字典一样的key-value的访问机制,同时也保留了数组
阅读全文
摘要:1,查看文档: shift+tab 2,输入输出历史: In Out 3. %time %timeit %%time %%timeit numpy: 1,特点:数据类型相同的有序的数据集合,如果初始化的数据类型不同,会强制类型统一 优先级: str >float > int 2.构造: np. ar
阅读全文
摘要:3.其他聚合操作 Function Name NaN-safe Version Description np. sum np. nansum Compute sum of elements #求和 np. prod np. nanprod Compute product of elements #求
阅读全文
摘要:3.变形 使用reshape函数,注意参数是一个tuple! #产生0-10的随机整数 arr6 = np.random.randint(0,10,size=(20)) arr6 array([2, 8, 9, 6, 2, 6, 6, 1, 0, 1, 3, 5, 1, 3, 8, 5, 0, 8,
阅读全文
摘要:三、ndarray的基本操作 索引和切片 1.索引维与列表完全一致 多维时同理 2.切片维与列表完全一致多维时同理 将数据反转,例如[1,2,3] >[3,2,1] 两个::进行切片 1.索引维与列表完全一致 多维时同理 #列表的访问方式 arr2 = np.array ([[1, 2, 3], [
阅读全文
摘要:1.numpy数组用列表直接创建 import numpy as np age=[15,16,18] #创建列表,后面赋值列表 array3=np.array(age,dtype=np.float64) #用自带的 np.float64 比较全面 array3 array([15., 16., 18
阅读全文
摘要:一.创建Array 使用np.array()由python list创建 C 数组的概念:数据类型一致的一个连续的内存空间 python list 列表 (C语言说:列表其实就是一个指针数组),列表不要求数据类型一致, numpy的构建是采用c语言,数组类型要保持一致 numpy默认ndarray的
阅读全文
摘要:二. IPython 的使用技巧 #通过命令来获得帮助文档 1.使用help() #示例 help(len) 2.使用? #示例 len? 3. shift+tab 查看文档 #示例 len() #按shift+tab #tab代码自动补全 按 TAB键 实现代码补全 三. IPython的魔法命令
阅读全文
摘要:cell单元格 单元格有两个【状态】: 选中状态:没有光标闪动,此出可以对整个单元格操作,比如洲除单元格、新增一个单元格、复制、枯贴、被销、切换模式... 编辑状态:能看到光标在闪动, 此时可以在单元格内部写代码或文本 编姆状态 >选中状态 按下ESC 选中状态一>编料状态 按下Enter 单元络有
阅读全文