摘要:
处理缺失数据 对于数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据。我们称其为哨兵值。 滤除缺失数据 过滤掉缺失数据的办法有很多种。你可以通过pandas.isnull或布尔索引的手工方法,但dropna可能会更实用一些。对于一个Series,dropna返回一个仅含非 阅读全文
摘要:
读取Microsoft Excel文件 将pandas数据写入为Excel格式 Web APIs交互 许多网站都有一些通过JSON或其他格式提供数据的公共API。通过Python访问这些API的办法有不少。一个简单易用的办法(推荐)是requests包(http://docs.python-requ 阅读全文
摘要:
要使用pandas,你首先就得熟悉它的两个主要数据结构:Series和DataFrame。 1.Series Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成 2.DataFrame DataFrame是一个表格型的数据结构,它含 阅读全文
摘要:
1.zip()函数 zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的对象,这样做的好处是节约了不少的内存。 我们可以使用 list() 转换来输出列表。 如果各个迭代器的元素个数不一致,则返回列表长度与最短的对象相同,利用 * 号操作符,可以将 阅读全文
摘要:
生成器——generator 创建generator,第一种方法很简单, 只要把一个列表生成式的[]改成(),就创建了一个generator: 定义generator的另一种方法。如果一个函数定义中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator: generato 阅读全文
摘要:
字典 特性: 函数 非固定参数: 若你的函数在定义时不确定用户想传入多少个参数,就可以使用非固定参数 还可以有一个**kwargs 全局变量与局部变量: 在子程序中定义的变量称为局部变量,在程序的一开始定义的变量称为全局变量。 全局变量作用域是整个程序,局部变量作用域是定义该变量的子程序。 当全局变 阅读全文
摘要:
列表 定义: 操作:切片,追加(append),插入(insert),修改,删除(del,remove,pop),扩展(extend),拷贝(copy),统计(count),排序,翻转等。 元组 概念:跟列表类试,只是一旦创建,便不可再修改,是只读列表 定义: 字典 字典一种key - value 阅读全文
摘要:
python是一种什么语言? 编译与解释 编译器是把源程序的每一条语句都编译成机器语言,并保存成二进制文件,这样运行时计算机可以直接以机器语言来运行此程序,速度很快; 而解释器则是只在执行程序时,才一条一条的解释成机器语言给计算机来执行,所以运行速度是不如编译后的程序运行的快的. python是一种 阅读全文