摘要:
math库: os库: random库: datetime库: 阅读全文
摘要:
文件的打开、读写和关闭 文件的打开: file_obj=open(filename,mode='r',buffering=-1,...) filename是强制参数 mode是可选参数,默认值是r buffering是可选参数,默认值为-1(0代表不缓冲,1或大于1的值表示缓冲一行或指定缓冲区大小) 阅读全文
摘要:
网络数据获取(爬取)分为两部分: 1、抓取(抓取网页) · urlib内建模块,特别是urlib.request · Requests第三方库(中小型网络爬虫的开发) · Scrapy框架(大型网络爬虫的开发) 2、解析(解析网页内容) · BeautifulSoup库 · re模块(正则表达式) 阅读全文
摘要:
SciPy https://www.scipy.org/ SciPy中的数据结构: 1、ndarray(n维数组) 2、Series(变长字典) 3、DataFrame(数据框) NumPy适合于线性代数和随机数处理 SciPy有效计算numpy矩阵 Matplotlib二维绘图库 pandas有高 阅读全文
摘要:
Python中的数组ndarray是什么? 1、NumPy中基本的数据结构 2、所有元素是同一种类型 3、别名是array 4、利于节省内存和提高CPU计算时间 5、有丰富的函数 ndarray的创建: ndarray的操作: ndarray的运算: 广播的思想: 统计运算: ndarray的专门应 阅读全文
摘要:
Series的基本特征: 1、类似一维数组的对象 2、由数据和索引组成 Series的基本运算: Series的数据对齐: 重要功能:在算术运算中自动对齐不同索引的数据。 Series的name属性: 1、Series对象本身及其索引均有一个name属性 2、Series的name属性与其他功能关系 阅读全文
摘要:
今天详细做下关于DataFrame的使用,以便以后自己可以翻阅查看 DataFrame的基本特征: 1、是一个表格型数据结构 2、含有一组有序的列 3、大致可看成共享同一个index的Series集合 DataFrame的基本操作 · 取DataFrame对象的行和列可获得Series: DataF 阅读全文
摘要:
时间格式: 创建时间序列: 阅读全文
摘要:
今天在做下python开发笔记之如何通过xml快捷获取数据,下面以调取nltk语料库为例: 阅读全文