摘要: 转载自:静觅 » Python爬虫入门七之正则表达式 阅读全文
posted @ 2017-03-13 18:04 Mars.wang 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 做数据分析的同学大部分入门都是从excel开始的,excel也是微软office系列评价最高的一种工具。 但当数据量超过百万行的时候,excel就无能无力了,python第三方包pandas极大的扩展excel的功能,入门需要花费一点时间,但是真的是做大数据的必备神器! 1.从文件读数据 panda 阅读全文
posted @ 2017-03-13 17:55 Mars.wang 阅读(3496) 评论(0) 推荐(0) 编辑
摘要: IO指输入输出,本文主要描述的是python对于文件的操作。 这是写文件,a+指新内容写在目标文件的尾部。 file.read()是读文件,很多时候文件较大,不知道多少行,不能一下子都读进内存,最好是一行一行读。就用到了file.readline() 下面是所有读写文件的模式。 阅读全文
posted @ 2017-03-13 16:53 Mars.wang 阅读(186) 评论(0) 推荐(0) 编辑
摘要: mongodb是近一段时间以来比较流行的非关系数据库之一,由于python和它都对json类型有着很好的支持,因此配合起来可谓天衣无缝。 首先要下载python对mongodb支持的包pymongo 上面只是一个简单的查询,也可以再建立连接之后,进行其他的操作,比方插入数据: 或者插入多条数据: 或 阅读全文
posted @ 2017-03-13 16:27 Mars.wang 阅读(3256) 评论(0) 推荐(0) 编辑
摘要: mysql是世界上应用最广的免费数据库,python当然也提供了对它的调用。 首先pip install pymysql,当然自己要知道数据库的用户名和密码,本地数据库的host就是localhost. 基本顺序就是 先建立python和数据库的连接,就是像平常我们使用账号和密码登录网站一样,然后建 阅读全文
posted @ 2017-03-13 16:05 Mars.wang 阅读(298) 评论(0) 推荐(0) 编辑
摘要: 1.有名字的元组——namedtuple 2.双向链表——deque list访问数据很快,但增删就比较慢,因为list是线性存储,deque是为了高效实现插入和删除操作的双向列表,适合用于队列和栈 deque除了实现list的append()和pop()外,还支持appendleft()和popl 阅读全文
posted @ 2017-03-13 10:13 Mars.wang 阅读(281) 评论(0) 推荐(0) 编辑