2018年4月27日

python爬虫之爬取糗事百科并将爬取内容保存至Excel中

摘要: 本篇博文为使用python爬虫爬取糗事百科content并将爬取内容存入excel中保存·. 实验环境:Windows10 代码编辑工具:pycharm 使用selenium(自动化测试工具)+phantomjs(无界面的浏览器 也可以使用Firefox或者chrome)+beautiful sou 阅读全文

posted @ 2018-04-27 22:02 DoctorXiong 阅读(889) 评论(0) 推荐(0) 编辑

2018年3月14日

字符串的编码

摘要: 1.ASCII 一个英文字母占用一个字节 无法表示汉字 2unicode 编码 每个字符占用两个字节,可以表示汉字,但对于英文字母来说会造成存储空间的浪费 3 utf-8可变长度的编码 对于英文占用一个字节 汉字占用三个字节 其它生僻的字符占用4-6个字节 把一个文件中的内容读取到内存最好转化为un 阅读全文

posted @ 2018-03-14 20:06 DoctorXiong 阅读(164) 评论(0) 推荐(0) 编辑

python正则表达式

摘要: 常用的正则表达式的符号以及它所代表的含义如下: 1 ^ 以某字符开头 2 $ 以某字符结尾 3 *某字符出现0次或多次 4 +某字符出现0次或多次. 5 .点代表任意一个字符 它的匹配范围要大于\w 6? 代表非贪婪模式 7{n}某字符出现n次 8{n,}某字符出现大于等于n次 9{n,m}某字符出 阅读全文

posted @ 2018-03-14 19:34 DoctorXiong 阅读(188) 评论(0) 推荐(0) 编辑

2018年2月6日

python爬虫学习心得

摘要: 作为一名python的忠实爱好者,我开始接触爬虫是在2017年4月份,最开始接触它的时候遇到两个梗,一个是对python还不算太了解(当然现在也仍然在努力学习它的有关内容),二是对爬虫心怀一份敬畏之心,觉得这么高大上的东西,真的好难啊,记得我写过的第一个爬虫,是在linux下(带有图形界面)编写了十 阅读全文

posted @ 2018-02-06 17:43 DoctorXiong 阅读(2137) 评论(0) 推荐(0) 编辑

导航