摘要: 抓取百度贴吧帖子 按照这个学习教程,一步一步写出来,中间遇到很多的问题,一一列举 首先, 获得 标题 和 贴子总数 PS:我用的火狐浏览器,查看网页源代码,鼠标右击查看 获得 快捷键 Ctrl-U 接下来 抓取 楼层的内容,写好的 程序如下 但是运行之后一直报错,如下图: 检查代码无数次后,终于.. 阅读全文
posted @ 2016-11-13 23:13 Not-Bad 阅读(11599) 评论(0) 推荐(1) 编辑
摘要: 原文 decode的作用是将其他编码的字符串转换成unicode编码。 encode的作用是将unicode编码转换成其他编码的字符串。 PS:字符串在Python内部的表示是unicode编码。 因此,在做编码转换时,通常需要以unicode作为中间编码,即先将其他编码的字符串解码(decode) 阅读全文
posted @ 2016-11-13 23:11 Not-Bad 阅读(1922) 评论(0) 推荐(0) 编辑
摘要: raw_input 如其字面意思一样,返回输入字符的字符串形式,不做任何变换运算 input 本质上是使用raw_input()来实现的,即调用完raw_input()之后再调用eval()函数,调用如下: eg. 输入纯数字字符串,返回数字类型;对合法的 python 数字表达式进行运算,返回运算 阅读全文
posted @ 2016-11-13 23:08 Not-Bad 阅读(2854) 评论(0) 推荐(0) 编辑