摘要: 今天爬虫(新浪微博 个人信息页面)的时候遇到了转义和正则匹配中文出乱码的问题。 先给出要匹配的部分网页源代码如下: 昵称:他们叫我远凸哥哥\r\n\t\t 想要匹配得到的结果是这个人的昵称,即“他们叫我远凸哥哥”1.转义 比较简单,需要转义的是反斜杠(\)和引号(")1 >>> cont... 阅读全文
posted @ 2015-08-11 11:37 丰丰丰 阅读(2628) 评论(0) 推荐(0) 编辑
摘要: 转载链接:http://www.cnblogs.com/yin-jingyu/archive/2011/08/01/2123548.htmlHTTP(HyperText Transfer Protocol)是一套计算机通过网络进行通信的规则。计算机专家设计出HTTP,使HTTP客户(如Web浏览器)... 阅读全文
posted @ 2015-07-30 14:19 丰丰丰 阅读(138) 评论(0) 推荐(0) 编辑
摘要: python第三方包安装的两种方法总结 阅读全文
posted @ 2015-07-29 15:09 丰丰丰 阅读(5605) 评论(1) 推荐(0) 编辑