摘要: s="你好" s_to_utf8=s.encode("utf8","ignore") print(s_to_utf8) print(type(s_to_utf8)) utf8_to_unicode=s_to_utf8.decode("utf8","ignore") print(utf8_to_uni 阅读全文
posted @ 2018-01-30 20:30 outback123 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 在上一篇博客中使用redis所维护的代理池抓取微信文章,开始运行良好,之后运行时总是会报501错误,我用浏览器打开网页又能正常打开,调试了好多次都还是会出错,既然这种方法出错,那就用selenium模拟浏览器获取搜狗微信文章的详情页面信息,把这个详情页面信息获取后,仍然用pyquery库进行解析,之 阅读全文
posted @ 2018-01-30 19:24 outback123 阅读(2005) 评论(0) 推荐(0) 编辑
摘要: 爬虫 requests 阅读全文
posted @ 2018-01-30 19:14 outback123 阅读(808) 评论(0) 推荐(0) 编辑