摘要: 爬取知乎时,复制下请求headers,使用scrapy进行爬取 然而打印response.text后得到的是一堆乱码 阅读全文
posted @ 2018-04-05 21:41 heinz97 阅读(324) 评论(0) 推荐(0) 编辑
摘要: 正则表达式 阅读全文
posted @ 2018-04-05 09:03 heinz97 阅读(116) 评论(0) 推荐(0) 编辑
摘要: 字符 阅读全文
posted @ 2018-04-04 12:09 heinz97 阅读(233) 评论(0) 推荐(0) 编辑
摘要: post7 阅读全文
posted @ 2018-04-02 11:31 heinz97 阅读(86) 评论(0) 推荐(0) 编辑
摘要: python正则表达式 阅读全文
posted @ 2018-04-02 11:30 heinz97 阅读(106) 评论(0) 推荐(0) 编辑
摘要: 提高电脑工作效率 基本思路 全键盘操作,避免使用鼠标 listary 文件快速查找 total commander 全键盘操作的资源管理器 autohotkey 定制快捷键 chrome vimium 解决网页天然对键盘不友好的问题 tab操作 ctrl+alt+r 关闭右侧tab ctrl+alt 阅读全文
posted @ 2018-03-31 18:44 heinz97 阅读(157) 评论(0) 推荐(0) 编辑
摘要: scrapy 阅读全文
posted @ 2018-03-31 07:23 heinz97 阅读(85) 评论(0) 推荐(0) 编辑
摘要: ip代理 从http://www.data5u.com/free/gnpt/index.shtml获取免费代理 测试代码 <div id="result"><div class="well"><p>您现在的 IP:<code>118.184.180.46</code></p><p>所在地理位置:<c 阅读全文
posted @ 2018-03-31 07:22 heinz97 阅读(135) 评论(0) 推荐(0) 编辑
摘要: urllib 阅读全文
posted @ 2018-03-30 08:42 heinz97 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 爬虫 阅读全文
posted @ 2018-03-29 10:00 heinz97 阅读(130) 评论(0) 推荐(0) 编辑