会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
老兵笔记-郑昀
参与软件开发这些年来,不断地遇到新领域新知识点,屡屡感受到新进入者的迷惑和彷徨,所以对遇到的每一个问题都详细记录问题现象、解决思路以及解决方案,并在blog中留下印迹,以备他日有心人google之而知之。
你们的新手之痛,你们的新业务发展之初的思路混沌,我都感同身受,所以欢迎和我一起探讨,知无不言言无不尽。
订阅
管理
2010年5月18日
07-爬虫的多线程调度 | 01.数据抓取 | Python
摘要: 一般让爬虫在一个进程内多线程并发,有几种方法。
阅读全文
posted @ 2010-05-18 16:12 老兵笔记
阅读(8055)
评论(1)
推荐(2)
编辑
05-访问超时设置 | 01.数据抓取 | Python
摘要: 设置 HTTP 或 Socket 访问超时,来防止爬虫抓取某个页面时间过长。
阅读全文
posted @ 2010-05-18 16:07 老兵笔记
阅读(12072)
评论(0)
推荐(1)
编辑
03-网页内容的编码检测 | 02.数据解析 | Python
摘要: 我们需要确定网页的内容/标题等文字的编码格式,比如 utf-8 、gb2312 等。
阅读全文
posted @ 2010-05-18 15:57 老兵笔记
阅读(3533)
评论(1)
推荐(1)
编辑
5·17月光论坛事件真相
只有注册用户登录后才能阅读该文。
阅读全文
posted @ 2010-05-18 14:48 老兵笔记
阅读(4153)
评论(4)
推荐(3)
编辑
公告