Fork me on GitHub
摘要: 提到爬虫,大部分人都会想到使用Scrapy工具,但是仅仅停留在会使用的阶段。为了增加对爬虫机制的理解,我们可以手动实现多线程的爬虫过程,同时,引入IP代理池进行基本的反爬操作。 本次使用天天基金网进行爬虫,该网站具有反爬机制,同时数量足够大,多线程效果较为明显。 阅读全文
posted @ 2019-03-27 22:21 云外孤鸟 阅读(3987) 评论(0) 推荐(2) 编辑