摘要: 前言 前文介绍过用Python写爬虫,但是当任务多的时候就比较慢, 这是由于Python自带的http库urllib2发起的http请求是阻塞式的,这意味着如果采用单线程模型,那么整个进程的大部分时间都阻塞在等待服务端把数据传输过来的过程中。所以我们这次尝试用node.js去做这个爬虫。 为什么选择 阅读全文
posted @ 2019-03-28 14:27 高级生命体 阅读(1011) 评论(0) 推荐(0) 编辑
摘要: 列表[List] 元组(truple) 字典{dict} 生成器(generator) 带有 yield 的函数在 Python 中被称之为 generator(生成器) 迭代器 iterator 迭代器是访问集合元素的一种方式。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代 阅读全文
posted @ 2019-03-28 09:18 高级生命体 阅读(246) 评论(0) 推荐(1) 编辑