摘要: 实例3--股票数据定向爬虫 程序结构如下: 1.先从网站中获取股票代号列表(requests库,re库) 2.遍历每一只股票,从股票信息网站中获得详细信息 3.使用字典的数据结构,写入文本文件中 以下为代码: 由于requests库爬虫的限制,我运行后速度会比较慢,后续可尝试scrapy爬虫。 又想 阅读全文
posted @ 2017-10-12 21:00 从菜鸟开始 阅读(4862) 评论(0) 推荐(0) 编辑
摘要: 实例2--淘宝商品信息定向爬虫 在程序结构上仍然与实例1类似: 1.调用requests库获取目标网页内容 2.调用re库搜索得到目标信息,并返回列表 3.打印得到的列表 代码如下: 该程序的关键是使用合适的正则表达式去搜索商品(此处商品为书包)的相关信息!! 程序输出如下: 阅读全文
posted @ 2017-10-12 15:31 从菜鸟开始 阅读(817) 评论(0) 推荐(0) 编辑