摘要: 这里用的是json+re+requests+beautifulsoup+多线程1 import json 2 import re 3 from multiprocessing.pool import Pool 4 5 import requests 6 from bs4 import BeautifulSoup 7 from config import * 8 ... 阅读全文
posted @ 2018-09-01 23:41 BruceLong 阅读(1016) 评论(0) 推荐(0) 编辑
摘要: 今天闲着没事,不想像书上介绍的那样,我相信所有的数据都是有规律可以寻找的,然后去分析了一下淘宝的商品数据的规律和加密方式,用了最简单的知识去解析了需要的数据。 这个也让我学到了,解决问题的方法不止一个,我们要常常学会去思考,学会去学习,相信我们爬虫还是可以拿到我们想要的一切需要的数据。 我也对数据感 阅读全文
posted @ 2018-09-01 23:17 BruceLong 阅读(3151) 评论(0) 推荐(1) 编辑
摘要: 淘宝密码(爬虫爬取淘宝美食的数据源码)正则匹配找规律import reimport requests# 在搜索框中输入美食得到的数据q=%E7%BE%8E%E9%A3%9Furl = 'https://s.taobao.com/search?q=%E7%BE%8E%E9%A3%9F'response 阅读全文
posted @ 2018-09-01 21:56 BruceLong 阅读(801) 评论(0) 推荐(0) 编辑