随笔分类 - part90 爬虫
摘要:一、介绍 Scrapy一个开源和协作的框架,其最初是为了页面抓取 (更确切来说, 网络抓取 )所设计的,使用它可以以快速、简单、可扩展的方式从网站中提取所需的数据。 但目前Scrapy的用途十分广泛,可用于如数据挖掘、监测和自动化测试等领域,也可以应用在获取API所返回的数据(例如 Amazon A
阅读全文
摘要:一、安装 1、 官网下载:https://www.mongodb.com 2、找到箭头所指 3、等待下载loading 4、下载完毕开始安装 5、按照图示 6、选中Custom选项 7、更改路径:点击Browser:D:\MongoDB\ 8、点击next 9、确保Data Directory 和L
阅读全文
摘要:分析 天猫控制登录字段: sort: 排序 s:起始第几个商品 如:http://list.tmall.com/search_product.htm?s=60&q=Ůװ&sort=s 跳转到登录页面 如果想正常访问,删除字段sort与s http://list.tmall.com/search_pr
阅读全文
摘要:分析 https://movie.douban.com/j/new_search_subjects?sort=U&range=0,10&tags=%E7%94%B5%E5%BD%B1,%E9%9D%92%E6%98%A5&start=0&genres=%E5%89%A7%E6%83%85&count
阅读全文
摘要:一、什么是爬虫 1、爬虫的比喻: 互联网就像一张蜘蛛网,爬虫相当于蜘蛛,数据相当于猎物 2、爬虫的具体定义: 模拟浏览器向后端发送请求,获取数据,解析并且获得我想要的数据,然后存储 3、爬虫的价值: 数据的价值 发送请求(requests)——获取数据——解析数据(bs4,pyquery,re)——
阅读全文