摘要: 1、爬虫核心:爬取网页数据,解析数据,爬虫和反爬之间的博弈。 2、爬虫用途:数据分析/人工数据采集,社交软件冷启动,舆情监控,竞争对手监控。 3、爬虫分类 通用爬虫:抓取的数据大多是无用的,不能根据用户的需求来精准获取数据。 搜索引擎 网站排名SEO:竞价排名 聚焦爬虫:根据需求,实现爬虫程序,抓取 阅读全文
posted @ 2022-04-11 15:26 归零19 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 爬虫时用到pip指令下载scrapty包。 pip:安装python时会自动下载并安装pip。pip -V查看版本,如果没有可能没有添加环境变量。 pip是一个现代的,通用的python包管理工具,提供了对python包管理工具。提供了对python包的查找、安装、卸载的功能,便于我们对python 阅读全文
posted @ 2022-04-11 14:49 归零19 阅读(21) 评论(0) 推荐(0) 编辑