随笔分类 - 爬虫实战
摘要:前言 前几周做了个使用Selenium的项目,踩了好多好多好多的Selenium的坑,越来越感觉他作为一个第三方库,对于Chrome的操作实在是有局限。另外,推荐大家一个Selenium之外的操作浏览器的选择:puppeteer(https://github.com/GoogleChrome/pup
阅读全文
摘要:前言 最近做了一个python3作业题目,涉及到: 网页爬虫 网页中文文字提取 建立文字索引 关键词搜索 涉及到的库有: 爬虫库:requests 解析库:xpath 正则:re 分词库:jieba ... 放出代码方便大家快速参考,实现一个小demo。 题目描述 搜索引擎的设计与实现 输入:腾讯体
阅读全文