随笔分类 -  爬虫实战

摘要:前言 前几周做了个使用Selenium的项目,踩了好多好多好多的Selenium的坑,越来越感觉他作为一个第三方库,对于Chrome的操作实在是有局限。另外,推荐大家一个Selenium之外的操作浏览器的选择:puppeteer(https://github.com/GoogleChrome/pup 阅读全文
posted @ 2020-08-25 21:13 蛮三刀酱 阅读(1004) 评论(0) 推荐(0) 编辑
摘要:前言 最近做了一个python3作业题目,涉及到: 网页爬虫 网页中文文字提取 建立文字索引 关键词搜索 涉及到的库有: 爬虫库:requests 解析库:xpath 正则:re 分词库:jieba ... 放出代码方便大家快速参考,实现一个小demo。 题目描述 搜索引擎的设计与实现 输入:腾讯体 阅读全文
posted @ 2020-08-22 18:04 蛮三刀酱 阅读(1081) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示