爬虫爬取微博关键词
前言
用了 上一个项目作为载体,该项目中有些代码需要修改
安装python
准备工作
- 进入
- 进入
- 安装所需要的库:
pip install scrapy
pip install -r requirements.txt
pip install jieba
pip install matplotlib
pip install imageio
设置参数
-
进入
-
打开
-
修改搜索词,开始日期,结束日期。
爬取
-
进入
-
进入
-
执行
scrapy crawl search
-
等待爬取,不要点击
-
得到结果文件文件夹,结果为 格式
-
将 改成英文名防止路径中文编码
统计
-
进入结果 文件,把除了评论内容的列全部手动删除
-
执行
设置输入输出文件路径
-
得到
-
执行 ,得到词云图和词频 。
本文作者:misasteria
本文链接:https://www.cnblogs.com/misasteria/p/16749444.html
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步