第一次个人编程作业
博客班级 | https://edu.cnblogs.com/campus/fzzcxy/2018CS?filter=all |
---|---|
作业要求 | https://edu.cnblogs.com/campus/fzzcxy/2018CS/homework/11732 |
作业目标 | 数据采集,数据处理,数据分析展示 |
作业源代码 | https://github.com/lpf9493/first-personal-work/edit/main/README.md |
学号 | 211808663 |
代码行数:27 | |
工作 | 用时 |
前期准备 | 2天 |
数据采集 | 1h |
构造词云图 | 1h |
数据采集: | |
打开网络搜索腾讯视频电视剧《在一起》的评论,按f12查看源代码 | |
对比发现加载一次更多评论,source加一,cursor起始值为0,因为很久没用爬虫所以有些忘记,借鉴了其他的代码
通过爬取评论得到下图
构造词云图:
因为不会使用分词软件,所以直接进行网络上构造词云图,通过http://www.picdata.cn/picdata/indexb.php来进行构造
因此生成词云图:
最后通过上传到github仓库中。
感觉自己还是有很多不会的东西需要学习,才能更好的完成任务。
参考文献:
构成词云图软件:http://www.picdata.cn/picdata/indexb.php
https://my.oschina.net/u/4397001/blog/3421754
https://www.cnblogs.com/211808334xuwenhao/p/14450285.html