王瑞---第一次个人编程作业
博客班级 | https://edu.cnblogs.com/campus/fzzcxy/2018CS |
---|---|
作业要求 | https://edu.cnblogs.com/campus/fzzcxy/2018CS/homework/11732 |
作业目标 | 爬取腾讯视频《在一起》并且进行高频词统计和词云图展示 |
作业源代码 | https://github.com/wr110/first-personal-work |
学号 | 211806238 |
时间分布
要求 | 内容 |
---|---|
代码行数 | 28行 |
分析时间 | 2h |
编程时间 | 2h |
步骤 | |
通过比对网页的url, 只有last_id是不同的 | |
打开js界面,有v2开头的点开可以看到如下界面 | |
这里是用正则匹配last,内容保存在comment.txt中 | |
内容如下 | |
数据处理 | |
下载jieba | |
这里是利用pycharm导入jieba包 | |
在网上搜索了关于jieba包的使用方法和操作 | |
以下是代码 | |
统计了共20个高频词 | |
利用js插件echarts.js,绘制词云图 | |
之前没有学过html的内容 | |
所以从网上下载echarts的插件后百度了模板将数据输入 | |