摘要: library(tm) library(tmcn) library(rJava) library(Rwordseg) #install.packages('wordcloud') library(wordcloud) #获取data中的聊天信息,写入text.txt中 write.table(data$des,"text.txt",row.names = F) #使用segmentCN进行分... 阅读全文
posted @ 2017-08-17 15:39 绪哥哥 阅读(161) 评论(0) 推荐(0) 编辑
摘要: 生成图如下: 阅读全文
posted @ 2017-08-17 14:35 绪哥哥 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 构思步骤: 1、从data中取出时间数据。 2、从时间数据中提取小时数据。 3、根据日期数据进行汇总每小时的消息数量。 4、利用ggplot2进行绘图。 生成图如下: 阅读全文
posted @ 2017-08-17 13:38 绪哥哥 阅读(642) 评论(0) 推荐(0) 编辑
摘要: 构思步骤: 1、从data中取出时间数据。 2、从时间数据中提取日期数据。 3、根据日期数据进行汇总每日的消息数量。 4、利用ggplot2进行绘图。 最终生成下图: 阅读全文
posted @ 2017-08-17 13:22 绪哥哥 阅读(222) 评论(0) 推荐(0) 编辑
摘要: 先对分析进行简单构思: 1、搜集并格式化数据 a、搜集QQ群记录-从QQ导出txt文档,筛选出需要统计的QQ群记录信息。 b、导入QQ群记录信息,根据\n换行符读取每一行的信息。 c、逐行读取,利用正则表达式判断该行是否是时间行,是的话进行切割,分割出时间和昵称,该行的下一行则为聊天信息。 d、把时 阅读全文
posted @ 2017-08-17 10:21 绪哥哥 阅读(198) 评论(0) 推荐(0) 编辑