11 2019 档案
摘要:这两天一直在忙别的事,上次查完毕设还没来的及细想。 要细化他们的行为,首先应该重新构建一下动作行为的语料库,重新设计一下动作行为的流程,这个要细作一下。最终的数据效果应该是清洗之后展现的有用的(出现频率高,最能代表这个人的行为的)数据。 然后打算这几天做一个当天热点展示页面,当天热点新闻追踪的内容。
阅读全文
摘要:DELETE FROM wynews WHERE title IN (SELECT * FROM (SELECT title FROM wynews GROUP BY title HAVING COUNT(title) > 1) t1...
阅读全文
摘要:今天也是很失败的一天了,但是今天可以说是这周最认真的一天,但是今天脑子没跟上。 今天主要是做了媒体统计展示的功能,试了很多图,然后有个图和所有图都冲突,无奈搞了很久就把他放弃了,最后选了个简单的展示了。。。这里就不放图了,太丢人了。本来是打算这两天把专题舆情这个模块做完,结果也没完成,明天还得再做个
阅读全文
摘要:今天是打算做两个图,因为一个图太乱了,而且效果也出不来,人机交互效果不好,所以打算做:人物-机构-行为图,人物-地点-机构图,第一个涉及到关系,第二个只是简单统计该类关键字之下涉及到了哪些区域、人物、机构,以及频率。目前第二个图效果: 提取的内容不是很准确现在,所以后期打算把语料库全部更新。现在接着
阅读全文
摘要:今天用了关系图走了关系,但是效果看上去和难受: 位置没有控制好。下面是官网的图: 为了人机交互能有个更好的效果,打算把这些内容分成几张图来展示。。。。。哎,这个图真失败。
阅读全文
摘要:经过上周以及前几天的设计写吧,现在有了个基本的页面。今天打算把监测这块弄的细一点,页面如下: 下午先试着确定监测范围,之后换一个热力图,把这一块再细化细化。
阅读全文
摘要:创建 代码: js: 效果: 原因: html代码:这种获取选中标签的方式,是通过监听body来实现的,所以body上要增加这个onclick(this)
阅读全文
摘要:今天又一次被导师训了,怎么也达不到他的要求,好像我俩不在一条线上。所以现在重新整理一遍思路,继续走。 我认为重点还是主题追踪这一块,但是主题追踪的结果以及显示是个问题,目前还是打算做出来当天最热的前几条新闻的热度曲线,之后进行每个新闻的数据关联关系随着日期的变化而不断变化(语义分析)。 先界面在功能
阅读全文
摘要:上周最终的成果是做到了主题追踪,但目前仅限于已有网站的追踪,很不成熟,最终效果: 下一步打算继续将主题追踪完善,进行可视化展示以及话题随时间变化而产生的数据关联图,如下: 这个图将随着时间而不断变化扩大。 参考了一下其他舆情网站的试用产品,打算将主题追踪这块做的细一点,目前打算实现效果如下: 现在做
阅读全文
摘要:灰常感激我的一个同学,点拨了我一下子! 追踪:某天到达某一时刻的所有新闻的所有热度即为当前查看时的某天的热度,随着时间不断变化。
阅读全文
摘要:今天主要将提取地主题词入库以及重新对新闻分类。 测试了一下单纯使用主题词作为主题追踪依据不是很好,明天尝试使用特征值提取(主题词(名词实体))+摘要比对综合。但是目前还没想好是每篇新闻的都要追踪还是热点新闻的进行追踪,也就是对爬虫和响应这里不是搞得很清楚。 今天进度很小,自闭了。
阅读全文
摘要:今天由于自己的原因进度不是很大,今天整理了一下全网关联的思路流程(个人可能就是那种没自信,在思路不知道对不对的情况下不敢下手那种渣渣),和之前的一个学长讨论了一下大概思路流程,如下: (1)使用LDA模型提取一篇新闻主题词,确定最大概率主题词; (2)新闻追踪时使用主题与主题之间的关联(相似度比对)
阅读全文
摘要:周二的主题提取使用LDA模型进行了简单的测试,效果还可以。主要是提取的分词的结果,LDA:随机生成文章各个主题比例,再根据各个主题随机生成词,词与词之间的顺序关系被彻底忽略了,这就是LDA眼中世间所有文章的生成过程! 参考博客:https://blog.csdn.net/aws3217150/art
阅读全文
摘要:运行结果: 两个进程同时运行,输出的结果并不是按照某个固定的顺序进行的,是随机产生的,无规律可言。 参考博客:https://blog.csdn.net/zyj0813/article/details/78345617
阅读全文

浙公网安备 33010602011771号