十一周周六
今天是打算做两个图,因为一个图太乱了,而且效果也出不来,人机交互效果不好,所以打算做:人物-机构-行为图,人物-地点-机构图,第一个涉及到关系,第二个只是简单统计该类关键字之下涉及到了哪些区域、人物、机构,以及频率。目前第二个图效果:
提取的内容不是很准确现在,所以后期打算把语料库全部更新。现在接着做第一张图。
行为关系拆分:先以句号作为切分,然后按逗号切分,提取每个逗号话里面的人物及行为(如果一个逗号话里面涉及多个人物和多个行为,视为,两人都有该行为);如果一逗号话里面既涉及人物也涉及机构,视为机构和任务均具有该行为;如果一个逗号话里面只有行为没有人物或者机构,往上追溯,直至有人物或机构出现,进行归并。
按照句号对新闻拆分,大致思路:
这样的行为规则肯定不太准确,这个目前还没有想到别的想法。。难道智能一逗号话里面人物行为同时出现对应吗?这个现在思考的不是太好。。。
第一张图(目前是提取的占比前20的人物和机构):
大概效果是这样,目前最大的问题就是提取的内容不准确,这个后期会如上说的更新语料库进行更改。