摘要: 一、热点产业分析 以“力度词表”为基础,使用hanlp分词技术,分析国家大力发展的热点产业和经济发展因素。 二、重点词词频计算 按照主题词进行分类统计个主题政策的重点词汇的词频、占比等信息。 三、经济发展热点因素的相关性分析 根据之前计算的经济发展因素的总词频和国家GDP的曲线进行对比,分析经济发展 阅读全文
posted @ 2021-12-06 21:48 程序那点事 阅读(78) 评论(0) 推荐(0) 编辑
摘要: 一、确定标准政策主题词分类 从政府官方网站上(http://sousuo.gov.cn/s.htm)爬取标准政策主题词分类 二、模型训练和数据补全 以在政府官方网站上(http://sousuo.gov.cn/s.htm)的政策数据为训练集训练模型,并用模型预测补全从其他网站爬取的政策的主题词。 三 阅读全文
posted @ 2021-12-06 21:38 程序那点事 阅读(138) 评论(0) 推荐(0) 编辑
摘要: 一、政策正文解析 根据政策标题对政策进行切割,使用hanlp对切割后的段落进行解析,总结出段落核心内容。 二、关联关系分析 根据之前切分好的政策,以段落为基本单位使用hanlp文本相似计算方法,找出关联政策并使用图谱展示 三、关联政策力度分析 根据hanlp对政策进行分词处理,并以“力度词表”为基础 阅读全文
posted @ 2021-12-06 21:19 程序那点事 阅读(75) 评论(0) 推荐(0) 编辑