课题简介:
“自动化学科创新思想与科学方法研究”课题,编号2009IM020300。 项目旨在对影响国内自动化领域发展的知识要素(包括 人物、机构、研究对象等)进行系统分析,形成知识体系,构建知识服务网络平台,提供知识服务,促进知识创新。
项目涉及文献情报分析与研究、知识关联与服务等层面,但是在底层数据获取的方面需要依赖于文本挖掘技术。
资源简介:
论文:
PPT:
数据专区:http://www.datatang.com/member/5878
以下算法在论文中都有提到,
人名消歧和机构名称归一http://download.csdn.net/detail/finallyliuyu/5491655
科技术语或者说是关键词的聚类算法:http://download.csdn.net/detail/finallyliuyu/5491665
知识族谱形成算法:http://download.csdn.net/detail/finallyliuyu/5491675
以上三个算法,写的比较乱,也没有时间进行优化了,有需要的自己费劲看一下吧。大致的框架是main函数调用DataBaseManagement类,再进行算法的调用。
文本分类程序代码:http://www.datatang.com/data/13483 这个放在了数据堂已经有一定的下载量了。