摘要:ICTClAS分词系统是由中科院计算所的张华平、刘群所开发的一套获得广泛好评的分词系统,难能可贵的是该版的Free版开放了源代码,为我们很多初学者提供了宝贵的学习材料。 但有一点不完美的是,该源代码没有配套的文档,阅读起来可能有一定的障碍,尤其是对C/C++不熟的人来说.本人就一直用Java/VB作为主要的开发语言,C/C++上大学时倒是学过,不过工作之后一直没有再使用过,语法什么的忘的几乎一干二净了.但语言这东西,基本的东西都相通的,况且Java也是在C/C++的基础上形成的,有一定的相似处.阅读一遍源代码,主要的语法都应该不成问题了.虽然在ICTCLAS的系统中没有完整的文档说明,但是我.
阅读全文
随笔分类 - 自然语言
摘要:接口文档ICTCLAS2011接口文档ICTCLAS2009接口文档ICTPOS3.0 词性标注集相关论文Chinese Name Entity Recognition Using Role ModelHHMM-based Chinese Lexical Analyzer ICTCLASAutomatic Recognition of Chinese Unknown Words基于多层隐马模型的汉语词法分析研究基于N-最短路径方法的中文词语粗分模型基于角色标注的中国人名自动识别研究基于角色标注的中文机构名识别其他ICTCLAS学习笔记计算所汉语词性标记集(ICTPOS3.0)N-Gram及其.
阅读全文