摘要: 这一次我们需要利用HanLP进行文本分类与情感分析。同时这也是pyhanlp用户指南的倒数第二篇关于接口和Python实现的文章了,再之后就是导论,使用技巧汇总和几个实例落。真是可喜可贺啊。文本分类在HanLP中,文本分类与情感分析都是使用一个分类器,朴素贝... 阅读全文
posted @ 2018-09-24 20:27 FontTian 阅读(3579) 评论(0) 推荐(0) 编辑
摘要: 文本推荐该部分的内容之所以在一起是因其底层原理相同。文本推荐,语义距离,同义改写等都是基于word2vec的。因为作者HanLP源代码和博客都没有写该部分的原理。所以笔者大概查看了源码,发现功能实现原理非常之简单,就是根据文档与给定单词的距离进行打分,而这个... 阅读全文
posted @ 2018-09-24 18:00 FontTian 阅读(2221) 评论(1) 推荐(0) 编辑
摘要: 依存句法分析器在HanLP中一共有两种句法分析器依存句法分析基于神经网络的高性能依存句法分析器MaxEnt依存句法分析基于神经网络的高性能依存句法分析器HanLP中的基于神经网络的高性能依存句法分析器参考的是14年Chen&Manning的论文(A Fast... 阅读全文
posted @ 2018-09-24 13:41 FontTian 阅读(1721) 评论(0) 推荐(0) 编辑
摘要: 繁简转换HanLP几乎实现了所有我们需要的繁简转换方式,并且已经封装到了HanLP中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合。这里我们不再做过多描述。说明HanLP能够识别简繁分歧词,比如打印机=印表機。许多简繁转换工具不能区分“... 阅读全文
posted @ 2018-09-24 13:39 FontTian 阅读(611) 评论(0) 推荐(0) 编辑