乐水悠悠

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2018年4月21日

摘要: 分词是中文自然语言处理的基础。目前常用的分词算法有 1.张华平博士的NShort中文分词算法。 2.基于条件随机场(CRF)的中文分词算法。 这两种算法的代表工具包分别是jieba分词系统和哈工大的LTP语言技术平台。下面就分别演示这两个工具的使用方法。 jieba包有两个分词函数, 和`cut_f 阅读全文
posted @ 2018-04-21 21:01 乐水悠悠 阅读(1890) 评论(0) 推荐(0) 编辑