摘要:
本文旨在介绍如何利用HanLP训练分词模型,包括语料格式、语料预处理、训练接口、输出格式等。 目前HanLP内置的训练接口是针对一阶HMM-NGram设计的,另外附带了通用的语料加载工具,可以通过少量代码导出供其他训练工具使用的特定格式(如CRF++)。 阅读全文
posted @ 2019-02-13 14:52 左手中倒影 阅读(292) 评论(0) 推荐(0) 编辑
|
|||
摘要:
本文旨在介绍如何利用HanLP训练分词模型,包括语料格式、语料预处理、训练接口、输出格式等。 目前HanLP内置的训练接口是针对一阶HMM-NGram设计的,另外附带了通用的语料加载工具,可以通过少量代码导出供其他训练工具使用的特定格式(如CRF++)。 阅读全文
posted @ 2019-02-13 14:52 左手中倒影 阅读(292) 评论(0) 推荐(0) 编辑 |
|||