2021 年 8月 14 日随笔档案 - 理想几岁

2021年8月14日

摘要：在英文中，单词之间有空格做天然的分割，分词变得非常简单。但是在中文中就没有那么容易了，所以分词是自然语言处理的基础，分词不好，后面很难去做进一步分析。尽管现在NLP中有很多算法以字来切分，比如bert，中文分词仍然是NLP中很重要、很基础的一块工作。目前已经有许多开源的中文分词工具，比如jieba，阅读全文

posted @ 2021-08-14 16:24 理想几岁阅读(1059) 评论(0) 推荐(0) 编辑