摘要: 1. Boolean representation word_dict = ['我们', '又', '去', '爬山', '今天', '你们', '昨天', '跑步'] def booleanRepresent(user_input): count = {} for word in word_dic 阅读全文
posted @ 2020-01-05 19:50 RamboBai 阅读(410) 评论(0) 推荐(0) 编辑
摘要: 本文转载自: https://zhuanlan.zhihu.com/p/58163299 最近我在学习自然语言处理,相信大家都知道NLP的第一步就是学分词,但分词≠自然语言处理。现如今分词工具及如何使用网上一大堆。我想和大家分享的是结巴分词核心内容,一起探究分词的本质。 (1)、基于前缀词典实现高效 阅读全文
posted @ 2020-01-05 13:25 RamboBai 阅读(2887) 评论(0) 推荐(0) 编辑