会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
rui
博客园
首页
新随笔
联系
订阅
管理
2019年9月4日
大数据之路【第十三篇】:数据挖掘---中文分词
摘要: 一、数据挖掘 中文分词 • 一段文字不仅仅在于字面上是什么,还在于怎么切分和理解。• 例如: – 阿三炒饭店: – 阿三 / 炒饭 / 店 阿三 / 炒 / 饭店• 和英文不同,中文词之间没有空格,所以实现中文搜索引擎,比英文多了一项分词的任务。• 如果没有中文分词会出现: – 搜索“达内”,会出现
阅读全文
posted @ 2019-09-04 01:30 Simon92
阅读(1582)
评论(0)
推荐(0)
编辑
公告