会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
summerkiki
Great things never came from comfort zones
博客园
首页
新随笔
联系
订阅
管理
2016年2月22日
信息检索导论 第二章 阅读笔记
摘要: 1. 词条化是将给定的字符序列拆分成一系列子序列的过程,其中每个子序列称为一个词条(token)。在这个过程中,可能会同时去掉一些特殊字符,如标点符号等。 输入:Friends, Romans, Countrymen, lend me your ears; 输出:Friends Romans Cou
阅读全文
posted @ 2016-02-22 20:09 summerkiki
阅读(503)
评论(0)
推荐(0)
编辑