会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
利炳根
敲代码、学日语,不做任何付费咨询
博客园
|
首页
|
新随笔
|
新文章
|
联系
|
订阅
|
管理
2018年4月21日
学习笔记CB011:lucene搜索引擎库、IKAnalyzer中文切词工具、检索服务、查询索引、导流、word2vec
摘要: 影视剧字幕聊天语料库特点,把影视剧说话内容一句一句以回车换行罗列三千多万条中国话,相邻第二句很可能是第一句最好回答。一个问句有很多种回答,可以根据相关程度以及历史聊天记录所有回答排序,找到最优,是一个搜索排序过程。 lucene+ik。lucene开源免费搜索引擎库,java语言开发。ik IKAn
阅读全文
posted @ 2018-04-21 09:15 利炳根
阅读(352)
评论(0)
推荐(0)
编辑
公告