posts - 145,comments - 23,views - 73万

1.IK分词器是否选择智能分词的问题:IK分词器的智能分词粒度是非常粗的,比如说对 "安阳市人民政府" 来进行分词,智能分词的分词结果是 [安阳市][人民政府]。而不使用智能分词的时候分词的结果是 [安阳市][安阳][市][人民政府][人民][民政][政府]。显然,在不考虑模糊匹配的情况下 当用户输入 "安阳",“人民”,“民政”,“政府” 等这些词的时候使用智能分词是不能够匹配的到的。只有输入“安阳市”或者是“人民政府”才能够匹配的到。应该说不通的分词算法有不同的使用场景,在我做毕业设计的时候没有用智能分词,因为老师测试的时候是把一句话拆分成许多关键字来分别输入测试的。当他输入的关键词屡屡查询不到的时候,就会质疑你这个搜索的功能做的不好。

2.给关键词加高亮的时候遇到的一些问题:我要对搜索结果中的文章标题和文章简介中命中的关键词加上高亮显示的功能,但是发现如果标题中没有包含用户输入的信息分词之后的关键字的话标题 内容还原之后就变成空了,简介中如果也不包含的话简介显示在页面上的也是空,后来查找API发现,原来HighLighter.getBestFragment(TokenStream, String);在进行高亮的时候如果输入的字符串包含相应的关键词的话就会返回高亮之后的结果,如果字符串不包含相应的关键词的话返回的是null,而不是返回原来的字符串,而我的程序是把从Document中得到的域值做为高亮的输入字符串了然后直接在页面上显示这个值了,所以,不包含关键词的域值就显示不出来了。这里只需要加一个判断,把高亮之后变为空的哪些值再重新设置为域的值返回即可, 虽然是个小问题,但归根到底是自己对API不熟悉,所以以后要加强学习。

posted on   梦中彩虹  阅读(285)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
< 2013年5月 >
28 29 30 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 1
2 3 4 5 6 7 8

点击右上角即可分享
微信分享提示