陋室铭
永远也不要停下学习的脚步(大道至简至易)

posts - 2169,comments - 570,views - 413万

现在有个需求是这样子的:
需要计算搜索词的权重设置其为总排序权重的0.6,其他因素的权重为0.4
其他因素中还有详细的划分.
这里我们用Solr如何来实现?众所周知solr默认的排序方式为按照文本相似度来进行降序排列的,现在我们要将打分的Score作为排序的一个因子来利用.就需要单独的获取到Score.
网上是有一些通过继承类来实现的方式的.这里我不再累述,而说一种通过Solr内置的函数来实现的方式.

solr提供了函数查询的方式,也能用函数的计算结果来作为排序的字段.我们用solr的函数是可以拿到查询的score打分的,下面给出相应的证明:

原始查询打分如图:下面使用solr获取可以操作的score,如图:能看出来,我们自己得到的myscore和原始的score的大小是一致的.



下面看一个例子及其相应的打分函数的实现:



①匹配权重系数:0.6,
权重因子系数:
标题 0.6   正文0.4
②其他权重系数:0.4
评论得分:0.3
点赞数得分:0.25
最后评论时间得分:0.2
浏览量得分:0.15
收藏数得分:0.1


拿搜索词 话题 来举例子,函数如下:

myscore:sum(product(scale(query({!v='topicName:"话题"^3  OR topicContent:话题^2'}),0,1),0.6),product(sum(product(scale(topicReplyNum,0,1),0.3),product(scale(likeCount,0,1),0.25),product(scale(collectionNum,0,1),0.1),product(scale(countPV,0,1),0.15),product(scale(lastReplyTime,0,1),0.2)),0.4))



我们用函数来排序能看出来综合排序是有效果的,score大的不一定在前面了
由于考虑到性能问题,真正代码实现时可以牺牲一部分的准确性,先离线计算一下其他部分的分值,存储起来,直接综合文本相似度和其他权重即可.能提高一部分的查询效率.但是数据量太大还是会存在问题(需要考虑做rerank来进行一个topN的精确排序)
离线部分索引代码和查询部分的生成排序的函数如下:

查询部分的排序字段使用函数来实现:到此基本上综合多因素排序部分基本上可以算完成了,下面就是根据的搜索效果来调整算法和参数了!

posted on   宏宇  阅读(938)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
阅读排行:
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用
· 按钮权限的设计及实现
历史上的今天:
2013-10-30 asp.net mvc Partial OutputCache 在SpaceBuilder中的应用实践
2013-10-30 输出缓存与CachePanel
2012-10-30 win2008WEB服务器集群实践(转)
2009-10-30 总结一些做人的标准
2008-10-30 C# 内置类型表
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示