搜索框 sug 基本技术方案

一、候选 sug 词数据来源:

商品侧:query 召回的商品数、query 召回的订单数
query侧:QV、QV_CTR、QV_CXR
从这两个角度选出的 query 作为 sug 词候选集

二、数据处理(分析)

规则挖掘、FP算法挖掘、商品标题NER标签提取:功效/品牌/适用群体/适用场景+简名

三、sug 词召回

query:商品侧 vs query侧
query处理:原始query(未处理) vs 改写query
原始query/改写query-->分词-->基于分词结果从候选集中进行前缀召回
原始query/改写query-->拼音前缀匹配召回
原始query/改写query-->连续子串匹配召回

四、排序

query 侧召回的词 > 商品侧召回的词
搜索PV
固定指标:QV_CTR/QV_CXR

五、评价指标

sug 词点击率
搜索框点击跳出率
相关产品功能的转化指标等

六、工程技术方案

https://github.com/hankcs/AhoCorasickDoubleArrayTrie 双数组字典树,key 是查询词,value 支持对象(sug结果词+各种指标(搜索 uv、QV_CTR、QV_CXR))

posted @   大熊猫同学  阅读(1211)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
历史上的今天:
2018-08-28 Spark 整合ElasticSearch
2015-08-28 数据结构--图 的JAVA实现(下)
点击右上角即可分享
微信分享提示