简介: 本文详细介绍智能开放搜索OpenSearch行业版在跨境电商领域的智能搜索应用。
典型业务场景
搜索是电商场景的核心流量入口,在跨境电商、国际电商场景下亦是如此。在跨境电商搜索场景中,涉及多语言、多场景复杂搜索条件,搜索处理尤为复杂。首先,需要识别不同搜索场景下的语言类型,确定目标商品池。然后,识别用户查询意图,针对不同语言类型进行关键词改写和商品召回。最后,预测召回商品的潜在点击率,根据用户特征千人千面的返回搜索结果。
上述跨境电商搜索业务能最大程度的满足多语言场景下的用户搜索需求,同时提升搜索引导的点击率、GMV,满足业务增长诉求。
搜索核心痛点
- 需要多语言搜索算法模型,自研搜索缺少数据、经验积累。特别是在中文搜索时召回结果偏少,无结果率过高,用户体验不佳
- 跨境场景下,多语言业务搜索配置困难,需要针对不同语言进行特殊处理
- 无法实现千人千面的的个性化搜索
- 搜索引导购买效果不佳,业务增长面临瓶颈
解决方案
开放搜索中文电商场景下的最佳实践已经过丰富的验证,可参考:电商行业搜索最佳实践
本文主要介绍在英文电商领域的解决方案
电商英文行业分词模型
英文自带空格切分,大部分场景下可以基于空格分词。但实际搜索中,用户输入关键词有时会漏掉空格,出现连写情况,不做正确分词会导致搜索无结果。
对于电商英文行业,OpenSearch汇集多个相关数据来源,利用亿万级数据训练了英文电商行业增强版分词模型,支持英文连写等场景下的小粒度切分,提升英文搜索召回率。
电商英文行业词权重模型
词权重在query改写和相关性算分阶段都起到重要作用,通用版的词权重模型没有覆盖英文商品描述,在产品词、品牌词、修饰词的权重上表现较差。
针对电商英文行业,OpenSearch基于英文电商行业数据、BERT模型训练深度词权重模型,精准预测每个词的权重,提高搜索召回率与相关性排序效果。

电商英文行业向量召回模型
相比传统文本搜索需要通过分词、同义词、纠错、词权重改写等算法技术增强语义搜索效果,基于深度学习的语义向量召回模型具备更强大的表征能力,可以更好地处理用户查询词中的简写、别名、拼写错误等情况。

OpenSearch和阿里达摩院合作自研的向量召回技术,在业界知名榜单MS MARCO上夺冠。结合电商英文行业数据训练的向量召回模型在OpenSearch行业增强版对客户透出。
配置流程
开放搜索英文电商行业增强版支持基于模板一键式完成搜索全链路配置,更多使用方法请参考 接入流程。
客户价值
某中英文跨境电商行业客户,通过约10个工作日完成POC接入后:
- 整体业务搜索加购率提升超过25%,UV-CTR提升超过8%,搜索引导GMV转化提升10%以上
- 长尾query无结果率降低80%
- 基于个性化排序模型,实现千人千面的搜索结果展示
填写问卷享开放搜索英文电商行业版首月半价试用:https://page.aliyun.com/form/act4137000/index.htm
如果你想与更多开发者们进行交流、了解最前沿的搜索与推荐技术,可以钉钉扫码加入社群

本文为阿里云原创内容,未经允许不得转载。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
2021-11-01 阿里云消息队列 RocketMQ 5.0 全新升级:消息、事件、流融合处理平台
2021-11-01 Serverless 工程实践 | 自建 Apache OpenWhisk 平台
2021-11-01 一图速览 | DTCC 2021大会,阿里云数据库技术大咖都聊了些什么?
2021-11-01 业内首款云原生技术中台产品云原生 Stack 来了!
2021-11-01 跨越行业绊脚石,阿里云函数计算发布 7 大技术突破
2019-11-01 一文带你了解 Flink Forward 柏林站全部重点内容