专题实战 | 如何快速构建高质量电商行业搜索?

简介:本文详细介绍如何快速接入智能开放搜索(OpenSearch)电商行业增强版,助力企业实现高质量搜索效果,提升业务转化率及用户产品体验!

电商搜索特点

1. 关键词堆砌

例如:明星同款夏季连衣裙包邮;

2. 词序对语义影响不大

例如:明星同款女夏季连衣裙包邮,女夏季连衣裙包邮明星同款;

3. 类目预测问题

例如:当用户查询“苹果”时,可能查询的是水果,也可能是手机品牌;

4.查询召回文档相关性差

核心词识别不准确,分词不准确;

5. 搜索引导的业务转化比重较大

据统计,综合类电商搜索引导转化占比40%以上,垂直类电商搜索引导转化占比60%以上;

6. 稳定性要求较高,支持弹性扩容

活动、大促系统QPS可能是平时的百倍千倍,需要平滑的扩缩容,保障系统的稳定;

开放搜索电商行业方案优势

  1. 基于淘系同款搜索引擎-问天(Ha3),提供更高性能的搜索服务,系统稳定高效,海量数据实时更新;
  2. 电商行业知识图谱能力,支持电商属性的分词、纠错、同义词、停用词、实体识别、词权重、类目预测等行业查询语义理解能力,精准定位用户搜索意图,提升业务转化,降低无结果率;
  3. 丰富的电商搜索服务经验,源自阿里巴巴内部搜索技术的云服务输出,集团内500+业务接入,阿里云电商客户服务数千家;
  4. 通过引擎侧的多路召回能力,支持搜索结果、下拉提示、底纹词等场景实现个性化搜索服务;
  5. 轻松接入,快速上手,一键式接入行业模板,可根据自身业务自定义选择功能,并满足非技术人员业务干预调优与数字化运营需求;

了解更多电商搜索能力:https://c.tb.cn/F3.0VTxwn

开放搜索电商增强版接入流程

注册阿里云账号(已有账号无需注册),并实名认证,创建好实例,如果是非本人使用,可以授权子账号权限,更多详情查看>

如果您已经对搜索有一定的了解或者是已经使用过开放搜索产品,则可以参考功能流程图以便更快速、更全面的了解开放搜索的能力。

表结构设计

接入开放搜索前,需要预先设计好表结构(可单表,可多表join),以便后期应对各种搜索业务场景和数据推送场景。目前开放搜索支持的多表场景如下:

详情可参考应用结构--->创建多表join

注意

电商行业模板中以下字段是必须字段,类型、字段标签固定,字段名称可自定义:

数据接入

开放搜索支持用户通过数据源将数据接入搜索,也支持无数据源,通过API/SDK/控制台上传文件的方式导入数据详情如下:

  1. RDS数据源配置
  2. MaxCompute(原ODPS)数据源配置
  3. POLARDB数据源配置
  4. API/SDK数据导入

电商行业模板配置

选择分析器

电商行业模板中以下索引标签、分析方式固定,索引名称可自定义:

开放搜索还向用户提供了面向其他行业、语言的分析器,如有相应业务需求,可参考内置分析器

设置查询分析规则

查询分析模板请选择,系统默认勾选的分析包:

查询分析的详情内容可点击此处进行参考。

设置排序策略

电商行业模板会自动根据用户配置的应用结构中的字段、索引去生成适合该应用的基础排序和业务排序,详情如下:

基础排序

0.6*static_bm25()+0.4*normalize(sales)

业务排序

query_match_ratio(cate_id) * 1000 + floor( if(field_match_ratio(brand) == 1, 1, field_match_ratio(brand) * query_match_ratio(brand)) + if(text_relevance(product_title) + text_relevance(cate_id) + text_relevance(brand) == 0, -1, 0) ) * 1000 + (text_relevance(product_title, default, true) * 0.3 + text_relevance(cate_id) + text_relevance(brand) + 0.5) * (normalize(sales) + 0.3) * if(is_sale, 1, 0.9) * timeliness_ms(up_time)

开放搜索中的排序策略较为灵活,您可根据自己的业务需求进行修改或自定义,详情可参考排序表达式配置

搜索引导服务

下拉提示模型配置

下拉提示是搜索服务的基础功能,在用户输入查询词的过程中,智能推荐候选query,提高用户输入效率,帮助用户尽快找到想要的内容。

热搜底纹模型配置

热搜和底纹是一个完整搜索引擎必备的基本功能,通常占据着搜索框入口的重要位置,提供不可或缺的业务价值。

原文链接

本文为阿里云原创内容,未经允许不得转载。 

posted @   阿里云云栖号  阅读(274)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
历史上的今天:
2021-01-28 如何做好性能压测丨压测环境设计和搭建
2021-01-28 云企业网CEN-TR打造企业级私有网络
2021-01-28 对话阿里云李飞飞:下一代企业级数据库6大技术方向
2021-01-28 「直播实录」中英数据库专家谈:数据库的过去、未来和现在
2021-01-28 Flink 助力美团数仓增量生产
2019-01-28 15分钟在笔记本上搭建 Kubernetes + Istio开发环境
点击右上角即可分享
微信分享提示