简介: 本文将详细介绍如何通过“开放搜索(OpenSearch)内容增强版“在文娱垂类场景的应用,提升用户搜索体验,带来更多的业务转化
内容搜索的价值主要体现在两个方面:
对用户而言,用户将搜索作为寻找内容的工具,目标是“搜的到,搜的准”。用户更关心搜索结果的相关性、时效性和多样性。
对平台而言,搜索是内容消费、流量引导的核心入口,目标是提升用户满意度与留存率。更进一步,搜索还能支持平台的宣发和商业价值,实现业务增长与流量变现。
常见文娱搜索场景
- 新闻、资讯搜索
- 社区、论坛、话题搜索
- 影音娱乐搜索
- 在线阅读小说、网漫、文章搜索
- 图像、视频搜索
文娱搜索业务特点
- 搜索效果需保证时效性和个性化
- 涉及多频道、多类别,内容覆盖广泛,需要精准理解用户搜索意图
- 热搜、下拉提示等搜索引导功能流量占比高
- 可能有文字、语音、图像、视频综合的多模态搜索需求
搜索痛点
- 用户用词规范程度参差不齐,文本内容复杂,用户意图理解要求高
- 内容垂类特殊,需要行业数据积累,分词和查询分析难度大
- 千人千面的的个性化搜索,需要5人以上的算法团队持续投入,成本高,周期长
- 业务导向性差,无法通过搜索实现付费内容引导
开放搜索内容文娱增强版解决方案
内容文娱行业分词模型
对于内容文娱行业,OpenSearch汇集多个相关数据来源,利用千万级数据训练了行业增强版分词模型。
针对更加特殊的垂类业务场景,在原有分词算法模型基础上,支持基于业务数据的定制分词模型,提供专属文本分词器。
内容文娱行业向量模型
相比传统文本搜索通过分词、同义词、纠错、词权重等算法技术增强语义搜索效果,基于深度学习的语义向量召回模型具备更强大的表征能力,可以更好地处理用户查询词中的简写、别名、拼写错误等情况。

开放搜索OpenSearch和阿里达摩院合作自研的向量召回技术,在业界知名榜单MS MARCO上夺冠。
结合文娱行业数据训练的向量召回模型目前已在OpenSearch对客户透出。
内容文娱行业CTR排序模型
针对内容文娱行业往往个性化诉求和实时性需求较高。比如不同用户兴趣爱好的引导、以及当天的热点事件引导。
CTR预估模型充分结合行业特点,保障搜索个性化建模和内容实时性。整体网络框架如下:

CTR预估模型可以根据客户特点和诉求做对应模型定制和链路定制,以达到更优业务转化效果。
案例实践
某文娱资讯平台,原自建搜索存在搜不准,跳出率较高等问题,直接影响用户体验和用户粘性。通过接入开放搜索OpenSearch 15天快速实现搜索效果各项指标的提升。
- PV-CTR提升超过10%,UV-CTR提升超过5%,有点击PV占比提升超过5%
- 具备语义向量模型能力,针对长文本复杂关键词也可准确返回语义相关文档
- 个性化排序模型,支持千人千面的搜索结果展示
填写问卷享开放搜索产品首月1元试用:https://page.aliyun.com/form/act4137000/index.htm
如果你想与更多开发者们进行交流、了解最前沿的搜索与推荐技术,可以钉钉扫码加入社群

本文为阿里云原创内容,未经允许不得转载。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?
2021-11-03 阿里云张献涛:公共云正不断向外延伸,一云多态是未来趋势
2021-11-03 演进实录|不同阶段的企业如何搭建监控体系?
2021-11-03 阿里云GanosBase重磅升级,发布首个云孪生时空数据库
2021-11-03 双11产品特刊请查收
2020-11-03 持续定义Saas模式云数据仓库+实时分析