Algolia-博客中文翻译-三-
Algolia 博客中文翻译(三)
原文:Algolia Blog
Inflect + Algolia:购买基础设施产品的现代化
原文:https://www.algolia.com/blog/customers/search-infrastructure-products-inflect/
Inflect 是唯一一个买卖互联网基础设施产品的全球中立在线市场。Inflect 的目标是让这个过程像预订酒店或机票一样简单。
Inflect 将其提供行业所需购买体验的能力在很大程度上归功于 Algolia 的搜索即服务平台。Algolia 允许 Inflect 工程团队将他们的开发工作集中在后端、数据标准化工作和整体用户体验上。
我们采访了 Inflect 的前端主管贾森·巴里,了解他的团队如何寻找搜索解决方案,他们的 Algolia 实现,以及各种搜索功能如何为他们的用户服务。
告诉我们一点关于 Inflect 的事情:公司是做什么的,解决什么问题?
互联网基础设施行业由两大类服务提供商组成——基础设施即服务(IaaS)和网络服务提供商(NSP)。IaaS 市场目前的估计规模为 650 亿美元,并以 21%的 CAGR 增长率增长,NSP 市场预计到 2020 年将达到 200 亿美元。
如今,Inflect 的主要客户要么是超大规模公司,要么是在全球寻找 主机托管 和互联服务的企业。如今,这些服务中的大部分都是通过过时的手动销售方法购买的。客户没有简单的方法在多个供应商的产品中进行搜索,被迫单独查看每个服务提供商,并尝试拼凑自己的解决方案。
这意味着他们正在根据旧的数据和假设做出非常重要的决策。Inflects 旨在通过为行业创建一个记录系统并为每个人创建一个共同的交易市场来实现销售过程的现代化。
是什么让你需要搜索?你是如何发现阿尔戈利亚的?
搜索是我们用户体验的焦点。用户在主页上首先看到的是一个搜索栏。登录后,用户被重定向到搜索页面。我们的目标是让用户在最短的时间内找到符合他们需求的解决方案。
我们喜欢明智地使用我们的工程师时间:我们不想从头开始构建搜索引擎。相反,我们决定调查具有满足我们技术需求的特性集的服务。我们需要一个客户端搜索库,它具有连接到分布式网络的强大性能、全面的在线文档以及灵活性和可定制性。作为前端工程师,我们不想花时间调整列索引或优化 SQL 查询——我们想在不妨碍搜索的情况下构建我们的产品。
我们最初看到了 Swiftype,但在之前的工作中使用过之后,我推荐了 Algolia。
给我们介绍一下实现过程。
得益于 Algolia 的文档和对开源的贡献,实现变得轻而易举。我们决定使用algoliasearchNPM 包,因为它轻量级且简单明了。
如何实现特定的功能——有什么有趣的细节吗?
自动完成
我们最近在搜索栏中添加了自动完成功能。顾客的反应非常积极。我们跟踪的每一种类型的东西都会被自动完成返回:位置、数据中心、服务提供商、对等网络和互联网交换。为此,我们创建了两个在每次击键时都会被查询的索引:一个是位置索引,另一个是所有其他内容的索引。
我们的位置索引由城市、州、国家、大洲、口语区(如硅谷)和机场组成。我们编写了一个脚本来获取每种类型的项目的边界框,并将它们放入 Algolia 索引中。我们在排名公式中使用一个自定义权重属性来控制平局情况下的排名,以便热门位置总是首先显示。
我们的另一个索引包含了来自 datacenter_search 索引的关于搜索方面的信息。从该自动完成索引中选择一个项目将触发与选择 datacenter_search 索引上的复选框相同的操作:例如,选择“InterXion”将显示 InterXion 是主机托管提供商的所有数据中心。
我们的第 99 百分位自动完成响应时间是 14ms。
响应如此之快,以至于我们不必对文本输入进行去抖——去抖实际上使感知的响应时间变得更慢。
地理定位
我们使用 Mapbox 在交互式地图上显示 Algolia 的搜索结果。Algolia 使这变得非常容易,支持开箱即用的地理位置搜索。通过在每条记录上设置一个_ geoloca键,可以添加 aroundLatLng 搜索参数,按给定的 lat/lng 对进行查询。在平移或缩放结束时,我们可以使用当前的搜索查询和过滤器以及地图的边界框创建一个新的 Algolia 查询。这有助于我们避免仅在视窗外部可见的大量数据响应。
我们自己实现这个功能需要花费大量的时间,但是使用 Algolia,就像向函数传递一个参数一样简单。
兼并/收购和普通名称的同义词
在我们这个行业,并购很常见。较大的服务提供商收购较小的公司,并改变他们所拥有的数据中心的营销名称。问题是用户仍然用他们原来的名字来称呼他们,即使新的名字有了新的所有权。
Algolia 的同义词功能让我们可以优雅地解决这个问题。我们将一系列已知的合并和收购设置为单向同义词,以便用户可以在他们以前的名称下找到数据中心及其提供商。设置这一点就像填写索引级别的 web 表单一样简单——其他一切都是自动发生的。
锦上添花的是,一个点击的 highlightResult 有适当的标记。例如,如果用户搜索“Telx”(一家被 Digital Realty 收购的公司),Digital Realty 会首先显示结果,并在替代同义词的文本周围加粗。这也有助于找到市场营销名称实际上不同的通用名称的产品或数据中心。
从上面可以看到,搜索“zcolo”(一个用来指代 Zayo 产品和服务的短语)会返回关于 Zayo 的信息。
合取和析取过滤
我们有一套过滤器,包含数以千计的不同服务提供商、对等信息、合规性等。大多数时候,用户在选择过滤器时,都在寻找他们选择的复选框选项的交集——他们希望看到什么匹配 这个 和 那个 。
这适用于所有情况,除非一个方面的项目是互斥的。主机托管服务提供商往往属于这一类,因为对许多人来说,他们与数据中心之间的关系是一对一的。
我们希望对主机托管服务提供商的过滤是复选框选项的联合(OR ),其他的都是交集。Algolia 让开发人员可以控制哪些方面应该进行合取搜索,哪些方面应该进行析取搜索,从而使这变得非常容易。这样,只需勾选几个复选框,就可以支持类似“显示 Equinix 或 Digital Realty 拥有的具有 3 级 和 Comcast on-net 的数据中心”的复杂查询。
零结果查询
我们越来越多地使用的一个功能是能够看到返回零结果的搜索查询。查看这些数据有助于我们填补客户期望的空白。从商业角度来看,这让我们在向公司索要数据时有了优势——我们可以通过这些零结果查询的频率来吸引他们加入我们的平台。
使用 Algolia 对您的团队或用户有什么好处?
Algolia 给我们的一个重要好处是能够在不妨碍我们的情况下进行迭代。我们的后端工程师能够以我们想要的结构顺利上传数据,之后我们能够随心所欲地查询和配置索引,而无需寻求帮助。使用 Algolia 节省的时间让我们能够专注于构建我们的实际产品。
我们的客户对我们通过搜索功能解决业务问题的速度、相关性和能力感到满意。
Algolia 搜索党-爬网
原文:https://www.algolia.com/blog/algolia/search-party-18-crawling/
上周三,2019 年 6 月 12 日,我们很高兴组织了我们的定期搜索聚会。这次是关于抓取网页内容。
人们倾向于认为抓取就是窃取他人的数据。虽然有些爬虫会这样做,但爬行本身只是从网站中提取内容的行为。动机通常是合法的,而不是非法的。在这次活动中,我们进行了三次精彩的演讲,介绍了抓取网页内容的不同方法,并讨论了开发爬虫时容易被忽略的一些挑战。
抓取网页的挑战——以及如何克服它们
https://www.youtube.com/embed/VZ9F3xs5f64?feature=oembed
视频
塞缪尔·博丁
在第一个演示中,塞缪尔·博丁向我们简要介绍了 Algolia 如何索引 pdf、Words、电子表格等复杂文档,以及如何用 javascript 大规模呈现网站。
他还谈到了网站常见的陷阱,更确切地说是“兔子洞”,一个爬虫永远被困住的地方。
最后但同样重要的是,他做了一个关于 Algolia 如何管理安全问题的快速演示。尤其是在 Algolia 的服务器上执行客户编写的 javascript 而不暴露任何敏感数据时。
编写分布式爬虫架构
https://www.youtube.com/embed/nYfSWMq6hqM?feature=oembed
视频
Nenad ti ari,TNT 工作室
在第二个演讲中,Nenad Tič arić谈到了网络爬虫的架构,以及如何使用 php 框架 Laravel 快速编写代码。
他把他的陈述分成两部分。他首先对爬虫做了一个很好的概述,并介绍了一些您在深入研究这个主题之前可能想知道的术语。他还描述了如何设计和构建大规模的自动网络爬虫。
第二部分关注的是如何用 PHP,更具体地说是 Laravel,以及像 Guzzle 和 Artisan 这样的一些基本工具简单地实现这一点。
从 Web 中自动提取结构化数据
https://www.youtube.com/embed/qxt6f8Y9YRA?feature=oembed
视频
卡尔·莱希,法布里斯
在今天的最后一个讲座中,Karl Leicht 讲述了如何使用爬虫实现自动和智能的属性提取。
如何抓取数百万个不同的网站?这是卡尔今天问我们的有趣问题。他描述了如何在不为每个网站重新发明轮子的情况下扩展你的代码。
我们看到了如何以编程方式区分列表页面和产品页面,微数据的重要性,以及在页面中哪里可以找到更有价值的信息。
第二部分关注的是长期维护这些代码的挑战,主要关注测试和监控。
下一个事件
我们在巴黎办事处举办了我们的搜索聚会。它面向所有人,而且…是免费的!请下次加入我们。
在 EventBrite 上关注我们,这样您就可以在下一次活动中得到通知。
搜索个性化 101
原文:https://www.algolia.com/blog/ux/search-personalization-101/
当你需要在网上寻找或购买某样东西时,你想感觉公司“了解”你吗?也许建议其他你可能喜欢的项目?当你输入搜索查询时,你喜欢看到搜索引擎“深思熟虑”地猜测你想要什么吗?
有些人觉得这种类型的指导有点令人担忧;你甚至会担心你的隐私被泄露。但是如果你像大多数美国人一样,你对这些问题的回答是响亮的“是,是,是”这是意料之中的,因为一旦你习惯了——并且被——网络个性化的体验宠坏了,就很难想象再回到过去。
过去,非个性化网络搜索有多不靠谱?根据 2018 年 互联网零售商 的一份报告,客户在网站搜索方面的主要挑战是,他们得到的是不相关的搜索结果,或者是按错误顺序组织的结果。人们将个性化搜索结果列为他们的头号需求。
当然,人工智能驱动的个性化领域不仅仅是定制的搜索结果。It 还包括在人们浏览网站和浏览内容时仔细记录他们的兴趣和偏好,然后应用这些知识来帮助他们导航和找到他们想要的东西。
各种形式的个性化网站(和应用程序)内容创作非常流行,而且会一直流行下去。根据insta page的数据,74%的客户发现当内容已经 而不是 被个性化时,他们会感到沮丧。而绝大多数消费者,91%,,是,,“更有可能与那些认可、记得并向他们提供相关优惠和推荐的品牌一起购物”,,表示,,埃森哲,,。
因此,收集购物者信息的能力——例如,通过他们过去的搜索和浏览历史——然后根据他们的需求定制内容,再加上预测他们的查询(“预测搜索”),显然对消费者有很多好处。但是对于那些在其网站上实现它的公司和组织来说呢?你猜对了:为公司定制用户搜索体验的潜在好处是巨大的,而且在某些行业,它们对于底线来说是变革性的和非凡的。
让我们来看看个性化搜索正在创造的“手持”购物和浏览体验的背后是什么,以及公司如何应用这一人工智能魔法来改善和优化客户的搜索体验,扩大客户群,增加收入和发展品牌。
什么是搜索个性化?
多亏了互联网几乎无限的存储能力,现在有更多的信息和更多的产品可以在网上找到。然而,随着数据和产品数量的激增,消费者发现自己被第一世界的“选择太多”问题淹没和淹没了。
在这个信息爆炸的时代,搜索技术拯救了人们,它让人们能够穿过堆积如山的无关细节,开始为他们想要的商品找到一条虚拟的直线。
在 2020 年发表的一篇内容广泛的论文中, “使用机器学习的搜索个性化”, 研究人员解释说,大多数企业一直在通过使用基于查询的搜索模型来帮助人们缩小购物选择,从而解决信息过载的问题。然而,不幸的是,让人们搜索网站的能力还不够。如果一个搜索者没有足够快地找到他们想要的东西(比如在几毫秒内)并且变得非常恼火,他们可能会跳槽到另一个网站。因此,公司面临的挑战是弄清楚 如何让搜索更好地为他们的潜在客户服务。
根据这些研究人员的说法,你可以通过两种方式改善网络搜索
- 提供更相关的一组 的搜索结果
- 将最相关的结果排在更高的位置, 或者在用户搜索时更早地显示,这样他们就不会点击错误的结果,或者不得不滚动到列表底部来找到正确的结果
研究人员倾向于第二种方法:“列表中结果的最佳排序是一个重要的问题,因为最近的研究表明,位置效应对消费者的点击行为和公司利润有重大影响(Narayanan 和 Kalyanam 2015,Ursu 2018),”他们说。
问题是不同的查询词对搜索它们的人来说意味着不同的东西。研究人员举了一个例子,人们输入查询【Java】(De Vrieze,2006)。人们可能在寻找关于咖啡、Java 编程语言或度假胜地爪哇岛的信息。研究人员指出,文档的相关性值是特定于用户的,因此排名排序必须特定于个人用户意图和搜索实例。
解决办法?个性化搜索和发现。是的,这个不断增长的领域有隐私的含义,并为公司提出了一些灰色地带的问题,这使得它成为一个持续辩论的话题。尽管如此,特定用户搜索排名的潜在回报是巨大的,不容置疑的。“数字服务的个性化仍然是市场营销的圣杯,”研究人员总结道。
搜索个性化是如何工作的?
机器学习是有效个性化搜索的秘笈。基于组织设置的参数,搜索引擎算法通过观察和记录特定用户随时间的行为来了解他们。
实现搜索个性化的第一步是收集用户数据,这有两个阶段:决定跟踪哪些行为,然后通过向软件程序发送事件来捕获该行为。接下来,业务创建个性化关联策略,并对其进行模拟和测试;最后,将关联策略转移到生产中。
Algolia
个性化还可以通过向用户展示更多潜在的有吸引力的选项,鼓励他们在一个网站(或一个应用程序)上停留更长时间。
Algolia 的关联策略包括:
- 文本相关性、 匹配功能,考虑了打字错误容差、同义词、自然语言处理等更多内容
- 以业务为中心的相关性 使用自定义排名根据业务指标对结果进行排名
- 销售: 根据规则提升和隐藏特定的结果或类别
另一个可以考虑的工具是 动态重新排名 , ,它基于一组用户的集体搜索数据,例如一个网站上的所有购物者,显示网站访问者的趋势结果和类别。
最后,如果不考虑 推荐 ,一个健壮的个性化策略将是不完整的,就像个人购物助理可能做的那样,鼓励人们根据他们感兴趣的东西来查看其他商品。(找一条牛仔裤?这件 t 恤和他们搭配怎么样?)
创造个性化搜索体验的商业好处
许多在网站上实现个性化的企业都是基于这一理念进行销售的。参与的购物者成为忠诚的顾客,这导致更多的商品被售出,回访…有什么不喜欢的呢?
统计数据证实了这一点。根据 Evergage 的调查,88%的受访营销人员表示,他们个性化的最大动力是提供卓越的客户体验。几乎所有人都认为个性化可以增强客户关系。
毫不奇怪,研究也证实了个性化通常会带来更高的利润:
个性化在某些行业尤其强大
搜索个性化被认为是各行各业的决定性胜利。它不仅有助于业务增长,而且有助于提高用户参与度,例如,通过增加杂志网站的读者数量或提高技术产品的客户支持效率。但在某些行业,它会产生巨大的影响。
以下是个性化在特定行业和业务类型中改变剧本的几种方式。
电子商务:COVID 创造的全新世界
当大多数人想到电子商务最近是如何变得疯狂时,他们会想到新冠肺炎迫使购物者避开实体店的影响。对 B2C 和 B2B 购物者来说,转向网上浏览和购买似乎是永久性的。网购火爆。人们对它已经习以为常,以至于他们把以前从不在网上购买的商品加入购物车。
零售网站上的个性化可以采取多种形式,从提供最相关的搜索结果到提供有针对性的推荐,再到简单地记住顾客的名字并保存他们对商品颜色和尺寸的偏好以备下次登录。
许多电子商务网站的改进时机已经成熟,但一些企业还没有想出如何应用搜索个性化 并获得广泛的 好处 ,包括提高转化率和更高的用户满意度。根据 Forrester 对数字体验提供者的一项调查,53%的人说他们缺乏为用户提供个性化网络体验所需的技术。
Algolia 估计 电子商务公司可以通过提供 卓越的用户体验 来增加 30% 的转化率。一种方法是遵循电子商务个性化 最佳实践 来充分反映每个人的购物需求和偏好。你可以测试你所做的事情,看看它是否有效,然后进行微调,使你的策略恰到好处。
市场网站:将电子商务提升一个档次
当谈到应用搜索个性化来改善整个 marketplace 网站的购物体验时,这类似于一个拥有独立商店的实体商场(想想 Etsy),事情会变得稍微复杂一些。面向市场的搜索引擎必须能够熟练地处理高级搜索和浏览场景,例如 动态分面 , 内容传送带 , 自动完成 下拉框,以及 联合搜索
在市场网站 上设置个性化 的一个主要好处是能够解放你的工程团队和业务团队,让他们专注于他们最擅长的事情,而不是陷入实施和维护有效解决方案的技术层面。
这里有几个市场网站已经发现了个性化是多么有益和有利可图:
- Amazon.com使用商品内容传送带来创建一个广泛的在线“百货商店”外观,显示诸如流行交易、假日装饰、体育用品和最后交易等类别。
- 访问Houzzmarket place 网站的人通常不会意识到他们拥有的所有购物和内容发现的可能性,因此搜索栏主动提供了多个选项,包括“发现设计创意”、“购买产品”和“为我推荐专业人士”
- 如果你去过Etsymarket place 购物,你会发现这个网站是多么成功地应用了个性化,让顾客每次走进“大厅”时都能重新参与进来根据人们最近的搜索、浏览和购买活动,Etsy 向他们提供了肯定会吸引人的产品和商店推荐,甚至是来自相对本地的卖家(在他们的州内)的商品。
媒体网站和应用程序:跟上新发布的内容和事件
人们不断在网上寻找各种媒体内容——新闻、直播或录制的体育赛事、文化活动(如舞蹈表演和音乐会)、歌曲、电影、视频。他们希望无论他们的物理位置和一天中的什么时间,都可以实时、即时地获得最相关、最新鲜的内容。
这意味着媒体网站和应用的个性化与电子商务和市场应用一样重要。 媒体网站和应用个性化 为用户提供内容,反映他们最有可能在自己选择的设备上观看、收听或阅读的内容。个性化推荐和其他工具可以让新闻和娱乐爱好者回来看看他们还可以在他们选择的设备上欣赏什么。
SaaS:授权支持和业务团队
软件即服务(SaaS)世界中的公司可以以一种独特的重要方式将个性化应用到工作中:让他们的客户支持和业务团队快速访问他们最常访问和参与的材料,以及针对他们的角色定制的信息(例如,技术支持代表与销售人员)。有了触手可及的正确细节,公司代表可以提高他们启发需要指导的用户和潜在客户的效率。更好的是(或者另外),寻求帮助的人可以主动回答他们的问题,这样他们就有可能解决自己的问题,从而节省时间并减轻支持人员的压力。
企业和工作场所网站个性化:提高效率
就感知到的个性化需求而言,面向外部的网站是明显的“需要改进”目标,但不要忽视个性化可以对 增强企业级搜索 和 提高企业工作场所搜索效率 。
考虑职场搜索。大型组织通常有一堆完全不同的筒仓:内容存储库、域和容纳各种功能的平台,例如人力资源门户、技术支持票据系统和文档数据库。
个性化职场搜索可以使用 自定义排名动态重新排名查询搜索建议 等功能,更好地满足员工的信息需求。您还可以根据员工在搜索栏中输入的内容个性化搜索结果,以及优化呈现给特定员工群体的结果,定制返回给营销传播团队等的内容。
个人是强大的
这就结束了我们关于搜索个性化如何工作的快速指南。
只要公司继续意识到他们可以针对个人偏好进行优化,以提高转化率,这项不断发展的技术将一直是热门话题。
如果你已经准备好开始享受个性化网络体验的回报,现在是时候加入了。为了获得专家的帮助,根据您客户的独特在线需求量身定制个性化策略, 今天就联系我们吧 。
Algolia 洞察:Q1 2020 年搜索趋势-全球颠覆时代
原文:https://www.algolia.com/blog/algolia/search-trends-a-time-of-global-disruption/
在过去的几周里,我们在 2020 年初所知道的世界已经完全改变了。随着世界各地的人们都在努力应对新冠肺炎疫情和随之而来的变化,人们的优先事项发生了变化,他们的行为也发生了变化。随着越来越多的人呆在家里,并在受影响的地区练习社交距离,这些行为变化包括人们如何优先考虑和花时间上网。
随着我们都在调整自己的工作和生活方式,您客户的优先事项和需求也可能会发生变化。无论你的生意是蒸蒸日上还是举步维艰,了解人们在寻找什么,并引导他们找到满足他们需求的最佳产品和信息,比以往任何时候都更重要。
通过 Algolia 的搜索即服务平台,搜索查询的年运行率达到 1 万亿,我们正在发布我们的 Q1 搜索趋势,以帮助组织了解和驾驭不断变化的环境。
本分析的目的是查看搜索量增加或减少最多的网站,并确定这些网站所在的行业,以更好地了解 2020 年 1 月至 3 月期间客户需求和搜索行为的变化。
虽然我们全球 8,600 多名客户的 Q1 搜索总量保持一致, 我们看到了几个行业网站的搜索活动激增,包括美容企业、在线教育网站和在线杂货商家,但也看到了旅游、房地产、体育用品和运动服等行业网站的搜索活动下降。
我们检查和分析了从 1 月 12 日到 3 月 28 日近 3 个月的搜索流量数据,并按国家和行业进行了细分,以了解客户行为在 2020 年第一季度如何以及在哪里发生了变化。以下是我们的发现——有些是我们预料到的,有些是让我们吃惊的,但现在在这种“新常态”下是有意义的。
首先,我们根据我们分析的公司,查看了在 Q1 期间搜索量激增的行业类别。随着世界似乎在一夜之间逐国发生变化,在线教育、杂货和其他电子商务购物网站的全球搜索出现了相当大的增长,尤其是在 3 月份。
行业 | 增加百分比 |
---|---|
杂货 | 618% |
电子商务 | 408% |
金融服务 | 309% |
医疗保健 | 280% |
美女 | 255% |
媒体 | 248% |
当我们绘制六个国家(美国、英国、法国、意大利、德国和西班牙)的图表时,我们发现每周都有稳步增长,只有第 8 周(即 3 月 1 日的那一周)例外,增长幅度更大,主要是因为美国和法国的一些精选在线杂货、游戏和学习网站。
让我们仔细看看 2020 年 Q1 的搜索量大幅增长的几个特定行业。如下图所示,显而易见的是,在全球疫情期间,虽然人们的核心需求没有改变,但人们采购商品和开展业务的方式发生了变化。
高需求行业
教育网站
随着学校关闭,家长在家办公,学生的学习被打乱了。随着学区争相开发某种形式的在线教学,并给学生分配更多的课程,学校管理人员和家长已经策划并找到了提供免费在线教育课程和资源的公司。此外,人们还利用这段时间充实自己,发展新技能——学习一门新的外语、演奏一种乐器或提高编程技能。
因此,在我们的分析中,教育相关网站在 Q1 的搜索量增长最快,增长超过 10 倍,在三月的后半月出现了最大的激增。
|
聚焦环节:开发人员搜索技术文档
通过 DocSearch,Algolia 支持超过 2,000 个项目,包括 Bootstrap、Laravel、Vue.js 和 React,帮助开发人员找到构建数字和移动体验所需的文档。在过去的一个月里,DocSearch 通过这项服务帮助了 310 万用户,同比增长 71%(即 3600 多万最终用户运行率,而 2019 年为 2100 万最终用户),这表明开发者正在利用这段时间来拓宽和深化他们的技术开发专业知识,并探索编程语言和环境,以建立新的网站和体验。排名前五的项目——包括 Bootstrap、Laravel、Materia-UI 和 Vue.js — 推动了超过 40%的业务量。有些事情告诉我们,在未来的几周和几个月里,我们将会看到更多这样的项目,希望包括更多帮助 战胜新冠肺炎的项目。 |
网上杂货网站
过去几周,随着“就地安置”和“社会距离”指导方针在世界各地的实施,越来越多的人开始避免去杂货店,而是选择送货上门或网上购买,在商店(BOPIS)提货。
因此,在 Q1,杂货网站的搜索量增长了 6 倍多。由于对鸡蛋、牛奶、咖啡和面包等每周主食的需求,首次用户可能会成为忠诚的客户(至少在疫情期间)——随着新用户继续加入并在线购物,他们会从上次的在线杂货订单——中重新订购。基于这种动态,我们预计这种上升趋势将在未来几周继续稳步增长。
美容场所
乍一看,我们惊讶地发现美容网站出现在需求不断增长的类别列表中。毕竟,人们外出的次数越来越少,为什么他们还需要美容产品呢?
随着我们对数据的深入研究,主要在 3 月份,搜索量增长了 3.5 倍以上,很明显,这一细分市场中的公司受益于越来越多的人在家呆的时间越来越长,而当地的沙龙和其他美容相关服务仍然关闭。这可能意味着更多的人自我修饰,包括剪头发或染发(或者问室友)。)
不幸的是,随着对超过世界三分之一人口的实施社交距离和一定程度的封锁措施,人们的行为发生了巨大的变化;某些活动和优先利益不再优先 — 或者在许多情况下甚至是不可能的。旅行、参加自己最喜欢的体育赛事和购买新房产不再是大多数人日常生活的一部分 — 我们分析的搜索数据支持了这一点。
需求较低的行业
旅游景点
不出所料,在线旅游网站的搜索量大幅下降 — 比 Q1 之初下降了 97%。这始于美国、中国、英国和其他欧盟国家开始限制然后禁止来自世界某些地区的航班。随着新冠肺炎成为全球疫情,世界卫生组织发布了更严格的指导方针,春假期间乘坐飞机、游轮和家庭度假显然需要自担风险。
体育用品&运动服网站
随着新冠肺炎疫情开始影响当地社区,学校关闭,留在家中的措施到位,户外活动和学校体育赛事减少。同样,随着受欢迎的体育人物被报道感染了冠状病毒,职业体育联盟如 NBA 和 FIFA 暂停了他们的赛季,体育赛事一夜之间停止了。体育相关网站的搜索活动,尤其是那些销售运动服的网站,在过去的一个季度下降了 69%,并持续下降。
|
聚光灯公司:健身器材供应商
虽然许多运动服和体育用品相关网站的搜索活动有所减少,但某些体育用品类别的一些公司的搜索量却大幅增长 — ,转化率可能也更高。一个例子是一家健身器材提供商,从本季度初开始,其搜索量增长了 74%。这可能是因为人们在寻找通过跑步机、自由重量和固定自行车等设备在室内保持活跃和身材的方法。 |
房地产网站
居家措施、社交距离和长期熊市迹象的结合,商业和住宅房地产等行业的活动已经放缓。虽然一些房地产经纪人 为他们的客户 和 提供虚拟旅游,但如果房地产价格下跌,潜在投资者正在寻找购买房产的机会 ,根据我们在几个网站的搜索活动数据,这个市场的整体势头正在下降,从 2 月 24 日那周的峰值和 3 月 16 日那周的底部下降了 85%。
在这种时候,每个公司都应该想办法减少在线体验中的摩擦。
- 如果您的业务放缓,您会希望为访问您网站的客户提供最佳体验。
- 如果您的业务大幅增长,那么优化您的产品或内容目录、分析搜索分析趋势并减少在线体验中的摩擦将有助于您的整个业务,包括您的客户支持和退货团队。
当客户找不到想要的东西时,搜索往往是他们的一个关键摩擦点。另一方面,提供搜索体验以快速提供客户想要的东西在任何时候都是最佳实践——尤其是在这个客户积极花时间上网、寻求基本和增值产品、信息和服务的特殊时期。
如果您在此期间需要帮助,请致电support@algolia.com联系我们,或者访问我们的 新冠肺炎资源页面。
要了解如何在此期间发展您的在线体验和方法,请注册参加 “新冠肺炎世界的数字战略” 网络研讨会。
注意: 在本次分析中,没有披露任何特定于客户的信息。引用的所有数据都是经过国家和/或行业汇总或匿名处理的,因此不特定,也不代表任何特定客户。
当考虑搜索和浏览时,如何满足用户意图
原文:https://www.algolia.com/blog/ecommerce/search-vs-browse-satisfying-user-intent/
搜索与浏览——不同的活动,但相辅相成。每个网站应该至少有一个,最好两个都有。您选择包含什么取决于您的业务模型、专业领域和用户期望。
整合T5搜索和浏览涉及:
- 满足用户意图 —用户想做什么:搜索特定的东西还是浏览你的目录?
- 提供推荐 —你如何鼓励用户超越他们最初的意图,发现更多你的目录,而不干扰他们的搜索和浏览意图?
换句话说,最好的网站能够让用户 拉 自己需要的信息,同时无缝地 推 相关信息给用户。这对用户和企业来说都是双赢的:掌握这种拉/推动态可以提高客户满意度和参与度。这篇文章是关于如何做到这一点。
在考虑搜索与浏览时满足用户意图
我们首先将用户分为两个阵营:搜索者和浏览者,也就是那些想要 找到 的人和那些想要 探索 的人。我们这样做有两个原因:揭示搜索和浏览的潜在需求,以及定义满足这些需求的最佳用户体验。
但是我们并没有就此结束。浏览和搜索一起工作。一些行业更加以浏览为中心,另一些则依赖于强大的搜索;但所有网站都可以从两者的结合中受益,为所有用户提供最完整、最直观的购物体验。
从根本上说,用户的查找 或 探索 ) 就是把 从中搜索出来
搜索者的意图是什么?
搜索者的意图是 获取 或 找到——无论是特定的产品还是特定类别的产品。
他们称搜寻者为“矛鱼”,决心捕捉精确或相当明确的东西。越快越容易越好:挫败感加剧了搜索者的专一。当用户去亚马逊买电脑时,他们已经做了调查,他们只需要一个搜索框、一些界面和用户评论来做决定。
浏览器的意图是什么?
浏览器的意图是 探索 和 了解 关于你所提供的东西,去 发现 。
浏览器撒网更广。他们有更多的时间和耐心——只要浏览体验允许他们轻松探索。虽然浏览器有时可能会转换角色,成为搜索者,但他们的最终目标是浏览页面,发现你所提供的内容,并从中获得灵感。在浏览场景中,搜索框不在中心位置(尽管它应该很容易获得)。什么是中央浏览是 导航**展示 你的产品和内容。导航涉及菜单和小平面;showcase 涉及类别页面和传送带。我们将在下面看到许多例子,但这里有一些优秀的浏览和发现体验的例子:
- 时尚购物者带着好奇心浏览一个品牌的特别系列
- 技术购买者探索和研究最新的高科技
- 房主利用沉浸式宜家体验想象不同的家居设计
- 旅行者一边浏览目的地,一边计划他们的假期
- 电影观众在选择电影之前浏览流派、主题和导演
容纳搜索者和浏览者
人们有时会在 搜索和 浏览之间切换。他们首先浏览一个网站,点击菜单、类别和不同的页面,如果这种体验富有成效,他们就会转向搜索特定的商品。
另一个场景是搜索到浏览,用户查询一个特定的项目来找到最佳的浏览起点。例如,他们在一个流行的市场上输入“电话”,而不是得到一个电话列表,他们会被带到网站上一个完全不同的智能手机部分。这被称为类别页面(如下图所示),网站可以在其中显示不同的手机和配件作为推荐。
考虑搜索 vs 浏览时如何促进发现和参与
答:通过用 推荐 , 商品销售 , 个性化 , 类别页面——本质上是我们在本文中举例说明的所有面向浏览的 UI 组件。在接下来的部分中,我们将仔细研究这些浏览元素,看看它们如何能够 鼓励进一步的发现 。
成功的发现体验提供的不仅仅是用户想要做的事情。这在以浏览为中心的 UI 中很自然。必须对搜索 UI 给予更多的关注。搜索者很快会被太多的营销活动、传送带和信息分类页面搞得灰心丧气。过多的信息阻碍了他们搜索和浏览搜索结果的简单意图。搜索者需要更多的空间来搜索,更少的空间来鼓励进一步的发现。也就是说,微妙的销售、联合搜索(下面讨论)和相关项目是更有效的发现技术。但最终,搜索者自己应该选择转换角色。
正如我们将要展示的,在线发现的全部潜力涵盖了广泛的搜索意图目标,只有设计良好的搜索和浏览界面才能满足这些目标。
一个搜索界面的组件
我们先来定义一下搜索者的基本需求:
- 寻找特定的东西
- 快速简单的流程
- 完成搜索任务的即时满足感
- 相关结果
- 易于导航/简单的用户界面
总之:搜索者需要一种简单的方法来挑选出他们需要的东西。这可以在第一次或第二次搜索时进行,并在 faceting 的帮助下向下钻取和减少他们的结果,直到获得他们需要的结果——没有困惑或沮丧。以下是一些基本的用户界面元素:
- 一个显眼的搜索框
- 即输即用的即时结果
- 轻松扫描结果
- 刻面
- 允许打字错误和同义词
- 高亮匹配关键词
用于搜索的高级组件
值得考虑搜索的全部潜力。搜寻者试图
当考虑你自己或客户的内容中的搜索意图时,如果你想实现你的目标,识别五种关键类型的搜索意图是很重要的。这些是信息、事务、商务调查、导航或基于位置的
我们建议使用更丰富的用户界面超越标准搜索。这将增加搜索框的使用率,并确保您满足搜索者的需求。原因如下:用户并不总是 知道如何搜索 ,或者如果他们的原始策略不起作用,如何适应和改变搜索策略。此外,一些用户对技术不够了解,无法充分利用标准搜索。他们需要更多的牵手。更好的搜索 UI 引导这些用户搜索 继续搜索 而不放弃。这就是你需要超越标准搜索的地方。
有许多同类最佳的功能来创造这种增强的搜索体验。这里有一个电子商务的例子,包括下面列出的许多功能。正如你所看到的,有了这些额外的特性,你可以为用户提供更多的选择和渠道来找到他们需要的东西。此外,他们可能会发现促销活动、畅销书或相关商品。
让我们仔细看看每个功能:
- 查询建议这些建议基于 analytics 收集的先前搜索行为。
此图片将建议的查询与建议的类别和产品结合在一起。
该图显示了查询建议与下一个元素联邦搜索的紧密联系。
- 联合搜索 显示单个查询的多个结果。结果可能来自不同的数据源。通常,您会将结果与博客、评论、类别和相关项目一起显示。
如这里所做的,其中查询“eye”返回建议的查询、产品、推荐的产品和 FAQ。使用一个查询的四组内容,来自四个不同的数据源。
- 增强的刻面 提供了更深入和相关的刻面。它们可以放在屏幕的不同部分,而不仅仅是左侧。
- 销售 提议或推广商品,开展活动和促销,展示横幅。
一个浏览界面的组件
许多行业使用浏览组件来满足用户的好奇心、各种需求以及他们对娱乐和信息的渴望。利用浏览的行业包括媒体、旅游、娱乐、新闻、社交媒体、图像浏览和应用商店。
通常专注于搜索的电子商务企业越来越多地开始将浏览元素集成到他们的用户界面中。你可以在时尚、科技和汽车购物中看到这样的例子。电子商务用户通常从好奇心开始,在做出决定之前寻找灵感和信息。
有一点需要注意的是,用户来你的网站是带着不同的意图的,取决于他们那一刻的需求。可能是新年前夜,也可能是夏天的开始。他们可能正在计划一次旅行或一场婚礼。
记住所有这些,让我们来定义浏览器在做什么。
- 不寻求答案,而是寻找多个项目和建议
- 为了研究,学习
- 为了娱乐而娱乐
- 受到启发,满足好奇心
- 抄底
- 查看社交媒体上的新闻标题或提要
- 以此类推。
高级浏览 UI 的组件
与标准搜索相比,简单的浏览界面增加了相关商品、促销横幅和菜单导航:
然而,你会想要建造更多的东西。这里列出了一些最常用的基于浏览的 UI 元素。这些 UI 组件的有趣之处在于,它们使用简单的想法来创建强大的最终结果。
- 旋转式传送带 显示多行按类别分组的醒目商品。例子包括在水平传送带上显示不同流派的网飞和其他流媒体服务,按主题或认证对课程进行分组的教育网站,创建在线通道的超市,以及按类别对其庞大目录进行分组的市场。
让我们来看看一个美食网站,它把每个转盘设计得像超市的过道:
- 分类页面 在单个页面上展示一组相关的项目。例子包括浪漫喜剧的页面,所有的 iPhones 或苹果产品,秋季时装系列,或者在线杂志中的政治故事。
例如,一家家具公司给用户一个专门的“窗帘”类别页面,其中包括带有不同窗帘sub——类别和促销的传送带。它们还提供了允许进一步浏览的菜单。还有许多按钮允许用户开始搜索。总的效果是一个灵感和发现,轻微的鼓励从浏览切换到搜索。
其他元素包括:
- 菜单系统 使用户能够直接导航到不同的项目或类别页面。
- 相关项目和建议 暗示进一步的可能性和相关性。
- 面包屑、书签、愿望清单让用户知道他们在哪里,并返回到他们曾经在的地方。
结合搜索和浏览的挑战
许多 UI 元素(如 联合搜索 , 商品销售 , 刻面 )可以是 ,就像搜索 一样适合浏览。这些特征使得搜索者能够容易地在两种模式之间切换。
但是,有一些特定的 UI 模式( 类别页面 , 轮播 ,thumbnaked-info)有时候 只对浏览器起作用,对搜索者不起作用。
挑战在于如何在不破坏搜索体验的情况下引入类似旋转木马的浏览功能。
例如,浏览器需要以易于浏览和理解的方式突出显示信息。这就是为什么旋转木马以易于扫描的缩略图形式呈现信息,提供了比大量文字更好的浏览体验。是想用冗长的描述还是过多的信息分散浏览器的注意力?你真的想展示令人焦虑的价格吗?
然而——回到搜索者:如果你 不 显示价格和描述,搜索者如何比较、决定、购买?
这里有一个为浏览和搜索提供价格的界面——用户必须将鼠标悬停在图片上才能获得价格。
混合搜索和浏览取决于用例和 UI
定义你的用例很重要。对于主要用例是帮助用户找到特定商品的企业,他们需要提供一个突出的搜索框、查询建议、相关结果和 faceting。这些功能还可以帮助用户“浏览”——也就是说,在购买之前进行比较、产生短暂的好奇心并获得灵感。但是他们的主要目的是搜索。例如,建筑工人寻找特定尺寸和大小的钉子或钻头。
对搜索者不起作用的一个例子是像苹果这样的品牌网站,其迷人而成功的用户界面是专为浏览和发现而设计的。如果搜索者不得不浏览许多产品、功能和交互式图形页面来找到写着“到此购买”的按钮,他们将会迷失和沮丧。
事情是这样的,苹果不需要组织搜索的视野。它的整个目标是令人惊叹的效果:启发和教学。服装设计师也是如此,他们的主要目标是展示他们最近的系列,并引导用户进入特殊场合和事件的页面。
但是有很多网站平衡了这两者,让浏览器很容易切换到搜索模式:
行业-媒体
让我们转向在线广播和流媒体杂志,它允许用户浏览标题和故事类别。他们提供相关链接和诱人的建议。他们还提供了一个搜索框和 faceting(特别是日期和主题)来确定最相关的故事。
行业—旅游/合作
我们知道 Airbnb 的界面,它允许你在搜索公寓或住宅之前浏览你的目的地。在下面的例子中,我们展示了 WeWork 是如何遵循从浏览到搜索的模式,增加了一种额外的协作方式。通过提供一个包含办公室类型的登录页面,然后为每种办公室类型提供一个带有比较功能的分类页面,WeWork 为用户提供了足够的信息来探索并最终选择合适的工作环境。在这一点上,他们被带到一个地图驱动的预订过程,以搜索位置。
结论——那么谁赢了?搜索还是浏览?
人们过去浏览网站的次数 多于搜索。当他们用谷歌、雅虎和其他互联网搜索引擎搜索 网页 时,当他们来到一个特定的网站时,他们的本能是浏览,这意味着使用菜单、点击链接和扫描不同的页面。
时代变了。我们已经知道“浏览”是一种伪装的低效搜索。如今,优质搜索在亚马逊等市场、Spotify 等流媒体服务、苹果等应用商店以及 Pinterest 等媒体收藏中扮演着同样重要的角色。一个搜索框是必不可少的,因为这些企业提供大量的、多样的和不断变化的服务。
也就是说,平衡已经达成。虽然网飞、Spotify、社交媒体平台和在线新闻期刊等企业主要依赖于 而非 搜索框浏览界面,但许多以搜索为中心的网站,如亚马逊和易贝,也开始采用这些相同的基于浏览的元素。一些网站,如 Airbnb 和 WeWork,正在创造两者的完美结合,这取决于用户处于旅程的哪个阶段:人们在搜索房屋之前浏览目的地。
在线企业正在认识到,建立一种像搜索一样高效浏览体验,以找到内容并获得灵感是多么重要。
这种 之间的来回搜索和 的浏览还会继续。搜索和浏览是与网站交互的两种不同模式。没有赢家和输家。它们有很大的不同,但在在线业务的所有领域都同样重要,包括媒体、电子商务、教育服务、SaaS、旅游——基本上是每一种业务。
为您的电子商务网站 提供搜索和使用技巧
原文:https://www.algolia.com/blog/ecommerce/searchandising-tips-for-your-e-commerce-site/
搜索和设计是将营销策略应用到你网站的搜索结果中。它允许营销人员、产品所有者、销售商和网站经营者在用户探索时直接向他们推销产品。
Searchandising 为在线品牌提供了一种控制网站和产品线的方式,这种方式通常与实体店有关。使用网站搜索分析,电子商务网站所有者可以更好地了解用户行为,并使用这些数据提供更相关(或转化率更高)的搜索结果。
一个强大的搜索策略必须从一开始就包含商品销售——而不仅仅是一个漂亮的附加产品。通过这样做,品牌可以确保搜索体验与整体业务战略保持一致,同时为用户提供无缝体验。
为什么搜索很重要
对于许多企业来说,搜索是一个黑匣子。产品所有者和营销人员可能不知道它在网站上是如何工作的,为什么某些结果会出现在他们出现的地方,或者如何控制这些结果。
幸运的是,searchandising允许网站运营者、产品所有者和任何其他相关方控制他们的搜索排名和推广。这不仅能提高转化率和收入,还能提供更好的整体客户体验,有助于提升品牌形象和忠诚度。
当顾客在电子商务网站上浏览和搜索时,他们会产生大量关于他们偏好和需求的数据。这些数据有助于形成和改进搜索和定位策略,从而提高营销效率。通过定制搜索体验,品牌有机会真正与客户交流。
五大搜索技巧
除了增加个性化因素,搜索和设计还可以帮助企业实现其战略业务目标。例如,一个电子商务商店可能想要促销某些适合当季、清仓或新到的商品。直接通过搜索推广这些商品,显著提高了点击率和 转化率 。
或者,企业可能希望定制搜索以匹配品牌和目录策略。例如,当用户搜索袜子时,企业可能希望他们看到多种颜色的袜子,而不仅仅是通常排序的白色袜子。搜索和设计也可以用来分析用户意图,以确保企业满足所有用户的需求。
在你的站点搜索中实现 searchandising 时,你应该考虑以下几点:
1。在搜索结果中使用促销横幅
促销横幅可以战略性地链接到结果或结果页面。这些横幅具有高度的上下文相关性,可以针对特定的关键字进行展示,从而增加用户转化的机会。
添加横幅广告有助于突出促销产品、内容或其他资源,增加视觉效果。强烈的颜色对比、不同的尺寸或其他视觉提示可以吸引用户的眼球,确保他们看到你所宣传的内容。此外,您还可以添加其他信息,如相关的促销详情。
2。战略性地提升和埋没产品
商家可以从自动重新排序中受益,以提高搜索结果的性能。但是他们仍然会觉得需要手动重新排序结果来实现战略目标。例如,由于季节性原因或者由于积极推销某些产品的商业决策,营销人员可能需要推销特定类别的产品。这可以针对特定的查询或查询组来完成。通过这样做,品牌可以帮助将客户推向他们想要销售的产品,并可以随着时间的推移轻松调整这一点,以应对消费者口味、产品线或商业目标的变化。
3。重定向至常见查询的专用页面
一些公司与某些供应商建立了合作关系,他们可能希望在活动中强调这些供应商。在这种情况下,您可以创建一个登录页面,每个包含该品牌的查询将在活动期间重定向到该页面。
或者,当分析您的搜索数据时,您可能会发现许多用户正在搜索一个特定的常见查询,如“鞋子”对于这种常见的大量查询,您的访问者可能会受益于一个专门的登录页面,向他们显示您网站上的一系列选项。
例如,你的“鞋子”专用登录页面可以有几个独特的功能,比如你提供的不同鞋子品牌列表、鞋子尺码指南、浏览所有打折鞋子的链接、顾客对你最受欢迎的鞋子的评论,以及冬季鞋子的季节指南。虽然您可能没有足够的资源来为每个可能的查询创建精心设计、精心策划的登录页面,但它为更常见(也更有利可图)的产品类别创造了良好的体验。
4。减少“无结果”页面的出现
【无结果】页面 是频繁导致用户跳票的 UX 死角。不要告诉用户他们的查询没有结果,你应该专注于优化你网站的搜索,这样每个用户的需求都能得到满足。减少“无结果”页面数量的一种方法是通过对性能最差的查询进行仔细的排序。对于你确实没有产品的用户需求,你可以在你的网站上提供有用的内容来尽可能长久地留住你的用户。向用户展示推荐的搜索、受欢迎的产品或有用的网站链接是将不成功的搜索转化为成功访问的好方法。有了更好的搜索路径,你就可以显著改善用户体验,增加他们留在网站上的机会(并最终转化)。
5。提供个性化的体验
智能地利用营销工具来管理搜索结果和促销活动,意味着用户将更快地找到他们需要的东西和发现新事物。开发一个经过深思熟虑的商品搜索体验可以提供一个的个性化体验,而无需实际部署个性化工具。然而,一旦营销策略到位,你就可以在个性化工具上更好地为个人客户提供
使用营销工具控制您的搜索结果
你的搜索营销策略对实现你的营销和商业目标至关重要,但它需要建立在一个强大的内部搜索引擎上。你的工具应该让商业用户,比如营销人员、品类经理或业务员,能够在没有开发和技术团队的情况下调整搜索体验。搜索工具应该为您提供数据来了解您的搜索体验,允许您基于该数据优化用户体验,并查看您的工作结果。
阅读我们的电子书 【超越盒子的搜索】 了解搜索如何在电子商务网站上推动发现和转化。
语义搜索及其对电子商务的重要性
原文:https://www.algolia.com/blog/ai/semantic-search-and-why-it-matters-for-e-commerce/
随着经济衰退,我一直听到客户说需要少花钱多办事。有人问我,Algolia 如何不仅能帮助他们提高销售额和利润,还能减少他们可支配的资源?
今天我最兴奋的答案是语义搜索。语义搜索是当今你可以添加到站点搜索中的最通用的技术之一。例如,零售商可以让他们的顾客更容易找到他们想要的产品。语义搜索改善了搜索相关性、排名和客户体验。此外,它可以自动化或至少大幅减少提高搜索相关性所需的工作和资源。
到本文结束时,我希望已经解释了什么是语义搜索,它如何减少资源和扩大收入增长,以及它的方向。
不劳而获
基于关键字的搜索只查找关键字(及其替代形式),而语义搜索理解人们正在搜索的内容的含义,通常也理解其意图。
以搜索“舞会礼服”为例关键字搜索引擎查找单词“prom”和“dress”以找到最佳匹配。在幕后,关键字引擎有一些内置的功能——错别字容差、单词粘合、词干和许多其他自然语言技术——用于找到常见的替代方法。
然而,如果你的顾客输入“返校节礼服”或“亮片礼服”,他们将找不到舞会礼服。你必须创造同义词来说明“返校节礼服”和“舞会礼服”是相似的概念。
语义搜索为你解决了这个问题。它知道这些术语是同义的或密切相关的——不需要额外的修改就可以工作。
语义搜索从何而来?
语义搜索曾经只是谷歌、亚马逊和微软等老牌巨头的发源地。这些公司投入巨资,让客户能够键入任何查询,以获得良好的结果。例如,亚马逊雇佣了近 2000 名工程师和数据科学家来完善站内搜索。
亚马逊花了 20 多年才设计出来的东西,现在任何人都可以立即完成,而且只需要很少的成本。今天,由于更新的机器学习模型,任何企业都可以在其网站上添加语义搜索,以获得更好的搜索结果,更高的收入和更满意的客户。
语义搜索包含多种技术和过程,包括 矢量嵌入 。向量为我们今天使用的一些最受欢迎的服务提供了动力,如网飞推荐、谷歌图片搜索和聊天机器人。 向量是表示文字的数学模型。机器学习模型从数据中产生向量,这些向量用于测量数据之间的距离。它们可以包含成千上万个点,但为了简化它,我们可以看看简单的三维模型,如下所示。
Words plotted in 3-D space, via Google. Tools such as Word2Vec and BERT help build these semantic relationships.
这些机器学习模型的训练集可能非常庞大,通常由数十亿个文档组成,这些文档有助于捕捉单词之间的关系。例如,对于我们自己的矢量解决方案(下面将详细介绍),我们使用各种基于人工智能的语言模型,包括通用句子编码器和各种句子转换器 。它使我们的搜索引擎知道“长袍”和“礼服”是密切相关的概念。
这就是 vector search 如何能够理解术语之间的关系,从而在不使用匹配关键字的情况下返回好的结果。
矢量搜索很神奇,但它的效果甚至比单独使用关键词搜索还要好!
混合搜索:关键字和语义搜索
向量搜索适用于较长的查询、描述性查询或问题。但是矢量搜索速度慢,扩展成本高。 关键词搜索比矢量搜索更快,而且通常更适合某些类型的查询,如单字查询或精确短语匹配。如果您能够在不牺牲速度或准确性的情况下同时获得两者的优势,会怎么样?
这就是混合搜索的用武之地。混合搜索引擎可以提供比单独的关键字搜索或矢量搜索更好的结果。诀窍在于使它快速高效,即使对于向量查询也是如此。在 Algolia,我们用一种叫做神经散列的技术来做这件事。我们可以将向量转换为二进制哈希——一种更小、更便携的数据集,可以在商用硬件上运行,而不是在专门的 GPU 上运行。
对于您的客户来说,Algolia 支持的混合搜索意味着更快、更准确的搜索、发现和推荐。更好的搜索结果意味着更好的用户体验和更高的现场转化和品牌忠诚度。
对你来说,这意味着事半功倍的能力——你不再需要创建同义词列表,编写 if/then 规则,或者用额外的关键字和标签填充你的产品页面。添加到目录中的新产品可以立即搜索到。你有更多的时间投入到其他业务领域。
市场上没有其他类似的东西:不可思议的开箱即用的搜索,大大减少了——通常是零——的工作量。 混合搜索即将到来!
语义搜索:它是如何工作的&它是为谁服务的
原文:https://www.algolia.com/blog/product/semantic-search-how-it-works-who-its-for/
语义搜索是否适用于你的商业和营销计划,你如何利用它?
对于简单的用户查询,搜索引擎可以单独使用关键字匹配可靠地找到正确的内容。“红色烤面包机”查询调出标题或描述中带有 烤面包机 ,颜色属性中带有 红色 的所有产品。为 红色 添加类似 栗色 的同义词,你可以搭配更多的烤面包机。但是事情很快变得更加困难:你必须自己添加这些同义词,而且你的搜索还会出现烤面包机。这通常是语义搜索的用武之地。
语义搜索 试图应用用户意图和单词、短语的含义(或 语义 )来寻找合适的内容。它通过使用可能不会立即出现在文本中的信息(关键字本身),而与搜索者想要的紧密联系在一起,从而超越了关键字匹配。比如用查询 找到一件毛衣毛衣 甚至 更甜 对于关键词搜索来说是没有问题的,而查询 保暖衣物 或者 冬天如何保暖?语义搜索能更好地服务于。
正如你所想象的,试图超越文本中隐含的表层信息是一项复杂的工作,许多人都在尝试,包含了许多不同的组成部分。此外,正如任何显示出巨大前景的事物一样, 语义搜索 是一个术语,有时用于名不副实的搜索。事实上,这个术语在市场营销中被过度使用,甚至被用来描述非常简单的系统,比如同义词词典的包装!所以在这里,我们想概述一下什么是语义搜索,最新的技术,它包含了什么,以及它解决了什么(以及没有解决什么)。
什么是语义搜索?
语义搜索应用用户意图、 、上下文 和概念意义来将用户查询匹配到相应的内容。它使用向量搜索和机器学习来返回旨在匹配用户查询的结果,即使没有匹配的单词。为了最好地找到结果并对结果进行排序,语义搜索将比较数百甚至数千个由机器学习获得的不同特征,并返回一个数字,该数字指定记录与基于公式的查询的相似程度,该公式也是通过机器学习获得的。它很复杂,是的,而且很强大。
这和单纯的关键词搜索不一样,可以产生很强的冲击力。纯关键字搜索大致通过将查询词与文档中的词进行匹配来工作。相反,语义搜索通常会返回没有匹配词的结果,即使应用了 NLP,但内容仍然“明显”匹配用户所寻找的内容。
语义搜索之所以能做到这一点,是因为语义搜索引擎的工作方式不同。它们不是文字上的匹配,而是意义上的匹配。这可能会让人想到有人在教软件每个单词的定义,这与实际情况相差不远。就像你会利用上下文线索来理解一个新单词(“鞋子卡在我的脚上,但我不顾一切地拉着它直到它脱落。”),一个语义搜索引擎做同样的事情,但是跨越数百万个例子。通过查看这个庞大的数据集,它不会给出单词的正式定义,但它会根据其上下文或用法理解单词的意思,以及在相同或相似的上下文中可以使用哪些其他单词。
语境
搜索发生的背景很重要。背景可以像场所一样简单(一个美国人搜索 足球 相比于一个英国人搜索同样的东西,想要不同的东西)或者复杂得多。
一个智能的搜索引擎会在个人层面和群体层面使用上下文。影响结果的个人级别被恰当地称为 个性化 ,并且将使用该个人搜索者的密切关系、先前的搜索和先前的交互来返回最适合当前查询的内容。个性化适用于所有类型的搜索,但是语义搜索可以走得更远。在群体层面上,搜索引擎可以使用关于所有搜索者如何与搜索结果交互的信息来对结果进行重新排序,例如哪些结果被最频繁地点击,或者甚至是某些结果比其他结果更受欢迎的季节性。这再次展示了语义搜索如何为搜索带来智能,在这种情况下是通过用户行为的智能。
语义搜索还可以利用文本中的上下文。我们已经讨论过同义词在各种搜索中都很有用,并且可以通过将查询的匹配扩展到相关内容来改进关键字搜索。但是我们也知道同义词并不是通用的——有时两个词在一个上下文中是等价的,而在另一个上下文中却不是。当有人搜索 足球运动员 时,有哪些正确的结果?俄亥俄州肯特市的答案将与英国肯特市不同。然而,像 坦帕湾足球运动员 这样的查询可能不需要知道搜索者位于何处。添加使 足球 和 足球 等同的总括同义词会导致当搜索者看到汤姆·布拉迪旁边的坦帕湾 Rowdies 足球俱乐部时的糟糕体验。(当然,如果我们知道搜索者更喜欢看坦帕湾队,搜索引擎会考虑这一点!)这是一个 通过语义搜索查询理解 的例子。
用户意图
任何搜索引擎的最终目标都是帮助用户成功完成一项任务,无论是阅读新闻文章、购买服装还是查找文档。搜索引擎需要搞清楚用户想要做什么,或者说 用户意图 是什么。
在电子商务网站上搜索时,我们可以看到这一点。当用户键入查询 乔丹 时,搜索会自动过滤类别 鞋子 。这预期用户的意图是寻找鞋子,而不是约旦杏仁(这将在 食物&小吃 类别中)。通过超越用户意图,搜索引擎可以返回最相关的结果,并且不会用文本上匹配但不相关的项目分散用户的注意力。当在搜索的基础上应用排序时,比如从最低到最高的价格,这可能更加相关。这是一个 查询分类 的例子。对查询进行分类并限制结果集将确保只显示相关的结果。
关键字与语义搜索的区别
我们已经看到了语义搜索的智能化,但它与关键字搜索的不同之处还是值得进一步研究的。虽然关键词搜索引擎也引入了自然语言处理来改善这种词与词的匹配——通过使用同义词、删除停用词、忽略复数等方法——但这种处理仍然依赖于词与词的匹配。但是语义搜索可以返回没有匹配文本的结果,但是任何了解该领域的人都可以看到有明显的好匹配。
这与关键字搜索和语义搜索之间的巨大差异联系在一起,这就是查询和记录之间的匹配是如何发生的。简单来说,关键字搜索是通过文本匹配来实现的。 Soap 将始终匹配 soap 或Soap,因为在文本质量上有重叠。更具体地说,有足够多的匹配字母(或 字符 )来告诉引擎,搜索一个字母的用户会想要另一个字母。该相同的匹配还将告诉引擎,查询soap对于单词soup比单词 洗涤剂 更可能匹配,除非搜索引擎的所有者已经提前告诉引擎soap和 在这种情况下,搜索引擎在确定相似度时会“假装”认为 洗涤剂 实际上是 肥皂 。
基于关键词的搜索引擎还可以使用同义词、替代词或查询词移除等工具(所有类型的查询扩展和放松)来帮助完成这一信息检索任务,以及 NLP 和 NLU 工具,如错别字容忍、标记化和规范化。
因为语义搜索是在概念上进行匹配,所以搜索引擎不再能够根据两个单词共有多少字符来确定记录是否相关。再想想 肥皂vs汤vs洗涤剂 。或者更复杂的查询,像 洗衣清洁剂 , 去除衣物污渍 ,或者 如何去除牛仔布上的草渍?你甚至可以包括图像搜索之类的东西!
现实世界中的一个类比是,一名顾客问一名员工“厕所疏通器”在哪里。如果员工对该要求只有纯粹的关键字式理解,就会失败,除非商店明确将他们的活塞、排水管清洗器和马桶螺旋钻称为“马桶疏通器”。但是,我们希望员工足够聪明,能够将各种术语联系起来,并将客户引向正确的通道(也许通过了解客户可以用于任何给定产品的不同术语或同义词)。
总结语义搜索的一种简洁方式是,通过使用向量搜索,语义搜索在概念匹配上比在单词匹配上带来更高的智能。有了这种智能,语义搜索可以以更像人类的方式执行,就像搜索者在搜索 花式 时找到了服装和西装,却看不到牛仔裤。
什么是语义搜索不是?
到目前为止,语义搜索作为一种提高搜索质量的有力手段应该是显而易见的。因此,当你得知语义搜索的含义已经被越来越广泛地应用于搜索那些并不总是名副其实的体验时,你应该不会感到惊讶。虽然没有语义搜索的官方定义,但我们可以说,这种搜索超越了传统的基于关键字的搜索,它结合了现实世界的知识,根据查询和内容的意义来推导用户意图。
这导致了一个结论:语义搜索不仅仅是应用自然语言处理和给索引添加同义词。虽然标记化确实需要一些关于语言构造的真实世界知识,并且同义词应用对概念匹配的理解,但在大多数情况下,它们缺乏搜索上升到 语义 级别所需的人工智能。
实现语义搜索
正是这最后一点使得语义搜索既强大又困难。一般来说,对于术语语义搜索,有一种隐含的理解,即涉及某种程度的机器学习。几乎和经常一样,这也涉及到 矢量搜索 。
矢量搜索的工作原理是将一件物品的详细信息编码成矢量,然后比较矢量以确定哪一个最相似。同样,即使是一个简单的例子也会有所帮助。
拿两个短语来说:“丰田普锐斯”和“牛排”。现在让我们将它们与“混合”进行比较。前两者哪个更相似?两者在文字上都不匹配,但你可能会说“丰田普锐斯”是两者中更相似的。你可以这么说,因为你知道普锐斯是一种混合动力汽车,因为你在与“混合动力”一词相似的上下文中看到过“丰田普锐斯”,比如“丰田普锐斯是一种值得考虑的混合动力汽车”,或者“像丰田普锐斯这样的混合动力汽车。”然而,你很肯定,你从来没有在这么近的距离内看到过“牛排”和“杂种”。
这通常也是矢量搜索的工作方式。机器学习模型从网络、书籍或其他来源获取数千或数百万个示例,并使用这些信息来预测相似性。当然,车型去一一对比是不可行的(“丰田普锐斯和混动经常在一起看到吗?混血儿和牛排怎么样?”)因此,实际情况是,模型会对它注意到的不同短语的“模式”进行编码。这类似于你看着一个短语说,“这个是肯定的”或“那个包括一种颜色”,除了语言模型不那么透明(这也是为什么语言模型很难调试)。这些编码存储在一个向量或一长串数值中,向量搜索使用数学来计算不同向量的相似程度。
另一种思考向量搜索所做的相似性度量的方式是想象被标绘出来的向量。如果你试着想象一个标绘成数百维的向量,这是非常困难的,但是如果你想象一个标绘成三维的向量,原理是一样的。这些向量在绘制时形成一条线,问题是:这些线中哪一条彼此最接近?用于 牛排 和 牛肉 的线条会比用于 牛排 和 汽车 的线条更接近,等等更相似。这个原理叫做 向量相似度 。
向量相似度有很多应用。它可以基于先前购买的产品做出推荐,找到最相似的图像,并且当与用户的查询进行比较时,可以确定哪些项目在语义上最匹配。
结论
语义搜索是一个强大的搜索应用工具,随着强大的深度学习模型和支持它们的硬件的兴起,它变得更加重要。虽然我们在这里已经触及了许多不同的常见应用程序,但还有更多使用矢量搜索和人工智能的应用程序。甚至图像搜索或者从图像中提取元数据都可以归类为语义搜索。我们正处于激动人心的时代!
然而,它的应用仍处于早期阶段,其已知的强大功能可能会导致对该术语的误用。语义搜索管道中有许多组件,确保每个组件都正确非常重要。当正确完成时,语义搜索将使用真实世界的知识,特别是通过机器学习和向量相似性,使用用户意图、上下文和概念含义来将用户查询与相应的内容匹配。
将语义、知识和问题回答添加到您的搜索页面
原文:https://www.algolia.com/blog/ux/semantic-search-returns-knowledge-and-answers-your-questions/
搜索已经走过了漫长的道路。
我们曾经盲目地按下回车键,希望能找到我们的宝藏。如果没有,我们将添加或删除一个单词,或者完全改写查询,然后再次单击 Enter。再一次。不要谈论打字错误——对于我们这些母语不是英语或者打字或拼写能力差的人来说,我们只能放弃。
几年前,当 SaaS(搜索即服务)公司上市并向我们展示了搜索应该如何: 快速和相关时,搜索发生了变化;当您键入即时结果时;充满活力的 UI/UX;刻面和过滤。
回车键不见了。
SaaS 科技继续发展,增加了更多的产品细节、客户评论和评级、多张照片、推荐和商品销售——速度更快,相关性更强,导航更加便捷。
搜索现在已经成为网上购物必不可少的,以及盈利的进行竞争的网上商家。
不过还是那句话,搜索已经走了很长的路,达到了一个新的里程碑:问答和**知识。**看看这个:
有了的知识,我们不再需要 离开 的搜索屏幕。我们可以留下来问更多的问题,接收多个答案,点击相关问题,阅读带有链接的主题摘要以进一步了解。
全部同单查询。或者声音,或者图像。(还没想好。)
而这仅仅是开始。GPT 就在眼前。搜索不再一样。
商业 不再相同。一个 ll 公司,无论大小,在任何领域——电子商务、媒体、旅游——都可以实施 问答 和 知识面板 作为其知识管理和数字平台的一部分。
为什么在搜索结果旁边展示知识改变了一切?
知识的重要性
在过去的好日子里,炼金术士秘密工作,贪婪地向他人隐瞒他们的知识。他们未能理解的是,他们的知识(无论对错)比他们未能创造的黄金更有价值。
他们没有体会到 分享知识 推进了人类的理解和表现。
知识是一种资产。了解知识的货币和竞争价值的公司学会释放他们的数据,并为他们的员工、商业伙伴和客户进行个性化处理。
由此可见, 知识管理的重要性 。
知识管理从何入手?搜索栏。
任何成功的真正有用的知识管理系统的出发点都是理解人们在使用这样的系统时需要什么。没有比一开始更好的开始了,在那里首先获得知识: 搜索界面 。
考虑知识管理可以解决的三个搜索用例:
- 经典搜索: 搜索某个特定的人、地点或事物,立即用它做一些事情,比如购买(电子商务)、播放(流媒体)或阅读。
- 问题&答案: 寻找精确问题的答案。
- 知识: 寻找有助于你执行任务的信息,浏览、研究、决策、与他人互动、学习新东西等等。本质上,希望提高你的大脑、表现和决策能力。
注意,此列表中缺少 语义搜索 。那是因为语义搜索和任何人工智能搜索一样,比如 NLP、NLU、LMs 和 GPT,都不是使用* 用例 而是 搜索技术 可以在上述所有三种用例中使用。我们将继续讨论语义搜索。
那么,什么样的搜索界面能够满足这三种截然不同的用例呢?
让我们将所有这些用例背后的意图合并成一个短语:
用户需要以正确的格式访问所有可用的、必要的和有用的信息,以满足他们的即时意图。T36
挺密集的,这个词组。这个怎么样:
人们需要一个搜索界面,只需几个搜索词就能为他们提供所需的信息。
当我们想到这样一个“系统”时,我们往往会跳到“信息”部分,并问:如何才能将我们许多单独的数据源和不同的格式和流程结合起来?这将我们带入系统架构、数据科学和应用编程。理应如此。但是它跳过了本质的一点——为什么—为什么 我们需要知识管理吗?
从最终用户体验(通过搜索获取信息)开始,我们将重点放在寻找和使用知识上。
换句话说,就是能够找到最好、最有用的信息。而 数字 寻找是从搜索栏或者语音助手开始的——或者是用我们所说的 联合搜索 。
什么是 知识管理背景下的联邦搜索
**联合搜索,或多维搜索,是在一个搜索界面上仔细展示不同的信息片段。它为用户的每个查询提供了各种信息和选项。看一下下面的模式:
总的想法是, 单个查询 显示各种信息,如标准结果、超链接、方面和过滤器、菜单、销售和推荐,以及一个更大的“知识面板”,提供一个问题的相当完整的答案或一些相关主题的摘要。
我们可以在 Birchbox 的搜索页面上看到联合搜索的运行。请注意右侧的产品列表、方面、类别以及常见问题和文章的“百科全书”:
一种知识管理电子商务的本质是一个 各种各样的相关信息 都可以如此方便快捷地找到。
在剩下的两节中,我们将仔细研究:
- 知识管理前端实例
- 从各种数据源生成知识的后端流程
前端-联合搜索界面上的知识管理
提醒一下,有三个用例:
- 经典搜索
- 提问&回答
- 知识内容
电子商务用例——将经典搜索与内容相结合
经典的电子商务搜索会返回一个产品列表,包括简短描述、图片、价格等。利用这些信息,用户可以选择查看或购买商品,或者改变他们的搜索。大多数电子商务网站提供分面和过滤以及相关商品的推荐。亚马逊为大多数电子商务企业提供了模式。
这就是 经典搜索 的样子。
但是你也可以在经典的搜索体验中加入知识。右边是空的,所以我们添加了一些额外的信息:
我们添加了第一个结果的信息快照。它包含手机的详细信息,评级,运输信息,选项和更多的总结。你也可以点击物品的选项或查看评论。
当你向下滚动搜索结果时,你可以看到每个项目的预览:
你会想要很好地设计体验,因为太多的知识会开始塞满你的屏幕。比如添加基于物品的配件和推荐很重要;但是需要设计好:
语义搜索——问题&答案+内容
创造一个更自然的语义搜索怎么样?
谷歌通过其知识小组,以及其回答问题和提出相关问题的能力,改变了我们的期望:
这里发生了很多事情:谷歌回答了这个问题(“南极洲有多大?”),并提出其他问题。它还将南极洲的大小与其他国家进行了比较,并提供了南极洲的图片和链接摘要,以获得有关大小、人口和历史的更多信息。
没有理由离开这个屏幕,除非你想了解更多信息。
谷歌根据主题改变设计。艺术家得到不同的待遇。比如一个问题(“杰夫·贝克是谁?”)返回照片,轻松访问他的艺术,和一些传记信息:
奇怪的是,谷歌并没有为新闻提供同样的知识,你可能会认为至少获得头条新闻更重要:
新闻杂志、博客或软件文档等信息驱动型网站可以在用户向下滚动搜索结果时添加内容快照:
最后,文档网站经常使用相同的技术——显示页面的快照。这节省了开发人员的时间,因为他们不必筛选多个页面,直到找到他们的答案:
总之,基于知识的搜索就是以多种方式呈现信息,而不仅仅是提供链接。
现在让我们深入了解一下搜索引擎是如何做到这一点的。
后端——将数据整理成知识
几十年来,人们一直在激烈争论这样一个事实,即一个有效的知识管理系统不能像任何软件系统那样安装在内部网中,知识也不能存储在文档或数据库中。随着知识图(KGs)的兴起,许多知识管理实践者问自己这样一个问题:KGs 是否仅仅是另一个数据库,或者它是否最终是 DIKW 金字塔中知识层与信息和数据层之间缺失的链接。
—Andreas blu mauer,语义网公司创始人&CEO
我们可以补充的是, 智慧 ,在企业和电子商务知识管理的背景下,与做出明智的决策、良好的表现、创造更好的营销活动以及增加客户满意度和在线收入等意图相关。
从数据到信息到知识
数据需要上下文来赋予它意义。否则,它就是简单的原始信息,比如字符串(“A”,“A”,“B”,..)、数字以及代表真和假的二进制 0 和 1。客户的名字是一串数据。只有当有人搜索客户的名字或想要查看他们的销售活动时,它才成为一个有意义的字符串。
后端数据库和应用程序提供数据;前端搜索界面将数据显示为信息和知识。
流程&算法
为了将数据从后端拿到前端,工程师和数据科学家需要构建一个 数据管道 来馈给 中间层 。中间层提供对前端的 API 访问, 使前端工程师能够构建一个联邦搜索接口。
我们来看两个中间层数据集:
- 一个搜索索引
- (人工智能/机器学习向量或知识图的)知识库,如下文所述
搜索索引——为经典搜索
大多数在线公司使用基于云计算的搜索索引。搜索索引由 子集**相关 信息组成,如可搜索的关键字和元数据(标题、品牌、颜色、价格等。),以及更长的自由文本描述。它还包含用于在搜索界面上显示、排序和过滤信息的信息。
当处理(如产品目录、客户数据)的多个数据源时,工程师需要创建一条“数据管道”使 将 的各个数据源合并成 一个 的搜索索引。
这是后端应用程序到单个搜索索引之间的流程图:
- 在最左侧,您有许多典型的后端系统,它们为不同的用途提供重要信息,例如员工寻找工作所需的信息,客户搜索产品,营销人员和业务合作伙伴管理他们的产品目录。
- 称为管道的数据流从每个系统获取相关信息的子集,并执行合并,这包括重新格式化和结构化数据源以供搜索。正是这个过程构建了搜索索引。
- 搜索索引包含大量结构化数据,搜索引擎使用这些数据来执行所有查询并向用户显示所有相关信息。
- 搜索 API 执行所有搜索请求,返回一组搜索结果显示在搜索界面上
- 最后,在右边,你有搜索界面本身——结果、方面、推荐和其他用户交互的信息。
知识库——添加 知识问题解答
**知识管理,包括问答,来源于一个 第二个 中间层数据:
- 知识管理改变了界面,用类似谷歌的超链接显示基于知识的信息(见上一节的例子)。它还显示问题的答案(参见上面的“谁是 jeff beck”示例)。
- 添加知识时,数据管道流程和算法必须适应。之前它只喂搜索索引;现在,还有一个将公司数据映射到知识库的额外流程。此外,由于知识需要更多相关信息,数据管道需要做的不仅仅是格式化和结构化数据,其算法需要重新处理数据,以构建基于向量的分类和/或知识图 。我们将在下面更详细地介绍如何建立知识库。
- 一旦知识库完成,它还可以向搜索索引发送一些摘要数据,并带有完整信息的链接。这样做是因为访问搜索索引通常会更快,其关键字搜索最适合管理整个搜索执行过程,尤其是相关性。这也将在下一节讨论。
- 最后但并非最不重要的是,前端现在并行发出两个搜索请求:一个对搜索索引,另一个对知识图。这应该是异步,搜索结果先出现后立即出现,额外的知识紧随其后出现。这种延迟通常是察觉不到的。
这就是将公司数据转化为相关用户知识的完美例子。当然,细节是最大的问题,有多种方法来构建它,但是这应该给出了所涉及内容的一个大概的概念。
用知识图和/或机器学习存储知识
储存知识的方法有很多种。它可以存储在一个搜索索引中,或者以向量和知识图等格式存储。我们将讨论后两者。
机器学习&语义与神经网络、向量和语言模型
多年来,搜索引擎主要依赖关键词,就像你在书后面找到的索引一样。除非查询与索引中的关键字匹配,否则搜索引擎可能会空手而归。虽然“匹配”的概念传统上驱动着搜索引擎,但从“匹配”到“理解”的重大转变目前正在进行中。这是由人工智能驱动的,人工智能用于以数学方式表示文本,以便机器可以在概念上理解它。概念正在取代关键词,这对每个人来说都是好消息。
–哈米什·奥美 、人工智能副总裁安戈利亚
当机器“读取”大量(非常多)数据时,它们会自学理解这些内容,或者赋予其意义。借助 的自动化 的自我学习,他们可以完成以下任务:
- 查找单词中的相似性(检测同义词、单词相关性)
- 从文本中提取主题和主题层次
- 提供上下文以创建对文本的更深理解,从而实现推理和深层知识
- 预测下一个单词
- 生成内容
大多数 ML 技术(如神经网络)创建某种形式的矢量化数据集。矢量化是将单词转换为向量(数字)的过程,这使得它们的含义能够以数学方式进行编码和处理。你可以把向量想象成代表单词的一组数字。在实践中,向量用于自动化同义词、聚类 documents、检测查询中的特定含义和意图以及对结果进行排序。矢量化功能非常广泛,其他对象(如整个文档、图像、视频、音频等)也可以矢量化。
我们可以用一个简单的三维图来可视化矢量:
图像 通过媒介 显示向量空间维度。
你和我都能理解诸如“国王”、“女王”、“统治者”、“君主”和“皇室”等术语的含义和关系有了向量,计算机可以通过在 n 维空间中把它们聚集在一起来理解这些术语。在上面的三维例子中,每个术语可以用坐标(x,y,z)来定位,并且可以使用距离和角度来计算相似性。
然后可以应用机器学习模型来理解向量空间中靠近的单词(如“国王”和“王后”)是相关的,甚至更靠近的单词(如“王后”和“统治者”)可能是同义词。
向量也可以加减乘除,寻找意义,建立关系。最受欢迎的例子之一是国王——男人+女人=王后。机器可能使用这种关系来确定性别或理解性别关系。搜索引擎可以利用这种能力来确定一个地区最大的山脉,找到“最佳”的度假路线,或者确定健怡可乐的替代品。这些只是三个例子,但还有成千上万个!
AI 和知识管理有什么关系?
通过寻找单词关系并建立事实和概念推理,机器学习使系统能够综合公司的独特知识。谷歌十多年来投入了数百万工程小时来设计其用于互联网搜索的深度学习 BERT 语言模型 和搜索基础设施。
在电子商务、媒体和其他在线服务中也可以做到这一点。
什么是知识图?
在搜索的历史上,有许多不同的搜索方法,例如,经典的关键字搜索,它基于文本匹配或同义词来匹配单个单词或短语。本体和知识图通过添加主题匹配向前迈进了一步,其中属于相同主题或包含相同实体(不一定是相同单词)的项目和文档也被认为与查询相关。
–朱利安·莱莫因 、联合创始人&前安哥利亚 CTO
让我们从“本体和层次”开始。知识图包含“节点”,如概念、主题、层次和其他分类信息的方式。它还包含显示节点之间关系的“边”。
通常,节点是名词,边是动词。我们用一个简单的例子:“牛”是“动物”,“动物”是“生物”,“牛”吃“草药”:
你可以看到生物是吃东西的植物。更重要的是,这个图式使我们能够做出 的推论 ,比如生物需要吃哪种食物。
一旦分类到位,公司就可以将它的真实对象(产品、财务、客户和其他事实)分布到图表中。例如,一个特定的“生物”(雏菊)可以通过它的分类和与其他事实和对象的关系来理解。
我们可以说,作为一种生物,雏菊需要吃东西,因此,我们可以推断它的一些行为与吃有关。因此,搜索“奶牛食品”可能不仅会显示不同品牌的奶牛食品,还会显示奶牛如何寻找食物、营养信息等知识。
从高层次来看,这就是知识图如何用事实(节点)、事实关系(边)和推理链来表示知识,从而提供一个摘要或讲述一个完整的故事。
理解知识图表中的一些挑战很重要:
- 对于大规模企业来说,知识图成功所需的大量事实和关系令人望而生畏。如果它的知识中有任何漏洞,或错误的信息,图表就变得不可用,如果重要的数据是误导性的,那么依赖它就有风险。
- 信息变化、过时或失效;旧数据可能是错误的或错误分类的;新数据有时需要重新思考旧的概念和关系;诸如此类。
- 知识图表通常依赖于该领域专家的繁琐的手动输入来加强数据的质量和数量。这需要他们花费大量宝贵的(也是昂贵的)时间来输入正确的东西。
从本质上讲,知识图要有用,并且不完整或不准确,就需要大量的数据和持续的维护。但是,控制这种情况的一个方法是专注于较小的目标。例如,一家电子商务公司可以通过为其在线服务创建一个小型知识图来限制其内容的广度,包括关于产品、销售、营销和客户的知识。另一方面,同一家电子商务公司可以为其员工创建第二个更大的知识图。但是后者可能最适合语义和矢量化。
值得一提:语义和知识图可以协同工作。知识图可以提供矢量化分类,因此中间层可以将经典搜索索引与基于强大语言模型(如 LLMs 和 GPT)的强大自动化人工智能索引相结合。
现在是什么,接下来是什么
多个结果、丰富的知识、问题的答案–全部在一个搜索界面上。与我们聊天如果您想知道现在正在发生什么,接下来会发生什么,以及如何构建您自己的知识丰富的联合搜索体验。****
语义搜索:搜索引擎技术的下一件大事
原文:https://www.algolia.com/blog/product/semantic-search-the-next-big-thing-in-search-engine-technology/
语义搜索:搜索引擎技术的下一件大事
当你输入谷歌搜索查询时,你有没有想过谷歌有一种神奇的能力来完成你的句子?有点吓人。或者谷歌(或必应或雅虎,以及其他搜索引擎)可以熟练地理解句子的意思,并在其特色片段中回答非常具体的问题(如英语中的“伊丽莎白女王如何喝茶?”或者“哈利·波特多大了?”)
哇。似乎有某种神奇的东西帮助谷歌“思考”和使用心灵能力。但实际上,这种现象只是谷歌拥有一个非常复杂的人工智能搜索引擎的结果,该引擎使用语义搜索来提供答案。
什么是语义搜索?
如果你试图理解什么是一般语义,想想“语义”这个词在语言中,语义的定义与语言意义有关。所以就搜索而言,语义搜索引擎正在研究意义,重点是输入的搜索词的意义。本质上,语义搜索的工作原理是在单词和短语之间画出链接;它能够以更“人性化”的方式解读数字内容。当这一点实现后,它可以为搜索者提供更加个性化和准确的搜索结果。
语义举例
假设你要结婚了,你在新娘词典中用语音搜索英语短语:“梦想婚纱”。语义驱动的搜索引擎会理解,当“梦想”与“婚纱”联系在一起时,你指的是同义词“理想”。
相比之下,传统的搜索引擎可能会被“梦”这个词弄糊涂,在搜索引擎结果页面(SERP)上提供一组不太准确的项目。如果你 梦到 穿婚纱是什么意思?嗯, 号
一个语义搜索引擎可能会将它“认为”你穿起来会很梦幻的婚纱风格(也许是零售商目前流行的风格)作为搜索结果呈现出来。
之前搜索引擎都在做什么?
在过去十年左右的时间里,搜索引擎技术严格依赖关键词本身来解释内容的含义。例如,网络上一篇关于婚纱的文章,只有在整个内容中不断使用“婚纱”或“复古婚纱”这样的关键词时,才会被网络爬虫选中。这意味着数字内容营销人员和作者必须确保他们的关键词与人们在搜索框中输入的内容相匹配。
让网络爬虫注意到你的网页内容的关键词,从而在搜索结果中提高你的文章排名的艺术和科学被称为搜索引擎优化(SEO)。创建优化的内容意味着更多的人可能会看到它出现在搜索结果的顶部,这是他们点击链接并阅读内容的好机会。
我们为什么需要 SEO?
为网络优化内容是必要的,因为搜索引擎技术还没有先进到足以破译人类创造的内容的含义。语义搜索是一大进步,因为它更加关注搜索者的意图、从语言学角度看的上下文含义以及对单词之间关系的复杂理解。
数字营销人员可能还不想放弃他们的 SEO 策略、关键词研究或 SEO 术语排名列表,但如果搜索引擎技术足够进步,理论上,语义搜索的“智能”将实质性地改变我们为网络制作内容的方式,传统关键词可能变得无关紧要。
然而,目前我们还不在那里。在事情进一步发展之前,营销内容创建者被建议采用主题驱动的方法来制作网页内容。不要以一两个主要关键词为目标对内容进行排名,你应该确保你覆盖了一个主题的深度,并使用几个针对用户意图的排名长尾关键词,而不是一两个在竞争激烈的 SEO-word 领域也很难排名的更短、更通用的关键词。
语义搜索受两个原则支配:搜索意图和语义。为了更准确地解释自然语言,或者根据上下文,搜索引擎必须基于这两个因素来解读内容。
搜索意图
搜索意图是指进行搜索的人的意图或动机。当你在搜索栏中输入“购买肥皂”时,搜索引擎应该很容易理解。
但是人们并不总是以最直接的方式查询搜索引擎。在这种情况下,例如,他们可以输入“现在需要肥皂”或“便宜的肥皂”或“好闻的肥皂”。从用户搜索中的各种短语中,搜索引擎必须弄清楚他们是否想买东西,如果是,具体是什么;或者他们是否只是想了解相关信息(例如,市场上最便宜的肥皂是什么?).
语义搜索引擎能够更好地解释单词的意思。它可以更好地理解查询意图,因此,它可以生成比传统搜索引擎更相关的搜索结果。
语义含义
语义学是关注意义的语言学的一个分支。它是关于单词之间的关系,而不是孤立的单词。传统的搜索引擎基于关键字或短字符串来解读查询,而语义搜索引擎采用更全面的方法,考虑单词的意思以及它们之间的关系。这个过程更类似于人类解读语言的方式。理想情况下,语义搜索意味着不再有不相关的搜索结果,这反过来意味着更好的用户体验。
为什么我们需要语义搜索?
您是否曾经不得不点击多个搜索结果页面来寻找您需要的信息?或者被提供看似随机的、不相关的搜索结果,并且不得不用不同的词重新尝试你的搜索?
这可能是因为你输入了一个措辞不当的查询,但也有可能是因为传统搜索引擎在搜索知识库时遇到了麻烦,误解了你的请求。
为什么传统的搜索引擎技术有时无法找到想要的结果?
等级的能力已经很容易操纵
从 90 年代开始,关键词的出现和它们在内容中的使用次数决定了搜索引擎指定的排名。使用某个关键字次数最多的网页将首先出现在搜索结果中。当营销人员意识到排名是如何工作的,他们或他们的网站开发人员开始“ 关键词填充 ”他们的内容,以使其排名更高。
传统搜索已经把用户带到了低质量的内容上
因为营销人员和开发者做了太多的关键字填充,他们降低了内容的质量。网络上充斥着针对爬虫的低质量内容,而不是为人们创造的制作精良、易读的内容。网上出现的文章有很多排名关键词,但是写得很差或者没有包含正确的信息。
例如,一篇文章重复了“小熊猫灭绝”一词,但没有涉及小熊猫是如何灭绝的,也没有提供任何关于这一现象的相关统计数据,对于对该主题感兴趣的读者来说,这不是一个很好的资源。
寻找人才得更加努力
早期的搜索引擎很难正确解读查询的内容,通常会误解人们的请求。只有当精确的短语匹配时,他们才能产生搜索结果,所以有时用户必须以各种方式描述他们想要的东西,并在找到匹配之前尝试多次搜索。
相比之下,如今,拥有谷歌算法等技术的先进搜索引擎可以熟练地破译你向它们抛出的几乎任何查询——糟糕的拼写和怪异的措辞不会吓住它们。为什么?因为他们利用了语义搜索技术。
为什么电子商务网站和市场需要语义搜索引擎?
由于大量使用谷歌,在单个公司的网站上,大多数访问者都希望能获得像谷歌一样的搜索栏,第一时间生成相关结果,并直观地解释他们查询的正确含义。但是许多托管在线平台和数字市场的公司低估了语义搜索引擎的价值,所以他们没有投资语义搜索。
一个不符合人们基本预期的搜索体验显然是令人失望的,但那只是冰山一角。如果有人访问一家公司的网站,却被过时的搜索技术卡住,相比之下,他们会认为这是一次糟糕的体验。他们也可能不会回到网站,并可能在社交媒体上留下负面反馈,导致公司收入潜在减少。因此,重要的是,运行在线平台的企业高管要认识到这个绊脚石,并采取必要的措施,为他们的用户或客户提供现代搜索体验和丰富的结果。
使用 Algolia 搜索 API 提供强大的语义搜索
Algolia 使用强大的机器学习驱动的语义搜索,为公司的网站访问者和购物者带来有益的在线体验。
Algolia 回答 在资料中寻找深层细节,产生更准确的搜索结果。它的人工智能搜索提供了对查询文本的类似人类的理解,并确保人们可以直观地浏览网站或在线市场。在电子商务平台上,它可以减少人们搜索商品和购买之间的时间,快速跟踪转化。
探索语义搜索的力量,重启你的搜索引擎,联系 us 或 开始免费构建 。
为您的商店提供便捷而强大的 Shopify 搜索
原文:https://www.algolia.com/blog/ecommerce/shopify-search-experience/
作为值得信赖的 Shopify 搜索合作伙伴,我们很高兴宣布与 Shopify 定价模式一致的新定价,并以更低的价格提供对我们许多高级功能的访问。
Algolia 提供搜索和发现体验,可以通过 Algolia 更新的 Shopify 插件快速部署。这种合作关系最早始于 2016 年,从那时起,我们不断改进我们的插件,以满足 Shopify 客户的需求并支持新的 Shopify 功能。
最近来自数字商务 360 的研究显示,在搜索方面的投资有非常高的投资回报率,使许多电子商务网站的转换率翻了一番。
虽然 Shopify 的内置搜索是一个很好的起点,但 Algolia 提供了许多高级功能,可以改善搜索和发现体验,使客户更容易快速找到合适的产品。Algolia 通过实时索引、出色的搜索速度以及一系列搜索和发现功能,包括根据您的独特需求调整文本和业务相关性的能力,增强了 Shopify 购物体验。我们还提供用于配置销售策略的工具,这些工具适用于 Shopify 系列。
下面是一个自动完成菜单的很好的例子,它在用户输入时实时动态更新:
我们的新定价于 7 月 1 日推出,旨在让任何商店都能更方便地进行搜索和发现。即使您是一家小型零售商,也可以轻松开始使用高级功能,并随着业务的增长享受批量折扣。这种新的定价模式使得 Algolia 的 Shopify 搜索对 Shopify 客户来说极具成本效益。
您可以在 Shopify 应用商店 上找到 Algolia,还可以在我们的 网站 上获得更多关于 Algolia Shopify 集成的详细信息并下载插件 。
全渠道购物体验的秘密-欧洲购物网- Algolia
原文:https://www.algolia.com/blog/ecommerce/shoptalk-europe-omnichannel-shopping/
如今购物者没有非此即彼的选择。随着世界走向大流行后的现实,消费者已经开始重新接触他们最喜爱的品牌,无论是在线还是店内。为了取得成功,今天的零售商需要提供无缝体验,连贯地连接所有这些购物接触点。这个百万美元的问题是:你准备好为今天的混合现实提升你的客户体验了吗?
Algolia 的专家们正前往伦敦参加欧洲大陆最大、最具影响力的零售活动 Shoptalk Europe,分享在电子商务和现实世界接触点创造成功的混合零售体验的策略。从 6 月 6 日到 8 日,在 Algolia 的#K22 展位,了解如何利用强大的搜索和发现功能促进您的零售业务。
通过无缝、全渠道接触点提供卓越体验
在经历了两年的零售挑战——疫情停工、供应链中断和陡峭的新技术障碍——之后,随着购物者蜂拥回到商店,实体零售商松了一口气。
回归面对面购物是一个令人兴奋的发展,但现在不是零售商开倒车的时候。在今天的环境中,顶级品牌通过拥有每一个客户接触点来取得成功:店内购物、电子商务和来回购物,以及混合购物,也称为“ 物理购物。 “购物者不仅想要全渠道体验,而且以正确的方式接近混合零售可以让企业抓住不同购物者的脉搏,了解他们的偏好并建立持久的关系。
混合零售的成功之路意味着在正确的地点和时间将产品与人匹配,并在每个可用的接触点提供无缝互动。关键是在每次互动中利用行为数据来预测他们的需求。
鉴于劳动力和商品成本不断上涨,加倍发展混合零售的想法可能会令人望而生畏。在我们最近的 电子商务趋势报告 中,Algolia 调查的 900 名电子商务决策者中,只有 20%认为自己有能力向客户提供个性化的数字购物体验。
在竞争激烈的零售环境中,全渠道体验可以带来巨大的变化。学会如何提供增强的混合体验的在线零售商是那些从专业、利基在线品牌中脱颖而出的零售商,他们是那些站起来对抗亚马逊、Overstock 和阿里巴巴等大型竞争对手的零售商。****
****## 在欧洲购物对话上了解如何通过 Algolia 提供混合购物体验
在 K22 号展位,Algolia 的搜索专家将分享他们在帮助行业领先品牌如鳄鱼、保罗&鲨鱼、安德玛和 Gymshark 在混合零售方面取得成功的知识和专业技能。这些品牌正在利用 Algolia 的 API-first 搜索平台 来增长转化率,增加产品互动,获得重复订单和客户访问。我们的专家可以向您展示如何通过个性化搜索、发现和推荐来构建和创建卓越的数字体验。
Algolia 是创造个性化、强大的电子商务搜索和发现体验的全球领导者,受到全球 11,000 多家客户的信赖。我们的 headless API-first 平台拥有业经验证的成功记录,帮助 Nuts.com 等品牌将转化率提高了 3 倍,Pentair 将在线产品浏览量提高了 500%,Gymshark 实现了 400%的收入增长。
在 Shoptalk Europe 上,我们的专家将分享关于人工智能搜索如何将用户和产品数据整合在一起以增强和扩展零售销售的见解和技术。我们将帮助您的业务团队发现新的销售增长方式,并保持购物者的参与度和回头率,包括:
- 推荐 :根据高级行为分析展示和提炼商品和目录
- 人工智能功能:通过动态重新排序、动态同义词建议和个性化将用户意图转化为有意义的行动
- 简单的实验:灵活的微调和 A/B 测试,以监控和优化性能
Algolia 通过混合方式丰富客户参与度,将在线客户与实体店连接起来,为全渠道零售开辟了新的领域。我们每周为全球 11,000 多名客户提供 300 亿次搜索请求。这些伟大的功能使 Algolia 成为仅次于谷歌的世界第二大搜索引擎。
“Algolia 是 Lacoste 全球平台导航体验的重要组成部分。它不仅提供了以 Lacoste 闻名的一流用户体验,还将我们的全球销售额提高了一倍多。”
全球用户体验经理——Lacoste
了解更多关于 Algolia 和 composable commerce shop talk Europe 的信息
6 月 6 日,从超级游艇上的早餐开始吧!Algolia 专家将在英国夏令时晚上 8:30 到 12:30 回答关于可组合商务的问题。 坐稳最后几个剩余的空位, 此处 。
当天晚些时候,加入 Algolia 和马赫联盟网络的成员进行
Vagabond Wines 的鸡尾酒会,距离欧洲购物中心仅 20 分钟的地铁路程。从下午 5:30 到 7:00,与可组合软件领域的顶尖人物讨论电子商务。点击此处注册。点击阅读更多关于马赫联盟的信息。
在 Algolia,我们一直在幕后进行一项激动人心的产品升级。安排一次会议,或者到 Algolia 的展位(#K22)参观,成为欧洲购物对话的第一批参与者!
不参加欧洲购物对话?
我们仍然希望向您展示像 Algolia 这样强大的搜索和发现解决方案如何帮助您提升混合购物体验。免费预订, 个性化演示 ,让 Algolia 专家对您网站的搜索和销售潜力进行审核。****
简化 Algolia 的包裹递送
原文:https://www.algolia.com/blog/engineering/simplifying-parcel-delivery-algolia/
注意:我们对这篇文章和我们的包装标签读取 OCR 应用程序进行了重大更新。请查看关于如何将 OCR 集成到搜索 的新文章。
每天,Algolia 的员工都会在巴黎办公室收到大量包裹。到目前为止,我们的办公室协调员久美子一直在照顾他们。每次有新包裹到达,久美子都要搜索标签,找出是给谁的,然后找到 Slack 上的人,让他们知道他们的包裹在前台等着。
这种手工流程很有效,但 Algolia 正在快速发展:仅在去年,巴黎办事处的员工人数就增加了一倍多。Kumiko 开始用越来越多的时间手工处理包裹派送。在节日期间,它变得非常难以控制。
A typical day at Algolia, a month before Christmas
显然,手动操作无法扩展。
我在 Algolia 的内部工具小组工作。我们的使命是通过自动化低效的流程、制造工具和提供技术支持来提高 Algolia 团队的效率。我认为应该有一种更快、更容易、可扩展的方式来帮助派送包裹。
我决定为它构建一个 web 应用程序。我的目标是尽可能地自动化这个过程,从扫描标签到通知人们有空闲时间。
第一次尝试:条形码
我的第一个想法是使用标签上的条形码。我想我可以从中提取出雇员的姓和名。然而,我很快发现条形码不包含与二维码相同的数据。大多数时候,它们只包含 EAN 标识符。这些号码旨在查询私人承运商 API 以获取包裹的详细信息。
第二次尝试:OCR
我们为每位 Algolia 员工编制了一份 Algolia 索引,用于我们的关于页面。我认为这可能是一个有趣的起点。想法是用光学字符识别引擎( OCR )来“读取”包裹标签,并将其与索引中的正确记录进行匹配。
第一步:阅读包装标签
有几个处理 OCR 部分的开源库。最受欢迎的是宇宙魔方。然而,在能够要求 Tesseract 识别字符(去饱和、对比度、去倾斜等)之前,您通常需要对图像执行一些预处理。)还有,我们收到的一些包裹标签是手写的!宇宙魔方不擅长阅读手写文字,预处理部分工作量很大。因此,我认为这个解决方案是行不通的。
我知道谷歌的视觉 API ,它提供 OCR 功能,我想尝试一下,所以我决定试一试。除其他外,它规定:
- 每月 1,000 次免费 API 调用(起步绰绰有余)。
- 手写字符检测(测试版)。
我创建了一个 React 应用程序,并安装了 React 网络摄像头组件来访问设备的摄像头。在内部,这个 React 组件利用了 getUserMedia API。
一旦用户用手机捕捉到一个标签,应用程序会将其发送到快递后端。这负责将 base64 编码的图像代理到 Google Vision API。然后,Vision 返回一个 JSON 有效负载,其中包含文本形式的数据。
第二步:用 Algolia 搜索
标签不好看。它们包含许多噪音。相关信息放在某个地方,被其他数据包围着:只与送货人相关的字符、标签号、发件人地址等。此外,顺序不一致,信息也不总是完整的,所以在发送给 Algolia 之前,我们不能依靠单词排序或元素位置来提取相关部分。
显然,我不想为我们的办公室经理选择正确的部件增加额外的手动步骤。这将是很麻烦的,并挫败了应用程序的整个目的。
好在Algolia 搜索 API 有一个有趣的参数 : removeWordsIfNoResults
。
当您将此参数设置为allOptional
并且引擎未能找到原始查询的任何结果时,它会进行第二次尝试,同时将所有单词视为可选。这相当于将单词之间隐含的AND
运算符转换为OR
。
通常,当查询过于严格时,这个参数有助于改善结果。在我的例子中,它允许我发送未经处理的提取数据;我相信 Algolia 引擎会“忽略”查询中无关的单词,只考虑重要的单词。
只剩下几个步骤:从 Algolia 搜索结果列表中提取第一个匹配项,并显示出来。从那里,我们的办公室经理可以确认结果,并自动向正确的员工发送 Slack 消息。
当 Kumiko 拍摄包装标签的照片时,该应用程序会通过 Express 后端将其发送到 Google Vision。Google Vision 返回一个包含已识别文本的 JSON 有效负载,后端将其作为搜索查询发送给 Algolia,并附带removeWordsIfNoResults
选项。Algolia 返回匹配记录的列表,后端从中提取第一个匹配记录,并将其返回给 React 应用程序。这使得 Kumiko 只需轻轻一点就可以直接放松这个人。
https://www.youtube.com/embed/gM0siS-4h0g
视频
Algolia 是一个强大的搜索引擎,但是搜索并不局限于搜索框。只要有一点想象力,您就可以将 Algolia 的使用远远超出盒子的范围,并解决各种问题。
这得益于 Algolia 强大的文化。这个项目源于 Algolia 的核心价值观之一:关爱。我们尽量互相帮助。我是在 Algolia 的每月工程冲刺时做的,这让员工可以进行实验!
使用 ESLint、标记模板文字等来简化 Tailwind CSS
经过多年的开发,我们决定将我们最重要的产品之一——多应用仪表板的用户界面标准化。我们这样做是为了我们的客户和内部用户(易用性)以及我们的产品团队(更容易的设计过程、决策和编码)。我们还需要与我们公司的品牌更加一致。
为此,我们建立了一个内部设计系统,叫做卫星。在开发 Satellite 的过程中,我们研究了 UI 库的不同 CSS 解决方案,各有利弊: Saas , css 模块 ,CSS-in-js。
考虑到框架类似于 Bootstrap,我们选定了 CSS 框架Tailwind CSS。为什么?
- 纯 CSS(无 JS 运行时)——性能良好
- 倾向于生成更小的 CSS 样式表文件(清除后)——对性能也有好处
- 开发新组件时,不要在 CSS 文件和 javascript 代码之间切换
- 没有时间浪费在寻找实用程序类的好名字上
- 有助于提高用户界面的一致性
- 允许你定义一个间距和颜色的集合,很好地映射到设计符号(“受限调色板”)
然而……顺风有一个缺点:复杂组件的可读性。当你不习惯它的类名时,顺风的汤可能很难消化。在我们的例子中,情况变得更糟,因为我们必须使用 CSS 类的前缀版本(stl-
)来避免与我们的遗留 CSS 冲突,这给我们的类名字符串增加了更多的噪音和长度。
这篇文章展示了我们如何减轻可读性问题。首先,我们使用了几种 web 开发技术,比如标记文字和插值,来缩短字符串的长度。然后我们用 linter 工具 ESLint 简化了类名的使用,用两个工具提供了更好的 DX:
- 一个 ESLint 插件,因为当时没有 官方 ESLint-Tailwind 插件 。
- 一个 Visual Studio 代码扩展,通过提供对 Tailwind 的许多类的智能感知来简化使用。 官方 ESLint VS extension对我们不起作用,因为它期望项目中存在一个配置文件(
tailwind.config.js
),而我们当时使用的是预构建版本。在其他任务中,我们需要 VS 来处理我们的配置文件。
这或多或少就是背景。现在让我们进入实现阶段。
类名不错
像Tailwind这样的实用程序优先的 CSS 框架附带了大量预先存在的实用程序类,您可以在 HTML 和 JavaScript 中直接使用它们。这些类实现了代码的一致性。而且它们是完全可配置的:有了相同的类名,我们可以很容易地用变体来标记我们的应用程序。因此,使用 Tailwind CSS 类名使我们能够创建一组一致的颜色、间距、字体——本质上是 CSS 的所有东西——并推出一个易于实现的设计系统。
但是顺风类可以变复杂
我们想简化对 Tailwind 类的使用。为此,我们使用了标记模板文字、插值和条件等技术。
我们从一长串 CSS 类开始,如下所示:
const className = 'stl-inline-flex stl-items-center stl-justify-center stl-rounded-full stl-h-10 stl-w-10 stl-bg-blue-100';
但是我们很快意识到这并不容易读懂。此外,它包含了不必要的噪声,比如前缀stl-
,用来避免与其他类冲突。因此,我们求助于 标记的模板文字 来移除字符串中的前缀。我们创建了一个stl
标签:
const className = stl 'inline-flex items-center justify-center rounded-full h-10 w-10 bq-blue-100';
最后,我们想要更多的可读性。所以我们加了:
- 为了更好的可读性和公共元素的分组,使用单独的行
- 内联标记模板文字插值
- 更强大、适应性更强的造型条件
结果是一段优雅的(CSS)代码:
const className = stl '
inline-flex items-center justify-center
h-10 w-10
${round && 'rounded-full'}
${iscool ? 'bg-blue-100' : 'bq-red-100'}
;
ESLint——毫不费力地纠正人为错误
优雅是一回事。正确是另一回事。很容易拼错类,尤其是当在 Tailwind 中有很多类需要学习的时候。
这里有一个可能出错的例子
cost className = stl 'felx space-between text-gray-200’;
你能发现这些错误吗?
- 切换字母(felx 代表 flex)
- 不完整或不存在的类(空格分隔)
- 美式 vs 英式拼写(灰色)
ESLint 来拯救——创建 ESLint 插件
我们需要验证人们使用的类是正确的。所以我们使用了 linter 工具ESLint来解析代码,分析它,并报告错误。为了保证代码质量,我们创建了一个 ESLint 插件来报告不存在的类名错误。
下面是进行验证的中央 ESLint 代码:
ESLint 使用抽象语法树(AST ),可以访问单独的代码行。AST 本质上将代码的字符串转换成节点,您可以将节点解析为集合和元素。
下面是 ESLint 解析代码的细节。整个表达式是一个类型为VariableDeclataion
: 的node
我们想要解析右边的表达式,即TaggedTemplateExpression
。如您所见,有一个回调函数处理这种表达式:
【T2
在TaggedTemplateExpression
回调中,我们收集模板中的所有字符串。例如:
一旦收集完成,就会有另一个注册的回调循环遍历收集到的类名,并确认它们是否存在。它对集合validClassNames
: 执行此操作
就这样。我们马上知道创建这个验证插件是正确的,因为我们实际上在我们的系统以及现有的仪表板代码库中发现了一些拼写错误!
用我们的 ESLint VisualStudio 扩展提出建议
我们创建的最后一个工具是 Visual Studio 代码中的一个扩展。使用与我们插件中相同的逻辑,ESLint 建议开发人员键入类型脚本类。这种智能感知使开发人员不必猜测或去 Tailwind 网站搜索和找到正确的类。
正如你在 GIF 中看到的,它不仅给出了类名,还显示了每个建议的颜色或有用的图标。
有了 Tailwind CSS 和 ESLint,我们已经能够通过改进 DX 来执行我们的标准(在 Github 上可以内部访问)。
网站搜索和 API:它们如何一起工作
原文:https://www.algolia.com/blog/product/site-search-and-apis-how-they-work-together/
像谷歌这样的搜索引擎和亚马逊这样的网站已经为用户的搜索体验设置了很高的门槛。所有企业,无论其垂直或规模,都在努力达到行业领先网站和搜索工具设定的高标准。要达到这个标准,开发人员需要在设计复杂的搜索功能方面有很高的专业知识,这些功能对用户来说既简单又有益。
不幸的是,大多数开发团队都没有这方面的专业知识。然而,使用搜索 API,开发人员可以快速无缝地将强大的搜索功能添加到他们的 web、移动和语音应用程序中,而无需成为搜索专家。
虽然搜索 API 主要是开发者的工具,但它可以帮助商业用户从用户搜索数据中获得有价值的见解,并给最终用户提供最符合他们期望的搜索体验。
什么是站点搜索?
站点搜索 允许用户快速搜索一个网站的内容或产品目录,并得到相关结果。一些网站搜索平台,如 Algolia,是托管 SaaS 平台,提供最短的上市时间。并不是所有的站点搜索引擎都使用搜索 API,但是如果使用搜索 API,搜索可以实现得更快,得到更好的结果。
网站搜索通过引导客户找到他们正在寻找的产品、服务或内容,使他们受益。它甚至可能 让他们意识到他们甚至没有意识到的事情让他们感兴趣 。它减少或消除了寻找相关结果所需的反复试验。搜索 API 特性,如允许输入错误、自动完成、 联合搜索 、 过滤器/方面 ,以及个性化帮助最终用户快速获得他们需要的结果。
你的公司也可以从网站搜索中获得很多好处
- 捕捉有价值的数据。 你可以 分析搜索数据 更好地了解你的客户在浏览你的网站时的行为。例如,您可以通过查看客户在寻找什么来发现您的产品供应中的差距。
- 支持 SEO 努力。了解你的客户在网站上使用的搜索词有助于你的搜索引擎优化工作。事实上,他们在你的网站上搜索时使用的术语是他们在谷歌或必应等全球搜索引擎中使用的有效关键词的线索。
- 缓解成长的烦恼。随着你的网站发展壮大,承载的内容越来越多,用户可能越来越难找到他们想要的东西。网站搜索使用户很容易找到相关信息,而不管要搜索的内容有多少。
- 无忧维护。使用搜索即服务还有额外的好处。使用托管 SaaS 平台意味着您不必采购、安装和配置服务器。这也意味着您的最终用户可以立即从管理该平台的公司引入的任何改进中受益。
什么是搜索 API?
搜索 API 是一种软件组件,可以快速轻松地为网站或应用程序添加搜索功能。它们通常由后端工具组成,帮助开发人员索引数据、配置搜索查询、处理分析等。现成的搜索 API 可用于 Python、PHP、Java 和其他语言,最大限度地减少了开发人员需要编写的代码量。
搜索 API 如何实现强大的搜索体验
搜索 API 是将现代搜索功能集成到您的网站或应用程序中的最直接的方式。设计一个满足所有终端用户期望的搜索工具需要多种语言、人机交互和计算机系统方面的大量专业知识。搜索 API 将这种专业知识融入到他们的代码中,以便开发人员可以轻松地将强大、快速和现代的搜索功能集成到他们的网站或应用程序中。
在这一节中,我们将描述开发者将从使用搜索 API 中受益的主要功能。
索引数据
当用户搜索网站时,搜索引擎不会通读网站上的每一页来找到相关内容,这将导致搜索速度非常慢。相反,指数是有杠杆作用的。
索引 是一种从数据库记录中提取相关信息,为更快检索做准备的方法。索引基本上是一个表,它将关键字和与这些关键字相关的数据关联起来。
搜索 API 创建这样的索引,有效地在任何查询之前进行搜索,以便它们可以快速响应相关的搜索结果。索引是搜索不辜负用户高期望的一个要求。
配置搜索查询
有很多不同的搜索 API 解决方案。其中最大的区别在于一个 搜索查询配置 可以有多细粒度。搜索配置对于创造一种用户的自然语言能被搜索引擎清楚理解的体验是至关重要的。如果没有它,您的用户将被迫使用您的数据语言而不是他们自己的语言来找到他们需要的东西。
可以配置的一些可能的搜索行为有:
- 首先显示最近的结果
- 首先显示评分最高的内容或产品
- 过滤结果,查找特定的尺寸、口味、品牌等。
您应该能够配置搜索 API 解释查询的方式。可配置项目可能包括:
- 理解同义词
- 理解缩写
- 理解用户的语言
- 可搜索属性列表中属性的顺序。这直接影响搜索相关性。列表中位置较高的属性被认为比位置较低的属性更相关。
更多的搜索查询配置选项让开发者有机会微调搜索结果。它可以确保搜索 API 理解查询以及它与您的数据的关系,从而尽可能提供最佳的用户体验。
分析数据
网站搜索分析 是对访问者在你的网站上的搜索行为的详细考察。这些行为包括关键字和关键短语搜索、过滤器和方面选择以及接受搜索建议。
搜索的主要目标是相关性,因为满足和吸引你的用户取决于这种相关性。搜索分析提供数据帮助你提高 搜索相关性 。例如,分析可以向你展示你的用户可能更喜欢的新词或表达,这样你就可以确保搜索功能理解它们。
分析是一个有价值的工具,可以帮助你了解你的受众。它允许您微调搜索 API,以最好地满足用户的需求。搜索分析还提供可操作的 业务洞察 ,这些洞察可以带来改进,例如更好的产品目录、更有针对性的内容以及更好的整体用户体验。
使用搜索 API 构建强大的搜索体验
搜索 API 帮助开发者高效且有效地实现优化的站点搜索。它们帮助商业用户获得有价值的商业洞察力。它们为最终用户提供了更有价值的搜索体验。
开始为您的用户提供快速且相关的搜索结果。Algolia 的 搜索 API 让开发者可以快速轻松地给用户一个最优的搜索体验。 通过我们的电子书**搜索框外 ,了解更多关于提高电子商务转化率的创新用户体验**
网站搜索和搜索引擎优化:功能如何创造价值
原文:https://www.algolia.com/blog/product/site-search-and-seo/
今天的客户比以往任何时候都有更高的期望。人们期望从他们访问的几乎每个网站和使用的每个应用程序中获得无摩擦、动态的体验。如果他们不能在你的网站上获得正确的体验,他们会简单地尝试竞争对手的网站。
当你的网站易于搜索时,客户更有可能停留在网站上,消费你的内容,进行购买,甚至成为回头客。另外,越多的人在你的网站上搜索,你就可以收集越多的关于他们的行为和需求的数据,从而为商业、营销和 SEO 策略提供信息。
什么是站内搜索?
站内搜索(也称为站点搜索或内部搜索)是允许用户通过在搜索栏中键入查询来从网站检索结果的功能。网站搜索有不同的方法,但它们都是根据用户在搜索栏中的输入来提供网站内容的。
出色的网站搜索体验几乎可以改善任何网站。网站搜索越好,你在两个关键领域就越成功:
- 更高的转化率: 在你的网站上搜索的访问者转化 的可能性至少是 的 200%,使网站搜索成为一个非常强大的电子商务工具。
- 更高的品牌忠诚度: 12%对你的搜索结果不满意的网站访客 会转向竞争对手。提供出色搜索体验的公司会提高品牌忠诚度,并减少竞争中的客户流失。
对于一些网站来说,网站搜索尤其重要,比如电子商务网站,它们依赖于客户快速方便地找到某些产品。但任何有内容集合的网站都可以获得相关、快速、易用的网站搜索的好处:更高的点击率、更多的用户参与以及对客户需求的更好理解。
SEO 之间的连接&站点搜索
在搜索引擎优化(SEO)和网站搜索之间有一个 重要的联系 ,搜索引擎优化首先把用户带到你的网站,网站搜索帮助他们找到他们到达后需要的东西。
现代 SEO 的基础是创建高质量、相关且及时的网页内容,以满足受众的需求。然而,添加到网站的内容或产品越多,就越难找到。
虽然一个强大的导航菜单可以让访问者踏上发现内容的旅程,但每个产品或内容并不能通过它自己的子菜单来获取。(而且,即使他们可以,对用户来说挖掘也是相当麻烦的!一个更好的长期解决方案是投资伟大的网站搜索,它可以帮助用户每次都找到他们需要的东西,而不用不断更新菜单和子菜单。
另外, 网站搜索分析 可以帮你发现你的访客到底想要什么,从而可以提炼和提升你的 SEO 策略。每次搜索,访问者都用自己的话告诉商家他们需要什么。您可以使用这些数据来找出什么产品或内容最受欢迎,以及您的内容营销、销售或产品开发策略中是否有任何差距。
例如,如果成百上千的用户在你的网站上搜索某样东西,但你却没有任何相应的产品或资源,这就引发了一个危险信号。这些数据引发了与内部利益相关者(搜索引擎优化、营销、产品等)的更大范围的对话。)关于如何填补这个空白。由于高需求,你可能会决定加快产品路线图上的某些东西,或者建立一个再营销活动,以执行网站搜索但不立即转换的访问者为目标。
那么说到底,为什么网站搜索如此重要?它有助于您更好地了解您的客户,推动更多的转换,并增加客户忠诚度/回头客。高达 30%的电子商务网站访问者使用搜索功能,而网站搜索者占电子商务网站收入的比例高达 14%。随着一群被俘虏的观众此时此地搜索你的产品,一个好的网站搜索体验是必须的。
站内搜索如何带动 SEO
有许多指标显示了现场搜索的有效性。一个强大的网站搜索解决方案应该具有分析能力,允许你测量这些指标,这可以帮助你发现用户行为和监控你的搜索性能。利用这些信息,你可以推动网站的迭代改进,并帮助你适应用户。一些值得注意的指标包括:
查询
揭示你的用户到底需要什么是 SEO 的基石。分析 查询 ,或者用户在搜索栏中输入的信息,是一种未被充分利用的发现信息的方式。查询提供了最直接的方式来了解访问者在寻找什么,并帮助您确定哪些主题、内容或产品最受欢迎。使用这些信息,您可以采取一些战略性措施,例如在主页上突出显示热门搜索结果,将热门项目放在搜索结果的顶部,或者扩展缺少的内容区域。
关键词
关键词揭示了一些对客户来说很重要的主要话题。这些观点很有见地,因为它们展示了顾客搜索相似商品的不同方式。你的站点访问者也可能在主要的搜索引擎中使用这些相同的术语。分析内部搜索数据可以帮助组织在 PPC 或有机 SEO 活动中找到新的优先关键词。
转换
虽然成功转化的定义可能因业务而异,但它仍然是一个非常重要的跟踪指标。无论转换是由添加到购物车的商品、销售、花费在内容上的时间还是订阅组成,跟踪转换都可以帮助您了解哪些查询比其他查询执行得更好。它还可以帮助您确定哪些产品对您的客户最有价值。例如,如果您找到点击量低但转化率高的查询,您可以采取可操作的步骤为客户突出显示相关项目。总的来说,转化的项目和内容往往与你的用户最相关,可以推动你的活动、产品策略、SEO 策略,甚至线下销售。转换和收入之间的直接联系使它成为一个必须跟踪的指标。
点击率
在一个网站上,点击率(CTR)或点击量是衡量搜索引擎相关性和用户参与度的重要指标。一般点击率越高,用户越满意。如果在你的网站上显示给用户的结果点击率很低,你的网站很可能无法满足用户的需求。也许值得研究一下 重新定义你的站内搜索的相关性 。
点击位置
检查网站上不同内容资产或产品的点击位置可以帮助你了解访问者对它们的可访问性。例如,如果受欢迎的产品或新产品的点击量很低,访问者将很难找到这些内容。这可能意味着应该对一些查询进行处理(例如,提高排名)。使用这些信息,您可以对搜索引擎的相关性进行必要的改进。分析点击位置还可以提供对用户兴趣的精细洞察,这对推动 SEO 和线上线下活动非常有价值。
索引站点搜索页面进行 SEO
像谷歌这样的流行搜索引擎可以用它们的爬虫索引内部站点搜索结果页面。这最初被认为是不可取的,因为组织认为观众在使用谷歌这样的通用搜索引擎进行搜索时,不想看到现场搜索引擎的结果。因此,标准做法是阻止僵尸程序链接到网站搜索页面。
最近,一些大型电子商务网站成功地允许谷歌爬虫索引内部网站搜索页面。这使得访问者可以从谷歌或必应本身获得一系列热门搜索结果,而不仅仅是一个产品或内容页面。
然而,这种策略会带来一些风险。
主要的风险是,如果不加监控,允许机器人抓取站内搜索页面会导致每个关键词的可索引页面。结果是大量用户生成的 垃圾页面 大大降低了搜索结果的有效性和意义。让机器人索引任何关键词都有助于丰富高质量的页面。尽管如此,它还是倾向于创建许多不符合用户需求的低质量页面。
此外,无限制的僵尸程序抓取过多的站点搜索结果页面可能会影响 抓取预算 。大量被谷歌称为“低附加值”的网址会对网站的可抓取性和可索引性产生负面影响。这通常只是大型高流量网站(1000 多个 URL)的问题,但它会对内容的可发现性产生负面影响。
尽管如此,只要你调查并最小化索引站点搜索页面的风险,你就能开发出一个包含 SEO 和用户需求的站点搜索策略。
网站搜索可用性和 SEO
具有良好性能和用户体验的网站往往在使用谷歌这样的搜索引擎时表现更好。搜索功能的可用性直接影响到访问者在网站上的互动质量和参与度。
为了取悦访问者并从网站搜索中获利,企业需要了解如何优化用户参与度。他们可以通过关注:
- 视觉效果:在搜索结果中包含图片使现场搜索更具吸引力和用户友好性。
- 搜索结果相关性: 一个不令人满意的搜索体验会迅速将访问者推向其他网站。因此,根据文本和商业排名规则定制的相关结果是必要的。
- 页面加载速度: 虽然几毫秒的延迟在纸面上看起来很小,但用户对微小的延迟很敏感,这种延迟会在搜索体验的过程中逐渐积累。搜索功能应该 建立在健壮的基础设施 上,以防止令人沮丧的延迟。
这些只是可以提高网站可用性的现场搜索的一些基本方面。如果实施得当,组织可以创造更好的用户体验,提高客户满意度,同时推动 SEO 目标的实现。
用 Algolia 优化你的站内搜索
今天,现场搜索对任何企业来说都是无价的财富。它使组织能够提高转换率,在需要时提供他们想要的信息,并为网站的持续成功制定战略计划。
Algolia 为我们所有的客户提供了始终如一的无摩擦体验。 观看 Algolia 演示 了解我们的搜索行动!
网站搜索如何推动内容发现
原文:https://www.algolia.com/blog/ux/site-search-content-discovery/
互联网上充斥着各种内容。随着每天都有新的内容和产品出现,用户比以往任何时候都更难找到相关信息。由于用户只搜索他们当前需要的东西,他们可能会错过新的相关产品或内容。
同样,企业也在一个日益拥挤和增长的市场中竞争,获得和留住新客户比以往任何时候都更加困难。企业努力向访问者展示网站提供的全部产品,并以支持 KPI 的方式与客户互动。
内容发现为用户和企业面临的问题提供解决方案。通过让企业打破所有的噪音,它连接新的和相关的内容访问者。事实上,内容发现对于企业保持可见性和在任何行业取得成功都是至关重要的。
什么是内容发现?
内容发现在网站访问者和内容之间充当桥梁,使这些访问者能够找到新产品、内容和服务。最好的情况是,内容发现以有益的、鼓舞人心的和相关的方式将访问者与网站内容联系起来。它还可以提供直观的浏览体验,激励用户接触新内容并重新连接收藏夹。
内容发现,有时也称为搜索和发现,最适合用作商业战略的一部分,更大的 网站搜索 战略。
最终,用户可以通过两种主要方式发现新内容:
检索。在这种情况下,用户访问网站的目的是找到非常具体的东西。他们可能会在搜索栏中搜索,或者有意识地使用网站导航来找到他们需要的东西。在这个过程中,他们可能会在搜索结果中遇到促销横幅、促销产品或相关内容,这些内容显示了他们预期不会需要的东西。
探险。 在这种情况下, 用户进入具有更广泛意图的良好优化的站点,并发现新的内容和产品。成功的发现可能始于卓越的搜索,但在大多数情况下,它是通过网站的各种功能实现的,如内容层、产品货架、促销横幅、编辑管理、产品和内容推荐等。
内容发现流程不应与内容发现网络混淆,内容发现网络是一种广告平台,允许企业在网络上的其他网站上推广其内容。像 Outbrain 这样的广告平台在其他网站上展示链接框,鼓励用户离开页面,访问赞助链接。
搜索和发现环境中的内容发现有很大不同。内容发现帮助你更好地转化你已经拥有的流量,而不是给网站带来更多低质量的流量(其中大部分会导致立即反弹)。一个伟大的内容发现系统在你自己的网站上可以帮助用户更容易地找到他们需要的东西,这可以降低跳出率,鼓励转化,从你的网站流量中获得更高的投资回报率。
搜索和发现如何帮助最终用户和企业
内容发现对用户和业务都有重要意义。
对于用户来说,好处包括:
预测用户需求: 了解客户行为和偏好的商家可以展示最符合未来需求的内容和产品。该网站可以引导用户找到他们下一步可能想要的东西。例如,当用户结账时,提供补充产品既可以增加消费者的价值,也可以增加平均购物篮大小。这也意味着用户将永远有一条发现之路,并且几乎不会遇到一个 【没有结果】的页面 。
提供个性化体验: 如今, 63%的客户 期望服务和体验个性化。个性化的浏览和搜索体验大大增加了转化的可能性,并改善了整体用户体验。搜索和探索可以基于过去的交易历史进行高度个性化,并塑造每个访问者的网站之旅。这不仅仅是为了追加销售。而是可以把被动的浏览者引导到相关产品上,把他们变成主动的客户。
好处也延伸到业务,包括:
改善关键业务指标。通过向用户展示目录的深度、产品的范围和内容的全部范围(全部在一个大 UX 内),企业可以推动优先 KPI。对于电子商务网站来说,内容发现与平均购买量和销售量的增加密切相关。对媒体而言,它支持客户忠诚度,并推动每用户平均收入。对所有网站来说,更多的顾客参与会带来更高的转化率。
推动营销目标。 此外,内容发现系统允许营销人员推广和测试新产品。当内容发现直接嵌入到站点搜索中时,这就有效地提供了一个有机的营销渠道。不利用免费广告将是一种浪费。
通过搜索建立直观的内容发现
搜索是一个强大的工具,可以塑造访问者在网站上的全部体验。从搜索、浏览到推荐产品,搜索是实现有效内容发现的关键。
为你的内容发现提供四个提示和技巧
以下提示有助于创建全面有效的内容发现流程:
增强您的搜索:您是否知道在网飞,20%的发现流来自于搜索?通过加强搜索,您可以让客户发现新事物。一种方法是通过 启用匹配更广泛意图的发现查询。通过在初始查询和相关内容之间建立联系,您可以用鼓舞人心的相关内容来丰富结果集。
**为发现优化 UX:**搜索界面不应该是简单的文本框。相反,它应该支持 联合搜索 ,允许用户通过一次搜索探索多种类型的内容,通过强大的 UX、灵活的过滤器和类别显示。这样,用户可以通过搜索与网站进行交互,而不必学习自定义工作流来查找内容。您还可以使用查询扩展功能和动态过滤器邀请您的用户浏览更多内容。越来越多的人也在寻找像人类互动一样自然的 UX。还可以通过语音搜索功能来增强搜索。
收集数据并迭代: 搜索的一个强大部分是用户告诉你他们到底想要什么,以及他们期望如何参与。您应该定期查看常见的搜索查询,并确定如何继续 优化搜索结果 以更好地改善客户体验。 塑造你的浏览体验取决于用户趋势和你的商业策略。您的推广内容应该根据客户用户趋势和业务策略动态变化。通过各种形式:横幅、轮播、内容架。
定制你的推广排名策略: 你应该根据你个人的业务和用户需求,建立一个定制的内容排名策略。例如,您可能希望将新产品、特定位置的商品或利润较高的商品推到搜索结果的顶部。内容发现体验应该适合每个人。研究显示 48%的消费者在体验个性化时会花费更多的 。使用自动推荐来留住用户,并增加平均购物篮大小或会话时间。
寻找搜索和发现伙伴
搜索和内容发现是在任何网站上提供引人注目的用户体验的关键。Algolia 的 综合搜索平台 可以为一系列不同的使用案例提供丰富的内容发现体验:
了解 Algolia for 网站搜索 如何通过量身定制的体验来提高贵公司网站受众的参与度。
观看我们的网络研讨会“ 征服拥挤的媒体环境 ”,了解媒体公司如何帮助用户以新颖有趣的方式找到优秀的内容,同时提高转化率、CX 和投资回报率。 观看我们的网上研讨会“ 加速内容发现并推动增长 ”,了解电子商务网站如何减少访问者寻找合适产品的工作量并提高转化率
如何在拥挤的流媒体领域脱颖而出
原文:https://www.algolia.com/blog/ux/stand-out-crowded-streaming-media-landscape/
随着最近 Apple TV+的推出和预期的迪士尼+的到来,流媒体市场越来越拥挤。过去,消费者可以在一个电视包中获得所有内容,现在他们需要在许多流媒体平台中挑选。 一方面,这似乎是另一条健康的创新之路,推动传统演员通过更方便、更愉快的体验来传递他们的内容。的确,体验已经随着老牌 OTT 玩家设定的新标准而得到显著改善:可视化、流畅、身临其境、可在任何设备上访问、使用每种流行语言。
但这都是好消息吗?
由于纯 OTT 服务和线性电视公司都已经数字化,现在有超过 300 个视频服务通过互联网 传输,平均每个家庭订阅 3-4 个。问题不仅仅出在消费者方面,在消费者方面,内容是分散的,只能通过多次订阅才能访问。对于这些服务的提供商来说,挑战也很大。
服务提供商必须问自己两个问题:
- 我们如何让消费者选择我们的服务?
- 一旦他们选择了我们的服务,我们如何保持用户的参与度和忠诚度?
内容是吸引和留住用户最重要的因素。大多数消费者选择订阅流媒体服务来访问他们感兴趣的电影、连续剧和节目。但是他们如何知道每个服务的目录中有什么呢?大多数服务提供数百个(如果不是数千个)视频(例如,仅亚马逊 Prime 的 offe rs 就超过 17,000 个 内容)。由于复杂的许可规则,目录也因国家而异。如果没有彻底的调查,用户几乎不可能知道任何流媒体目录的确切内容。
这就是为什么流媒体服务不仅要关注向用户呈现什么内容,还要关注以快速、相关、个性化的方式呈现内容。
浏览流媒体视频目录的两个用户可能有着截然不同的动机。一个想要 检索 特定的一段内容(例如,“夏洛克·S2·EP3”),而另一个想要 探索 匹配更广泛标准的目录的一部分(例如,“浪漫喜剧电影”)。
无论使用何种情况,用户都会选择与为 提供快速、相关和个性化方式的 的平台进行互动,以符合他们的意图。强大的搜索和发现功能对于获取和吸引用户至关重要。
构建顶级搜索和发现体验的一些挑战包括:
- 提供即时搜索和浏览体验,最大限度降低跳出率
- 用最相关的结果回答任何特定或宽泛的意图
- 在客户旅程的每一点,通过动态内容推广吸引用户
我们的新电子书, 赢得流媒体搜索军备竞赛 通过聚焦 France.tv、Twitch 和 iflix 如何提供卓越的用户体验来探索这些挑战。重点是展示顶级搜索和发现如何让顶级媒体公司脱颖而出。
建议的搜索和自动完成如何协同工作
原文:https://www.algolia.com/blog/ux/suggested-search-and-autocomplete-what-is-it-and-how-does-it-work/
你或许可以想象,当你进行网络搜索并在搜索查询中输入字母时,如果建议的搜索功能能够说话,它会说些什么:
“啊哈,我赌 这个 就是你要的。”
“或者哎,那 这个呢?
“这里有更多有根据的猜测,以防我遇到高级搜索引擎。”
现在 我知道……你要 这个!
“打哈欠。这就是 这个人口统计学里的每个人 想要的。”
嗯,它可能没有自以为是的态度,但你不得不同意,一个“智能”的搜索引擎在哼唱时喃喃自语有用的搜索建议,至少会有点娱乐性。
你的搜索引擎有多智能?
建议搜索当然是无声的,但却是高效的,帮助用户筛选搜索结果页面的可能性,以输入保证会返回很好结果的查询。当你可以在眨眼之间得到你需要的东西,并且享受到满意的客户体验时,这难道不是值得的吗?如果他们使用移动设备试图找到正确的网页,结果会被放大。根据 Baymard Institute 的数据,78%在移动测试中使用搜索功能的人依赖自动完成选项来获得帮助。建议搜索意味着他们可以停止输入(万岁),只需点击正确的建议,获得他们想要的内容,并继续他们一天的社交媒体冲浪、游戏、阅读新闻或他们当前沉迷的任何活动。
什么是建议搜索?
就正式定义而言,建议搜索(或 关键词查询建议 或仅仅是 查询建议 )是一种搜索特征,它预测正在输入的搜索项的剩余部分,以及用户开始键入的下一个单词或短语。
自动填充建议列表是数据驱动的,利用通过将人工智能应用于输入而生成的分析信息,例如人们的浏览历史和用户搜索历史(过去的搜索)。
搜索建议——热门搜索、热门短语或基于最近搜索的推荐——然后神奇地出现在搜索框中的字符串下方。它们可以实时编辑,以考虑每个新字母的添加。
当然,这些短语只是潜在更准确或更相关的查询的 建议——促使尝试更精确的查询,以便检索更具体的结果。无论如何,搜索者可以选择一个看起来不错的建议,或者,如果正确的项目没有出现,继续输入字母,直到搜索引擎产生他们正在寻找的项目。
建议搜索与自动完成
如果你一直在关注,你可能想知道建议搜索(或预测搜索)和自动完成之间的区别。毕竟,它们听起来不都是一样的基本东西吗?
是的。但是 查询建议 是指从文本输入中生成的建议。
术语(或“下拉菜单”)指的是 用户界面 让特定用户与预测的搜索项目或查询建议进行交互。自动完成实际上只是一个容器。在这种情况下,它可以显示搜索结果,而不是建议的搜索。
现在你有了对建议搜索及其助手自动完成的理解。
亚马逊和谷歌搜索当然有最好的搜索建议。但许多其他较小的利基网站也采用了同样的自动建议技术,试图模仿谷歌的个性化搜索。
这是一件好事,因为大多数消费者已经习惯了搜索快捷方式的便利,比如让查询建议出现在自动完成功能中。如果你输入查询,希望享受与谷歌搜索结果相同的功能,那么你会注意到那里是 而不是 ,也许会翻个白眼,气呼呼地离开网站。
建议搜索功能的好处
当网站用户从基于自动完成数据的搜索建议中进行选择,而不是键入他们自己的完整查询时,他们可能会有更积极的用户体验。他们可以享受现代搜索、个性化搜索结果,并了解热门搜索,而不是例如:
- 不得不考虑 他们之前的搜索,然后尝试一个可能失败的查询;相反,当搜索引擎猜测时,他们可以指向适当的短语
- 费力地输入字母 (并导致打字错误),特别是如果他们在他们的迷你设备上,比如 iphone 或 Android 手机
- 绞尽脑汁 关于什么是相关搜索措辞;相反,当它出现时,他们可以简单地寻找正确的片段
- 担心 他们没有得到正确的内容(因为根据他们感知的用户意图,他们肯定 是 )
搜索推荐是如何工作的?
以下是该过程的一些细节:
- 为了从数据库中选择相关建议,应用了语法和人工智能或机器学习算法
- 预测性搜索建议的生成方式可以被编辑,以更准确地满足搜索者的需求
- 一些预测搜索功能使用来自内容管理系统的频繁搜索数据,通过应用结构化参数和分层列表来细化查询,然后呈现最相关的结果
- 对于不同的解决方案,自动完成功能的编码可能有所不同
- 典型的实现是为每个输入的按键提供查询建议
- 当查询建议索引被配置时,它开始填充来自其用户如何与搜索体验交互的建议。
你的流量越多,你能产生的建议就越多。
根据您的需求进行配置
如果需要,您可以在同一个自动完成预测界面的多个部分中提供建议和结果,每个部分来自不同索引的搜索或覆盖不同方面的值,例如产品、类别、品牌、文章或博客文章
你可以让你的软件规范化和完善建议,以删除重复、相似和带前缀的建议。您也可以取消某些搜索条件。例如,Algolia 的查询建议不会将包含非字母数字字符的术语作为建议,不符合查询给定源索引时配置的最小结果数,不符合配置的最小字母数,或者匹配任何禁止的表达式。从 analytics API 获取的热门搜索被聚合,然后进行更多的规范化。
想要个建议?考虑 Algolia 搜索
搜索建议不仅能帮助那些需要在网上找到东西的人,也是优化你的电子商务网站和 增加转化率 的好方法。
为搜索相关性微调你的用户体验可能会让人望而生畏。一个更简单的选择:与 Algolia 这样的 搜索即服务合作伙伴 合作,Algolia 提供您的搜索 UI、分析和其他工具,让您根据您的用例和用户数据创建最佳搜索体验。
Plus with Algolia,您的站点搜索个性化可以更进一步,在您的搜索栏中使用自动完成建议,添加 等更直观的功能 即时搜索结果和 联合搜索 。这些基于自动完成的功能附带了创建即时反馈循环的方法,可以提高相关性和速度,并最终推动所有个人用户的发现。
如果您准备好了解如何利用我们成熟的搜索算法和近实时搜索, 联系我们 。你是开发商吗?开始 免费构建出 您的新解决方案。今天就来看看 Algolia 的搜索技术吧!
日落我们的地方功能
原文:https://www.algolia.com/blog/product/sunsetting-our-places-feature/
我们有重要的消息要分享。经过慎重考虑,我们决定取消我们的地点功能。在接下来的 18 个月里,我们的客户将能够不受干扰地继续使用这些地方,因为我们希望确保有足够的时间找到替代方案。但是,我们将不再积极投资该功能。
Algolia Places 最初创建于 2014 年,是 Google Places Autocomplete 的一个很好的替代品,满足了市场对搜索巨头产品的替代需求。地址搜索是一个复杂而难以解决的问题,但我们的搜索引擎是唯一能够解决它的,Algolia Places 是作为一个快速,美观,易于使用的地址自动完成功能而构建的。
尽管我们在 Algolia Places 取得了成功,但也面临着挑战。具体来说,Places 的构建依赖于由开源社区维护的 OpenSteetMap。结合绘制世界地图是一项永无止境的任务这一事实,这意味着该功能是有限的,取决于它所搜索的国家,尤其是当试图包括街道级别的精度时。
在 Algolia,我们努力始终提供一流的产品质量。在对该功能进行了严格和诚实的评估后,我们意识到 Places 没有达到我们自己为之自豪的质量标准。我们对解决 Places 缺陷所需的要求进行了全面分析,鉴于市场上存在更好的解决方案,我们做出了艰难的决定,即最好将精力集中在其他产品领域。这一决定将使我们能够以更快的速度投资和发展 Algolia 关键产品竞争力,如 Algolia AI(Algolia AI 2010 年秋季网络研讨会)。
如果您是整个 Algolia 团队的 Places 客户,我们很抱歉给您带来任何不便。我们致力于尽可能平稳地过渡,这也是我们将继续支持 Places 直到 2022 年 5 月 31 日的原因。为了帮助您开始,我们提供了一些潜在的替代方案:
如果您遇到过渡问题,请随时联系我们的支持团队,我们将尽最大努力提供帮助。感谢您成为 Algolia 社区的一员。
搜索分析:从用户搜索数据中获得洞察力
原文:https://www.algolia.com/blog/product/supercharging-search-analytics/
通过分析你的用户搜索什么,你可以了解他们想要什么,他们使用哪些关键词。通过观察他们如何与搜索结果互动,你可以了解你的服务如何满足他们的愿望。
最重要的是,通过搜索,你可以获得关于用户意图的宝贵反馈:这些反馈可以加速他们的数字化之旅,从而增加你的收入。但这只有在你积极使用他们通过搜索提供给你的数据的情况下才是真的——如果你收集、分析和展示这些数据的话。
我们的新分析
我们的分析功能将首次全程跟踪搜索流程——从开始到结束。我们不仅分析输入的查询和使用的过滤器,还分析检索到的结果以及用户如何与它们交互。人们点击结果列表吗?他们会在购物车中添加产品、阅读文章或观看视频吗?
今天,我们发布了一个新的分析功能,可通过 API 和最新更新的前端仪表板获得。它旨在跟踪搜索后的点击和转换事件。
新功能
分析 API
搜索。 提高查询和关键字用户类型的可见性,以及返回零结果的查询。为一次性有问题的查询设置 查询规则—或者调整您的可搜索属性以解决系统性问题。
滤镜。 Cr 根据用户搜索时选择的最常用过滤器,针对特定关键词预定义过滤器,从而加快转化速度。
结果。我通过洞察用户在执行搜索时看到的结果来提高每个查询的相关性。识别和分析低质量的搜索结果,并找到有问题的查询,如常见的错别字、模糊的查询和查询重构,以改善内容和相关性。
点击分析 API
**点击。**Ga 洞察用户正在点击什么结果,那些结果出现在什么位置,以及特定搜索查询的平均点击位置
转换。 加入搜索和转换数据,以了解哪些搜索结果正在转换,并改进导致用户放弃 的搜索查询
为什么有用
搜索分析提供价值的主要方式有两种:给你可操作的商业洞察力,以及帮助你提高搜索引擎的相关性。
商业见解
- 完善你的产品目录或内容。 例如,一个电子商务平台可以意识到客户经常询问某个特定产品,他们应该将该产品添加到他们的目录中。新闻媒体可以了解更多他们的观众想了解的话题。
- 提升 SEO 。如果你的用户在你的网站上搜索某些词,这些词很可能也是他们在谷歌上输入的词。
- 推动你的销售和营销计划。注意到像“健康”、“便宜”或“革命”这样的主题词的流行可以推动你未来的活动。
提高搜索的相关性
分析表面提高搜索相关性的简单方法:
- 查询“沙发”没有返回结果?也许你错过了“沙发”的同义词“沙发”。
T39 - 查询“番茄”的点击率比你希望的低?也许你的关联配置检索到的“番茄汤”比实际的番茄要高,你需要改进你的关联策略。
- 你搜索到的最多的文章与你最好的文章不相符?你可以更新你的排名来展示更多。
这只是开始!
自从我们创建 Algolia 以来,我们的目标一直是专注于打造最好的搜索引擎,而我们新的分析功能是这条道路上的又一步。它为我们引擎的强大基础增加了一个新的维度:文本和业务相关性、速度和可靠性。
我们迫不及待地想看到您如何利用分析技术对您的搜索体验和业务做出有意义的改进。我们当然计划在这一过程中为您提供指导,并帮助您充分利用您的分析所带来的洞察力。
参加我们 4 月 5 日的网络研讨会,了解搜索分析如何帮助提高转化率。另外,c 查看以下资源或 联系我们进行演示 :
不要犹豫,联系并分享你的问题和反馈:给我们发邮件, 发推特给我们 ,评论这个帖子。
Algolia+MongoDB–第 3 部分:数据管道实现
我们邀请 Starschema 的朋友写一个结合使用 Algolia 和 MongoDB 的例子。我们希望您喜欢这个由全栈工程师 Soma Osvay 撰写的四部分系列。
如果你想回顾或跳过,以下是其他链接:
在我开始之前,有一点需要注意:你可以在这里跟随实现。
在上一篇文章中,我们分析了我们的数据管道架构,并留下了一个关于我们将如何运行 Python 脚本来加载 Algolia 索引的未决问题。有三种选择:
- 编写嵌入 ETL 过程的 Python 脚本,同时更新 Algolia 索引和 MongoDB。
- 托管 Python 脚本,完全独立于我们现有的 ETL 工作流,将数据从 Mongo 拉到 Algolia。
- 在 MongoDB 更新之后,使用 MongoDB 触发器和函数来更新 Algolia 索引。
在与我们的工程团队讨论后,我决定选择第一个选项,因为我们已经有了一个成熟的方法来运行当前的数据准备管道,在将数据加载到数据库之前,我们会使用大量现有的脚本来清理、聚合和格式化数据。在这里添加一个额外的脚本不会花费太多精力,所有的维护和监控工具都是现成的。在决定了架构步骤之后,我决定编写一个脚本,既执行到 Algolia 的初始数据加载,又保持索引最新,而不是为每个动作编写一个脚本。
令人欣慰的是,Algolia 通过公开一个 replace_all_objects
方法来支持这种用例,该方法实际上首先创建一个新的临时索引,然后在构建完成后将其与活动索引交换。这使得旧索引和刷新索引之间的转换几乎是即时的,没有任何停机时间或数据不一致。
第 0 步。规划
在开始实现我的 Python 脚本之前,我必须注册一个免费的 Algolia 帐户,并创建一个样本数据集,我可以使用 MongoDB Atlas 来填充我的索引。
我选择使用 Atlas 自带的默认 AirBnB 数据集,因为其格式和用例与我的现实生活数据非常相似。我还公开托管了样本数据集,供跟踪或想要试验的任何人使用:
- 主机 :
algolialistingstest.vswcm0y.mongodb.net
- 用户名 :
ReadOnly
- 密码 :
AlgoliaTest
- 数据库 :
sample_airbnb
- 收藏 :
listingsAndReviews
我决定使用 Jupyter 笔记本来实现这个脚本,因为它让我能够独立地测试我的代码片段,用 Markdown 注释我的代码,反复试验和建模数据结构,并轻松地将创建的 Python 代码导出为脚本文件。它的功能非常多,交互性也很强,我通常很喜欢使用它。我把它放在 Google Collab 上,所以我可以很容易地分享代码,而不需要任何人安装一个内部 Jupyter 环境。你可以在这里找到实现的脚本。我们使用实现的脚本来:
- 使用 Algolia Python API 连接到 Algolia,并验证连接。
- 连接到 MongoDB 实例并检索样本数据。
- 准备阿尔戈利亚指数。
- 将数据集从 MongoDB 实例加载到 Algolia 中,并替换现有的索引。
第一步。连接到 Algolia
第一步是生成 API 密钥:
- 注册一个免费的 Algolia 账户,或者登录您现有的账户。
- 登录后,将自动为您创建一个 Algolia 应用程序。您可以使用默认的未命名应用程序,也可以创建一个新的应用程序。
- 转到您的应用程序的 API 密钥部分,检索您的应用程序 ID 和管理 API 密钥。从下面的 Python 代码连接您的 Algolia 帐户时,您将需要使用这两个工具。
我们需要先安装 Algolia Python 客户端,但之后,我们的连接代码看起来是这样的:
# The Application ID of your Algolia Application
algolia_app_id = "[your_algolia_app_id_here]"
# The Admin API Key of your Algolia Application
algolia_admin_key = "[your_algolia_admin_key_here]"
# Define the Algolia Client and Index that we will use for this test
from algoliasearch.search_client import SearchClient
algolia_client = SearchClient.create(algolia_app_id, algolia_admin_key)
algolia_index = algolia_client.init_index("test_index")
# Test the index that we just created. We do this as part of the function, because these variables are not needed later
def test_algolia_index(index):
# Clear the index, in case it contains any records
index.clear_objects()
# Create a sample record
record = {"objectID": 1, "name": "test_record"}
# Save it to the index
index.save_object(record).wait()
# Search the index for 'test_record'
search = index.search("test_record")
# Clear all items again to clear our test record
index.clear_objects()
# Verify that the first hit is our object
if len(search["hits"]) == 1 and search["hits"][0]["objectID"] == "1":
print("Algolia index test successful")
else:
raise Exception("Algolia test failed")
# Call our test function
test_algolia_index(algolia_index)
第二步。连接到 Mongo 并获取数据
首先,安装 Python MongoDB 客户端 PyMongo ,然后使用这段代码连接到我们的示例 MongoDB 数据库并读取示例数据。请注意,我们只获得 5000 个项目,这样我们就不会超出我们的免费层使用量:
# Define MongoDB connection parameters. These are wrapped in a function to keep the global namespace clean
# Change these values if you are not running your own MongoDB instance
db_host = "algolialistingstest.vswcm0y.mongodb.net"
db_name = "sample_airbnb"
db_user = "ReadOnly"
db_password = "AlgoliaTest"
collection_name = "listingsAndReviews"
connection_string = f"mongodb+srv://{db_user}:{db_password}@{db_host}/{db_name}?retryWrites=true&w=majority"
# Connect to MongoDB and get the MongoDB Database and Collection instances
from pymongo import MongoClient
# Create MongoDB Client
mongo_client = MongoClient(connection_string)
# Get database instance
mongo_database = mongo_client[db_name]
# Get collection instance
mongo_collection = mongo_database[collection_name]
# Retrieve the first 5000 records from collection items
mongo_query = mongo_collection.find()
initial_items = []
for item in mongo_query:
if len(initial_items) < 5000:
initial_items.append(item)
第三步。将我们的数据转换成适合 Algolia 的形式
我们的 MongoDB 样本数据集中的对象包含许多属性,其中一些与我们的 Algolia 索引无关。我们只保留搜索或排名所需的内容。
- 属性将被保留,因为它也将是 Algolia 对象 ID。
- 这些属性将被保留用于搜索、刻面或显示:
name
、space
、description
、neighborhood_overview
、transit
、property_type
、address
、accommodates
、bedrooms
、beds
、number_of_reviews
、bathrooms
、price
、weekly_price
、security_deposit
、cleaning_fee
、images
。 - Airbnb 条目上的
review_scores
属性将被转换为 scores 属性,该属性将包含给予该列表的星级数。 - 一个
_geoloc
属性将根据原始地址对象中的字段添加到对象中。这将用于地理搜索。 - 以下属性由于 Algolia 不需要,将被完全剥离:
summary
、listings_url
、notes
、access
、interaction
、house_rules
、room_type
、bed_type
、minimum_nights
、maximum_nights
、cancellation_policy
、last_scraped
、calendar_last_scraped
、first_review
、last_review
、amenities
、extra_people
、guests_included
、host
、availability
、review_scores
、reviews
。
这里是这个转换代码:
# We define a function first that is able to strip long texts longer than 350 characters. This is done because the sample data has some records with very long descriptions, which is irrelevant to our use-case and takes up a lot of space to display
def strip_long_text(obj, trailWithDot):
if isinstance(obj, str):
# Strip texts longer than 350 characters after the next full stop (.)
ret = obj[:350].rsplit(".", 1)[0]
if trailWithDot and len(ret) > 0 and not ret.endswith("."):
ret = "."
return ret
else:
return obj
# We define a function to validate number values coming from MongoDB. MongoDB stores numbers in Decimal128 format, which is not accepted by Algolia (only as string). This function:
# 1\. Converts numbers to float from Decimal128
# 2\. Introduces a maximum value for these numbers, as some values in MongoDB are outliers and incorrectly filled out and it gives range filters an unreal max value.
def validate_number(num, maxValue):
if num is None:
return num
else:
val = float(str(num))
if val > maxValue:
return maxValue
return val
def prepare_algolia_object(mongo_object):
# Create an instance of the Algolia object to index, and set its objectID based on the _id of the mongo object
r = {}
r["objectID"] = mongo_object["_id"]
# prepare the string attributes
for string_property in [
["name", True],
["space", True],
["description", True],
["neighborhood_overview", True],
["transit", True],
["address", False],
["property_type", False],
]:
if string_property[0] in mongo_object:
r[string_property[0]] = strip_long_text(
mongo_object[string_property[0]], string_property[1]
)
# prepare the integer properties
for num_property in [
["accommodates", 100],
["bedrooms", 20],
["beds", 100],
["number_of_reviews", 1000000],
["bathrooms", 100],
["price", 1000],
["weekly_price", 1000],
["security_deposit", 1000],
["cleaning_fee", 1000],
]:
if num_property[0] in mongo_object:
r[num_property[0]] = validate_number(
mongo_object[num_property[0]], num_property[1]
)
# prepare the Sortable attributes (except for scores rating)
# set rating if any
if (
"review_scores" in mongo_object
and "review_scores_rating" in mongo_object["review_scores"]
):
stars = round(mongo_object["review_scores"]["review_scores_rating"] / 20, 0)
r["scores"] = {
"stars": stars,
"has_one": stars >= 1,
"has_two": stars >= 2,
"has_three": stars >= 3,
"has_four": stars >= 4,
"has_five": stars >= 5,
}
# set images
if "images" in mongo_object:
r["images"] = mongo_object["images"]
# set GeoLocation if any
if "address" in mongo_object:
if "location" in mongo_object["address"]:
if mongo_object["address"]["location"]["type"] == "Point":
r["_geoloc"] = {
"lng": mongo_object["address"]["location"]["coordinates"][0],
"lat": mongo_object["address"]["location"]["coordinates"][1],
}
return r
第四步。定义我们的索引属性
现在让我们告诉 Algolia 如何处理我们赋予它的属性。我们将设置[attributesToRetrieve](<https://www.algolia.com/doc/api-reference/api-parameters/attributesToRetrieve/>)
,Algolia 将在我们的 UI 中显示的每个搜索结果返回的属性,为这些属性的数组:summary
、description
、space
、neighborhood
、transit
、address
、number_of_reviews
、scores
、price
、cleaning_fee
、property_type
、accommodates
、bedrooms
、beds
、bathrooms
、security_deposit
、images/picture_url
、_geoloc
。我们的[attributesForFaceting](<https://www.algolia.com/doc/api-reference/api-parameters/attributesForFaceting/>)
数组将包含property_type
、address/country
、scores/stars
、price
和cleaning_fee
。
我们还将设置[searchableAttributes](<https://www.algolia.com/doc/api-reference/api-parameters/searchableAttributes/>)
,这是计算查询时要考虑的属性。Algolia 不会浪费时间在这个列表之外寻找潜在的搜索匹配,因此它加快了查询速度,并让我们从最高到最低设置优先级顺序:
- (最高优先级属性)
name
、address/street
、address/suburb
address/market
,address/country
description
(这将是一个无序属性)space
(另一个无序属性)neighborhood_overview
(另一个无序属性)- (最低优先级)
transit
我们还将更新索引的默认排名逻辑:
- (第一要务)
geo
–就近提供搜索结果是我们的首要任务 typo
words
filters
proximity
attribute
exact
- (最不优先)
custom
我们还更新了我们的索引,以忽略复数(你可能不会想太多,但是当它像你的用户不期望的那样工作时,你的用户肯定会想的)。你可以在官方 Algolia API 参考页面上找到其他很棒的资源和设置。下面是我们为这个编写的代码:
algolia_index.set_settings(
{
"searchableAttributes": [
"name,address.street,address.suburb",
"address.market,address.country",
"unordered(description)",
"unordered(space)",
"unordered(neighborhood_overview)",
"transit",
],
"attributesForFaceting": [
"property_type",
"searchable(address.country)",
"scores.stars",
"price",
"cleaning_fee",
],
"attributesToRetrieve": [
"images.picture_url",
"summary",
"description",
"space",
"neighborhood",
"transit",
"address",
"number_of_reviews",
"scores",
"price",
"cleaning_fee",
"property_type",
"accommodates",
"bedrooms",
"beds",
"bathrooms",
"security_deposit",
"_geoloc",
],
"ranking": [
"geo",
"typo",
"words",
"filters",
"proximity",
"attribute",
"exact",
"custom",
],
"ignorePlurals": True,
}
)
第五步。将数据集从 MongoDB 加载到 Algolia
这段简短的代码将数据集加载到 Algolia 索引中,替换现有的索引,因此没有过时的记录。
# Prepare the Algolia objects
algolia_objects = list(map(prepare_algolia_object, initial_items))
algolia_index.replace_all_objects(algolia_objects, {"safe": True}).wait()
剧本评价&表演
总的来说,我发现从 Python 加载 Algolia 索引是一项非常简单的任务,尽管我的 Python 技能有些生疏。实际上,我的大部分时间都花在了准备 AirBnB 列表对象上,并把它们转化成我在 Algolia 想要的东西。如果我使用我们自己的数据集,这可能会简单得多,因为不需要太多的转换。
我了解到 Algolia 公开了一个很棒的 Python API——它比我预期的更容易使用,并且包含很棒的文档,一步一步地指导我完成整个过程。准备和加载索引所需的代码很少,对我来说很直观。它在加载索引时表现也很好:加载和替换 5000 条记录的整个索引只需要不到 5 秒钟,即使是在资源有限的云托管服务器上运行。当我在我们的一些高速服务器上用快速互联网连接运行它时,只需要大约 2 秒钟。我们的生产数据集要大得多(大约 40k 条记录),但是我们准备列表数据的标准管道每天都要运行一个多小时,所以我确信我们的整体性能不会受到 Algolia 的影响。到目前为止,它的简单性和速度远远超过了任何缺点。
【T2
在本系列的第一篇文章中,我谈到了我们的用例、架构以及我们面临的搜索挑战。
在本系列的第二篇文章中,我介绍了 PoC 的设计规范,并讨论了实现的可能性。
在本系列的第四篇文章中,我将实现一个示例前端,这样我们就可以从用户的角度评估产品,如果开发人员选择这个选项,就可以给他们一个先发制人的机会。
Algolia+MongoDB–第 4 部分:前端实现和结论
我们邀请 Starschema 的朋友写一个结合使用 Algolia 和 MongoDB 的例子。我们希望您喜欢这个由全栈工程师 Soma Osvay 撰写的四部分系列。
如果你想回顾一下,以下是其他链接:
在这篇文章中,我将实现使用我们在本系列第 3 部分中创建的 Algolia 索引的前端。创建的 web 应用程序在这里可用:https://algolia-listings.starschema.com/。默认情况下,您可以使用我们的示例数据来尝试它,但是如果您一直遵循并尝试我们在上一篇文章中使用的格式,您可以连接自己的索引!应用程序的代码可在 GitHub 的 上获得。在 StackBlitz 上举办了一场公开演示。
第 0 步。规划
我们现有的面向消费者的应用程序的前端是用 jQuery 和普通 JavaScript 编写的,所以我需要确保我正在开发的 Algolia 示例应用程序与这些技术兼容。幸运的是,Algolia 的 InstantSearch.js 无需任何定制就可以与 vanilla 前端兼容,所以我可以使用 Algolia 文档中的默认示例实现。在开始之前,我画了一个我想用 Algolia 搜索 UI 创建的快速草图。我将我们现有的搜索页面作为基线,并添加了一些我们目前缺少的额外功能:
我使用官方的 Algolia 入门指南来设置我的项目并开始编码。 npx create-instantsearch-app
创建了一个准备充分、结构良好的应用程序,我可以修改它来匹配我的用例。
在开始 Algolia 特定的开发之前,我必须确保我的 Algolia 应用程序 ID 和 API 密钥没有硬编码在我的应用程序中,以便我可以轻松地共享源代码。为此,我们创建了一个表单,要求您提供 Algolia 凭据,并将它们存储在浏览器localStorage
中,以便在查询中使用。
第一步。修改 HTML 和 CSS
首先,我必须改变与项目一起创建的生成的index.html
文件的布局。这是因为我希望有一个不同于 Algolia 最初根据我的 UI 计划为我创建的搜索布局。经过几次迭代,我实际上偏离了我最初的计划:我在过滤器部分的顶部添加了一个 Clear Refinements 按钮,取消了分页,因为我意识到 Algolia 支持无限滚动,我决定实现 GeoSearch (这样我们的最终用户除了文本之外还可以通过位置进行搜索)。我更新的特定于 Algolia 的 HTML 和 CSS 如下所示:
<!--Used to host the Algolia search UI-->
<div id="algolia-container">
<!-- The search box. Located on the top of the page, spanning the entire width -->
<div id="searchbox"></div>
<!-- The filters section, located on the left -->
<div class="filters">
<h2>Filters</h2>
<!-- Clear filters button location -->
<div id="clear-refinements"></div>
<!-- Country filter location -->
<h3>Country</h3>
<div id="country-list"></div>
<!-- Property Types filter location -->
<h3>Property Types</h3>
<div id="property-list"></div>
<!-- Review scores filter location -->
<h3>Review Scores</h3>
<div id="review-scores"></div>
<!-- Price filter location -->
<h3>Price</h3>
<div id="price"></div>
<!-- Cleaning fee filter location -->
<h3>Cleaning Fee</h3>
<div id="cleaning-fee"></div>
</div>
<!-- The results panel, located to the right side from the filters -->
<div class="results">
<h2>Results</h2>
<!-- The pagination container, which was later changed to infinite scroll results container -->
<div class="pagination-container">
<!-- The container which displays the number of results, and a link which can load the next set of results. These are modified from js -->
<div id="result-count">
<span></span>
<a href="#"></a>
</div>
<!-- The location of the control that controls how many results are loaded at once -->
<div id="per-page"></div>
</div>
<!-- The location for the map which shows the results on the world map -->
<div id="map-display">
<h3>Map</h3>
<div id="geo-search"></div>
</div>
<!-- The location of the search result details -->
<div id="details-display">
<h3>Details</h3>
<div id="hits"></div>
</div>
</div>
</div>
Algolia 的 InstantSearch.js 能够自动创建自己的控件,所以我只需提供布局本身。
我还用了一些 CSS 来使它看起来更好:
#algolia-container {
max-width: 1200px;
margin: 0 auto;
padding: 1rem;
display: grid;
grid-template-columns: 200px 1fr;
grid-template-rows: auto auto;
gap: 20px;
}
#searchbox {
grid-column: 1 / 3;
grid-row: 1;
}
.filters {
grid-row: 2;
grid-column: 1;
}
.results {
grid-row: 2;
grid-column: 2;
}
.pagination-container {
display: grid;
grid-template-columns: 1fr auto auto;
gap: 20px;
}
.ais-GeoSearch-map {
height: 500px; /* You can change this height */
}
第二步。初始化 Algolia 即时搜索. js
接下来,我初始化了 Algolia JS 引擎,它将查询我的索引并显示结果。
const {
algoliasearch,
instantsearch
} = window;
// Initialize the Algolia Search client and connect to our index
const searchClient = algoliasearch(appId, searchKey);
const search = instantsearch({
indexName: indexName,
routing: true,
searchClient,
});
第三步。添加小部件
Algolia 已经将他们的前端功能设计成了“widgets”,即你可以动态合并空的 HTML 节点的 UI 组件。Algolia 使用这些来添加搜索框、过滤和分面界面、无限滚动和许多其他功能。我们可以通过调用addWidgets
来添加小部件,并以数组的形式提供所需的小部件。
search.addWidgets([
// The widget definitions go here
]);
我将逐步介绍我使用的所有小部件,但是请记住,下面的代码示例都发生在addWidgets
的数组参数中。
搜索框。这将向页面添加基本搜索栏。
instantsearch.widgets.searchBox({ container: '#searchbox', placeholder: 'Search real-estate listings', autofocus: true
})
```
InfiniteHits. This is where our search results will populate. I used
InfiniteHits
instead of justHits
to enable infinite scrolling.instantsearch.widgets.infiniteHits({ container: '#hits', templates: { // Item template will be filled out later item: `Sample item template` } })
该控件将包含 item 模板,这是一段显示单个搜索结果的 HTML 代码。我会回到这个问题上——现在这里只有一个占位符。
每页点击量。这个小部件允许用户选择一次加载的项目数量。
instantsearch.widgets.hitsPerPage({ container: '#per-page', items: [{ label: 'Load 5 results per page', value: 5 }, { label: 'Load 10 results per page', value: 10 }, { label: 'Load 20 results per page', value: 20 }, { label: 'Load 50 results per page', value: 50, default: true }, { label: 'Load 100 results per page', value: 100 }, { label: 'Load 200 results per page', value: 200 } ]
})
```
清除滤镜按钮。用户可以按下此按钮清除所有优化。
instantsearch.widgets.clearRefinements({ container: '#clear-refinements', templates: { resetLabel: 'Clear filters', },
})
```
针对酒店类型和国家过滤器的细化列表。这提供了复选框,允许用户过滤特定属性类型和位于特定国家/地区的结果。
instantsearch.widgets.refinementList({
container: '#property-list',
attribute: 'property_type'
}),
instantsearch.widgets.refinementList({
container: '#country-list',
attribute: 'address.country'
})
```
一个分级菜单,用于过滤某些分级的列表。我原本想为此创建一个简单的单选按钮菜单,但我意识到 Algolia 支持这种开箱即用的控件。
instantsearch.widgets.ratingMenu({ container: '#review-scores', attribute: 'scores.stars'
})
```
列表价格和清洁费的范围滑块。最初,我想将文本输入限制在某个范围内,但是我发现滑块使用起来更直观。
instantsearch.widgets.rangeSlider({ container: '#price', attribute: 'price', precision: 10
}),
instantsearch.widgets.rangeSlider({
container: '#cleaning-fee',
attribute: 'cleaning_fee',
precision: 5
})
```
地图小工具用于在世界地图上显示结果。我还为地图上的标记添加了一个 click 事件,稍后我将实现该事件来滚动到被单击的列表的详细信息。
instantsearch.widgets.geoSearch({ container: '#geo-search', googleReference: window.google, initialPosition: { lat: 48.864716, lng: 2.349014, }, initialZoom: 10, builtInMarker: { createOptions(item) { return { title: item.name, }; }, events: { click({ event, item, marker, map }) { // to be implemented later }, }, },
})
```
I also added a custom connector for infinite hits. Custom connectors let you hijack the functionality of a widget but provide your own HTML, so it’s entirely customizable and dynamic. The reason that I went this route is that Algolia didn’t provide an existing widget to show the result information exactly the way I wanted to due to the layout of our existing search page. Essentially, I give the array of widgets my own custom widget name like this:
customInfiniteHits({})
然后,在小部件数组之外,我创建了一个自定义函数,当点击次数发生变化时运行该函数,并为点击列表返回新的 HTML。我将它配置为在当前地理搜索没有搜索结果或根本没有搜索结果时拥有定制的视图。当有结果时,它显示结果计数,并允许用户请求将下一页结果附加到当前页的底部。
// Define custom logic that runs when the results changed. // This will call a function that displays the total result count and allows the user to Load more or clear filters if needed. // The hitsChanged method is defined below to keep the initialization code clean. // Documentation: <https://www.algolia.com/doc/api-reference/widgets/infinite-hits/js/> const renderInfiniteHits = hitsChanged; const customInfiniteHits = instantsearch.connectors.connectInfiniteHits( renderInfiniteHits ); // This function is called every time the search results change // It checks how many results there are in total and either: // - displays a 'No results found' message to the user along with the possibility to Clear Filters. It also hides the result container and possibly the map too // - displays information about how many total results there are, and how many are currently displayed. It also allows the users to click a 'Load more' button on the top of the page. function hitsChanged(renderOptions) { // if this is an initial render and we got no results object, skip if (!renderOptions.results) { return; } // get the reference for the Result Count elements on the UI (its text and link as well) const resultCountElement = document.getElementById('result-count'); const textEl = resultCountElement.querySelector('span'); const linkEl = resultCountElement.querySelector('a'); // check if we have any results const hasHits = renderOptions.results.nbHits !== 0; // check if we have any search query const hasQuery = !!renderOptions.results.query; // check if we have any geo bounding box (query made on map) const hasGeoQuery = !!renderOptions.results._state.insideBoundingBox; // We show/hide result Details depending if we have results or not document.getElementById('details-display').style.display = hasHits ? 'block' : 'none'; // We hide the Map display if we have no results AND there was no map query applied (so the query can be undone) document.getElementById('map-display').style.display = hasHits || hasGeoQuery ? 'block' : 'none'; // Update the Result count container to display information about results if (hasHits) { // if there are any results if (renderOptions.isLastPage) { // if we are on last page, show text and a link to clear filters textEl.innerText = `Showing all ${renderOptions.hits.length} results`; linkEl.style.display = 'none'; linkEl.innerText = 'Clear all filters'; linkEl.href = '.'; linkEl.style.display = 'inline'; linkEl.onclick = null; } else { // if we are not on last page, show text and link to load more items textEl.innerText = `Showing top ${renderOptions.hits.length} results of ${renderOptions.results.nbHits}`; linkEl.href = ''; linkEl.innerText = 'Load more'; linkEl.style.display = 'inline'; linkEl.href = "#"; linkEl.onclick = () => { renderOptions.showMore(); return false; }; } } else { // if we have no results, construct message let statusMessage = 'No results have been found'; if (hasQuery) { statusMessage += ` for '${renderOptions.results.query}'`; } if (hasGeoQuery) { statusMessage += ' in selected map area'; } // show message and link to clear filters textEl.innerText = statusMessage linkEl.innerText = 'Clear all filters'; linkEl.href = '.'; linkEl.style.display = 'inline'; linkEl.onclick = null; } }
添加我的小部件后,UI 如下所示:
第四步。修改项目模板
在添加小部件时,我将搜索结果模板留空,因此项目细节还没有正确显示。我将InfiniteHits
小部件配置更改为:
instantsearch.widgets.infiniteHits({
container: '#hits',
templates: {
// We use no 'empty' template, as our results container will be hidden if there are no results.
// The item template is heavily modified to draw the details of a listing in detail
item: `
<article id="hit-{{objectID}}">
<div class="name-container">
<h1 class="name">{{#helpers.highlight}}{ "attribute": "name" }{{/helpers.highlight}}</h1>
{{#scores}}
<div class="stars">
<svg aria-hidden="true">
{{#scores.has_one}}
<use xlink:href="#ais-RatingMenu-starSymbol"></use>
{{/scores.has_one}}
{{^scores.has_one}}
<use xlink:href="#ais-RatingMenu-starEmptySymbol"></use>
{{/scores.has_one}}
</svg>
<svg aria-hidden="true">
{{#scores.has_two}}
<use xlink:href="#ais-RatingMenu-starSymbol"></use>
{{/scores.has_two}}
{{^scores.has_two}}
<use xlink:href="#ais-RatingMenu-starEmptySymbol"></use>
{{/scores.has_two}}
</svg>
<svg aria-hidden="true">
{{#scores.has_three}}
<use xlink:href="#ais-RatingMenu-starSymbol"></use>
{{/scores.has_three}}
{{^scores.has_three}}
<use xlink:href="#ais-RatingMenu-starEmptySymbol"></use>
{{/scores.has_three}}
</svg>
<svg aria-hidden="true">
{{#scores.has_four}}
<use xlink:href="#ais-RatingMenu-starSymbol"></use>
{{/scores.has_four}}
{{^scores.has_four}}
<use xlink:href="#ais-RatingMenu-starEmptySymbol"></use>
{{/scores.has_four}}
</svg>
<svg aria-hidden="true">
{{#scores.has_five}}
<use xlink:href="#ais-RatingMenu-starSymbol"></use>
{{/scores.has_five}}
{{^scores.has_five}}
<use xlink:href="#ais-RatingMenu-starEmptySymbol"></use>
{{/scores.has_five}}
</svg>
</div>
{{/scores}}
</div>
{{#description}}
<div class="description">
<div class="title">Description{{}}</div>
<p class="desc">{{#helpers.highlight}}{ "attribute": "description" }{{/helpers.highlight}}</p>
</div>
{{/description}}
{{#summary}}
<div class="summary">
<div class="title">Summary</div>
<p class="desc">{{#helpers.highlight}}{ "attribute": "summary" }{{/helpers.highlight}}</p>
</div>
{{/summary}}
{{#space}}
<div class="space">
<div class="title">Space</div>
<p class="desc">{{#helpers.highlight}}{ "attribute": "space" }{{/helpers.highlight}}</p>
</div>
{{/space}}
{{#neighborhood}}
<div class="neigh">
<div class="title">Neighborhood</div>
<p class="desc">{{#helpers.highlight}}{ "attribute": "neighborhood_overview" }{{/helpers.highlight}}</p>
</div>
{{/neighborhood}}
{{#transit}}
<div class="transit">
<div class="title">Transit</div>
<p class="desc">{{#helpers.highlight}}{ "attribute": "transit" }{{/helpers.highlight}}</p>
</div>
{{/transit}}
<div class="info">
{{#property_type}}
<div>
<span class="title">Property Type:</span>
<span>{{property_type}}</span>
</div>
{{/property_type}}
{{#address}}
<div>
<span class="title">Address:</span>
<span>{{#helpers.highlight}}{ "attribute": "address.street" }{{/helpers.highlight}}</span>
</div>
{{/address}}
{{#price}}
<div>
<span class="title">Price:</span>
<b>{{price}}$ per night</b>
{{#cleaning_fee}}
<span> + {{cleaning_fee}}$ cleaning fee</span>
{{/cleaning_fee}}
{{#security_deposit}}
<span> + {{security_deposit}}$ security deposit</span>
{{/security_deposit}}
</div>
{{/price}}
{{#accommodates}}
<div>
<span class="title">Accommodates:</span>
<b>{{accommodates}} people</b>
{{#bedrooms}}
<span> in {{bedrooms}} bedroom(s)</span>
{{/bedrooms}}
{{#beds}}
<span>, {{beds}} bed(s)</span>
{{/beds}}
{{#bathrooms}}
<span> with {{bathrooms}} bathroom(s)</span>
{{/bathrooms}}
</div>
{{/accommodates}}
</div>
{{#images.picture_url}}
<img class="image" src="{{images.picture_url}}">
{{/images.picture_url}}
</article>
`
}
})
Algolia 项目模板使用 Mustache 添加变量。在创建索引时将变量添加为attributesToRetrieve
很重要,这样当 Algolia 构建项目的 HTML 时,它们就会出现在代码中。我还添加了以下 CSS 来正确显示项目:
article {
display: grid;
width: 100%;
grid-template-columns: 1fr 400px;
column-gap: 20px;
grid-template-rows: auto auto auto auto auto auto auto 1fr;
}
article .title {
margin-top: 8px;
font-size: 14px;
color: gray;
}
article p {
display: block;
margin: 0px;
}
article .name-container {
grid-row: 1;
grid-column: 1 / 3;
}
article .name-container > * {
display: inline-block;
vertical-align: middle;
}
.stars {
margin-left: 8px;
height: 24px;
}
.stars svg {
width: 24px;
height: 24px;
display: inline-block;
fill: yellowgreen;
}
article .description {
grid-row: 2;
grid-column: 1;
}
article .summary {
grid-row: 3;
grid-column: 1;
}
article .space {
grid-row: 4;
grid-column: 1;
}
article .neigh {
grid-row: 5;
grid-column: 1;
}
article .transit {
grid-row: 6;
grid-column: 1;
}
article .info {
grid-row: 7;
grid-column: 1;
}
article .info > * {
margin-top: 8px;
}
article .image {
grid-column: 2;
grid-row: 2 / 9;
margin-top: 8px;
width: 100%;
}
article .properties {
display: grid;
grid-template-columns: auto auto;
gap: 4px;
grid-auto-flow: column;
width: fit-content;
}
article .properties .key {
color: gray;
font-size: 12px;
}
article .properties .value {
font-size: 12px;
}
现在搜索结果是这样的:
吸取教训
总的来说,我发现 Algolia InstantSearch.js 框架为在 web 应用程序中创建自己的搜索界面提供了一种非常灵活的方式。UI 构建感觉很流畅,小部件系统是一个非常好的工具,可以非常快速地构建好看的界面。使用定制连接器,我还意识到 Algolia 也可以适应更复杂的用例,这需要更定制的方法。生成的 HTML 可以很容易地进行样式化,看起来与原型大不相同。
我的整个 Algolia 前端实现只有几百行代码,相比之下,如果我自己要实现这种功能,我必须编写数千行代码。大部分代码都被我的自定义泛化和连接器逻辑占用了,Algolia 让我只用几个命令就将所有这些复杂的特性与默认的 InstantSearch.js 小部件捆绑在一起。
搜索速度惊人的快,指数超出我的预期相当多。平均搜索或过滤操作在 60 毫秒内显示结果,比我们通常预期的整整一秒钟要快得多。
总体结论
在概念验证过程中,我发现:
- Algolia 的搜索速度和准确性超过了我迄今为止见过的任何现有的解决方案。
- Algolia 索引结构简单,不需要深入的技术知识。
- 搜索优先级、排名、地理搜索和其他属性都是可定制的,不需要大量的维护。
- Algolia 搜索索引无缝集成到我们现有的数据管道中。它还公开了一个很棒的 Python API,因此脚本可以由我们热爱 Python 的数据工程师编写和维护。
- Algolia 前端 SDK 是有据可查的。我向我们的一些前端开发人员展示了我的应用程序,在检查了代码之后,他们对自己使用 InstantSearch.js 感到非常兴奋。
- 由于 Algolia 是云托管的,这让我们的基础设施团队很高兴,因为没有必要在我们的环境中引入另一个系统。它可以自动扩展,并且提供的 SLA 符合我们的要求。
- 我们根本不需要修改我们的应用程序后端,这为我们节省了大量的时间和成本。
基于这些发现,我肯定会向我的团队推荐我们在生产中使用 Algolia。
Algolia+MongoDB–第 2 部分:建议的解决方案和设计
我们邀请 Starschema 的朋友写一个结合使用 Algolia 和 MongoDB 的例子。我们希望您喜欢这个由全栈工程师 Soma Osvay 撰写的四部分系列。
如果你想回顾或跳过,以下是其他链接:
当我们讨论将第三方索引系统集成到产品中的挑战时,我们的工程师立即提出了三个潜在的问题:
- 我们如何跨多个数据提供者维护数据完整性和数据就绪性?
- 我们如何确保我们的应用程序的性能不会因为引入第三方系统而受到影响?
- 我们如何在第三方系统上维护现有的安全和访问控制规则?
到目前为止,我们有一个真实的单一来源数据库(清单数据库),其中存储了所有的清单。当将 Algolia 引入生态系统时,我们必须优先保证它与数据库保持同步。这些系统之间的任何不一致都会对我们站点的 UX 产生严重影响。我们不希望最终出现搜索结果:
- 单击时抛出 404 未找到错误
- 列表本身不是最新的(即搜索结果包含不同的标题、描述等)
- 不会出现在现有的房地产列表中
所有这些情况都会导致对我们的服务失去信心,并可直接转化为收入损失。这是绝对必要的,我们都创建一个我们现有的数据集到 Algolia 的初始加载,并保持 Algolia 与该数据集中所有未来的变化保持同步。
我们的后端应用程序已经负荷过重。它使用 Kubernetes 进行水平扩展,但是我们希望避免由于服务器上的高流量而大幅增加运营成本。设计解决方案时,我们必须将尽可能多的流量转移到 Algolia。
我们还想确保我们不会损害应用程序的安全性和访问控制。目前,我们的应用程序不需要登录会话来查询列表,所以这并不重要,但如果有人登录了,那么能够使用 Algolia 存储用户的身份就很好了,这样就可以使用它来个性化搜索结果并完善我们的内部报告。
设计可能性
我们可以将其分解为三项任务:
- 在 Algolia 中索引我们现有的所有列表数据。为此,我们将在 Jupyter 笔记本中创建一个 Python 脚本来开发数据加载逻辑。我们以后可以重用其中的一部分。如果你想知道我为什么在这里选择 Jupyter 笔记本,那是因为它允许快速迭代、部分执行和简单的评论系统。这在构建原型和进行代码评审时很有帮助。我将在本系列的第三篇文章中实现它。
- 定期更新 Algolia 指数任何列表变化。
- 创建直接从前端搜索 Algolia 的能力,这样我们就不需要接触任何遗留的后端代码。
更新后的架构图如下所示:
让我们来看看在任务 2 中我们可以采取的不同途径的一些优点和缺点。以下是我们的一些选择:
- 一个。创建更多的 Python 脚本,作为我们现有 ETL 过程的一部分运行(已经将数据同步到 Mongo 中)。这可能是一个好的选择,因为 Algolia 索引与 MongoDB 数据同时更新,使它们保持同步。此外,它在我现有的 ETL 过程中作为一个单独的任务运行,因此它可以很容易地被监控和维护。另一方面,如果数据库加载任务成功,而 Algolia 任务失败,那么我们的数据集之间就会出现一些不一致。这可能需要手动校正,这给我们的团队带来了很大的负担。
- b 。创建 Python 脚本,独立于我们的其他 ETL 工作流,将数据从 Mongo 同步到 Algolia。这让我们可以独立地维护和监控 Algolia,因为它会定期刷新基于 Mongo 数据库的数据。这可能会给数据平台团队带来额外的压力,因为它必须单独托管和维护。
- c 。使用 MongoDB 触发器。这里的想法是,当在 MongoDB 中添加、删除或编辑记录时,它将通过数据库触发器触发调用 Algolia REST API 的函数,直接同步到 Algolia。这将根据在 MongoDB 中完成的操作自动更新我们的索引,而无需实现第三方解决方案。不过这个计划也不是没有缺点。MongoDB 操作可能需要很长时间来执行,因此性能可能会成为一个问题。触发器也可能失败,因此我们仍然必须在 MongoDB 接口中手动监控它们。
无论我们最终选择哪个选项,我们都将在本系列的第三篇文章中实现它。
最后,第四部分将着重于创建一个小型的基于 web 的前端来查询 Algolia 索引。我希望能够向我们的前端开发人员展示一个带有基本代码的工作解决方案,以便他们可以评估将其集成到我们现有的前端应用程序中所需的时间和精力。
数据集&用于实现的技术
为了保持实现简单,我将使用一个对 MongoDB 公开可用的数据集,它与我的生产数据相似。这背后有多种原因:
- 我希望我的脚本足够通用,将来可以用于我们的多个应用程序。从一开始就将它构建到脚本中的最佳方式是为我的最终数据集之外的东西设计和开发脚本。通过这种方式,我可以通过稍后对我的生产数据运行脚本来测试脚本的适应性。
- 我们也对这里的社区反馈感兴趣!我使用的是公共数据集,所以你可以尝试一下,告诉我们你的经历。
- 我们的 MongoDB 实例和所有 ETL 都在 VPN 后面,我坐在家里。由于我们的 VPN 很慢,我不希望在将数据从 Mongo 转移到 Algolia 时加载时间给我不切实际的性能计数器。
我决定使用 MongoDB 的官方样本 AirBnB 列表数据集,因为它相当接近我们现有的数据结构。我还将使用 MongoDB Atlas 来托管我的样本数据库以及一个免费的 Algolia 帐户来存储记录。我可能已经是 Python 方面的专家了(这就是我们使用 Jupyter 笔记本的原因),但我不熟悉 HTML、CSS 和 JavaScript 的前端语言,所以这将是一个测试 Algolia 的 SDK 是否像它们被认为的那样简单的好机会。
在本系列的第一篇文章中,我谈到了我们的用例、架构和我们面临的搜索挑战。
在本系列的第三篇文章中,我将实现数据摄取到 Algolia 中,并弄清楚如何保持数据最新。
在本系列的第四篇文章中,我将实现一个示例前端,这样我们就可以从用户的角度评估产品,如果开发人员选择这个选项,就可以给他们一个先发制人的机会。
Algolia+MongoDB–第 1 部分:用例、架构和挑战
我们邀请 Starschema 的朋友写一个结合使用 Algolia 和 MongoDB 的例子。我们希望您喜欢这个由全栈工程师 Soma Osvay 撰写的四部分系列。
如果你想跳过,这里有其他链接:
嗨,我是 Soma,我是一个相对较小的咨询团队的成员,为我们最知名的客户之一维护多个房地产电子商务解决方案。这些应用程序使最终用户能够在多个国家出售、购买或租赁房屋。尽管它们不是传统的网上商店。在某些情况下,我们只是连接供应和需求,但在租赁的情况下,我们实际上管理交易、订单、取消和各方之间的沟通。在过去几年中,我们一直在大幅扩展这些服务的范围,这使我们的客户能够探索新的业务机会,并投入时间和资源来添加新功能、升级基础架构,以及专注于数据驱动的决策制定。
我们最近为网上商店增加了许多新服务,例如:
- 社交媒体整合
- 高级搜索引擎优化
- 房地产代理注册的可能性
- 基于人工智能的推荐系统
- 房地产历史
- 邻域分析
由于这些新服务和有机增长,网站上的列表数量急剧增加。这让我们注意到这样一个事实:我们的搜索能力没有满足客户的需求。搜索结果往往不相关、不准确、速度慢,给用户带来了糟糕的体验,也给公司带来了坏名声。
提供准确的房地产搜索结果是一个挑战,因为有许多相关的属性。客户希望通过以下方式进行搜索:
- 地理位置
- 邻里类型(城市、郊区、经常光顾、安静等)
- 建筑类型(新建、旧建筑、工业建筑)
- 靠近公共交通、学校、体育设施等
- 价格幅度
- 能源和绿色评级
- 某些贷款或其他融资解决方案的资格
客户调查表明,糟糕的搜索结果直接导致我们客户的收入损失。仅仅几次搜索失败后,顾客就离开了网站!对照组显示,只有那些坚持不懈并使用简单搜索词的人才能找到他们正在寻找的列表。这充分表明,提供快速、准确和相关的搜索结果将提高产品的点击率,因此它被指定为下一个发布周期的首要功能。
我的任务是提出一个解决方案,以提高电子商务网站的搜索能力。这篇博文讲述了我实现一个基本的概念验证搜索解决方案的过程,我们可以在这个基础上为我们的服务创建高级搜索。
当前网店架构&数据管道
这个特殊的网上商店的架构有点支离破碎。面向消费者的应用程序和面向管理员的应用程序是完全独立的,由不同的团队管理,并且只在数据级别上连接。
房地产所有者和代理使用该管理应用程序来列出他们可购买和租赁的房产,管理租赁订单,以及查看统计数据等。此应用程序不由我的组织单位管理。它连接到包含应用程序数据的单个数据库。
消费者应用程序已经上市,公开可用,在谷歌上市,并具有先进的搜索引擎优化。这是我的团队负责的部分,也是我们将在本系列文章中改进的部分。消费者使用该应用程序列出他们有兴趣购买和租赁的房产,并允许他们处理金融交易,与其他用户交流等。
建筑
我们当前的架构是这样的:
挑战&可能的解决方案
我们的主要挑战是 MongoDB 在搜索部门受到限制。目前,MongoDB 的云托管版本支持 Atlas Search,这是一种细粒度的索引解决方案,但它不适用于我们,因为我们使用的是内部 MongoDB 实例,它只支持遗留文本搜索。它不能搜索多个领域和重要的文本内容。
遗留文本搜索给我们带来了几个问题:
- $text 运算符不支持全文搜索。它可以搜索短语和关键词,但这通常是不够的。
- 它不能根据与查询的相关性对结果进行排名。
- 它不允许我们轻松地搜索多个字段和数组。
- 带有发音符号的单词(如é或)应该被视为与不带发音符号的单词(在本例中是 e 和 o)相同,但这非常慢..
由于这些问题,我们的应用程序无法为最终用户提供流畅的搜索体验。
我们已经试验了本地托管版本的 ElasticSearch (并使用 MongoDB River 插件进行同步),但是托管&微调 ElasticSearch 对我们的团队来说很困难。我们最终得到了一个非常不可预测的搜索体验,它不仅在很多情况下很慢,而且不准确。
除此之外,ElasticSearch 集成需要我们修改整个应用程序堆栈!我们的应用程序的后端和前端都需要进行大量修改才能正常工作。我们必须管理应用程序的安全性,编写我们自己的 UX 代码,并用代码编写复杂的索引逻辑。我们的应用程序中也有许多遗留代码,因此修改、测试和部署新版本的成本很高,因为这需要广泛的领域知识和经验,而这里只有少数开发人员具备这些知识和经验。
看到这些问题,我们放弃了 ElasticSearch。时间和资源的开发成本对于它所带来的利益来说太大了。
阿哥利亚
在做了一些内部和外部研究后,我发现我公司内部的其他团队正在使用一种叫做 Algolia 的解决方案来改进他们产品的搜索。他们告诉我很多关于它提供的 SDK 的质量,以及集成到现有系统中是多么简单,根本不需要改变后端代码。
看看这个特性列表吧!
- 它是云原生的,并承诺非常高的可扩展性。
- 我们可以最小化实现该功能所需的编码,尤其是在后端,这肯定会成为瓶颈。
- 我们的数据工程师和领域专家可以在项目上合作,共同创造价值,而不是各自为战。
- 它简化了搜索开发过程,因为它不需要关于定义优化索引的深入技术知识。
- 它维护成本低,易于组织大量数据
- 管理和配置搜索规则以提高搜索准确性很简单,甚至给我们提供了用 AI 进行微调的选项。
- 有非常易于使用的前端 SDK 可以与我们现有的前端应用程序集成。
- 它提供了预配置的分析和 KPI,进一步降低了开发成本。
- 它支持从前端发送事件,以进一步提高准确性和功耗分析。
出于这些原因,我决定使用 Algolia 为我们新的搜索索引功能构建 PoC。
在本系列的第二篇文章中,我将介绍 PoC 的设计规范,并讨论实现的可能性。
在本系列的第三篇文章中,我将实现数据摄取到 Algolia 中,并弄清楚如何使数据保持最新。
在本系列的第四篇文章中,我将实现一个示例前端,这样我们就可以从用户的角度评估产品,如果开发人员选择这个选项,就可以给他们一个先发制人的机会。
支持支持我们成功的开源软件
原文:https://www.algolia.com/blog/algolia/supporting-open-source-projects/
在 Algolia,我们中的许多人每天都在与开源项目合作,为其做出贡献,或者从中受益。我们都是关于帮助我们完成工作并正确完成工作的工具。
然而,我们用来在互联网上创造最快搜索体验的大部分软件并不是来自大型公司。它直接来自全世界才华横溢的开发人员的笔记本电脑,他们热衷于解决特定的问题,并与世界分享他们的解决方案。
许多开源项目仅仅由一小群开发人员保持活力和迭代,尽管他们的工作被许多其他开发人员用来创建令人敬畏的应用程序,但他们经常声称他们的努力没有报酬。
建立一个开源项目,并在 2018 年找到合适的采用水平,需要比以前更多的时间、考虑、规划和日常管理。幸运的是,“仅仅因为它是开源的并不意味着它是免费的”这种思维模式很好地适应了许多开发者和更大的公司。
像 OpenCollective 这样的服务越来越多,这使得向你最喜欢或最常用的开源项目捐款变得非常容易,同时也让项目所有者了解到这些钱是如何使用的;非常透明,但也非常有用。
我们热爱我们的社区,并尽我们所能支持它;包括帮助开源项目,但是是时候进一步发展了。所以,我们想分享一下未来 12 个月我们将捐赠的项目。
首先,简单介绍一下我们是如何得出以下列表的。
这一切都始于这样一个建议:我们为 OSS 的贡献拿出一个月的预算,并在 13 个不同的团队之间进行分配(的微型团队组成了 Algolia 这里的工程部),让他们选择他们想要支持的项目。
一旦选票统计完毕,我们得出了一个在全公司广泛使用的 18 个项目的列表。一些项目收到了来自多个团队的投票,因此它们的权重更高,分配的金额也更大。
其他人则更具体,所以分配的金额更少,但只是为了让我们能够支持尽可能多的人,并且仍然为每个获得投票的项目提供一点财政支持,而不是在最大程度上推动更多的资金。
2018 年我们支持的开源项目
Babel–帮助确保我们的 JS 库向前和向后兼容。
Preact——在 InstantSearch.js 的前端使用的更轻便、性能更高的 react 渲染库
story book–允许您浏览组件库,查看每个组件的不同状态,并交互式开发和测试组件。也用于即时搜索网站。
OpenStreetMap–这是我们获取 Algolia Places 大部分数据的地方。
Cheerio——一个极好的库,使得在 NodeJS 中解析和抓取网站变得轻而易举。
code sandbox——一个在线 IDE,具有令人敬畏的利基特性,如双向 GitHub 编辑功能。在整个公司广泛用于演示,但也通过即时搜索模板得到支持。
因为良好的代码质量对于任何项目的健康都是非常重要的。这有助于我们的 Ruby 项目按照 Ruby 项目指南维护它们的代码标准。
vue js——我们都喜爱和珍惜的不可思议的前端库。
Scala——一种伟大的语言,由于它惊人的编译器,使我们能够简化开发过程。
web pack–构建解决方案,将 JS 文件捆绑部署到任何运行 JavaScript 的设备上,从浏览器到服务器,再到桌面应用。如今,Algolia 没有一个 JavaScript 项目不使用 Webpack。
Material ui–一组强大的 React 组件,实现了谷歌材料设计规范中规定的设计标准。
Ruby Together——捐赠给这个网站,你会发现 RubyGems、Bundler 和 Ruby 社区中其他优秀共享工具的维护者。
roll up–一个 JS 模块捆绑器,帮助你从原始源代码创建一个微小的有效载荷。
Mobx——现代 JS 框架的状态管理库。
Faker . js——伟大的测试需要伟大的测试数据,Faker 是确保您从其 30 多个位置和大量 API 端点的支持中获得您所需要的东西的最佳产品之一。
Pug–一种具有强大功能的模板语言,用 JavaScript 编写,设计用于 node.js 和浏览器。我们为所有组成 Algolia 社区的网站使用它。
node mon–监控源代码中的任何更改,并自动重启服务器。哦,我们用这个节省了多少时间!
shields . io——活在你身边的自述。我们使用 Shields 来识别所有我们自己的 oss 项目的构建状态、代码覆盖率、版本号等等。
我们不仅为这些项目提供支持,还为其他人奉献我们的时间。例如,我们想要支持的一些项目没有捐赠页面,并说,“我们更希望你花时间在问题和代码上,而不是捐钱”。
这是一个非常合理的要求,这正是我们要做的。通过与这些项目合作,并通过我们自己的 DocSearch 项目为许多其他人提供快速的文档搜索,Algolia 还为许多其他开发人员驱动的项目提供了专用的工程时间(这对任何公司来说都意味着金钱)。
我们非常期待 2019 年将加入这个名单。如果你现在正在向 OSS 项目捐款,或者只是想分享你自己的令人敬畏的工具列表,那么请随时在推特上联系我们,或者在我们的讨论中,让我们知道它。
新冠肺炎网站和应用程序的免费专业搜索计划
原文:https://www.algolia.com/blog/algolia/supporting-our-communities-during-this-time-of-need/
在这个令人不安和未知的时期,Algolia 团队 — 全球 350 多名员工(现在远程工作) — 希望所有开发人员和各种规模的企业都知道 Algolia 在这里提供帮助。
鉴于新冠肺炎疫情,我们首先要向所有受到身体和经济影响的人送上我们最美好的祝愿。我们认识到如此多的人正以如此多的不同方式受到影响,我们的心与你们所有人同在。
已经有一些开发人员联系我们,要求我们在他们构建网站和应用程序时提供支持。在不确定的时代,这些应用程序中的许多都旨在帮助人们快速找到他们正在寻找的东西 — 无论是社交距离最佳实践、如何获得适当的医疗保健,还是如何在网上找到急需的产品或服务。
为此, Algolia 将其 Pro 计划免费提供给任何在新冠肺炎相关的非营利性网站或应用上工作的开发者或团队。此类项目可能包括建立一个与公共服务项目相关的新网站,以促进社区中的新冠肺炎交流;开发一种搜索体验,以帮助当地企业更好地连接并为其社区提供基本产品和服务;或者创建一个网站和移动应用程序,以将社区成员相互联系起来。
如果你对 — 感兴趣,或者如果你知道有人正在建立这样一个网站,请给我们发电子邮件:support【at】algolia . com,标题为“新冠肺炎请求”。 此外,如果您需要搜索专业知识来构建一个与新冠肺炎相关的应用程序或网站,以便在需要的时候更好地将人们与他们可以访问的最佳信息、产品和服务联系起来,我们的搜索专家也可以在这里提供帮助,并可以提供答案来支持您。
要与致力于解决相关问题的其他组织联系,并了解该计划的更多更新,请访问我们的 Algolia 社区网站 并分享您正在进行的项目。
阿尔戈利亚团队
要了解更多关于 Algolia 和其他公司在此期间如何提供帮助,请访问我们的新冠肺炎资源页面。
支持跨浏览器的语音到文本的语音搜索
原文:https://www.algolia.com/blog/product/supporting-speech-to-text-across-browsers-for-voice-search/
直到今天,如果你想在桌面和移动的浏览器中使用语音到文本,你要么被限制在提供原生支持的浏览器中(目前只有 Chrome 和 Edge,加上 Firefox),要么你必须投入大量的前期时间来实现第三方语音到文本提供商。然而,今天,我们很兴奋地宣布,我们在 AssemblyAI 的朋友已经开发了一个用于语音识别的 InstantSearch.js 小部件,它将 InstantSearch 以易于实现而闻名的特性与他们自己的高质量语音转文本功能结合在一起。
关于即时搜索和语音搜索的一点历史
当我们的客户找到我们,询问他们的客户如何进行免提搜索时,我们发布了针对 Android 和 iOS 的语音覆盖,随后是一个 IntantSearch.js 小部件,用于使用浏览器的原生功能在移动网站上进行语音搜索。从那以后,我们从客户那里得到了很好的反馈,他们喜欢在几分钟内就能在他们的网站和应用程序中进行语音搜索。
algolia instant search 的目标是让伟大的搜索变得容易,同时给其他人提供工具来构建支持新形式搜索的新部件。语音也是如此,这就是为什么我们很高兴看到 AssemblyAI 的 InstantSearch.js 小部件支持跨平台浏览器的语音到文本转换。
这个用在哪里?
很简单:你可以在任何地方搜索!语音搜索不仅仅是“Alexa,一条鲸鱼有多重?”(这取决于鲸鱼的种类。)您的用户希望在他们喜欢的购物平台、内容网站和市场上进行语音搜索。普华永道的一项研究显示,71%的用户更喜欢通过语音搜索,而不是使用键盘。语音搜索通常比打字更快,用户发现他们犯的错误更少:我们需要给他们更简单的搜索方式。
如果你正在寻找更多的灵感和它是如何工作的,你可能想看我们关于语音搜索能为零售做什么的网上研讨会,阅读我们关于媒体语音搜索的电子书,或者查看我们关于 WW 如何使用 Algolia 来为他们的用户实现食品跟踪的案例研究。
实施需要多长时间?
用 Algolia 实现语音搜索只需要不到一个下午的时间。你可以在我们的文档中看到所有的步骤。这是一个很好的开始使用语音的方式,并且可以在用户想去的地方与他们见面。
请记住,语音搜索就是让你的用户能够在他们想到你卖的东西时,随时随地询问你的产品。没有这个简单的出口,他们可能会转而去谷歌或决定推迟到另一个时间——永远不会到来。声音确保你不会被遗忘。
想进一步了解 Algolia 能为您的搜索需求(网络、移动、语音)做些什么?安排一次演示。
扫除我们的环境足迹
原文:https://www.algolia.com/blog/algolia/sweeping-away-our-environmental-footprint/
世界各地的公司——尤其是科技初创公司——正在认真对待它们的生态足迹,并有意识地努力减少它们。Algolia 也采取了一些重要的环保措施,如碳抵消/补偿,并选择清洁能源数据中心。这些是保护环境的重要步骤。
实现碳中和
我们先从 我们自己 能做什么开始。每个科技公司都有能力通过减少其技术产生的温室气体来补偿其碳排放。做到这一点的方法之一是通过植树和恢复我们的森林,这反过来减少温室气体的速度与它们产生的速度相同。这个补偿过程抵消了碳排放,从而实现了碳中和。
碳中和对任何环保政策都是至关重要的 。这是回报的一种形式。云公司使用的数据中心排放的温室气体占全球总量的 2%。
在一家专门确保碳中和的公司的帮助下,pacha ma,我们已经能够评估我们的碳足迹,并采取措施将其清除。
我们的最终目的是帮助保护和恢复地球上的森林,从大气中回收碳,扭转气候变化。
–pacha ma
我们选择 Pachama 不仅是因为它评估碳使用的全面方法,还因为它的创新技术:他们使用深度学习模型和数据密集型算法来评估一家公司的确切碳足迹。但更重要的是,这些算法依靠卫星和无人机来确保使用的数据是 100%可靠的。
–帕查马
多亏了 Pachama 的仔细分析,我们确信我们的碳中和声明是真实和准确的。
在我们的数据中心使用清洁能源
虽然碳中和很重要,但选择不产生温室气体的能源就更好了。科技行业需要找到减少对化石燃料和其他形式“肮脏”能源依赖的方法。我们无法独自做到这一点,因为我们中的许多人并不拥有我们所使用的数据中心。相反,我们依靠数据中心提供商的环保努力。
数据中心所有者的趋势是转向可再生能源,依靠阳光、风、雨、潮汐、海浪和地热等“清洁”能源。Algolia 使用的数据中心遍布世界各地,在减少化石燃料的使用方面取得了巨大进展。我们许多最重要的中心已经公布了它们的生态足迹,比如谷歌、微软 Azure 和亚马逊。这些数字令人印象深刻:有些是 100%可再生能源。清洁能源是一种趋势,Algolia 欣然接受,以帮助清除其足迹。
顾客和员工要求我们回馈
碳中和和清洁能源只是全球企业回馈社会的两种方式。潜在客户和客户开始询问有关这些和其他此类工作的问题。员工和潜在员工对我们的全球关怀同样感兴趣。他们询问我们如何回馈社区。关心环境只是一种方式。还有其他的——资助开源软件、匹配慈善捐款、设立 1000 美元的推荐项目、签署创始人誓言。 我们认为,通过亲生态和基于社区的慈善事业回馈社会是所有云公司的责任。
我们将继续关注由我们的员工以及我们的客户和合作伙伴生态系统领导的其他绿色计划。今天,科技行业的所有成员都应该积极主动地保护环境。
使用 Algolia 和自动完成功能将文档搜索提升到新的高度
这是精心研究的结果,旨在为我们的文档用户提供 Algolia 的最佳产品。
如果您在今天之前从未使用过 Algolia 文档搜索,我们会在滑动面板中提供搜索结果(见下图)。这种体验还不错,但是很传统;具有两组分页结果的选项卡式体验。
在相关方面,我们收到了几起投诉。现有的代码变得太复杂而无法修复。这些年来,它已经发展了很多,不再适合文档的当前状态。
在 Algolia,文档团队与 InstantSearch 和 DocSearch 团队紧密合作。通过合作和重用来自构建自动完成 v1 和文档搜索 v3 的研究,我们能够走很多捷径。
我们在左侧显示结果列表,在右侧显示预览面板。这使您可以在决定是否要导航到相关资源之前发现更多关于搜索结果的信息。
一切触手可及
感谢 Autocomplete v1 ,我们现在提供了先进的自动完成体验,具有增强的可访问性和全键盘导航支持。
你几乎不需要使用鼠标。它使得优化查询的过程更加无缝。
You can virtually interact with every part of the search with your keyboard.
只有最好的结果
您可能会注意到搜索没有分页。这是故意的。我们认为最好的结果应该总是出现在首页。让用户经历分页会让他们走上一条不太相关的结果的不令人满意的道路。
相反,我们在结果列表的末尾提供了一组查询建议,让您细化查询并产生更好的结果。
Instead of endlessly scrolling through pages, you get to adjust your query to trigger better results.
敏捷过滤与快速过滤
在之前的经验中,我们自动应用了滤镜,但是是以一种不透明的方式。您不知道应用了哪些过滤器,其中一些取决于您的本地偏好。这使得该特性不可预测并且难以调试。
我们希望用户能够明确地选择过滤器,没有任何意外。我们经历了两次迭代,在收集反馈并观察人们使用它们之后,我们选择了快速过滤器。**我们建议您在键入时直接从搜索框中选择过滤器,并允许您应用或不应用它们。**您可以继续输入您的查询,并在不离开搜索框的情况下替换或删除过滤器。
Quick Filters trigger as you type to offer filters suggestions.
这是一个实验性的功能,我们渴望看到人们如何使用它。我们计划利用 Algolia 的搜索方面值功能,通过提供更多允许输入错误的建议,进一步增强体验。
永远不会让你失望
当你登陆一个 404 页面,它却没有指引你去任何地方,这难道不令人沮丧吗?我们对无用的无结果页面也有同样的感觉。
我们不会因为你输入了“错误”的查询而惩罚你,而是通过让你知道什么是错的以及下一步该采取什么步骤来提供一种更友好和宽容的体验。每当您的过滤器没有返回给定查询的结果时,我们会立即执行另一个没有过滤器的搜索。这样,我们可以向您显示没有过滤器的匹配。
体验保持不变,我们所做的只是让你知道。
We display results even when filters get in the way.
如果即使没有过滤,搜索仍然没有结果,我们会提供查询建议,这样你就可以一直向前。
No results page with Query Suggestions to adjust the query.
口袋搜索
我们重新设计和优化了平板电脑和移动体验,让您甚至可以通过手机轻松搜索。所有功能都适用于手机,包括快速过滤器。
预览面板在移动设备上毫无意义,因为你不能用键盘悬停或导航。因此,我们在搜索结果中将其替换为简短描述。
反思文档相关性
当你处理文档时,你处理的是相互关联的信息片段。这与电子商务体验有着本质的不同,在电子商务中,商品大多是独立的。
文档资源可以是系列的一部分,也可以是规范指南的附录。一个页面被分解成单个段落,以适应 Algolia 记录。当您在文档网站中搜索某个内容时,它会映射到一个搜索结果。然而,为了让你理解它,并决定在众多的点击中哪一个最有意义,你需要上下文。例如,当搜索“索引”时,您可能对索引您的数据感兴趣。然而,Algolia 没有办法知道此时你确切地在寻找什么:如何索引数据的指南、给定语言的 API 参考、定价问题等等。如果我们仅仅依靠 Algolia 的排名策略,我们将首先得到最相关的文本结果。这是一个好的开始,但还不够。
动态联合搜索
我们创建了一个动态联合搜索实验。我们依赖单一索引,在前端处理类别分组。没有空的或静态定位的类别,不缺乏类别之间的平衡。我们依靠 Algolia 强大的 API 在创纪录的时间内返回最佳匹配结果,并且我们用业务代码赋予它们更多的意义。
Results are categorized dynamically, to create context and help users scan them.
它是如何工作的
当我们收到来自 Algolia 的点击时,我们认为它们都是相关的。我们做的第一件事是按照类型(集成、即时搜索小部件、常见问题等等)对它们进行分组。然后,我们为每个类别分配一个分数,以便在 UI 中对其进行排序。这有助于我们控制顺序,这样用户就可以期望某些类型的结果总是出现在同一个地方。指南通常在顶部,REST API 页面在底部。
我们依靠 Algolia 的第一个匹配来在顶部显示最佳匹配,但前提是分组命中的第一个结果不同。
由于我们不依赖于多索引搜索,我们无法控制每个组的点击率。这可能导致不平衡的结果,你会得到十个指南和两个 API 参考页面。这将无法呈现各种内容。因此,我们调整每组中显示的点击次数。如果在集成和小部件中有十个匹配,我们不会显示二十个匹配,因为这会隐藏第二个组并迫使用户滚动。取而代之的是,我们用总点击数除以组数来限定点击数。
当 Algolia 从单个类别返回命中结果时,该算法会显示所有命中结果,因为这可能是您正在寻找的内容类型。如果它从第二个类别返回命中,我们将每个组的命中上限设为一半。
到目前为止,这种分组和封顶逻辑创造了一种令人愉快的体验,感觉自然而透明。
**所有这些前端逻辑并不意味着我们无视 Algolia 的排名策略。**我们非常依赖 Algolia,我们提高了它在文档用例方面的排名。Algolia 返回我们知道相关的结果,所以我们有一个良好的基础开始。它还提供了一个“预先排名”,这是我们对大多数内容类型所依赖的。我们分配的许多分数是相等的,这意味着我们默认使用 Algolia 的排名来打破这些分数的平局。
增压索引管道
我们不能在不提及索引的情况下谈论新的搜索。这是我们重新设计的第一件东西,我们设法让它比以往更快。
各取所需
我们的一个难点是添加新的内容。根据页面类型的不同,我们索引数据的方式也不同。当您索引 FAQ 和 Crawler 参数时,您不会获得相同的信息。
我们的遗留索引管道是在文档中有如此多样的产品之前设计的,所以它没有针对这个用例进行优化。
新的索引管道使得添加新的内容类型变得轻而易举:每种类型的内容都有自己的记录构建器。如果我们需要记录一个新产品、库或集成,我们需要做的就是为它编写一个构建器。
Each content type has its own record builder.
这还能更快吗?
我们还通过同时生成多个记录来提高索引管道的性能。我们利用一种技术来确保所有的任务都完成了,而不需要等待所有的任务。这减轻了引擎的压力,也为我们节省了一些额外的时间。
为文档生成完整的索引需要 13 分钟以上的时间。有了新的管道,从 1,300 多页中提取数据、运行健全性检查以确保数据完整性,以及为 50,000 多条记录建立索引的时间减少到大约 4 分钟。这几乎是****的 4 倍快**。当我们只更新需要改变的记录时,索引甚至更快。在典型部署期间,增量重新索引现在只需不到 3 分钟。这让我们比以往更快地迭代和发布新内容。**
**
A full reindex with the new pipeline.
接下来是什么?
我们很高兴能够发布这一体验,我们认为这是打造同类最佳搜索体验的第一步,可以帮助和激励我们的用户。我们已经有了一些想法:
- 🎙·阿尔戈利亚用网络语音 API 回答&语音搜索支持
- 💻打开搜索支持从浏览器的地址栏搜索 Algolia 文档
这让我们对发布自动完成的 v1 充满信心,因为我们现在已经在几个高可见性的项目中使用了它。
我们也在努力将新的 Algolia 文档搜索的所有特性以插件的形式加入到自动完成功能中。通过这种方式,您将能够使用基于 DocSearch 的文档站点或者直接使用库来创建类似的体验。敬请关注我们的话语论坛!**
双引擎的故事-阿尔戈利亚和统一
原文:https://www.algolia.com/blog/engineering/tale-two-engines-algolia-unity/
游戏引擎里面的搜索引擎? 这个想法是在阿尔戈利亚的一个非冲刺日之前形成的,这是一个阿尔戈利亚人尝试新概念的活动。
在之前的冲刺阶段,我的同事塞缪尔·博丁和我在想:阿尔戈利亚有一个 。NET API 客户端 和Unity都支持 C#作为脚本语言——为什么不试着把它们结合在一起呢?
我们的想法是在一个 Unity 游戏场景中实现“随你搜”的体验。我们决定创建一个 市场 ,一个在游戏中搜索的常见用例。
结果?成功。除了一个小的性能挑战,这是通过切换到异步模式解决的,在一天结束时,我们在 Unity 中有一个全功能的 Algolia 搜索,包括游戏资产和图像的索引,以及完整的搜索和结果 UI。让我们看看这是怎么做到的!
用阿洛与阿洛合一。入门!
团结不支持。NET 包管理器 NuGet。要解决这个问题,你必须直接在【nuget.org】上下载 Algolia 库 的 zip 包,然后解压你的 Unity 项目的Assets/Plugins文件夹中的内容。
在这一步之后,您必须在 C#脚本中添加 using Algolia.Search.Clients;
语句,才能开始使用 Algolia with Unity。
既然我们已经把 Algolia 接入了 Unity,下一步就是创建游戏场景。
寻找资产
我们的第一个任务是找到游戏资产和一个数据集来设计我们的游戏场景。
我们从 Unity 找到了这个 优秀的入门套件 ,并把它作为我们实验的基础。好的一面是,它包含了许多 UI 元素——我们只需要重用它们来创建市场场景,并添加一个菜单来访问它!
创建行星数据集
在深入研究游戏设计之前,我们必须创建一个数据集。由于科幻小说是资产的主题,我们决定创建一个由行星组成的数据集。我们用强大的数据集生成器Mockaroo创造了一千个假行星。我们接着用 CC 图像 来说明数据集。一旦完成,我们就准备好出发了!如果你想重用这些数据,你可以在GitHub上找到。
神石市场
最后也是最具挑战性的一步是为市场创建游戏场景。我们希望它简单:它将由一个搜索栏和一个显示结果的面板组成。为了实现这一点,我们从初学者工具包中取出 控件 场景并对其进行定制。结果——行星面板——看起来像这样:
搭建好场景后,需要做一点工作来使它生动起来。我们需要编写一些 C#来把空盒子变成行星。
为随键入搜索编写脚本
在向 Algolia 发送请求之前,我们需要捕捉用户的每一次击键。为了实现这一点,我们给 InputField 附加了一个 C#脚本,以catchValueChangeCheck()event。 一切正常,我们能够检索输入的击键!用检索到的字符串向 Algolia 发出请求非常简单:
var results = await _searchIndex.SearchAsync(new Query(SearchInput.text)
{
HitsPerPage = 8,
});
注意:我们已经在**Start()方法中实例化了AlgoliaClient和Index对象,以避免为每个请求创建一个客户端。**
我们让搜索工作起来,Algolia 的 C# API 返回了一个行星列表(List
我们编写了void LoadResults(List<planets>)
方法,该方法从 *列表<>*中创建游戏对象。你可以在GitHub上找到源代码。这里我们只指出几个部分。简而言之,该方法在行星上循环以创建游戏对象,每个行星一个。
完美。
不,不完美。还没有:行星的显示太慢,图像刷新不稳定。
不同步
我们的第一个想法是为每个星球创建两个游戏对象:一个raw image和一个 Text, ,然后做一些计算来确定它们在场景中的位置。搜索体验还可以,但是有点滞后。
所以我们对此进行了调查,发现了我们展示行星方式的一个缺陷。我们同步加载行星的纹理,这使得它看起来很慢。让搜索体验更加流畅的解决方案是异步加载行星的纹理。为了实现这一点,我们使用了来自 Unity 中的Resources.LoadAsync<Texture2D>
方法 LoadTexture
IEnumerator LoadTexture(RawImage image, Planet planet)
{
var resourceRequest = Resources.LoadAsync<Texture2D>($"{planet.Path}"); ;
while (!resourceRequest.isDone)
{
yield return 0;
}
image.texture = resourceRequest.asset as Texture2D;
image.color = Color.white;
}
你可以在下面的视频中看到不同:
https://www.youtube.com/embed/qHtWuM6E-8s?feature=oembed
视频
完美!但是没有完成。虽然搜索体验对于我们的 POC 来说已经足够快了,但是我们还没有从主菜单中加载场景。
从主菜单中加载场景
为了结束这个循环,我们在主菜单中创建了一个按钮来访问市场。我们附加了一个LoadSceneOnClick脚本到这个按钮的 OnClick()
事件上。顾名思义,这个脚本在按钮被点击后加载一个场景及其索引:
public class LoadSceneOnClick : MonoBehaviour
{
public void LoadByIndex(int sceneIndex)
{
SceneManager.LoadScene(sceneIndex);
}
}
我们现在已经准备好了所有的部分,让我们看看结果吧!
https://www.youtube.com/embed/xALmioNiwS0?feature=oembed
视频
我们完成了吗?
一天之内,我们用 Algolia 的 C# API 客户端创建了一个简单的搜索市场。我们还没完!一个有趣的方向是尝试与其他游戏引擎相同;例如,另一个项目将重现这种与CryEngine的集成,它也支持 C#作为脚本语言!
但真正的下一步是将 Algolia 的所有功能添加到解决方案中。我们仍然有很多可能性可以探索:在 MMO 游戏的库存中创建一个搜索,为搜索服务器添加一个 UI,添加方面和过滤,深化数据集,添加分析和个性化等等。本质上,随着你的游戏越来越复杂,你的市场,以及 Unity 中任何基于搜索的功能,都需要跟着做。祝游戏愉快!
与塞缪尔·博丁合作撰写。
用 Zapier 和 Algolia 教英语
原文:https://www.algolia.com/blog/engineering/teaching-english-with-zapier-and-algolia/
在美国,3 月 11 日是国家无代码日,以鼓励更多的人在网上无代码地创建东西。为了庆祝这一天,我们邀请英语教师 Alita Leite de Silva(她不是开发人员)使用 Algolia 的 API 优先搜索工具和 Zapier 自动化平台创建一些很酷的东西。下面是阿丽塔来解释她建造了什么。
应用无处不在!有银行、组织、甚至只是发送提醒给植物浇水的应用程序。它们如此普遍,以至于像我这样的小企业现在甚至制作自己的应用程序,向客户发送重复的电子邮件或短信——毕竟,这是与客户保持联系并继续创造新业务的轻松有效的方式。
这不需要什么技巧。相信我;我一点也不懂技术!作为一名英语老师,我花很多时间发作业邮件,实际上几乎没人打开这些邮件…😒哦,教学的美妙之处。无论如何,我想也许我可以自动化这个过程,给我的学生发一封定期的电子邮件,让他们每周练习一个新的英语表达,而不用我自己浪费时间发这些邮件。然后,我们可以有一个简单的、可搜索的页面,上面有这些电子邮件中的所有英语表达,供学生参考。问题是,除了知道如何打开和关闭电脑,我没有一点发展技能;使用我教学需要的程序,如谷歌表单、文档和幻灯片;我可以发电子邮件和下载作业文件。
我还是不知道什么是代码。但我还是踏上了这段旅程,事实证明,这比看起来容易多了!还有**如果我能做到,你也能!**最简单的形式是这样的:
配置一个像 Zapier 这样的无代码平台
- 找到一个工具来完成整个过程,而不需要编写任何代码。我发现扎皮尔在这里非常有帮助。如果你想跟进,你需要注册一个帐户并创建一个新的 Zap。
- 选择一个“触发器”,基本上就是会启动整个过程的 app。我选择了 Zapier 的 Schedule,因为我希望我的“每周表达”邮件每周发送一次。
- 现在我们需要找到一个工具来存储我们的信息,一个与 Zapier 一起工作的工具。为此,我选择了 Algolia。那边的一个朋友最近向我展示了他们正在建造一个 Algolia/Zapier 连接器,他给了我一个早期版本。如果你也想摆弄它,你可以在这里进入。
- 之后,你需要在 Zapier 中选择一个“动作”,这是一个存储你的信息并在被触发时发送出去的应用程序。如果您点击了上面的链接并完成了整个过程,您应该可以在这里选择 Algolia。
添加您的 Algolia 数据源
接下来,我们需要构建我们的数据。Algolia 将让我们用一个 JSON 文件填充我们的数据库,这是一种我以前从未听说过的格式。它是这样工作的:
首先,找一个地方写你的文件。一个很好的选择是微软记事本。不要使用任何带有格式选项的东西,比如 Word 或 Google Docs。
整个文件将被放在方括号中。
[
是文件的开头,]
是结尾。在方括号内,我们将列出几个
objects
,每一个代表学生将会收到的一个英语表达。对象以花括号开始和结束:{}
。每个对象之间需要一个逗号。一定要让 JSON 有条理,间距适当,这样你就可以方便地阅读和添加。
对象中的每一行都是一个标签(在引号中),一个冒号,然后是该标签在引号中的值。我的开发人员朋友说,让标签以小写字母开头是一种习惯,通过大写接下来单词的第一个字母来替换所有空格。所以标签可能是
expressionOfTheWeek
,而不是Expression Of The Week
。你还需要在一个对象中的每一行之间加一个逗号,这样除了最后一行之外,对象中的所有行都将以逗号结尾。JSON 描述一个人可能是这样的:{ "firstName": "Jane", "lastName": "Doe"
}
```
- 在我的例子中,我希望 Algolia 和 Zapier 知道哪一天将哪些信息发送给我的学生,所以我在 JSON 文件中的所有对象上都有一个
day
标签,它们的值就是我希望这些表达式发出的日期。出于测试目的,最好在制作应用程序的当天发送一个对象。让我给你看看我的 JSON 是什么样子的:
- 将此保存为
.json
文件。你正在使用的应用程序可能会让你先将其保存为.txt
,但你也可以稍后在屏幕上用你所有的计算机文件对其进行重命名。确保文件的类型为“JSON 文件”。 - 回到阿尔戈利亚。一旦你注册了一个账户,它会带你完成创建应用程序和索引的过程。一旦它让你上传数据,就把我们做的 JSON 文件给它。
- 在 Algolia 索引中,我必须添加
day
作为 faceting 的属性,这基本上意味着我将能够向 Algolia 发送一条指令,将所有搜索结果过滤为我选择的那一天的结果。这是在配置>刻面>attributesForFaceting
下。 - 回到 Zapier,在 Algolia connector 应用程序的选择帐户下拉菜单下,我们可以给它我们的 Algolia 凭据。
- 现在我们的 JSON 文件已经完成,并且在正确的位置,让 Zapier 在 Algolia 运行一个测试搜索。如果您今天有一个可用的结果,Zapier 应该把它拉进来,并识别我们之前在 JSON 文件中设置的标签。
- 接下来,你只需要设置你的电子邮件信息。在“正文”下,你可以写电子邮件并插入来自 Algolia 的信息,方法是在你开始输入时显示的下拉菜单中点击“在 Algolia 中运行搜索”。设置 Algolia 标签在句子中的显示方式,如下图所示。我们在正文框中写的内容将与电子邮件中显示的内容完全一致,因此请确保您的标点和语法正确无误🙂
把这一切联系在一起
我们完事了。现在,通过将它发送给自己来测试一下,看看它在我们的收件箱中是什么样子!我的看起来像这样:
Zapier 将根据您的意愿随时发送这些短信或电子邮件(通过 Zapier 订阅,因为我们使用的不仅仅是免费功能)。
Algolia 的主要用途是,一旦你建立了索引,他们就会提供所有必要的工具,让你的用户(或你的应用程序,无论它如何工作)搜索这些数据。在索引中的 UI Demos 选项卡下有一个选项,可以实际制作一个页面的原型,您可以在其中搜索索引中的信息,这个页面足够好,我可以发送给我的学生,这样他们就可以自动看到所有的表达式并搜索它们,而不必查看他们的电子邮件。这是一个干净、简单的显示器:
我在经验如此之少的情况下就能做到这一点,这难道不疯狂吗?这表明我投入的几个小时(尽管这可能比大多数专业开发人员花费的时间要长一点)是值得的。毕竟技术在不断进步,时间也越来越宝贵,所以学习如何入门自动化是极其有价值的。感谢 Algolia 的同事给了我一些建议,这样我就可以专注于为我的客户提供高质量的服务,而不是手动发送重复的电子邮件。我期待着看到我的学生在工作中更加自信地使用日常英语表达,这都要归功于这样的自动化。
所以,如果你像我一样不是开发人员,不要害怕 Algolia 这样的工具,因为它们是为编码友好而设计的。通过使用像 Zapier 这样的低代码组织工具,你仍然可以自动化你的业务,并且只需要很少的时间投入就可以把时间花在更重要的事情上。那种力量就在我们(非编码)的指尖!所以为什么不试一试呢!如果你需要任何帮助,阿尔戈利亚的人会像他们和我在一起一样,很乐意为你指明正确的方向😉
生产中的弹性测试:部署时测试
作为一家 SaaS 公司,我们的软件和基础设施必须在竞争中保持领先。它必须可靠:服务器和 API 的可用性与创新同样重要。换句话说,虽然我们需要尽可能快、尽可能频繁地发布产品更新和新功能,但我们也需要通过测试一切来构建有弹性的软件——这占用了创新的时间。
经验告诉我们如何平衡这些相互竞争的需求:生产测试。
为什么要在生产中做弹性测试?
生产中的弹性测试是在生产中部署新代码的过程,并直接使用生产流量“测试”它,而不是运行详尽的测试套件。这有风险。您通常希望避免这种情况,但是随着应用程序的增长,测试所有内容变得不可能。
在 Algolia 引擎中,我们目前有二十多个查询参数。如果它们都是布尔标志,测试所有情况将需要一百万次测试:二十个参数,每个参数有两个可能的值,这就是 2^20 可能性。
当谈到测试所需的时间时,有三件事需要考虑:
- 是时候编写测试了
- 到维护测试的时间
- 是时候运行测试了
编写一百万个测试已经是一个漫长的过程,但是一旦它们出现,这些测试就成为了项目的一部分。因此,它们像其余的源代码一样需要维护,所以现在每个软件迭代都需要更多的工作。
现在让我们假设你的团队足够大,可以编写和维护那些测试,你仍然需要运行它们。如果每个测试只需要 10 毫秒,那么总共需要运行 2h45m。代码中的任何更新现在都需要 2h45m 来验证。
我们的客户购买我们的产品不仅是为了现有的功能,也是为了即将推出的服务。他们希望我们定期发布新功能,这样我们就可以帮助他们成长,变得有创新性和弹性。因此,我们需要有效率。
当我们实现一个新特性时,我们只编写测试来验证实现并检测明显的极限情况。为了彻底验证功能,我们决定建立一个部署设置,允许我们在生产中进行测试,在出现错误时对客户的影响最小。这样,我们可以按时交付新的特性。
真实例子
让我们举一个具体的例子:我们最近重写了 Algolia 的突出显示功能。如果我们想彻底地测试它,这意味着将所有参数所需的一百万次测试与所有可能的 Unicode 字符(超过一百万)结合起来。这加起来超过十亿次测试。如果每个测试只需要一毫秒运行,这个测试套件本身将需要 11 天来完成。
我们必须找到更好的解决方案。因此,我们决定在生产中测试,而不是维持数十亿次测试并显著减慢我们的发布过程。
我们主要关心的是避免影响客户,因此我们定义了实施这种设置所需的条件:
- 一个渐进部署流程
- 一种在健康基础设施上重试的方法
- 主动问题检测
现在,即使采用这种设置,软件错误也可能导致服务中断。为此,我们制定了一个跨越三天的搜索引擎渐进部署流程。这种部分部署为我们提供了足够的时间来检测问题。
如果在新版本中有一个 bug,我们的 API 客户端会接管他们的重试策略。如果它们的目标是一个损坏的节点,它们会透明地用另一个节点重试,直到得到成功的响应。从最终用户的角度来看,这个问题是看不见的。
当我们部署重写高亮特性时,我们发现了一个规范化问题。目标是将文本转换成规范形式,以简化不同输入之间的比较。规范化的表单通常比原始表单更短或更长,这正是突出显示代码所期望的。但是,有一些字符的规范化形式更长:将的(德国夏普 S)规范化为的 ss 。在重写过程中,我们添加了运行时前置条件检查,以确保规范化的大小更短或相等,并且代码的行为符合预期。这就是揭露 bug 的原因。
当我们在第一个节点上部署新版本时,它立即停止响应生成更长规范化表单的查询。然而,由于我们的 API 客户端的重试策略,没有一个客户注意到它。在我们这边,我们的监控系统触发了警报,我们很快恢复了变化以稳定引擎。它留给我们所有必要的时间来正确理解这个问题,编写适当的修复程序,以及相应的测试。
一个合适的设置
当您想要在生产中进行测试时,您需要三个关键要素:
- 一个复制的基础设施
- 一款弹性软件
- 一个安全部署策略
复制基础设施
如今,配置复制的基础架构非常简单:所有云提供商都在多个虚拟机前提供负载平衡器。在我们的例子中,我们在集群级别处理搜索引擎数据的复制,每个节点拥有 100%的数据。这样,节点可以独立地回复查询。
弹性软件
这部分高度依赖于你正在构建的软件。在 Algolia 引擎中,我们在代码中有大量的健康检查来验证函数的先决条件和预期状态。当我们进入意外状态时,引擎停止处理以避免返回损坏的数据。它强制 API 客户端透明地在不同的节点上重试。
安全部署策略
最后,同样重要的是,部署过程的主要目标是发布新版本,同时逐步控制风险。
在 Algolia,我们将基础设施分为四个环境:测试、试运行、生产和安全。每个环境都有不同的 SLA:
- 测试包含我们内部使用的集群。违反它只会影响公司。
- Staging 包含由 Algolians 维护的面向公众的项目的搜索集群。
- 生产包含我们的客户群。
- Safe 包含我们的高级 SLA 客户群。
在我们的部署策略中,我们利用这些不同的环境来降低风险。这意味着我们首先部署在对客户影响最小的环境中。
除了不同的环境之外,我们还利用复制因子 3,创建了一个包含 12 个步骤的部署流程:
- 我们部署在测试集群的所有三个节点上。
- 我们部署在暂存集群的第一个节点上,然后部署在生产集群的第一个节点上,然后部署在安全集群的第一个节点上。
- 我们等一天。
- 我们部署在暂存集群的第二个节点上,然后部署在生产集群的第二个节点上,然后部署在安全集群的第二个节点上。
- 我们等一天。
- 我们部署在暂存集群的第三个节点上,然后部署在生产集群的第三个节点上,然后部署在安全集群的第三个节点上。
第一步允许我们检测处理分布式系统和集群中节点间交互的代码中的问题。
然后,在每个节点上逐一部署让我们可以评估一个集群是否可以同时支持两个不同的版本,以及代码是否稳定。
在部署到下一个环境之前等待一整天的理由是,它留下了足够的时间来检测性能问题、数据损坏或基于时间的问题。一旦我们到达这一步,我们就已经检测到了大多数问题。渐进部署的其余部分在这里帮助我们识别未捕获的突发变更。
每当我们检测到一个 bug,我们会立即恢复新版本。通过这种方式,我们可以将服务设置回稳定状态,这给了我们足够的时间来修复问题并正确地添加相应的测试。
使用这种方法,我们的测试套件由客户使用驱动。这使得它特别高效,并且允许我们每周发布一个新版本的引擎,以满足我们客户的需求,即使有如此大的代码库。
好胜过完美
创业生态系统充满挑战。小团队需要找到高效的策略,才能创造出比大团队大公司更好的产品。
定期发布新功能与拥有一个稳定的产品一样重要,该产品具有满足客户需求的出色用户体验。这种对效率的需求就是为什么我们必须在编写足够多的测试以获得良好的特性覆盖和能够经常发布之间找到一个中间地带的原因。
您应该始终小心添加更多的测试,因为它们很耗时:编写、维护和运行它们需要时间。那么,您如何知道何时编写测试呢?90 法则是适用的:测试一个特性的 90%通常很简单,最后的 10%也要花同样多的时间。这就是为什么根据客户使用情况处理剩余的 10%是至关重要的,而不是推动详尽的覆盖范围。
为了降低风险,确保你花时间设计一个软件和一个支持生产测试的基础设施,尽可能减少对客户的影响。
构建真正无头产品的 API 优先开发的 5 个原则
在我们谈论 API 优先开发之前,我们需要了解什么是 API。
应用编程接口(API)是一种允许两个应用程序交换数据和功能的技术。
假设你有一个电子商务网站,想集成 Algolia 的搜索功能。我们的搜索 API 让您的网站和我们的托管搜索引擎交换数据和功能。当用户输入一个查询时,你的网站向我们的服务器发送一个请求,我们的服务器发回响应——所有这些都是通过 API 完成的。这种 API 请求-响应交换是开发人员如何交付出色的搜索和发现体验 而无需 从头构建技术。
API 就在你身边——即使你看不到它们。谷歌通过其地图平台 API 分享其地图、导航和本地数据。OpenWeatherMap 向应用程序和网站提供超本地每分钟的降雨数据。脸书允许移动开发者整合社交关系和个人资料信息。这样的例子不胜枚举。
那是一个 API,但是什么是 API 优先 的开发方法呢?
API 优先是一种以 API 为中心的软件设计方法。应该可以通过脚本语言执行每一个动作,并且每一项功能都应该可供其他系统利用。
同样,如果这听起来很简单,那是因为它很简单。然而,问题出现了,因为定义变得模糊了。通常,当开发人员说他们是 API 优先时,他们只意味着 API 是重要的,而不是基础性的。
API 的核心原则——优先开发
由于如此多的开发人员不正确地使用术语 API 优先(或者可能部分正确),很难知道哪些产品是真正的 API 优先,哪些不是。
正是因为这个模糊的定义,我们收集了 API 优先开发方法的五个核心原则。
1。你的 API 是一个产品
发布一个 API 很容易。难的是让它为大众消费做准备。这就是仅仅创建 API 和把它们当作产品的区别。API 优先的方法要求您考虑开发人员将如何与您的 API 交互,您将如何教育他们 API 的功能,您将如何维护它,使用哪些工具来构建 API,以及您将如何遵守兼容性、安全性和简单性的标准。
一个公司打造一个产品,必须符合行业标准。对于 API,这意味着实践交付高质量软件产品的基础软件设计和开发周期。产品开发包括前期设计和规范、对等编程、符合 API 目标的技术选择和编程语言支持、云与现场之间的决策、测试和用户研究。
2。基础设计,而非特别改造
API 优先设计要求开发者从一开始就考虑 API。然而,很少有人能从头开始工作。通常,软件公司会在 构建产品之后,尝试采用 API 优先的方法 。通常,这意味着在现有平台上添加 API。这种方法并非没有价值。它可以提高自动化程度并改进底层功能。但是它不是 API 优先的方法。
简单来说,API 优先开发是以 API 为基础的。它不是预先构建的或自以为是的软件解决方案或体验,而是确保您可以通过 API 访问平台的所有功能。
3。团队协作和影响
当处理技术主题时,很容易只关注技术。但是 API 优先开发不仅仅是技术标准。这是一种工作和协作的方式。API 优先的方法不仅仅关注每个 API 的细节,而是更多地关注围绕这些 API 的团队和操作。
实现 API 优先的环境需要产品经理的强有力的领导,他既了解 API,又具备足够的技术技能。它也需要熟练的开发人员。尽管开发人员非常擅长交付出色的最终用户体验,但创造令人愉快的 工程 (或开发人员)体验(DX)完全是一套不同的技能。您需要一个客户成功功能来帮助实施和支持现场正在进行的查询和用户反馈。
4。API-first 支持微服务
开发世界正朝着可重用性的方向发展。正如汽车制造商使用通用部件一样,公司正在从一体化平台转向可重复使用的组件。
例如,在线零售商不再购买一体化的电子商务平台,而是采购所有最好的可重复使用的组件(库存管理、结账、支付网关、订单履行等),并将它们结合起来,创建完全适合其环境的企业产品。
因为你的组件需要相互通信,所以没有 API 就没有微服务。使用 API 优先的方法进行构建,可以确保其他开发人员可以轻松地将您的 API 集成到他们的微服务架构和应用中。
5。API 合同
我们已经提到,API 优先的方法是由可重用性驱动的。通过创建开放和可访问的 API,公司可以轻松地重用、重新部署和共享功能。但是说起来容易做起来难。提高可重用性的一种方法是通过一致的 API 描述语言。具体来说,这创建了一个约定,规定了 API 应该如何表现。建立契约需要花费更多的时间来考虑 API 的设计,并且经常需要额外的计划和协作。
API-first 符合 MACH 联盟的原则吗?
到目前为止,我们已经讨论了 API 和 API 优先开发。但两者都不是孤立存在的。它们位于一个更大的技术生态系统中。这就是为什么你经常听到 API-first 和另外两个概念: Jamstack 架构和 MACH 联盟原则。
例如,jam stack(Javascript、API 和标记)是构建现代产品的最佳实践的集合。它是关于分离 web UI 层和后端业务逻辑的。正是这种运动使得马赫方法成为可能。
但是什么是 MACH 联盟,API-first 在哪里?要回答这个问题,缩小范围问“谁是马赫联盟”是有帮助的
马赫联盟(MACH Alliance)是一个由独立科技公司组成的团体,倡导开放、一流的科技生态系统。像许多人一样,他们认为企业套件已经过时,并建议用“敏捷、灵活、始终保持最新”的 MACH 生态系统来取代它们。
为了创造这样的生态系统,他们建议公司遵循四个原则:
- 微服务 :独立开发、部署和管理的单个业务功能。
- API-First :所有功能都通过一个 API 公开。
- 云原生 :利用存储和托管之外的云的 SaaS,包括弹性扩展和自动更新。
- 无头 :前端表示与后端逻辑和通道、编程语言解耦,最终是框架不可知的。
如你所见,API 优先开发是 MACH 生态系统的基石,也是企业技术的未来。这就是为什么当我们来构建Algolia时,我们遵循 MACH 原则,基于微服务、API 优先设计、云和无头架构来构建产品。像联盟的其他成员一样——big commerce、Contentful、MongoDB 和 AWS 等——我们正在证明为什么这种方法如此有影响力。
将 API 放在首位并不容易,但这是值得的
我们已经解开了什么是 API 优先开发,并探索了随之而来的一些优势。但我们也强调了这是一个多么根本性的变化。转向 API 优先的开发并不像按动开关那样简单。你需要重新思考和评估你的产品设计和架构的整个方法。
面对如此重大的变化,公司半途而废或实施零敲碎打的方法并不奇怪。这就是为什么技术领导者需要睁大眼睛开始 API 优先的转变。当你这样做的时候,你就拥有了最大的成功机会,并且释放了 API 优先开发的所有好处。
个性化引擎的 7 个功能障碍
原文:https://www.algolia.com/blog/ai/the-7-dysfunctions-of-personalization-engines/
你是如何看待个性化的?
在过去的几个月里,我就是这样开始与大多数客户交谈的。我仍在做这件事,因为理解客户对个性化的各种观点对我来说很有吸引力。从通过将添加到电子邮件主题来实现个性化,到根据人口统计数据手动分类用户并向他们展示定制内容,或者在电子商务网站的产品详情页面上添加“最近查看”的小部件,个性化这一广泛主题下的大量实践令人震惊。
是的,推荐引擎和更复杂的基于人工智能的个性化策略被认为是解决可扩展性的一种方法。但这些技术绝不是什么新东西。早在 2018 年,Gartner 就发布了第一份关于个性化引擎的魔力象限报告,甚至在此之前很久,2003 年,由当时的亚马逊研究人员 Greg Linden、Brent Smith 和 Jeremy York 发表了一篇名为“Amazon.com 推荐:单品到单品协同过滤”的论文。
然而,个性化仍然是客户体验的整个圣杯,制造了挫折,也助长了关于隐藏在个性化引擎领域深处的按钮、复选框或开关的神话,这些会自动神奇地导致人工智能霸主为所有人设计理想的体验。正如 Gartner 在 2019 年发现的那样,这种扭曲的观点正导致大多数营销人员放弃他们的个性化努力。
让我们务实一点。
个性化不是一个勾选框练习,而是一项复杂的任务,一个维恩图代表了三个需要回答的问题:
- 我们为什么要做个性化?
- 我们在建造什么?
- 我们如何建造它?
如果是这样的话,很明显个性化不再是营销的同义词,就像在个性化早期被认为的那样。相反,它需要产品思维,需要业务团队、产品经理和工程团队之间的密切合作,以解决与个性化相关的问题。
在与客户(尤其是电子商务行业的客户)进行了多次对话和反馈会议后,我成功地将广泛而复杂的个性化主题分解为 7 个子问题:
- 不尊重用户隐私
- 冷启动问题//不支持实时
- 不支持用户身份一致性
- 难以准确预测用户意图&细分市场(针对首次访问者或回头客)
- 在编排更复杂的个性化体验方面缺乏灵活性
- 在模型指标和业务指标方面不透明
- 使用方式不道德
我建议我们深入分析个性化引擎的 7 个功能障碍及其潜在的解决方案。到本文结束时,你将更好地理解和应用适合你自己的"项目个性化"的正确策略。顺便说一下,如果你想看同一主题的视频,我推荐 DevCon 上的这个演示,因为它代表了本文的基础。
1。不尊重用户隐私或隐私友好的缺陷
83%的最终用户期望在瞬间和数小时内实现个性化,但同时,高达 80%的消费者对公司关于其在线数据的安全和隐私做法非常敏感。
起初,这似乎是一个悖论:个性化用户体验,同时保护他们的数据隐私?如果确实是这样,该如何解决?
一个建议是通过允许用户选择加入和退出,并决定在什么条件下可以使用他们的用户数据简档,使个性化引擎具有隐私意识。用户可以“激活”,甚至是部分激活他们认为适合他们所处阶段的个性化级别所必需的数据。最终用户可能有权访问如下所示的隐私设置页面:
请注意信息、导航和事务配置文件。在幕后,我们可能有这些用户配置文件的以下 JSON 表示:
[{
"user": "user-123",
"informational-profile": {
"properties": {
"raw": {
"device": "mobile",
"sessionCount": 12,
"timeOnSite": "02:03:10",
"browser": "chrome",
"pageviews": 32,
"avgSessionDuration": 102,
"lastVisit": "2022-09-11T10:12:37Z"
}
}
}
},
{
"user": "user-123",
"navigational-profile": {
"products": {
"value": [
{
"name": "Jirgi Half-Zip T-Shirt",
"objectID": "D05927-8161-111",
"url": "men/t-shirts/d05927-8161-111"
},
{
"name": "Boys T-Shirt",
"objectID": "D12461-8136-211",
"url": "boys/t-shirts/d12461-8136-21"
},
{
"name": "Men shorts",
"objectID": "D12345-5678-910",
"url": "men/shorts/d12345-5678-910"
}
],
"lastUpdatedAt": "2021-07-11T07:07:00Z"
}
}
},
{
"user": "user-123",
"commercial-profile": {
"orders": {
"value": [
{
"total": 159,
"products": {
"value": [
{
"name": "T-Shirts",
"objectID": "D05927-8161-111",
"size": "L",
"quantity": 1,
"price": 99.00
},
{
"name": "Hats",
"objectID": "D12461-8136-211",
"size": "M",
"quantity": 1,
"price": 15.00
},
{
"name": "Shorts",
"objectID": "D12345-5678-910",
"url": "men/shorts/d12345-5678-910",
"size": "L",
"quantity": 1,
"price": 45.00
}
]
}
}
],
"lastUpdatedAt": "2021-07-12T10:03:37Z"
}
}
}]
2。没有实时支持或冷启动问题
理想情况下,你会希望你的个性化引擎包括:(1)实时(在线)预测和(2)实时(持续)学习。因此,就实时就绪性而言,可能有 3 个级别:
- 0 级:批量处理。预测每天生成一次(甚至更频繁),并保存到数据库中。当发出 API 请求时,将提供预先生成的&保存的预测。
- 一级:在线/实时推理能力。当发出 API 请求时,在数据库中生成&保存(甚至缓存预测)的机制。
- **第二级:实时学习。**除了推理是实时的,ML 模型也以连续的方式更新。
实时对预测质量的影响因用户类型而异:
- 对于第一次访问 T2 的人来说,基于会话的预测是必不可少的。实时个性化引擎将为在持续时间和正在发送的事件方面具有丰富会话的用户生成更好的预测。
- 对于产生多个会话的回头客或未认证用户,实时个性化引擎将能够更准确地预测他们的偏好。
- 最后,认证用户不仅允许我们在多种设备上协调用户身份,还使个性化引擎在展现用户意图时发挥最佳性能。
3。数据质量差或用户身份不一致
数据是公司拥有的利用率最低的资产之一。它有各种大小和形状,有结构的也有无结构的。但在个性化系统的背景下,我们主要指的是以用户为中心的数据:行为、事件、点击流——这是建立集中式用户档案所需要的,其他产品和服务可以利用该档案来个性化用户体验。
根据我们在 Gartner 人工智能成熟度模型中所处的位置,我们必须考虑几个关键方面:
人们似乎期望新用户应该拥有与老用户相同的(个性化)体验,而实际上新用户几乎没有数据。显然,这是不可能的,经典的解决方案是采用混合方法:1)以内容为中心的方法,让用户第一次登陆你的网站,然后 2)一旦你对用户有了更多的了解,就把它改为以用户为中心的方法。
- 用户身份对账
为了阐明“用户资料”的含义,我们需要了解不同类型的用户标识符:
-
- 会话 ID =为单个会话创建的唯一标识符。
- 设备 ID =基于浏览器或基于移动应用的唯一匿名网站或移动应用用户的标识符。这是谷歌分析用来区分网站访问者的默认标识符。
- 用户 ID =自定义生成的 ID,用于不同设备之间的会话统一,在用户进行身份验证时设置。
一个高性能的个性化引擎应该考虑“会话统一”并处理或者至少支持用户身份一致性:
-
- 跨会话:如果用户未通过身份验证,则应该使用单个设备 ID 来跟踪来自同一用户的会话,如果用户通过身份验证,则应该使用单个用户 ID 来跟踪。
- 跨用户状态(已验证、未验证):在用户未验证时创建的会话不应在用户验证时丢失。
- 跨设备:一旦用户通过身份验证,来自不同设备的会话应该合并到一个用户 ID 下。
组合不同的数据源
数据存在于多个分析平台(Google Analytics 4.0/360、BigQuery)、CRMs、CDPs (Segment)等。这就引出了一个问题:真理的唯一来源是什么?如果数据是互补的,你如何把它们缝合在一起?
我们已经看到,第一步是确保用户身份的一致性。第二步是为个性化系统构建特性库。
维护和提供特性的方式在不同的项目和团队中会有很大的不同。这增加了基础架构的复杂性,并经常导致重复工作。分布式组织面临的一些挑战包括:
-
- 不重复使用特征
- 功能定义各不相同
- 计算特征需要很长时间
- 训练和服务是不一致的
- 特征衰减未知
为了解决这些问题,要素存储充当了一个中央保管库,用于存储组织内已记录、管理和访问控制的要素。
本质上,特征库允许数据工程师插入特征。反过来,数据分析师和机器学习工程师使用 API 来获取他们认为相关的特征值。
机器学习工程师花 80%的时间做特征工程,因为这是一个耗时且困难的过程。但他们这样做是因为,正如 2014 年的一篇论文“脸书预测广告点击的实用经验”所显示的那样,拥有正确的功能是开发他们的 ML 模型的最重要的事情。
作为结论,当涉及到数据和机器学习时,有一条规则要记住:垃圾进,垃圾出。我们不能通过向个性化系统扔数据来强行解决问题,并希望这会产生好的结果。我们需要先清理数据,然后再使用它。
4。对用户意图理解不足
用户意图被定义为用户一系列动作的目的。营销人员传统上一直使用一套标准的意图,主要受谷歌搜索算法的启发:导航、信息和交易。实际上,用户意图要比这复杂得多,它会因会话、网站和行业而异。
当大多数营销人员听到“基于意图的个性化”时,他们会想到推荐。但是一个高性能的个性化系统不应该仅仅局限于推荐商品。
对于电子商务旅行,我们可能会考虑以下类型的意图:(1)面向目标的意图;(2)亲和倾向;(3)面向度量的意图。值得注意的是,我们希望用户表现出多种意图,而不仅仅是一种主导意图。
用户意图可以用一个图来表示:我们可以想象每个用户(U)链接到他们的会话(S),在每个会话期间,用户与产品(P)交互——每个产品都有自己的属性(A)。
A representation of a user intent graph: user-sessions-products-attributes
用户可以在他们的会话中做某些不一定与特定项目相关的事件:注册、搅拌或浏览。而其他链接到商品和购物车:放弃购物车、添加到购物车和结帐。
用户也可以搜索,在这种情况下,有链接到项目和项目类别的常见查询,这就是图形复杂性增加得更多的地方。
A representation of a user intent graph: user-sessions-products-attributes, events and search queries
如果你想超越产品推荐,能够准确预测用户意图对于个性化系统是至关重要的。在 REST API 格式中,您会期望类似/1/users//fetch 的响应:
{
"user": "user_123",
"intents": [
{
"intent-type": "goals",
"value": [
{
"name": "product_view",
"probability": 0.56
},
{
"name": "add_to_cart",
"probability": 0.32
},
{
"name": "transaction",
"probability": 0.12
},
{
"name": "cart_abandonment",
"probability": 0.42
}
]
},
{
"intent-type": "metrics",
"value": [
{
"name": "next_order_value",
"value": 100
},
{
"name": "session_duration",
"value": 125
},
{
"name": "cognitive_load",
"value": 0.12
}
]
},
{
"intent-type": "affinities",
"value": [
{
"name": "color",
"value": "red",
"probability": 0.56
},
{
"name": "brand",
"value": "adidas",
"probability": 0.55
},
{
"name": "category",
"value": "shoes",
"probability": 0.67
}
]
}
]
}
在实践中,您希望能够探索用户意图图,并根据任何给定的意图组合轻松提取用户:
intents.cart_abandonment.probability: 0.5 TO 0.9
AND intents.next_order_value.value >= 50
AND intents.affinities.brand.value = “adidas”
AND intents.affinities.brand.probability > 0.5
这就是基于意图的细分发挥作用的地方,我们应该为我们的个性化系统考虑 4 个层次:
- Level-0: 基于原始用户属性(设备、年龄、城市等)的细分。)
- 级别 1: 基于预测值的细分,就像我们上面看到的
- 级别 2: 基于原始值和预测值的分割
- **第三级:**外貌相似者细分–识别与“目标”细分市场中的用户相似的其他用户
5。不可组合(API 优先)
这就把我们带到了下一个功能障碍:一个“不可组合”的个性化系统。如果我们承认,个性化最终用户的旅程意味着不仅仅是在产品详细信息页面上显示推荐小部件,那么,作为开发人员,我们需要一种方法来编排个性化的体验,以基于预测的意图创建智能触发器。
例如,如果用户对具有以下特征的项目感兴趣:颜色:红色(56%概率),品牌:阿迪达斯(67%概率),我们应该有这样做的方法:
为此,我们需要一种可组合的方法,而 API 优先的架构是实现这一点的开发人员友好的方式。至少您希望能够访问:
这是你能够配置作为个性化系统一部分的机器学习模型的地方,无论我们谈论的是:经常一起购买、相关产品还是意图预测。
[
{
"name": "Related Products",
"type": "related_products",
"compatibleSources": ["bigquery"],
"dataRequirements" : {
"minUsers": 10000,
"minDays": 90
},
"frequency" : “weekly”
},
{
"name": "Affinities",
"type": "affinities",
"compatibleSources": ["bigquery"],
"dataRequirements" : {
"minUsers": 50000,
"minDays": 30
},
"frequency" : “daily”
},
…
]
这个 API 将允许您为经过验证的用户(userID)或匿名用户(cookieID、sessionID)请求原始和/或预测的属性。
{
"user": "user_1",
"properties": {
"raw": {
"lastUpdatedAt": "2021-07-11T10:12:37Z",
"device": "mobile",
"sessionCount": 12,
"timeOnSite": "02:03:10",
"browser": "chrome",
"pageviews": 32,
"avgSessionDuration": 102,
"lastVisit": "2021-07-11T10:12:37Z",
...
},
"predicted": {
...
}
}
细分用于根据原始值和预测值对用户进行分组和筛选。
[
{
"segmentID": "segment_1",
"name": "Mobile users that will complete a purchase",
"conditions": "predictions.funnel_stage.value:transaction AND (predictions.funnel_stage.probability: 0.5 TO 0.9) AND raw.device = 'mobile'",
"type": "computed"
},
{
"segmentID": "segment_3",
"name": "Users that are interested in red Adidas shoes",
"conditions": "predictions.affinities.color.value = 'red' AND predictions.affinities.brand.value = 'adidas' AND predictions.affinities.category.value = 'shoes' AND predictions.affinities.color.probability > 0.5 AND predictions.affinities.brand.probability > 0.5 AND predictions.affinities.category.probability > 0.5",
"type": "computed"
},
...
]
6。绩效指标缺乏透明度
个性化引擎需要在衡量和交付业务结果方面值得信赖,它需要在影响的所有方面都可以验证——能够解释为什么构建 ML 模型的输入很重要,以及它们如何影响离线和在线指标方面的输出/预测。
以下是你应该从一个透明的基于人工智能的个性化引擎中期待的一些东西:
- 每个特征对模型单个预测的贡献程度(相关矩阵)
- 准确度、精确度、召回率、F1 分数(混淆矩阵)
当谈到在部署个性化系统后衡量业务结果(KPI)时,我们必须小心不要短视。让我给你举个例子:
| 点击率 | 转换率 | 平均订单值 |
| 变型 A | 变型 B | 变型 A | 变型 B | 变式 A | 变型 B |
| 10% | 20% | 10% | 5% | $50 | $100 |
许多公司只评估 CTR,并得出结论,变式 B 是胜出的一个,但如果你仔细观察,你会发现,事实上,就 CR 而言,变式 A 是最好的。是吗?事实上,如果你计算一下,你会发现本质上是一样的。
但是,如果你更进一步,看看平均订单价值,变量 B 产生的收入最多。不是因为更好的转化率,而是因为用户在购物车中添加了更多或更贵的商品,增加了平均订单价值。
总之,个性化系统应该对隐藏在引擎盖下的机器学习模型的性能以及一旦实现个性化并部署到生产中的业务结果是透明的。
7。艾伦理学的不成熟
假设您正在构建一个系统来对用户新闻提要中的项目进行排序。你的目标是最大化用户参与度——用户点击它的可能性。但是你很快就会意识到,仅仅针对用户参与度进行优化可能会导致可疑的道德问题,因为极端的帖子往往会获得更多的参与度,而算法会学习优先考虑极端的内容。听起来很熟悉?
不幸的是,个性化系统的道德含义是事后才想到的,只有当它伤害了公司的底线时,公司才会注意到。从你的“项目个性化”的范围界定阶段就要注意道德差距,不要让它在以后让你吃惊。
通常帮助我识别伦理盲点的一个问题是:“如果我们能建造它,我们应该吗?”换句话说,人工智能就像一把刀,既可以在手术中使用,也可以在战斗中使用。我相信开发者有责任引领人工智能的应用方式。
根据我们讨论的所有内容,很明显,构建一个高性能的个性化引擎不是一项简单的任务。有一个很好的理由:个性化不是一个勾选框练习。这是一项复杂的任务,因为每个用户都是独一无二的,需要尊重他们的隐私,同时还要提供个性化的体验。
我们一致认为,当谈到个性化时,为最终用户构建是我们的首要目标。
我们也可以承认这个过程需要多次迭代——作为开发人员,我们很少通过查看数据或甚至考虑代码的道德含义来导航这个过程。通常,会有其他人,无论是产品经理、营销分析师,甚至是数据科学家,仔细检查和总结数据,并将其转化为下一个产品发布所需的功能列表。
开发者(构建者)和最终用户之间存在差距,导致了次优产品的开发。
如果开发人员能够更好地识别用户如何与他们正在构建的产品交互的第一手资料,那会怎么样?如果开发人员可以在面向用户的产品组件中直接获得数据,会怎么样?如果开发人员可以构建这些组件来根据他们的意图自动适应用户行为,最终提供更好的用户体验,会怎么样呢?
很明显,构建一个高性能的个性化引擎不是一项简单的任务。这就是为什么在过去的一年里,我们一直在开发一种新产品,修复我们在本文中谈到的七种功能障碍。如果你有兴趣提前进入,你可以在这里登记等候名单:https://alg.li/fixperso
高性能推荐系统剖析-第 1 部分
原文:https://www.algolia.com/blog/ai/the-anatomy-of-high-performance-recommender-systems-part-1/
推荐系统介绍
用外行人的话说,推荐系统是一种软件,它过滤用户的选择,并根据他们的要求或偏好为他们提供最合适的建议。
第一个推荐系统创建于 20 世纪 70 年代,在杜克大学的研究社区;然后由施乐帕洛阿尔托研究中心开发。当互联网在 20 世纪 90 年代出现时,推荐系统立即被采用,作为帮助人们从过多的可用选项中选择最合适的产品的方法。
自那以后,推荐系统变得越来越受欢迎,它们现在对脸书、亚马逊、网飞、谷歌、YouTube 和 Tripadvisor 等大型互联网公司发挥着关键作用,涉足社交网络、娱乐、电子商务、旅游、婚介等领域。
在这个博客系列中,我们将解构推荐引擎的剖析,探索构建一个高性能的推荐引擎需要什么,以便您在决定如何将该功能集成到您的应用程序中时有更好的准备。
个性化推荐系统的四大指导原则
首先,我们需要对非个性化 和 个性化 推荐系统进行区分。对于非个性化推荐,所有用户都会收到相同的推荐。非个性化推荐的例子是给定位置的流行电影、最近的热门歌曲和最佳评级的餐馆。
使用个性化推荐系统最明显的操作目标是向用户推荐与相关的商品,因为人们更有可能购买他们 觉得有吸引力的商品 。
推荐人需要实现四个次要目标:
A .冷启动 当可用的信息或元数据不足时,推荐引擎不能最优地执行。有两个(极端的)冷启动问题:当没有关于用户的数据时,这分为缺乏关于访问者的先前知识和没有来自当前会话的足够信息;当用户没有足够的反馈或评分时。 例如,假设一个首次访问的访问者在一个电子商务网站上搜索一部新的智能手机。不到一周,他就买了一部手机,对浏览手机不再感兴趣。推荐引擎现在应该显示什么?
B .克服数据稀疏性 数据稀疏性源于电子商务网站上的用户倾向于与有限数量的商品进行交互(将商品添加到购物车、购买或评论)。大多数推荐引擎对相似用户的评级进行分组;然而,他报告的用户-项目矩阵具有高达 99%的空的或未知的评级,因为缺乏用户对项目进行评级的激励或对项目进行评级的足够知识。因此,不提供反馈或评级的用户会收到不相关的推荐。
C .可扩展性 可扩展性问题随着电子商务行业的快速增长而显著增加:现代推荐引擎需要为大规模应用生成实时结果。换句话说,推荐模型的性能是根据吞吐量(每秒的推理次数)和延迟(每次推理的时间)来衡量的。
D .多样性和新颖性 推荐引擎能够获得的最准确的结果是基于用户或对象的相似度。然而,这使得用户只能选择范围更窄的商品——热门商品——而高度相关的小众商品可能会被忽略。推荐的多样性允许用户发现他们自己不容易发现的项目。
为推荐者构建可扩展的架构
1. Data Sources 2. Feature Store 3. Machine Learning Models 4. Predictions 5. Actions 6. Results 7. Evaluation 8. AI Ethics
从工程的角度来看,为了实现推荐系统的主要目标,推荐系统的架构必须是可扩展的。完成这项工作需要 8 个关键要素:
1。数据来源
在潜入数据源之前,首先要了解的是 隐性 vs 显性 的收视率性质。评级形式的反馈是明确的,因为用户在指定他们对各种项目的好恶的特定评估系统(例如,五星评级模型)中选择数值。 在收集反馈的隐式方法中,用户的浏览和购买行为,或他们的一元评级(例如,他们是否“喜欢”、“阅读”或“观看”)——其中存在一种机制来表达他们对某个项目的亲和力——可以被视为评级信号。今天,许多商业系统允许基于显式和隐式反馈提供推荐的灵活性。这就引出了一个问题,“推荐引擎的最佳输入是什么?”至少,你应该包括用户、项目和明确的评分(五分制):
****| 用户/项目 | U1 | U2 | U3 | U4 | U5 |
| I1 | 1 | ❓ | 3 | 4 | ❓ |
| I2 | 3 | ❓ | ❓ | 2 | 3 |
| I3 | 2 | 5 | 3 | ❓ | ❓ |
| I4 | ❓ | 4 | 1 | ❓ | ❓ |
| I5 | 5 | ❓ | 2 | ❓ | 5 |
虽然此表有一些缺失的评分(用问号表示),但实际上,不到 1%的项目经常被评为 , ,这些可以被称为流行项目。绝大多数被评为 很少被评为 ,这导致了潜在评级的高度偏斜分布——实际上,我们正在处理评级的长尾特性。
对于推荐系统,有两种主要的数据来源可以考虑:
- 您的产品目录(商品)和用户元数据(如年龄和性别)的首选 CMS(如 Shopify、Magento 或 woo commerce)
- Google Analytics(或任何第三方分析平台)用于互动,如页面浏览量、停留时间和转化率
聚合数据集可能看起来像这样:
[
{
"user_id": "1",
"item_id": "100",
"events": [{
"event_1": "2016-04-20T13:25:55+02:00", //detail-page-view
"event_2": "2016-04-20T14:01:55+02:00", //add-to-cart
"event_3": "2016-04-20T14:13:55+02:00" //purchase
}]
},
{
"user_id": "2",
"item_id": "200"
},
{
"user_id": "3",
"item_id": "300"
}
]
阅读关于数据源的更多信息
2。特征工程(FE)
构建机器学习(ML)模型最重要也是最耗时的一个方面就是数据准备,具体来说就是特征提取(或 engineerng)。 我们都知道: 数据科学家 80%的工作是数据准备。
特征提取阶段——提取各种物品的描述——是高度特定于应用的。项目可能有多个描述其各个方面的字段。例如,一个销售书籍的电子商务企业可能有一个项目、标题、描述、作者和价格字段。
| 项目 | 标题 | 描述 | 作者 | 价格 |
| I1 | 后来的 | 杰米·康克林是一位苦苦挣扎的单身母亲的儿子,他只想拥有一个平凡的童年。但是杰米不是普通的孩子。 | 斯蒂芬·金 | $10.88 |
| I2 | 我们从结尾开始 | 故事发生在一个小镇上,每个人都知道明星拉德里的事情——她的毒瘾,她的孩子被忽视的方式——但是很少有人伸出援助之手,除了与明星有过节的当地警长沃克。 | 克里斯·惠特克 | $14.84 |
| I3 | 2034:下一次世界大战的小说 | 来自两位前军官和获奖作家,这是一部令人毛骨悚然的真实地缘政治惊悚片,想象了 2034 年美国和中国在南中国海的海军冲突,以及从那里通往噩梦般的全球大灾难的道路。 | 埃利奥特·阿克曼,海军上将詹姆斯·斯塔夫里迪斯号 | $17.84 |
| … |
除了描述每个项目的信息之外,除了关于用户评级的数据(隐式或显式)之外,一些推荐系统可能还需要用户属性(例如,人口统计)。
| 用户 | 最后一次出现 | 性别 | 年龄 | 国家 | 浏览量 | 添加到购物车 | 订单值 |
| U1 | 2021 年 10 月 1 日 | 男 | 45 | 加拿大 | 13 | 0 | 0 |
| U2 | 2021 年 2 月 28 日 | 母 | 25 | 美国 | 5 | 1 | $129 |
| U3 | 2021 年 1 月 2 日 | 女 | 39 | 法国 | 9 | 1 | $98 |
| … |
为了解决 ML 生命周期中的这一乏味挑战,引入了特征库的概念:特征工程和模型开发之间的接口,为数据科学团队提供特征的集中式数据仓库,解决两个问题。It:
- 以集中方式存储大量特性,允许 DS/ML 工程师更快地重用、试验和生产 ML 模型
- 为其他应用程序或数据库提供低延迟和高吞吐量的特性
不是所有的推荐系统都有特征存储的硬性要求;然而,当 DS/ML 工程师正在处理多个机器学习计划时,手动特征工程可能会导致冗余。 因此,首先,功能商店为共享所有可用的功能提供了一个真实的点。当数据科学家开始一个新项目时,他们可以访问该目录并轻松找到他们正在寻找的功能。但是特征存储不仅仅是数据层;它也是一种数据转换服务,使用户能够操作原始数据并将其存储为特征 ,以备任何机器学习模型 使用。
阅读更多关于特征存储和工程的信息。
3。型号
推荐系统的基本模型处理两种类型的数据:用户-项目交互,如评分和购买行为,以及关于用户和项目的属性信息,如文本简介和相关关键词。
下面是基本的推荐系统模型
- 基于内容的过滤 在基于内容的推荐系统中,内容在推荐过程中起着主要作用。利用项目描述和属性来计算项目相似性。在这种情况下,上面的用户评级矩阵被替换为项目内容矩阵,其中项目在行中,项目属性在列中。
- 协同过滤 协同过滤模型利用多个用户提供的评分的协同力量进行推荐。基本思想是可以计算未指定的评级,因为观察到的评级通常在各种用户和项目之间高度相关。
例如,考虑两个用户,Julia 和 John,他们是朋友并且有非常相似的品味。如果他们的等级(他们两个都指定了等级)非常相似,那么他们的相似性可以通过潜在的算法来识别。在这种情况下,很可能只有其中一个指定了值的评级也很可能是相似的。这种相似性可用于对不完全指定的值进行推断。
协同过滤主要有两种:
-
- 基于用户的 基于用户的协同过滤(UB-CF)背后的主要思想是,具有相似特征的人分享相似的品味。例如,如果 Julia 有兴趣向 John 推荐一部电影,只要他们一起看过很多电影,并且对它们的评价几乎相同,就可以肯定他们会继续喜欢类似的电影。
- 基于项目 与 UB-CF 相反,项目-项目协同过滤是基于项目之间的相似性,使用用户给项目的评级来计算。因此,约翰对类似科幻电影的评分,如外星人和捕食者可以用来预测他对终结者的评分。
阅读更多关于型号的信息。
4。混合推荐系统
**有些情况下可以使用不同的输入源。例如,协同过滤系统依赖于社区评级,基于内容的方法依赖于文本描述和目标用户自己的评级,而基于知识的系统依赖于在知识库的上下文中与用户的交互。类似地,人口统计系统使用用户的人口统计资料来进行推荐。
值得注意的是,这些不同的系统有不同的优点和缺点。一些推荐系统,例如基于知识的推荐系统,在大量数据不可用的冷启动设置中更有效。
其他推荐系统,如协作方法,在大量数据可用时更有效。在许多情况下,当更多种输入可用时,人们可以灵活地为同一任务使用不同类型的推荐系统。在这种情况下,存在许多混合的机会:将不同类型系统的各个方面结合起来以获得最佳结果。
基于内容的过滤和协同过滤经常一起使用,因为它们可以很好地相互补充。基于内容的系统受到过度专业化的困扰——它们倾向于推荐与用户已经看过的其他项目相似的项目。另一方面,协作推荐器不能有效地给出新项目的推荐。这两种方法经常在混合推荐系统中结合起来,从而获得两个世界的最佳效果。
阅读更多关于混合动力车型的信息。
**5。**目的地和动作
**此时,你能够生成建议,但是你会如何使用它们,在哪里使用它们呢?对于电子商务企业,标准方法是在产品详情页面上显示一个“推荐给你”的小部件。
Etsy 是一个利用热门商品展示推荐的电子商务平台的完美例子。这里是它的主页:
注意建议的中心位置。
首先展示受欢迎的产品背后的想法是,因为有如此多的购物者购买了它们,其他人也很可能对它们感兴趣。
虽然这种方法并不能真正个性化客户体验,但展示受欢迎的商品可以让你锁定没有账户的首次用户。作为比较,下面是 Etsy 主页在登录后的样子:
平台记录了所有过去的产品视图和添加到收藏夹的商品。然后,它与来自同一类别或同一卖家的类似产品进行自动关联。
推荐系统也可以用于交叉销售和追加销售,旨在帮助人们选择最适合他们的商品,同时增加商家的收入。
阅读更多关于预测&用户操作的信息。
6。商业结果和评估推荐系统
给定一组推荐算法,它们的表现如何?你如何评价它们的相对有效性?
开发人员正在关注技术方面,但商业领袖仍然有一个主要角色:决定在哪个页面上测试产品推荐。它可以是任何页面,只要你能收集到足够的数据。最好只将测试发送给 20%的流量,这样如果出现问题,你就不会破坏对所有人的建议。如果您想安全地测试上述任何推荐系统而不干扰实时数据,您可以让您的数据或 web 开发团队在其沙箱中进行测试。
无论哪种情况,都要关注你的关键绩效指标以及某项技术对它们的影响。如果你没有做过 A/B 测试,你的每一件商品的点击率和转换率,而不仅仅是整个商店的点击率和转换率,是你可以开始的两个安全的选择。
你将何去何从?
在这个阶段,你不仅应该能够理解使用推荐系统的好处,还应该对最适合你的应用的方法有一个直观的想法。
基于人工智能的电子商务推荐系统的主要目的是帮助你选择合适的产品放在你的用户面前。一切都有他们之前喜欢或感兴趣的产品的真实数据支持,所以你不再需要猜测他们可能在寻找什么。
定制产品推荐系统的未来将允许你瞄准新的用户群,并出现在任何地方:社交媒体、移动应用、电子邮件,当然,还有你的网站。同时,你可以推销你的所有商品,包括新产品,甚至可以记录用户行为的数据。因此,如果一个利基产品的受欢迎程度在一夜之间突然飙升,你不必等到第二天早上才更新你的推荐,因为所有这些都是实时进行的。
这篇文章只是致力于剖析高性能推荐系统的一系列博客中的第一篇。请继续关注下一篇文章,它将关注推荐系统的数据源。********
高性能推荐系统剖析,第二部分
原文:https://www.algolia.com/blog/ai/the-anatomy-of-high-performance-recommender-systems-part-2/
为您的推荐系统处理公共数据源
在本系列 的第一篇 中,我们谈到了一个高性能推荐系统的关键组件: (1)数据源、 (2)特征库、(3) 机器学习模型、(4) 预测&行动、(6)结果、(7)评估和(8) AI 伦理。
在这篇文章中,我们将深入探讨你的协同过滤推荐系统所需的公共数据源。至少,推荐引擎的输入包括用户、项目和评级:
| 用户/物品 | U1 | U2 | U3 | U4 | U5 |
| I1 | 1 | ❓ | 3 | 4 | ❓ |
| I2 | 3 | ❓ | ❓ | 2 | 3 |
| I3 | 2 | 5 | 3 | ❓ | ❓ |
| I4 | ❓ | 4 | 1 | ❓ | ❓ |
| I5 | 5 | ❓ | 2 | ❓ | 5 |
对于一个协同过滤系统,有三种类型的推荐系统数据集是你必须准备的:
1。项目数据集 从您的内部电子商务平台或您的 CMS 平台(如 Shopify、Magento 或 WooCommerce)导出数据。包括产品目录(项目)以及价格、SKU 类型或可用性等信息。
2。用户数据集 关于用户的元数据可能包括年龄、性别或忠诚会员等信息,这些信息对于推荐系统来说是重要的信号。
3。互动数据集谷歌分析(或任何第三方分析平台)通常被认为是用户互动信息的良好来源,如位置或设备(手机、平板电脑、台式机)、页面浏览量、网站停留时间和转化率。
如何准备物品数据集
在将 项目数据集 发送到推荐引擎之前,您需要从一个或多个来源提取数据,并以推荐引擎能够识别的方式对其进行格式化。
让我们考虑一个简单的场景,您已经在使用 Algolia 搜索您的电子商务,并且您正在使用 Algolia API 客户端 之一发送您的产品目录。JSON 可能是这样的:
[
{
"item_id": "0000031852",
"title": "CeraVe Moisturizing Cream",
"description": "Developed with dermatologists, CeraVe Moisturizing Cream has a unique formula that provides 24-hour hydration and helps restore the protective skin barrier with three essential ceramides (1,3,6-II). This rich, non-greasy, fast-absorbing formula is ideal for sensitive skin on both the face and body.",
"price": 16.08,
"image": "../images/0000031852.jpg",
"categories": [
"Beauty & Personal Care",
"Body Creams"
],
"availability": "in stock"
},
{
"item_id": "0000042941",
"title": "REVLON One-Step Hair Dryer And Volumizer Hot Air Brush, Black, Packaging May Vary",
"description": "The Revlon One-Step Hair Dryer and Volumizer is a Hot Air Brush to deliver gorgeous volume and brilliant shine in a single step. The unique oval brush design smooth hair while the rounded edges quickly create volume at the root and beautifully full-bodied bends at the ends in a single pass, for salon blowouts at home.",
"price": 41.88,
"image": "../images/0000042941.jpg",
"categories": [
"Beauty & Personal Care",
"Hot-Air Hair Brushes"
],
"availability": "in stock"
},
{
"item_id": "0000053422",
"title": "Maybelline Lash Sensational Washable Mascara",
"description": "Get a sensational full-fan effect with Maybelline New York’s fan favorite Lash Sensational Washable Mascara! Lashes grow in more than one layer. This volumizing mascara can unfold layer upon layer of lashes thanks to its exclusive brush with ten layers of bristle.",
"price": 6.49,
"image": "../images/0000053422.jpg",
"categories": [
"Beauty & Personal Care",
"Makeup",
"Mascara"
],
"availability": "out of stock"
}
]
很明显,你不需要包含所有的东西——你应该对数据集中的内容有所选择,只收集对构建你的推荐系统有用的信息。例如,如果推荐引擎不是为了处理图像而构建的,那么您应该简单地忽略*【image】*元数据。
另一个选择是从您的 Shopify、Magento 或 WooCommerce 商店导出 CSV 格式的产品目录。下面是他们每个人都需要的步骤:
从 Shopify 导出产品
- 从您的 Shopify 管理员,转到 产品>所有产品 。注意:如果您只想导出部分产品,那么您可以过滤产品列表,以查看和选择要导出的特定产品。
- 点击导出。从对话框中选择您要导出的产品:当前页面**(产品的)【所有产品】选定产品(您已选择的)当前搜索(与您的搜索和过滤器匹配的产品)。
*** 选择您想要导出的 CSV 文件类型–使用 普通 CSV 文件 。* 点击 导出产品 。* 你最终会得到一个类似于这个 的 CSV 文件 ,你可以下载下来检查。
**从 Magento 出口产品
对于 Magento 2,数据导出是一个异步操作,它在后台执行,因此您可以继续在管理中工作,而无需等待操作完成。以下是步骤:
- 在管理侧栏上,转到系统>数据传输>导出。
- 在导出设置部分,将实体类型设置为“产品”。
- 接受默认的导出文件格式CSV。
- 默认情况下,实体属性部分按字母顺序列出所有可用的属性。您应该选择要包括在导出中的特定属性。
- 向下滚动,点击页面右下角的 继续 。默认情况下,所有导出的文件都位于*
/var/export*文件夹中。如果启用远程存储模块,所有导出的文件都位于 <远程存储根目录> /import_export/export 文件夹 。
从 WooCommerce 出口产品
WooCommerce 有一个内置的产品 CSV 导入器和导出器,您可以按照下面的步骤来使用:
- 转到: WooCommerce >产品。
- 选择顶部的导出。将显示导出产品屏幕。
- 选择导出所有列、导出所有产品或导出所有类别。或者使用下拉菜单选择要导出的列、产品或类别。
- 如果您想为您的推荐系统添加更多元数据,请勾选导出自定义元数据。
- 选择生成 CSV 并等待导出完成。
最后但同样重要的是,您可能已经在使用 Google Merchant Center,在这种情况下,您已经在 拥有一个产品提要 ,您可以在您的推荐系统中重用它。
如何准备用户数据集
虽然 条目数据集 更容易生成或导出,但当涉及到使用 用户 数据集、 时,事情变得有点复杂,主要是由于隐私限制而不是技术限制。显然,从机器学习的角度来看,用户的元数据越多越好。然而,这并不总是可能的,您必须在如何处理用户数据(例如,从用户处收集的或关于用户的信息,包括设备信息)方面保持透明。
2006 年,披露了近 50 万客户的不充分匿名信息。在 网飞的 100 万美元竞赛 期间,为了改进其推荐系统,一些研究人员能够重新识别用户。它显然侵犯了用户的隐私,诉讼结束时网飞支付了 900 万美元来解决诉讼。
在欧盟,许多个人数据被视为敏感数据,并受到特定处理条件的限制。当讨论个人身份信息(PII)时,我们需要区分已认证、未认证或匿名用户。
这里我想强调一个细微差别——根据 欧盟法规 ,匿名化是创建匿名信息的过程,即“与已识别或可识别的自然人无关的信息”或“以数据主体不可识别或不再可识别的方式匿名的个人数据”。虽然我们认为未经认证的用户是匿名的,但值得注意的是,确保 100%匿名是很难实现的。
未认证/匿名 | 已认证 |
---|---|
session_id | 名和姓 |
装置装置装置 | 家庭住址 |
国家 | 电子邮件地址 |
城市 | 电话号码 |
护照号码 | |
驾驶证号码 | |
社会保障号 | |
一张脸的照片 | |
信用卡号 | |
账号用户名 | |
指纹 |
在这个阶段需要做出一个重要的设计决策: 你应该为经过认证的用户还是未经认证的用户构建你的推荐系统? 如果你选择认证用户,你有更多的元数据可以支配,理论上,你的推荐系统可能会更准确,但缺点是看到推荐的用户数量会非常非常少。
另一方面,用匿名用户元数据构建推荐系统只会为你的推荐带来更广泛的受众,即使准确度可能没有那么高。
这是在实施推荐模型的早期阶段需要做出的妥协。当然,在后期阶段,如果投资回报值得的话,可以考虑混合方法。
从 Google Analytics 导出未经认证的用户
用户浏览器报告 让您隔离和检查个人,而不是聚合用户行为。个人用户行为与客户端 ID(已验证)或用户 ID(匿名)相关联。
对于每个客户端或用户 ID,您会看到以下数据:
| **User Data **(在上面的屏幕图像中点击客户端 Id 时可见) | 互动数据 |
|
- 设备类别
- 设备平台
- 采集日期
- 频道
- 源/媒体
- 战役
|
- 上次查看日期(用户上次启动会话的时间)
- 会话
- 平均值。会话持续时间
- 跳出率
- 收入
- 交易
- 目标转化率
|
此外,当您基于人口统计、技术和行为信息的任意组合对用户浏览器报告进行细分时,您会有一个与该细分相关联的所有 id 的列表,您可以导出这些 id。请注意,2019 年发布的谷歌分析 4 (GA4)引入了一些重要的细微差别——用户浏览器是分析部分可用的技术之一。
然而,仪表板中的导出功能仅限于您可以获得的几个列/维度,这对于我们的 用户数据集来说并不真正有用。T55
解决方案是使用谷歌分析报告 API v4。但是有一个警告:默认版本不从用户浏览器报告中导出任何客户端 id,您必须通过创建定制维度来使这些 id 可用。这允许分析 API 在客户端 ID 或会话级别导出数据,而不是仅返回聚合数据。从谷歌分析管理面板的 进入 管理 部分。在 属性 部分,转到 自定义定义>自定义尺寸 。增加以下维度:
ClientID 与用户范围 从 自定义定义 部分,转到 自定义维度 部分,点击**+新建自定义维度** 按钮。添加名称*【ClientID】*并选择用户范围。
SessionID 与会话范围从 自定义定义 部分,转到 自定义尺寸 部分,点击**+新建自定义尺寸** 按钮。添加名称*【Session id】*并选择会话范围。
(可选)带有用户范围的 UserID。 从 自定义定义 部分,转到 自定义尺寸 部分,点击**+新建自定义尺寸** 按钮。添加名称 *【用户 id】*并选择用户范围。这个自定义维度将包含来自 CMS 的用户 id。它应该只在将 GA 连接到其他平台时使用,如 Shopify、Magento 或 WooCommerce。
添加完所有维度后,您的表将类似于下图。
接下来,您需要设置客户端 ID 和会话 ID 跟踪。如果 Google Analytics tracker 直接包含在您网站的源代码中,您可以通过修改现有代码来添加自定义维度值。
复制下面的脚本,将视图 id(应该是类似于UI-xxxxx-01)替换为与您的网站对应的视图 id。此外,用步骤 1 中创建的实际维度索引替换“维度 1”、“维度 2”和(可选)“维度 3”。你可以阅读更多关于 用 gtag.js 添加客户 ID 到自定义维度。
<!-- Global site tag (gtag.js) - Google Analytics -->
<script async src="https://www.googletagmanager.com/gtag/js?id=UA-XXXXXXXX-Y"></script>
<script>
window.dataLayer = window.dataLayer || [];
function gtag() { dataLayer.push(arguments); }
gtag('js', new Date());
// Maps 'dimension1' to client id, 'dimension2' to session id and 'dimension3' to user id.
gtag("config", "UA-XXXXXXXX-Y", {
custom_map: {
dimension1: "clientId",
dimension2: "sessionId",
dimension3: "userId", // Remove this line if you're not using the UserID custom dimension
}
});
// Sends an event that sets the dimensions
gtag("event", "custom_set_dimensions", {
sessionId: new Date().getTime() + "." + Math.random().toString(36).substring(5)
// Remove following line if you're not using the UserID custom dimension
userId: '## Replace with User ID from your CMS ##'
});
</script>
最后一部分包括创建可用于验证 Google Analytics 报告 API 和访问数据的 API 凭证。参见 关于如何访问分析报告 API 的谷歌文档。
您可以使用下面的 Python 脚本为您的协同过滤推荐系统创建一个匿名的 用户数据集 。该脚本使用 Google Analytics 数据创建一个 dataframe,并将其保存为 csv 文件。
from apiclient.discovery import build
from oauth2client.service_account import ServiceAccountCredentials
import pandas as pd
SCOPES = ['https://www.googleapis.com/auth/analytics.readonly']
KEY_FILE_LOCATION = '<REPLACE_WITH_JSON_FILE>'
VIEW_ID = '<REPLACE_WITH_VIEW_ID>'
CUSTOM_DIMENSION_USER = '<REPLACE_WITH_CUSTOM_DIMENSION_INDEX, ex. ga:dimension1>'
def initialize_analyticsreporting():
"""Initializes an Analytics Reporting API V4 service object.
Returns:
An authorized Analytics Reporting API V4 service object.
"""
credentials = ServiceAccountCredentials.from_json_keyfile_name(
KEY_FILE_LOCATION, SCOPES)
# Build the service object.
analytics = build('analyticsreporting', 'v4', credentials=credentials)
return analytics
def get_report(analytics):
"""Queries the Analytics Reporting API V4.
The API returns a maximum of 100,000 rows per request. If you have more data, you have to implement pagination:
- https://developers.google.com/analytics/devguides/reporting/core/v4/basics#pagination
- https://developers.google.com/analytics/devguides/reporting/core/v4/rest/v4/reports/batchGet#ReportRequest.FIELDS.page_size
Args:
analytics: An authorized Analytics Reporting API V4 service object.
Returns:
The Analytics Reporting API V4 response.
"""
return analytics.reports().batchGet(
body={
'reportRequests': [
{
'viewId': VIEW_ID,
'dateRanges': [{'startDate': '7daysAgo', 'endDate': 'today'}],
'metrics': [{'expression': 'ga:sessions'}],
'dimensions': [{'name': CUSTOM_DIMENSION_USER}, {'name': 'ga:country'}, {'name': 'ga:deviceCategory'}],
'pageSize': 10000
}]
}
).execute()
def parse_response(response):
"""Parses the Analytics Reporting API V4 response and returns it in a Pandas dataframe.
Args:
response: An Analytics Reporting API V4 response.
Returns:
Pandas dataframe with the data.
"""
df = pd.DataFrame()
for report in response.get('reports', []):
columnHeader = report.get('columnHeader', {})
dimensionHeaders = columnHeader.get('dimensions', [])
metricHeaders = columnHeader.get('metricHeader', {}).get('metricHeaderEntries', [])
for row in report.get('data', {}).get('rows', []):
dimensions = row.get('dimensions', [])
dateRangeValues = row.get('metrics', [])
entry = {}
for header, dimension in zip(dimensionHeaders, dimensions):
entry[header] = dimension
for i, values in enumerate(dateRangeValues):
for metricHeader, value in zip(metricHeaders, values.get('values')):
entry[metricHeader.get('name')] = value
df = df.append(entry, ignore_index=True)
return df
def main():
analytics = initialize_analyticsreporting()
response = get_report(analytics)
df = parse_response(response)
print(df.count())
print(df.head(10))
df.to_csv("data.csv")
if __name__ == '__main__':
main()
sample_read_ga_data.py
Displaying sample_read_ga_data.py.
从 Shopify 导出客户
您可以通过以下快速步骤导出所有客户及其详细信息的 CSV 文件:
- 从你的 Shopify admin ,转到 客户 。
- 点击 导出 。
- 点击 所有客户 导出您店铺的所有客户。
- 选择 普通 CSV 文件 格式。
- 点击 导出客户 。
正如您可以从 这个模板 中看到的,有很多列您实际上并不需要——例如,在您的 用户数据集 中包含全名或电子邮件地址作为推荐系统的输入是没有意义的。
从 Magento 导出客户
类似于从 Magento 2 中导出产品,您可以将 实体类型 设置为 【客户主文件】 ,您将获得一个客户列表,您可以在您的推荐系统中进一步清理和使用该列表。
从 WooCommerce 导出客户
从 WooCommerce 手动导出客户:
**1. 进入 WooCommerce >出口 。
2. 在 手动导出 选项卡上,更新以下设置:
1. 输出类型 :选择以 CSV 格式导出文件。
2. 导出类型 :选择要导出的客户。
3. 格式 :选择一种 预定义的 或 自定义的 格式。
4. 文件名:输入本次导出生成文件的名称。
5. 标记为导出 :启用,确保导出的数据不包括在以后的导出中。 点击此处了解有关此设置的更多信息。
6. 批量处理 :仅当您的站点 不支持后台处理 时启用。
3。点击 导出 。
如何准备交互数据集
数据集拼图的最后一块是生成 交互数据集。 根据 Builtwith.com 的数据,有近 3000 万个网站在使用谷歌分析,因此,为我们使用谷歌分析报告 API v4 的推荐系统介绍导出 用户行为 的最佳方式是有意义的。
我们已经介绍了用户数据集部分的大部分流程,您可以使用相同的 Python 脚本来导出将进入推荐系统的关键事件。如果你想添加额外的列,你可以看看 维度&度量浏览器 。
from apiclient.discovery import build
from oauth2client.service_account import ServiceAccountCredentials
import pandas as pd
SCOPES = ['https://www.googleapis.com/auth/analytics.readonly']
KEY_FILE_LOCATION = '<REPLACE_WITH_JSON_FILE>'
VIEW_ID = '<REPLACE_WITH_VIEW_ID>'
CUSTOM_DIMENSION_USER = '<REPLACE_WITH_CUSTOM_DIMENSION_INDEX, ex. ga:dimension1>'
CUSTOM_DIMENSION_SESSION = '<REPLACE_WITH_CUSTOM_DIMENSION_INDEX, ex. ga:dimension2>'
def initialize_analyticsreporting():
"""Initializes an Analytics Reporting API V4 service object.
Returns:
An authorized Analytics Reporting API V4 service object.
"""
credentials = ServiceAccountCredentials.from_json_keyfile_name(
KEY_FILE_LOCATION, SCOPES)
# Build the service object.
analytics = build('analyticsreporting', 'v4', credentials=credentials)
return analytics
def get_report(analytics):
"""Queries the Analytics Reporting API V4.
The API returns a maximum of 100,000 rows per request. If you have more data, you have to implement pagination:
- https://developers.google.com/analytics/devguides/reporting/core/v4/basics#pagination
- https://developers.google.com/analytics/devguides/reporting/core/v4/rest/v4/reports/batchGet#ReportRequest.FIELDS.page_size
Args:
analytics: An authorized Analytics Reporting API V4 service object.
Returns:
The Analytics Reporting API V4 response.
"""
return analytics.reports().batchGet(
body={
'reportRequests': [
{
'viewId': VIEW_ID,
'dateRanges': [{'startDate': '7daysAgo', 'endDate': 'today'}],
'metrics': [
{'expression': 'ga:productListViews'},
{'expression': 'ga:productDetailViews'},
{'expression': 'ga:productAddsToCart'},
{'expression': 'ga:productCheckouts'},
{'expression': 'ga:itemQuantity'},
{'expression': 'ga:itemRevenue'}
],
'dimensions': [
{'name': CUSTOM_DIMENSION_USER},
{'name': CUSTOM_DIMENSION_SESSION},
{'name': 'ga:productSku'}
],
'pageSize': 10000
}]
}
).execute()
def parse_response(response):
"""Parses the Analytics Reporting API V4 response and returns it in a Pandas dataframe.
Args:
response: An Analytics Reporting API V4 response.
Returns:
Pandas dataframe with the data.
"""
df = pd.DataFrame()
for report in response.get('reports', []):
columnHeader = report.get('columnHeader', {})
dimensionHeaders = columnHeader.get('dimensions', [])
metricHeaders = columnHeader.get('metricHeader', {}).get('metricHeaderEntries', [])
for row in report.get('data', {}).get('rows', []):
dimensions = row.get('dimensions', [])
dateRangeValues = row.get('metrics', [])
entry = {}
for header, dimension in zip(dimensionHeaders, dimensions):
entry[header] = dimension
for i, values in enumerate(dateRangeValues):
for metricHeader, value in zip(metricHeaders, values.get('values')):
entry[metricHeader.get('name')] = value
df = df.append(entry, ignore_index=True)
return df
def main():
analytics = initialize_analyticsreporting()
response = get_report(analytics)
df = parse_response(response)
print(df.count())
print(df.head(10))
df.to_csv("interactions.csv")
if __name__ == '__main__':
main()
sample_read_ga_interactions.py
Displaying sample_read_ga_interactions.py.
| 事件 | 触发 | 参数 |
| 添加 _ 付款 _ 信息 | 当用户提交他们的支付信息时 | 优惠券,货币,项目,付款类型,价值 |
| 添加 _ 运输 _ 信息 | 当用户提交他们的运输信息时 | 优惠券,货币,项目,运输层,价值 |
| 添加到购物车 | 当用户向购物车添加商品时 | 货币、项目、价值 |
| 添加到愿望列表 | 当用户向意愿列表添加项目时 | 货币、项目、价值 |
| 开始 _ 结帐 | 当用户开始结账时 | 优惠券、货币、项目、价值 |
| 生成 _ 销售线索 | 当用户提交表单或信息请求时 | 价值,货币 |
| 购买 | 当用户完成购买时 | 从属关系、优惠券、货币、项目、交易标识、运输、税收、价值(必需参数) |
| 退还 | 当退款发出时 | 从属关系,优惠券,货币,项目,交易标识,运输,税收,价值 |
| 从购物车中删除 | 当用户从购物车中移除商品时 | 货币、项目、价值 |
| 选择 _ 项目 | 当从列表中选择一个项目时 | 项目,项目列表名称,项目列表标识 |
| 选择 _ 促销 | 当用户选择促销时 | 项目,促销标识,促销名称,创意名称,创意时段,位置标识 |
| 查看 _ 购物车 | 当用户查看他们的购物车时 | 货币、项目、价值 |
| 查看 _ 项目 | 当用户查看项目时 | 货币、项目、价值 |
| 查看 _ 项目 _ 列表 | 当用户看到商品/供应的列表时 | 项目,项目列表名称,项目列表标识 |
| 查看 _ 促销 | 当向用户显示促销时 | 项目,促销标识,促销名称,创意名称,创意时段,位置标识 |
零售和电子商务应用程序应记录下列事件。记录事件及其规定的参数确保了报告中最大的可用细节,并提高了协同过滤推荐系统的整体性能。
虽然更多的用户交互增加了推荐系统的准确性,但你可能会考虑尝试更少更基本的交互,比如产品详情页面浏览量(针对未经认证的用户)和/或订单(针对经过认证的用户)。这里的直觉是,推荐系统将能够仅基于隐含的评级来推荐相关项目,例如:产品详细页面视图和购买历史。
从 Shopify 导出订单
您可以导出订单及其交易历史,也可以仅导出订单的交易历史:
- 从 订单 页面,点击 导出 。
- 在 出口订单 窗口:
- 为您想要导出的订单选择选项。例如,如果您想按日期导出订单,则单击 按日期导出 订单,并设置您要导出的订单的开始和结束日期。
- 下下导出为下,选择一种文件格式。
- 如果你想下载所有关于你的订单的信息,那么点击 导出订单 。如果您只想下载您的交易信息,则点击 导出交易历史 。
从 Magento 导出订单
在你的 Magento 2 后端,转到 销售>订单 ,点击 出口 下拉,勾选 CSV。
**
从 WooCommerce 出口订单
您可以按照与 导出客户 相同的步骤从 WooCommerce 导出订单,唯一不同的是选择 导出类型 的“订单”。 记住,对于你的协同过滤推荐系统的第一次迭代,你可能需要清理 交互数据集 导出直到它只包含: UserId,Date,ProductIds。
综合起来
如果您达到了这一点,您应该有 3 个 CSV 文件,每个文件的结构如下:
物品数据集 |
---|
用户数据集 |
---|
交互数据集 |
---|
请注意,如果您没有(或不想包含)任何用户元数据,完全可以忽略 用户数据集 。
互动是构建用户评级矩阵(URM)的基础。只需使用用户标识-项目标识对,您就可以创建第一个版本的 URM /基线模型。其他特性可以一个一个地添加,同时在每一步测量模型的性能。
从所有可用的数据集中,可以很容易地将数字或一次性编码的属性添加到模型中。其他的则需要额外的处理——例如应用自然语言处理从文本数据中提取嵌入内容,或者用计算机视觉处理产品图像。
在本系列的下一篇博文中,我们将专注于为我们的协同过滤推荐系统准备数据集和探索特征工程,这是构建高性能机器学习模型的关键一步。
敬请期待!
还有,如果有问题:https://twitter.com/cborodescu******
高性能推荐系统剖析-第三部分
原文:https://www.algolia.com/blog/ai/the-anatomy-of-high-performance-recommender-systems-part-3/
进入推荐系统的工程特征
在本系列 的第一篇 中,我们谈到了一个高性能推荐系统的关键组件:(1) 数据源、 (2) 特征库、(3) 机器学习模型、(4 & 5) 预测&行动、(6)结果、(7)评估和(8) AI 伦理。
在这第三篇文章中,我们将深入探讨推荐系统的特征工程这一主题。虽然从原始数据到推荐的路径要经过各种工具和系统,但该过程涉及两个数学实体,它们是任何推荐系统的面包和黄油: 特征 和 模型。
特征是原始数据的数字表示。特征工程是在给定数据、模型和任务的情况下组合最合适的特征的过程。在基本的协同过滤场景中,我们实际上没有特征,因为评级实际上是标签。
基于内容的系统处理各种各样的物品描述和关于用户的知识。特征工程包括将这些不同类型的非结构化数据转换成标准化的描述。尽管可以使用任何类型的表示,比如多维数据表示,但最常见的方法是从底层数据中提取关键字。
项目有多个字段,其中列出了各种属性。例如,书籍有描述、标题和作者。在某些情况下,这些描述和属性可以转换成关键字。
| ItemID | 标题 | 作者 | 描述 | 流派 | 价格 |
| 0000031852 | 2034:下一次世界大战的小说 | 美国海军上将詹姆斯·斯塔夫里迪斯·阿克曼号 | 来自两位前军官和获奖作家,这是一部令人毛骨悚然的真实地缘政治惊悚片,想象了 2034 年美国和中国在南中国海的海军冲突,以及从那里通往噩梦般的全球大灾难的道路。 | 惊悚片&悬疑片 | 17.84 美元 |
另一方面,当属性包含数字量(如价格)或从可能性的小宇宙(如类型)中提取的字段时,您可以直接使用多维(结构化)表示。
除了描述商品,你还需要收集用户资料。比如movie lens,一个经典的用户属性推荐数据集, 包含了性别、年龄、职业三个用户属性。因为这些是单标签属性,所以可以在预处理过程中使用 一键 编码对它们进行编码。
| 用户标识 | 性别 | 年龄 | 职业 |
| | 男/女 | * 1:“18 岁以下” * 18:“18-24 岁” * 25:“25-34 岁” * 35:“35-44 岁” * 45:“45 | * 0:“其他”或未指定
- 1:“学术/教育工作者”
- 2:“艺术家”
- 3:“文书/行政”
- 4:“学院/研究生”
- 5:“客服”
- 6:“医生/保健” 12:“程序员”
- 13:“退休”
- 14:“销售/营销”
- 15:“科学家”
- 16:“个体户”
- 17:“技术员/工程师”
- 18:“工匠” |
最后,并不是所有的特征都是平等的。您可以应用特性 权重、 根据特性的重要性给出不同的权重,或者应用特性 选择、 根据相关性包括或排除属性。
现在让我们探索推荐引擎中最常见的项目和用户属性的特征工程方法。
数字特征
离散化
项目数据集中包含的价格属性是一个 连续变量 ,因为它可以取不可数的一组值,并且可以包含给定范围内的任何值。为了将这种原始特征转换成机器学习模型可以接受的格式,您将使用 量化: 本质上,将连续值映射到离散值。从概念上讲,这可以被认为是 统计箱 的有序序列。
宁滨有三种典型的方法:
- 统一: 所有箱柜宽度相同
- 基于分位数: 所有箱都有相同数量的值
- 基于 K-均值: 每个仓属于最近的一维 K-均值聚类
统一宁滨是最简单的方法。它使用公式将一系列可能的值划分为宽度相同的 N 个箱
其中 N 为区间数。
N 通常是通过实验确定的——这里没有经验法则。
例如,如果变量 interval 为[10,110],并且您想要创建 5 个容器,这意味着110-10 / 5 = 20
,因此每个容器的宽度为 20,间隔为[10,30],[30,50],[50,70],[70–90]和[90,110]。
统一、分位数或 k 均值宁滨的代码和直方图如下:
from sklearn.preprocessing import KBinsDiscretizer
# create the discretizer object with strategy uniform
discretizer = KBinsDiscretizer(bins, encode='ordinal', strategy='uniform') # replace "uniform" with "quantile" or "kmeans" to change discretization strategies
data_disc= discretizer.fit_transform(data)
统一(垃圾箱= 10) | 分位数(仓= 10) | K-均值(仓= 10) |
---|
规范化和标准化
讨论最多的两种缩放方法是**(将值重新缩放到[0,1]的范围内)和 标准化 (将数据重新缩放到平均值为 0,标准差为 1)。以下是数据经过规范化和标准化后的可视化表示:**
**
您可以对页面浏览量、点击量和交易量等特征使用归一化,因为这些值不是正态(高斯)分布的,大多数时候它们是长尾。
这是归一化的公式:
其中Xmax和Xmin分别为特征的最大值和最小值。
# data normalization with sklearn
from sklearn.preprocessing import MinMaxScaler
# fit scaler on training data
norm = MinMaxScaler().fit(X_train)
# transform training data
X_train_norm = norm.transform(X_train)
# transform testing data
X_test_norm = norm.transform(X_test)
标准化对客户评论很有用,因为数据遵循高斯(正态)分布:
其中 μ 是特征值的平均值,𝝈是特征值的标准差。注意,在这种情况下,这些值不限于特定的范围。
from sklearn.preprocessing import StandardScaler
# fit on training data
scale = StandardScaler().fit(X_train)
# transform the training data
X_train_stand = scale.transform(X_train)
# transform the testing data
X_test_stand = scale.transform(X_test)
分类特征
通常,特征被表示为分类值,而不是连续值。在上面的例子中,用户可以拥有诸如性别([男性、女性])、年龄([18 岁以下、18-24 岁、25-34 岁])和职业([其他、学术/教育工作者、艺术家、职员/管理人员],…)等特征。这样的特征可以有效地编码为整数,例如,[男性,18-24 岁,文书/管理]可以表示为[0,1,3],而[女性,25-34 岁,学术/教育工作者]可以表示为[1,2,1]。
我们有几个将分类特征转换成整数的选项:
- 使用普通编码器。 该估计器将每个分类特征转换为一个新的整数特征(0 到 n _ categories–1)
from sklearn.preprocessing import OrdinalEncoder
user_data = [['male', '18-24', 'clerical/admin'], ['female', '25-34', 'academic/educator']]
encoder = OrdinalEncoder().fit(user_data)
encoder.transform([['female', '25-34', 'clerical/admin']])
# array([[0., 1., 1.]]
- 使用 scikit-learn 估计器。这个估计器使用一个“K 选一”的方案,也称为一键编码或虚拟编码,将类别转换为整数。
from sklearn.preprocessing import OneHotEncoder
user_data = [['male', '18-24', 'clerical/admin'], ['female', '25-34', 'academic/educator']]
encoder = OneHotEncoder().fit(user_data)
encoder.transform([['female', '25-34', 'clerical/admin'],['male', '25-34', 'academic/educator']]).toarray()
# array([[1., 0., 0., 1., 0., 1.], [0., 1., 0., 1., 1., 0.]])
文字嵌入
这些方法——标准化、规范化和分类特征——用于组合特征。它们都依赖于对语言的语义理解。让我们来看看如何阅读基于文本的内容。
自然语言处理(NLP)是人工智能的一个子领域,它使计算机能够理解和处理人类语言。有两种技术可以完成这项任务:对未处理的文本应用词袋模型,并对文本进行预处理,以便稍后使用神经网络模型。
袋字
词汇袋模型是最常用的流程,因为它易于实施和理解。这个想法是为句子和文档创建一个出现矩阵,而不考虑语法或词序。
from sklearn.feature_extraction.text import CountVectorizer
corpus = ["From two former military officers and award-winning authors, a chillingly authentic geopolitical thriller that imagines a naval clash between the US and China in the South China Sea in 2034–and the path from there to a nightmarish global conflagration."]
vectorizer = CountVectorizer(stop_words=None, ngram_range=(1, 1), min_df=1, max_df=1)
# stop_words - Please see the following guidelines before choosing a value for this param: https://scikit-learn.org/stable/modules/feature_extraction.html#stop-words
# ngram_range - Provides the range of n-values for the word n-grams to be extracted. (1, 1) means the vectorizer will only take into account unigrams, thus implementing the Bag-of-Words model
# min_df && max_df - The minimum and maximum document frequency required for a term to be included in the vocabulary
X = vectorizer.fit_transform(corpus)
print(vectorizer.get_feature_names())
'''
['2034', 'and', 'authentic', 'authors', 'award', 'between', 'chillingly', 'china', 'clash', 'conflagration', 'former', 'from', 'geopolitical', 'global', 'imagines', 'in', 'military', 'naval', 'nightmarish', 'officers', 'path', 'sea', 'south', 'that', 'the', 'there', 'thriller', 'to', 'two', 'us', 'winning']
'''
print(X.toarray())
#[[1 3 1 1 1 1 1 2 1 1 1 2 1 1 1 2 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1]]
产生的频率用于训练分类器。请注意,因为不需要对句子进行预处理,所以这种方法会带来一系列缺点,比如结果向量的稀疏表示、理解文本数据的能力差,以及在处理大量文档时性能不佳。
预处理文本
预处理句子的标准顺序是记号化、去掉不必要的标点和停用词、词干化、词条化。
标记化包括把句子变成单词。来自nltk package
的word_tokenizer
对字符串进行标记,以分离除句点以外的标点符号。
import nltk
nltk.download('punkt') # a pre-trained Punkt tokenizer for English
from nltk.tokenize import word_tokenize
text = "From two former military officers and award-winning authors, a chillingly authentic geopolitical thriller that imagines a naval clash between the US and China in the South China Sea in 2034–and the path from there to a nightmarish global conflagration."
tokens = word_tokenize(text)
print(tokens)
'''
['From', 'two', 'former', 'military', 'officers', 'and', 'award-winning', 'authors', ',', 'a', 'chillingly', 'authentic', 'geopolitical', 'thriller', 'that', 'imagines', 'a', 'naval', 'clash', 'between', 'the', 'US', 'and', 'China', 'in', 'the', 'South', 'China', 'Sea', 'in', '2034–and', 'the', 'path', 'from', 'there', 'to', 'a', 'nightmarish', 'global', 'conflagration', '.']
'''
不同的包都有预定义的停用词。另一种方法是定义一个与语料库相关的自定义停用词列表。
nltk.download('stopwords') # 2,400 stopwords for 11 languages
from nltk.corpus import stopwords
stop_words = set(stopwords.words('english'))
tokens = [w for w in tokens if not w in stop_words]
print(tokens)
'''
['From', 'two', 'former', 'military', 'officers', 'award-winning', 'authors', ',', 'chillingly', 'authentic', 'geopolitical', 'thriller', 'imagines', 'naval', 'clash', 'US', 'China', 'South', 'China', 'Sea', '2034–and', 'path', 'nightmarish', 'global', 'conflagration', '.']
'''
通过去除后缀和前缀,将语料库中的单词缩减到它们的根。词干分析器查找常见后缀和前缀的列表,并删除它们。
from nltk.stem.porter import PorterStemmer #there are more available
porter = PorterStemmer()
stems = []
for t in tokens:
stems.append(porter.stem(t))
print(stems)
'''
['from', 'two', 'former', 'militari', 'offic', 'award-win', 'author', ',', 'chillingli', 'authent', 'geopolit', 'thriller', 'imagin', 'naval', 'clash', 'us', 'china', 'south', 'china', 'sea', '2034–and', 'path', 'nightmarish', 'global', 'conflagr', '.']
'''
词汇化与词干化有相同的预期输出:将单词简化为一个公共基或其词根。然而,lemmatizer 考虑到了单词的形态分析,对所有词形变化使用相同的词根。
nltk.download('wordnet') # a dictionary is needed for a Lemmatizer
from nltk.stem import WordNetLemmatizer
lemmatizer = WordNetLemmatizer()
lemmas = []
for t in tokens:
lemmas.append(lemmatizer.lemmatize(t))
print(lemmas)
'''
['From', 'two', 'former', 'military', 'officer', 'award-winning', 'author', ',', 'chillingly', 'authentic', 'geopolitical', 'thriller', 'imago', 'naval', 'clash', 'US', 'China', 'South', 'China', 'Sea', '2034–and', 'path', 'nightmarish', 'global', 'conflagration', '.']
'''
图像编码
在进入这个话题之前,你必须了解计算机“看”图像的方式。每个图像被表示为 1 或 3 个像素矩阵。每个矩阵代表一个 通道。 对于黑白图像,只有一个通道,而对于彩色图像,有三个:红、绿、蓝。每个像素依次由 0 到 255 之间的数字表示,表示颜色的强度。
像素值作为特征
从图像中检索特征最简单的方法是重新排列所有像素,生成一个特征向量。对于灰度图像,这可以使用 NumPy: 轻松实现
import skimage
from skimage import data, io # data has standard test images
import numpy as np
from matplotlib import pyplot as plt
%matplotlib inline
camera = data.camera()
io.imshow(camera)
plt.show()
print(camera.shape) # (height, width)
# (512, 512)
features = np.reshape(camera, (512*512))
print(features.shape, features)
# ((262144,), array([156, 157, 160, ..., 121, 113, 111], dtype=uint8))
相同的技术可用于 RGB 图像。然而,更合适的方法是通过使用来自所有通道的像素的平均值来创建特征向量。
import skimage
from skimage import data, io # data has standard test images
import numpy as np
from matplotlib import pyplot as plt
%matplotlib inline
astronaut = data.astronaut()
io.imshow(astronaut)
plt.show()
print(astronaut.shape) # (height, width, no. of channels)
# (512, 512, 3)
feature_matrix = np.zeros((512, 512)) # matrix initialized with 0
for i in range(0, astronaut.shape[0]):
for j in range(0, astronaut.shape[1]):
feature_matrix[i][j] = ((astronaut[i, j, 0]) +(astronaut[i, j, 1]) + (astronaut[i, j, 2])) / 3
print(feature_matrix)
'''
array([[65.33333333, 26.66666667, 74.33333333, ..., 35.33333333,
29\. , 32.66666667],
[ 2.33333333, 57.33333333, 31.66666667, ..., 33.66666667,
30.33333333, 28.66666667],
[25.33333333, 7.66666667, 80.33333333, ..., 36.33333333,
32.66666667, 30.33333333],
...,
[ 6.66666667, 7\. , 3\. , ..., 0\. ,
0.33333333, 0\. ],
[ 3.33333333, 2.66666667, 4.33333333, ..., 0.33333333,
1\. , 0\. ],
[ 3.66666667, 1.66666667, 0.33333333, ..., 0\. ,
1\. , 0\. ]])
'''
边缘检测
边缘是图像中亮度和颜色急剧变化的一组点。有不同的边缘检测技术,最常用的是 Canny 边缘检测算法。下面是它如何工作的概述:
- 使用高斯滤波器降噪
- 梯度计算
- 非最大值抑制(该算法遍历梯度强度矩阵上的所有点,并找到边缘方向上具有最大值的像素)
- 双阈值(将像素分为两类:强和弱)
- 滞后边缘跟踪(当且仅当有另一个强像素作为其邻居时,将弱像素转换为强像素)
import skimage
from skimage import data # data has standard test images
import cv2
from matplotlib import pyplot as plt
%matplotlib inline
camera = data.camera()
# from skimage import color # the image should be grayscale for Canny
# camera = color.rgb2gray(camera) # however this one already is
edges = cv2.Canny(camera,100,200) # thresholds for the hysteresis procedure
plt.subplot(121), plt.imshow(camera, cmap = 'gray')
plt.title('Original Image')
plt.subplot(122), plt.imshow(edges, cmap = 'gray')
plt.title('Edge Image')
plt.show()
不同的项目和团队维护和提供特性的方式可能会有很大的不同。这增加了基础架构的复杂性,并经常导致重复工作。分布式组织面临的一些挑战包括:
- 特征未被重用
- 特性定义不同
- 计算特征需要很长时间
- 训练和发球不一致
- 特征衰减未知
为了解决这些问题,一个 特征库 作为一个中心库,用于存储一个组织内的文档化的、管理的和访问受控的特征。
特征存储 | |||
---|---|---|---|
平均 _ 用户 _ 订单 _ 价值 | 一个用户的平均订单值。 | 为什么将特征添加到模型中,它如何有助于概化,负责维护特征数据源的组织中的工程师姓名,输入类型,输出类型。 | 在运行时环境中执行并应用于输入以计算特征值的版本化代码。 |
本质上,特征库允许数据工程师插入特征。反过来,数据分析师和机器学习工程师使用 API 来获取他们认为相关的特征值。
此外,应对要素存储中的要素值进行版本化,以确保数据分析师能够使用与用于训练先前模型版本的要素值相同的要素值来重新构建模型。给定输入的特征值更新后,先前的值不会被删除;相反,它是用时间戳保存的,表明它是何时生成的。
在过去的几年里,分析师和工程师发明、试验并验证了各种适用于特性工程的最佳实践。在本文中,我们研究了规范化、标准化和分类特性。其他实践包括生成简单的特性、重用遗留系统、在需要时使用 id 作为特性、尽可能减少基数、谨慎使用计数、在必要时进行特性选择、仔细测试代码、保持代码、模型和数据同步、隔离特性提取代码、将模型和特性提取器序列化在一起,以及记录特性的值。
功能工程是一个创造性的过程,作为一名机器学习工程师,你最有资格确定哪些功能适合你的推荐模型。
在本系列的下一篇文章中,我们将专注于构建协同过滤推荐模型,这将是一件轻而易举的事情,因为我们已经解决了特征工程的问题。敬请期待!还有如果有什么问题,可以在Twitter上问我。**
高性能推荐系统剖析——第四部分—
原文:https://www.algolia.com/blog/ai/the-anatomy-of-high-performance-recommender-systems-part-iv/
推荐系统的流行模型和技术
在本系列关于推荐 的第一部分 中,我们谈到了一个高性能推荐系统的关键组件:(1) 数据源 ,(2) 特征工程和特征库 ,(3) 机器学习模型,(4)&5)预测&这里的重点是 3-应用于推荐模型的机器学习。
在我们之前关于 功能推荐 的文章中,我们了解到推荐系统最流行的技术依赖于三种数据源类型:(1)用户元数据——性别、年龄、职业、位置等。(2)关于项目的属性信息——销售书籍的商家可能具有书籍的描述和描述内容、标题和作者的关键字,以及(3)用户-项目交互——点击、查看、交易、评论等。
在本文中,我们将自己构建推荐模型。
我们根据处理这些原始数据源的方式对常见的推荐方法进行分类:
基于内容 —内容在推荐过程中起主要作用。正如我们将看到的,项目描述和属性被用来计算项目相似性。
协同过滤 —这些模型利用多个用户提供的评级的协同力量来进行推荐。基本思想是可以计算未指定的评级,因为观察到的评级通常在各种用户和项目之间高度相关。协作过滤主要有两种:
- 基于用户的——基于用户的协同过滤背后的主要思想是,具有相似特征的人分享相似的品味。
- 基于项目的 —与基于用户的相反,项目对项目的协作过滤基于项目之间的相似性,使用人们对这些项目的评级来计算。
让我们更深入地研究每一种技术。
基于内容的推荐模型
在基于内容的过滤中,我们根据项目的属性来推荐项目。因此,基于内容的推荐系统的输入由项目内容矩阵中描述的所有属性组成。
基于内容的推荐器的主要假设是,表达了对某个项目的偏好的用户可能会偏好类似的项目。例如,如果我碰巧喜欢漫威的电影,尤其是 2011 年的《绿灯侠》中的瑞安·雷诺兹,我很可能会喜欢《死侍》(2016 年和 2018 年)……更不用说《死侍 3》(据说他们将在 2022 年开拍,耶!)因为他们有同一个演员,他们是同一个电影类型。
条目内容度量(ICM)最能代表条目池的属性,如下所示:
“1” if the item has the attribute “A”, “0” otherwise.
现在,关键问题是: 我们如何根据两个物品的属性来衡量它们的相似度? 为此,我们在如下矩阵上计算余弦相似度:
| | 属性 1 | 属性 2 | … | 属性 N |
| 第 1 项 | 1 | 0 | … | 1 |
| 第 2 项 | 0 | 1 | | 0 |
| … | 1 | 0 | | 1 |
| 第 N 项 | 0 | 1 | | 0 |
直觉是,如果两个物品向量有很多共同的属性,我们可以假设这两个物品非常相似。数学上,这可以用点积运算来表示:
而几何上,可以表示为两个向量之间的余弦:
可以看出,较小的角度(较大的余弦)意味着项目具有较高的相似度。还有另外两个重要的概念将帮助我们构建相似性矩阵:
- 支持——向量中非零元素的数量。
- 收缩项 C——用于通过仅考虑与大型支持项目最相似的项目来调整相似性。
这样,使用公式计算相似度矩阵:
在下面,您可以看到我们如何根据众所周知的 电影镜头 数据集计算推荐,该数据集由电影标题和用户提供的标签组成:
首先,我们计算矩阵中所有样本之间的余弦相似度,并将其保存在一个新的数据帧中,该数据帧稍后将用于返回前 k 个相似电影:
# creating the tf-idf Vectorizer to analyze, at word level, unigrams and bigrams
tf = TfidfVectorizer(analyzer='word', ngram_range=(1,2))
# applying the vectorizer on the 'tags' column
tfidf_matrix = tf.fit_transform(movies_df['tags'])
# compute the cosine similarity between all the samples in the matrix
cosine_sim = cosine_similarity(tfidf_matrix)
# saving the values in a DataFrame for better visualisation
cosine_sim_df = pd.DataFrame(cosine_sim, index=movies_df['title'], columns=movies_df['title'])
def get_recommendations(movie_id, similarity_df, movies_df, k=10):
# partitions the matrix such that the indices are in the position they would be in a sorted array
ix = similarity_df.loc[:,movie_id].to_numpy().argpartition(range(-1,-k,-1))
# gets the corresponding movie titles for k+1 sorted indices
closest = similarity_df.columns[ix[-1:-(k+2):-1]]
# removes the queried title from the results
closest = closest.drop(movie_id, errors='ignore')
# returns top k most similar movies
return pd.DataFrame(closest).merge(movies_df).head(k)
最后,获得推荐非常简单:
x = 'Superman (1978)'
# get recommendations for the given x title
y = get_recommendations(x, cosine_sim_df, movies_df[['title', 'tags']])
这个基本的基于内容的推荐算法将产生以下结果:
相似度矩阵的问题在于它非常密集(计算量大),相似度值非常小,这在数据中引入了大量噪声,从而降低了推荐的质量。为了解决这个问题,我们可以使用 K-最近邻算法(KNN),这是一种在相似性矩阵中只保留 K 对最相似的项目的方法。
from sklearn.neighbors import NearestNeighbors
# Create the unsupervised learner with k=10 and train it on our data
knn = NearestNeighbors(n_neighbors=10).fit(cosine_sim_df)
def get_recommendations(movie_title, similarity_df, movies_df):
# Get the indices of the neighbors of the queried movie
ix = knn.kneighbors(similarity_df[movie_title].to_numpy().reshape(1, -1), return_distance=False)
# Get the titles of the corresponding indices
closest = similarity_df.columns[ix].flatten()
return pd.DataFrame(closest,columns=['title']).merge(movies_df)
相同的查询,使用与上面相同的代码,将产生以下结果:
在上面的基本例子中,我们只考虑了 1 个属性,即 标签。 基于内容的算法可以通过包含更多的非二进制属性如片名、演员、流派等得到极大的改进。
协同过滤推荐模型
协同过滤方法的主要思想是通过观察来自其他高度相关的用户和已经给出评级的项目的评级来推断用户没有明确给项目的评级。它们不需要任何项目属性就能工作,而是依赖于用户社区的意见。
协同过滤推荐系统的输入是用户评级矩阵(URM),它包含所有用户对项目的评级:
the rating user U gave to item I, “0” if no rating was given
例如,用户评级矩阵中的交互可以是明确的评级。显式评级意味着用户明确地陈述了他或她对某个项目的意见。显式评级的一个例子可以是用户给一个项目的星级数。如果没有用户对某个项目的评分,则 URM 中的相应值为 0。
| | 第一项 | 第二项 | … | 第 N 项 |
| 用户 1 | 1 | 3 | … | 1 |
| 用户 2 | 2 | 4 | | 4 |
| … | | | | |
| 用户 N | 3 | 5 | | 2 |
URM 中描述的另一种类型的交互可以是隐式评级。隐式评级只是说明用户是否与某个项目进行了交互,因此只有两个值:0 或 1。1 表示用户与项目进行了交互,而 0 表示没有信息。
原则上,可以设计一种算法,既可以使用显式评级,也可以使用隐式评级。最简单的算法被设计成只处理两种类型中的一种:隐式或显式评级。
尽管有不同类型的协同过滤技术,下面我们将介绍基于用户和基于项目的技术。
基于用户的协同过滤
当我们想向一个用户做推荐的时候,基于用户的协同过滤可以用来搜索其他有相似品味的用户,并推荐那些用户最喜欢的商品。
因此,第一个问题是找到一种方法来衡量用户之间的相似性。我们如何衡量这种相似性?
我们从查看用户的评分开始,并根据这些评分来比较用户的口味。如果两个用户对几个项目给出了相似的评价,我们可以假设这两个用户对这些项目有相同的意见;如果他们在很多项目上有相同的观点,我们可以假设这两个用户是相似的。
我们根据用户的评级计算用户之间的相似性,并创建一个相似性矩阵,其中行 i 和列 j 的值是用户和用户之间的相似性得分
为了计算两个用户之间的相似度,我们使用余弦相似度。为了计算的目的,我们将同时计算一个用户和所有其他用户之间的相似性:
# create URM
URM = np.zeros((num_users, num_items), dtype=int)
for _, row in data.iterrows():
URM[row['user_id'] - 1, row['item_id'] - 1 ] = row['rating']
# find the most N similar users to the current one (we picked N to be 3)
def similar_users(user_id, URM, N = 3):
number_of_users = URM.shape[0]
# create the list of other users (take all users ids and then remove the id for the current one)
other_users_ids = np.array(range(number_of_users), dtype=int)
other_users_ids = np.delete(other_users_ids, user_id).tolist()
# take the ratings made by the current user
user = URM[user_id].tolist()
# iterate through all the other users ids and compute the similarity to the current user
other_users_similarity = []
for other_user_id in other_users_ids:
other_user = URM[other_user_id].tolist()
other_users_similarity.append(cosine_similarity_pair_of_users(user, other_user))
# create a dictionary with the user indexes and their similarity
index_similarities = dict(zip(other_users_ids, other_users_similarity))
# sort by the similarity
index_similarity_sorted = sorted(index_similarities.items(), key=lambda x: x[1], reverse=True)
# get the first N users and their similarity
top_user_similarity = index_similarity_sorted[:N]
# get the ids for the top N users
top_user_ids = [usr[0] for usr in top_user_similarity]
return top_user_ids
此时,识别给定 user_id 的相似用户是简单的:
# for example we take the user with the id 48
example_user_id = 48
top_similar_users = similar_users(example_user_id, URM)
下一步是实际定义要推荐给我们用户的前 K 个项目。一旦我们确定了最相似的用户,下面的代码就可以做到这一点:
def recommend_topK_items_for_user(user_id, similar_users_ids, URM, topK = 5):
# get the similar users ratings
similar_users = URM[similar_users_ids]
# compute the average rating for every item rated by the similar users
average_ratings = similar_users.mean(axis=0)
# get the current user
user = URM[user_id]
# transpose it
user_transposed = user.transpose()
# get the items ids where the rating is 0 (the user didn't rate the item)
items = np.where(user_transposed == 0)[0]
# get the similar users ratings for the unrated items by the current user
similar_users_ratings = similar_users[:, items]
average_ratings = average_ratings[items]
# order the items by the average of their ratings
item_indexes = np.argsort(average_ratings)[::-1]
# get the top k items indexes
top_items_index = item_indexes[:topK]
return top_items_index.tolist()
最后一步是生成基于用户的推荐,并将它们与分级电影进行比较:
recommended_items = recommend_topK_items_for_user(example_user_id, top_similar_users, URM)
# items rated by the user
user_ratings = URM[example_user_id]
items_rated = np.where(user_ratings != 0)[0].tolist()
items_info.loc[items_info['movie_id'].isin(items_rated)]
# recommended items for user
items_info.loc[items_info['movie_id'].isin(recommended_items)]
基于项目的协同过滤
在基于项目的协同过滤方法中,为了预测用户对目标项目的评分,我们必须确定与目标项目最相似的项目集。这个想法是根据有多少用户对每一对商品进行了评价来计算它们之间的相似度。然后,我们使用用户在该项目中指定的评级来预测他或她是否会喜欢目标项目。
因此,第一步是计算项目之间的相似度,如下所示:
def similar_items(item_id, URM, topK = 5):
# get the current item
item = URM[:, item_id].tolist()
# get all the other items
number_of_items = URM.shape[1]
other_items_ids = np.array(range(number_of_items), dtype=int)
other_items_ids = np.delete(other_items_ids, item_id).tolist()
# compute the similarity between the current item and the other items
other_items_similarity = []
for other_item_id in other_items_ids:
other_item = URM[:, other_item_id].tolist()
other_items_similarity.append(cosine_similarity_pair_of_items(item, other_item))
# create a dictionary with the item indexes and their similarity
index_similarities = dict(zip(other_items_ids, other_items_similarity))
# sort by the similarity
index_similarity_sorted = sorted(index_similarities.items(), key=lambda x: x[1], reverse=True)
# get the first K items and their similarity
top_item_similarity = index_similarity_sorted[:topK]
# get the ids for the top K items
top_item_ids = [itm[0] for itm in top_item_similarity]
return top_item_ids
就像基于用户的协同过滤一样,在这个阶段,项目之间的相似度可以计算如下:
example_item_id = 29
recommended_items = similar_items(example_item_id, URM)
最后,获取推荐:
example_item_id = 29
# recommended items
items_info.loc[items_info['movie_id'].isin(recommended_items)]
在了解了协同过滤的工作原理之后,你可能还有一些悬而未决的问题,比如:
- 基于项目的推荐和基于用户的推荐有什么区别?
- 基于内容的推荐和基于项目的推荐有什么区别?
要回答这些问题,我们需要看看相似性是如何计算的——余弦相似性公式可以适用于从用户评级矩阵或 URM 开始计算用户之间的相似性和项目之间的相似性。
考虑到项目之间的相似性,解决问题的方法与我们看到的基于内容的过滤技术相同。在基于内容的过滤中,我们可以根据用户以前喜欢的内容向他或她推荐项目。通过考虑属性来测量相似性。如果两个项目有很多共同的属性,我们可以说这两个项目是相似的。
在不知道属性的情况下,是否可以衡量物品之间的相似度?
是的,我们不需要知道任何关于项目的属性,因为我们可以计算我们的相似性矩阵,知道来自用户评级矩阵或 URM 的评级。
进一步分类推荐方法
基于内存与基于模型
到目前为止,我们已经将基于记忆的技术用于我们的协同过滤算法,在该算法中,我们基于用户相似性来预测评级。它们在生产中直接使用用户评级矩阵或 URM 的评级,并且更易于实施。
然而,在协同过滤中还有第二种常用的技术:基于模型的方法。
基于模型的技术在计算建议时并不依赖于整个数据集,而是从数据集中提取信息来构建模型。这些技术需要两步进行预测:(1)第一步是建立模型;(2)第二步是使用将第一步中建立的模型和用户简档作为输入的函数来估计评级。
如果我们在系统中有了一个新用户会怎么样?
在基于记忆的技术的情况下,我们需要将新用户添加到 URM,并重新计算新用户和所有其他用户之间的相似性。这个操作的计算量很大,我们只能向模型中的用户提出建议。
在基于模型的技术的情况下,如果 URM 足够大,我们不需要将用户添加到 URM。我们不必重新计算相似性矩阵;它可以每天更新一次,也可以每周或每月更新一次。因此,我们甚至可以向不在模型中的用户进行推荐。
杂交
至少,混合推荐系统结合了一种协同过滤技术和一种基于内容的技术。然而,我们可以通过整合任意多的技术来构建一个混合推荐系统。
我们可以使用几十种不同的方法来构建混合推荐系统,所有这些方法可以大致分为五类:
线性组合 在这种类型的混合系统中,每种算法都是以现成的方式使用,也就是说每种算法都是按原样使用,不做任何修改。事实上,只有它们的输出被用于提供组合预测。这种结构允许算法及其并行执行的简单组合。例如:我们可以构建基于内容的算法 A 与协作算法 b 的组合。注意所使用的不同类型的输入数据:算法 A 使用 ICM,算法 b 使用 URM
列表组合一种简单而有效的方法是使用循环法:以循环的方式从每个列表的顶部开始选择项目。
流水线操作 流水线操作包括链接两个或多个算法,使得一个算法的输出等级作为输入被馈送到流水线中的下一个算法。例如,让我们考虑一个通用推荐算法 a。该算法可以将 URM 或 ICM 作为输入数据。 建立模型后,我们能够计算一些估计的评分。在流水线方法中,用算法 A 估计的评级可以用来丰富现有的用户评级矩阵。这个丰富的用户评级矩阵成为第二算法 B 的输入。结果是估计评级的最终矩阵。算法 A 的输出必须通过使用从我们希望为算法 b 充实的 URM 中获取的用户简档来计算。流水线的一个实际应用是使用基于内容的过滤算法作为第一阶段来充实用户评级矩阵,该矩阵随后被协作过滤算法使用。【T9
合并
在某些情况下,算法 A 的模型可以与算法 B 的模型相结合,得到一个新的模型用于推荐。只有当模型具有相同的结构时,我们才能使用这种方法。例如,我们可以将基于 ACF 项目的算法 A 与 CBF 算法 B 合并:第一个模型接收 URM 作为输入,第二个模型接收 ICM。重要的是两个型号是同一类型的。因此,不可能将协作算法的相似性矩阵与矩阵分解算法的因子矩阵合并。联合训练
最后一种混合方法基于联合训练。它类似于合并方法,不同之处在于,对于共同训练,合并的模型是在训练阶段直接获得的,并且算法 A 和 B 必须一起训练。
因式分解机
因式分解机器算法是一种通用的监督学习算法,可用于分类和回归任务,使其成为一种有吸引力的协作过滤方法。我们算法的输入被构造成一个表,其中所有的列,除了最后一列,都被分组。例如,我们有两个组:用户和项目。每个组对应于 URM 的一个维度。这些列代表数据集的特征。最后一列包含用户对项目的评级,这使得它成为推荐系统场景中的预测目标。
【T2
为了表示用户和项目,我们使用一个热编码。使用这种方法,我们为每个用户和项目分配一个列。通过将适当的列设置为 1 并将所有其他列设置为 0,我们可以选择特定的用户和特定的项目。 例如,第一列可能是 URM 的第一个用户,第二列可能是第二个用户,依此类推。通过将第一列设置为 1,将其他列设置为零,我们选择了第一个用户。类似地,在项目组中,如果我们将第一列设置为 1,而将其他列设置为零,则我们指定第一个项目。
与 URM 相比,这种格式使用更大的表,表中有更多的零,这使得表比 URM 更稀疏。根据这种表示,对于 URM 中的每个交互,我们在表中插入一行。例如,如果 URM 有 1000 个交互,我们应该在表中插入 1000 行。一旦我们定义了因式分解机的数据结构,我们就可以开始研究用于估计未知收视率的模型。
如何选择最好的推荐手法?
尽管我们希望有一个通用的推荐系统能适应所有的现实生活场景,但更现实的想法是拥有一系列推荐模型,每一个都有特定的用途。
例如,如果你是一家电子商务企业,你可能希望使用协同过滤技术来提供基于项目的推荐,就像我们提供的 Algolia 推荐 。然而,如果你是一家拥有数字出版物的媒体公司,提供基于内容的推荐可能更有意义。
或者,如果你正在寻找个性化推荐,那么基于用户的协同过滤是一个不错的选择。此外,当可伸缩性成为一个问题时,决定基于模型还是基于内存的技术更多的是一种技术考虑。
大多数情况下,混合方法是最佳策略,对于拥有能够迭代和微调推荐模型的机器学习团队的公司来说,这显然是一条出路。
Recommender Systems Cheat Sheet
在本系列的下一篇博文中,我们将关注各种推荐系统可以通过它们生成的预测来促进的行动。敬请期待!如有疑问:https://twitter.com/cborodescu
推荐和用户操作
原文:https://www.algolia.com/blog/ai/the-anatomy-of-high-performance-recommender-systems-part-v/
建议和用户操作
在本系列的前几篇文章中,您学习了,如何使用 正确的数据源 ,如何 设计它将从中学习的正确特性 ,以及有哪些 工业级推荐模型和技术
现在你已经有了一个可靠的推荐模型,是时候回到你的用户身边了。为什么用户甚至会在意推荐?在这里,从一些角度来看用户在网上导航时必须做出的越来越复杂的决定是有好处的。
引用网飞的研究:
“人类在生活的各个方面都面临着越来越多的选择——当然是在视频、音乐和书籍等媒体方面,但更重要的是,在健康保险计划、治疗和测试、求职、教育和学习、约会和寻找生活伴侣以及其他许多选择非常重要的领域。
“我们相信,推荐系统领域将继续发挥关键作用,利用现有的丰富数据使这些选择变得可管理,有效地引导人们选择真正最好的几个选项进行评估,从而做出更好的决策。”
卡洛斯·a·戈麦斯-乌里韦&尼尔·亨特。2015.网飞推荐系统:算法、商业价值和创新
我们已经到达了这样一个点,选择的数量让瘫痪。以 YouTube 为例:现在有 82 年的视频内容每天上传到他们的目录。作为一个用户,我甚至从哪里开始为我*将会重视的 gem 探索这一堆内容呢?
*
在我们系列的一开始,我们就着手“ 筛选出用户的选择,并根据他们的要求或喜好为他们提供最合适的建议 ”。一旦你手头有了一个高性能的推荐系统,是时候充分利用它可以生成的预测,在一个战略性的时间和地点向你的用户展示它们,以建议要采取的相关 行动 。
正如我们在上面网飞的引文中所看到的,对人类来说,能够独自在他们面对的网上选择的海洋中航行已经太晚了。因此,推荐系统的兴起是由商业需要驱动的:如果人们很难做出选择来访问你的内容,并且如果你有足够的数据来帮助他们做出正确的选择,那么你会因为 而不是 帮助他们而失去业务。
什么样的推荐可以帮助你的用户充分利用你的服务?在本系列的 第四部分 中,我们看到不同的推荐器模型可以提供不同种类的推荐:
从用户的角度来看,在每种情况下,他们都获得了 浏览快捷方式 :取代用户随机浏览一段时间,希望最终偶然发现正确的项目,高性能的推荐者可以直接为他们指出旅程的目的地。
不仅如此,用户还获得了 新的机会 :登陆这个页面的人可能不知道他们可能对一些相关项目感兴趣。这些预测可以让你扩大用户对你能提供的内容的接触,帮助他们充分利用大量的选择。
这使得企业能够为用户提供数量惊人的新内容,同时帮助他们理解这些内容:如果我们回到 YouTube 的例子,82 年来每天都有新内容出现,平均会话长度仍然很长—13m平均 。因此,YouTube 用户的参与度很高,月活跃用户 20 亿,其中1.22 亿** 为 日活跃用户 。**
**同样, 抖音在这一点上非常出色 :你开始观看任何种类的内容,你的互动告知系统你的兴趣。如果你表示对烹饪视频感兴趣,随着系统学习迎合你当前的口味,你可能会突然在你的提要中看到很多这样的视频。
鼓励行动:展示用户如何从战略建议中获利
在上一节中,我们已经看到了为什么有很多产品的企业对公开工业级推荐以帮助他们的用户有着至关重要的兴趣。然而,这不仅仅是把推荐信硬塞给他们。让我们举一个极端的例子,一个脱销的产品页面显示你的前 500 个相关商品作为备选:即使有一个高性能的系统,用户也不太可能滚动浏览它们。
我们如何从 获得好的推荐 到 展示战略推荐?T52
把推荐当成一种手段而不是目的:推荐是你让用户参与进来的方式,但是 行动 是你引导他们的目标。因此,一份好的推荐信应该是:
- 有限公司
- 上下文
- 省力
限定
只显示一个****相关的** 项。**
**人们很容易被诱惑去展示更多的选择,认为这只能提供更多的机会。然而,这种直觉很容易被推翻,而且有一个 的研究机构 证明,少量的选项(3-6)可以比大量的选项(10-24)转换高达 10 倍。我们在这里是为了帮助用户过滤不相关的选项,而不是为了带回太多信息的综合症,我们已经开始着手解决了!
语境
一个推荐物品此时此地应该有用。
推荐的价值来源于它在当前时间和地点为当前用户提供了多少服务;这种直接的相关性使得上下文意识成为提供优秀推荐的一个重要方面。
这里有一些例子
- 在 产品登陆页面上,用户在购物车 中添加了一件商品后,用户想知道 中是否有他们需要 购买的所有商品。这正是时候推荐 补充, 经常一起买的 产品一键添加到购物车 按钮 。
- 另一方面,在一个产品登陆页面上,用户正在 寻找其他选项 来解决同样的需求;推荐 替代, 相关产品 带链接看其详情 肯定会带来更多价值。
- 一个视频播放完 后,强烈推荐相似的视频不太可能令人满意;最好推荐那些经常一起看的内容,最大限度地提高用户参与度。
** 在某个类别的登陆页面上 ,用户正在寻找灵感或者一个新的想法;因此,显示具有该类别最佳推荐的轮播,例如,通过向该类别 中的最畅销者显示 相关产品 ,可能在将首次访问者转化为顾客方面表现良好。*
只有在为用户节省时间并帮助他们实现目标时,推荐才有价值。
- 一方面,这意味着你需要 保守 :推荐变化多端的内容,虽然增加了意外收获,却带来了用户受挫的风险。设身处地为用户着想,以初学者的视角浏览服务,并想知道:“这些推荐能帮助我更好地实现目标吗?”
- 另一方面,这意味着你可以 创新 :推荐在很多方面都很有用,不仅仅是作为你网站上的旋转木马。将这样的推荐反馈到营销平台和你的内容管理系统等其他工具中,会释放出很多价值。例如:
- 邮件活动 ,如 SendGrid :您可以根据相关建议定制您的邮件。这可以把普通的每周电子邮件变成动态的、高度相关的时事通讯!
- 营销自动化 n ,例如,Shopify :您可以让您商店中的应用程序利用来自 Algolia 的预测,将这些用户/商品洞察与您现有的商品和促销内容相结合,从而提高您当前 Shopify 应用程序的实用性。
- CRM 集成,例如 HubSpot :您可以通过对潜在感兴趣的服务进行分段推荐来扩充客户的资料,以通知您的销售团队在下次致电时提出正确的新功能。
- 像 Segment 或 BigQuery 这样的数据平台:从这些平台你可以使用生成的推荐来 扩充你自己的数据。
如果您遵循这些指导原则,您可以相信,您从系统中获得的可靠建议会有效地为您的用户服务。
推荐系统可能只需要数据和算法,但推荐系统本身并不能让用户满意。决定如何利用其 推荐 ,通过在正确的时间向正确的人建议正确的 行动 来最大限度地提高用户的满意度,这是让这种高性能推荐系统为您的用户群服务的关键,并最终使为您的业务充分利用推荐。
我们如何衡量你的推荐是否成功?
在这篇博文中,我们了解了什么是好的推荐,用户可以根据它们采取哪些行动,以及它们如何最好地服务于你的用户,以指导他们在你的服务中的行动。要了解 Algolia 推荐,从这里开始或查看我们的推荐 API 文档。
但是我们怎么知道这是正确的行动呢?您如何根据您的业务指标来衡量您的建议的有效性?一个人如何避免为了的短期表现而优化 的长期商业目标 【确保这个用户不会在一次又一次深夜狂看会议后取消他们的会员资格?)
请继续关注本系列的下一部分——结果和评估,深入了解在您的产品中利用推荐系统的这些关键方面!
如果你想继续对话,在推特上联系保罗-路易:【https://twitter.com/PaulLouisNech】*******
强大的应用内搜索的优势
原文:https://www.algolia.com/blog/ux/the-benefits-of-powerful-accurate-in-app-search/
你终于找到了。那个送餐应用。app store 中现在有了应用名称。
兴奋——更重要的是,饥饿——你下载它。
点击 iPhone 主屏幕上的搜索栏,你开始输入你最喜欢的泰国餐馆的名字。这个应用程序中唯一的一个。你迫不及待地想尝尝他们令人垂涎的泰国菜。
您等待自动完成功能立即给出餐馆的全名。
没事。
你再试一次——你拼错他们的名字了吗?他们有没有变成融合泰式/汉堡的地方,改了名字?他们被 app 甩了吗?
还是一无所获。
失望之余,你浏览了应用程序的其他餐厅。
然后你会看到这个地方,坐落在众多泰国美食中。
管它呢。
糟糕的应用内搜索令人扫兴
没有什么比像这样糟糕的苹果搜索体验更令人沮丧的了。
可悲的是,在应用程序中搜索的乏味体验比你想象的更普遍,因为许多应用程序仍然在昨天的搜索技术上蹒跚而行。考虑到近 60%的在线搜索是在手机应用程序占主导地位的 等移动设备 上进行的,这尤其是个问题。
一个时髦的应用搜索引擎可能会让搜索者失望,带来与他们想要的无关的内容,或者不适应他们输入了一个小的打字错误或拼写错误的事实。从短期来看,这只会惹恼用户,他们可能会叹口气,将徽标从移动设备的屏幕上滑掉。但随着时间的推移,如此糟糕的性能可能会大大消耗应用程序的受众。
什么是强大的应用内搜索?
出色、准确的应用内搜索 提升了应用用户的体验 ,同时为商业领袖提供了他们取得成功所需的电子商务工具。
说到搜索,最好的应用程序的特点包括:
- 无与伦比的速度: 提供即时结果的高性能算法
- 洞察 揭示你的客户如何使用应用
- A/B 测试
- 高安全性: 为您的数据提供强大、安全的环境
- 可扩展性: 持续强劲的性能,即使您不断增长
无论你是在苹果应用商店还是 Google Play 提供应用内搜索,有效的应用内搜索都能帮助你的用户快速找到最好的内容。有了最先进的搜索,你的应用程序可以提供更准确的搜索结果,提供 卓越的客户体验 ,快速跟踪用户的在线旅程。
应用内搜索用例
应用搜索引擎可用于增强多种流行类型的应用,包括:
- 约会。应用内搜索帮助约会者管理大量可能的匹配对象,并(希望如此)与潜在客户一起喝咖啡,直到他们找到那个人。当他们进入他们的 deets,他们期望被引导到他们的梦想的正确的男人或女人。如果这种情况没有发生,他们可以放弃这个应用程序,转而使用另一个应用程序。
- 送餐。 需要甜甜圈吗?自从 COVID 以来,送餐应用一直处于全盛时期,满足了那些太懒或不能离开家的人的用餐需求。大多数送餐应用都允许你使用应用内搜索来锁定特定的餐馆或按食物类型进行搜索。
- 社交。对话和虚拟朋友可以在 WhatsApp 这样的社交媒体应用中叠加。好消息是,通过输入相关的搜索词,您可以快速浏览界面,了解谁在做什么。
- 音乐。例如,使用 Spotify 应用程序,你可能会对你的老播放列表或歌曲感到厌倦。你可以打破常规,使用搜索框输入几个字符,找到一个新的播放列表或流派,如“conc”,它会带来平静的曲调,便于集中注意力和学习。
- 运输。 一个常见的例子:使用拼车应用的搜索引擎来叫出租车。当像这样的应用程序顺利工作时,很容易输入你的目的地,如果幸运的话,看着地图,司机似乎被卡住了,转过身,但仍然出现在前面。
- 新闻。 想了解政坛最新动态?应用内搜索帮助你涉水通过总是溢出的大量突发事件,而不会被有趣的点击诱饵分心。
强大的应用内搜索有什么好处?
一流的应用搜索引擎会让传统的网络搜索功能显得过时或落伍。以下是实施深思熟虑的应用搜索对企业的一些好处:
精确搜索结果
一个成功的应用搜索引擎能提供可靠、相关的搜索体验。与传统搜索相比,这些算法运行更快、更准确,并具有生成定制结果页面的预测功能。拼写错误和拼写错误都被考虑在内,而搜索查询建议很可能会引导用户顺利通过应用程序。与强大的搜索引擎(谷歌)一样,该软件似乎能读懂搜索者的心思。
【保持竞争力】
人工智能支持的搜索已经成为最好、最成功的应用程序的行业标准。如果你能向消费者提供这种水平的性能,你就比那些不能或不愿多做一点的竞争对手领先一步。
留住用户
就应用程序而言,就像网上做生意的许多其他方面一样,留住客户比吸引新客户成本更低。就营销和销售支出而言,吸引新客户的成本可能是保持现有客户的五倍,因此与用户建立持久的积极关系是值得的。此外,与新客户相比,现有客户尝试新产品的可能性要高 50%,因此您当前的客户群可能会产生更多的销售额。所有这些都意味着可靠的应用内搜索可以帮助你获得更高的用户留存率。
收益更高
毫不夸张地说,出色的应用内搜索体验可以大幅提高你的底线。你的用户界面就是一切,设计或执行不好的搜索功能几乎肯定会导致用户放弃或删除你的应用。即使是一次糟糕的体验也会让用户望而却步,这还不算他们第一次使用你的糟糕应用时警告别人而不是赞美它的影响。投资于最新的人工智能搜索是让人们想要并多年保持忠诚的一个关键途径。
应用内搜索的状态
就像用网络浏览器搜索网页一样,应用内搜索从早期开始已经走过了漫长的道路,应用开发者已经利用了许多奇妙的新功能。这项技术现在由人工智能提供支持,正如你可能知道的那样,如果你使用谷歌搜索或在亚马逊购物,它可以模拟和预测人类互动,并可以从人们输入的搜索词中学习。一个现代的应用内搜索引擎提供了快速、直观的体验,提供了正确内容的快捷方式,同时产生了潜在的有价值的商业洞察力。
你的搜索结束了
需要最好的搜索引擎来为你的应用带来新的收入吗?借助我们的 强大的搜索 API ,您的开发者可以在您的应用环境中优化和构建任何搜索体验。
有了 Algolia,你得到:
- 相关的个性化结果,帮助用户从第一次击键开始
- 为搜索优化的索引
- 帮助您利用隐藏机会的分析见解
- 强大的安全性保护您的数据
- 随着增长而扩展的能力
开始使用 Algolia 免费的 或 联系我们 将你的应用搜索界面变成你的用户喜欢的东西,更重要的是,喜欢使用它来购买你的产品或服务。
庆祝组织——为什么庆祝成就很重要—
原文:https://www.algolia.com/blog/algolia/the-celebration-organization/
我是 Algolia 的一名经理,我的职责是帮助我的团队选择正确的行动,并在安全的环境中正确执行。举行庆祝活动是一个很好的工具,可以引导我的员工走向成功,并让他们继续前进。在这篇博文中,我将告诉你为什么、做什么以及如何庆祝,以在你的组织中培养一种向上的文化,关注成就。
文化集标准
文化塑造工作场所的心态和行为。Reward Gateway 公司的一项研究发现,近 70%的员工希望他们的公司做更多的事情来激励他们。接受调查的美国员工提到的最主要的两个原因是缺乏认可和感觉被忽视/被低估。公司的文化决定了管理者是否以及如何认可或激励他们的报告。
消极情绪不仅限于美国人。例如,我是法国人,从我的个人经历来看,我们法国人倾向于关注不好的方面,而不是好的方面。以研究幸福社会学而闻名的巴黎大学教授克劳迪娅·塞尼克说,法国人被他们的文化教育得悲观。她 发现 大多数法国人的不快乐可以用“心态”和“文化”来解释(除了通常的社会经济决定因素),而不是外部环境。
几年前的一个故事说明了这一点。我就职于一家以关注员工而闻名的公司。这家公司位于另一个国家,所以我远离家人,脾气暴躁。一位工程总监在去开会的路上,注意到我拉长了脸,于是他停下来和我击掌。我从未和他共事过,我们以前几乎没说过话。这一举动太出乎意料了,以至于那天剩下的时间我都在咯咯地笑。通过击掌——就像所有的实践经验一样——我知道有东西要学:
- 即使是最小的庆祝也能振奋人心:一个微笑,一封祝贺的电子邮件,一张手写的便条,在同事面前说一句“干得好”。或者击掌庆祝。
- 管理者是团队文化的销售人员,也是整个公司内部的销售人员。环顾四周。如果你看到一些奇怪或令人担忧的事情,不要犹豫:作为一名经理,你有责任向他人伸出援手——即使是那些不属于你团队的人。
庆典福利
表扬个人会增强他们的自尊,因为他们看到自己在团队中的价值得到认可,他们工作的意义得到确认。最忠诚的员工表现更好,离开组织的可能性更小。
团队看到所有值得表扬的人,而不仅仅是最资深/有价值/速度快的球员。我们都在一起,公司/经理/同事的认可应该反映这一点。
项目可能会有长达数月的目标,有时与日常活动或个人发展相去甚远。庆祝经常提醒我们,持续的进步来自于一小步一小步,即使是日常活动。
通过认可你的同事的工作和其他团队的成功,包括其他部门的成功,你可以建立纵向的信任和横向的关心,这将使你和你的团队在整个组织中可见。
庆祝什么
为了创造积极的心态,有很多事情值得庆祝
- 超越期望的人
- 团队成员克服挑战,无论是否意外
- 很棒的客户反馈
- 早年的贡献者需要因成功的小步骤而得到认可
- 体现公司文化的人
- 帮助或影响整个组织的其他团队的同事
- 个人生活中的事情(如家庭、艺术、体育)
- 重大举措
- 迅速而有规律地做家务
- 富有成效的合作/会议
庆祝失败怎么样?
经理必须确保他们的团队成员能够尝试并有远大的目标,提供一个安全的空间是一件好事。会有几个失球,红色 OKRs,没关系。然而,承认冒险、家务和学习与给人一种没人关心结果或没人负责的感觉之间只有一线之隔。我相信我们应该帮助团队继续前进,不是庆祝失败,而是庆祝对失败的伟大反应。
如何以及在哪里庆祝
我们文化配方中的一个关键成分是我们称之为#庆典的 Slack 频道,每个员工都参与其中。我们鼓励每个人——不仅仅是经理——去那里向其他人表示敬意,庆祝同事的生日或获得一份大合同。经营一家公司是一项团队运动,我们关心其他参与者。在平常的一天,我们在那个频道有 1 到 5 场庆祝活动,一群人为每一场庆祝活动欢呼。此外,我们还会在每周的全体活动中讨论重大成功案例。
定期的团队活动(如每周同步)或内容(如邮件摘要、公告板)也是表扬团队成员的好地方。在回顾中收集庆祝活动是一个很好的激励因素:它有助于团队概念化什么是好的结果和伟大的行为,它创造了承认优点的集体努力,特别是来自其他团队的优点。
请务必将这些庆祝活动记录在笔记中,因为它们是 1-1 中绩效评估和讨论的重要材料。讨论庆祝活动可以帮助员工找到复制同事成功条件的方法。它可以确保你的经理知道你的庆祝和认可,它可以准备甚至开启关于加薪或晋升的讨论。理想情况下,员工希望在讨论开始前就知道所有的事情。
发布早&发布常开发者信奉的口头禅也适用于 kudos:等待重大进展或项目结束后再庆祝会为你的反馈创造一个隧道效应。
当一个人很长时间没有受到表扬——比如超过四分之一——这可能是一个信号,表明你必须问自己一些问题:作为一名经理,你足够关心吗?你错过了什么吗?你的团队如何评价自己的表现?他们觉得被授权/被引导了吗?他们需要做些什么才能从一般或很好变得很棒?
不适合大家
对一些人来说,成为焦点可能会很麻烦。在她的帖子 中,Lara Hogan 强调了一些人可能对公众的认可不放心,需要根据他们的条件来获得认可。你必须找到其他合适的方式来庆祝:想想手写的便条、专为他们打印的 3D 小物件,或者他们最喜欢的食物——这对偏远的团队也很有用。这一切都是为了让他们能够享受这一刻,而不是感到非常不舒服。
欢庆是关爱,这是我们 DNA 的一部分
如果你正在寻找一份新工作,并对在一个授权和认可是企业文化重要组成部分的环境中工作感兴趣,请前往https://algolia.com/careers,我们一直在寻找聪明善良的人来进一步推动我们的产品。并击掌庆祝。
数字商品销售的变化|
原文:https://www.algolia.com/blog/ecommerce/the-changing-face-of-digital-merchandising/
这一分为二的专题深入探讨了数字商品销售的转型之旅,以推动积极的电子商务体验。第 1 部分根据我们的客户以及他们如何考虑开发他们的销售策略,揭示了最重要的销售任务。第 2 部分将解构推动业务成果所需的卓越数字销售平台的核心组件。
在封锁期间,网上购物激增,但此后需求模式发生了很大变化。作为观察到的主要趋势的一部分,消费者已经重新回到商店,同时继续期待出色的数字体验。通货膨胀仍然居高不下,全球经济形势依然动荡,所有这些都影响着购物行为。除了寻找最划算的交易之外,还有一种越来越明显的趋势,那就是将他们的购买分散到几家网上商店。
这为在线零售商创造了一个复杂的等式,现在比以往任何时候都更需要 提高盈利能力是关键 。这种业务需求需要得到公司所有职能部门的支持,在公司中,所有员工都在建立并优先考虑他们的目标,以获得更多收入、更好的运营效率和更少的支出。一个比其他行业更迫切需要转型的特殊行业是数字营销。
为什么?数字销售商有能力影响几乎整个网上购物过程。他们的战略和活动推动业务成果。以至于他们的角色已经从内容网站管理员转变为多渠道产品发现战略家。他们在购买过程中创造的体验对业务有直接影响。首先,让我们看看这个小组的首要任务是什么。
按重要性排列的销售任务
根据 Algolia 最近进行的一项调查,以下是我们客户群中的业务员根据价值和重要性排列的前 7 项任务。不足为奇的是,虽然“物品可查找性”排在首位,但我们还发现,优先级因业务规模和阶段而异,例如,“在全球扩展的同时与本地相关”对 SMB 公司来说不太重要(与企业同行相比,SMB 公司可能不在全球范围内运营)。
Top 7 tasks ranked by value and importance.
相反,他们最常见的挑战是:
- 产品量/品类 创造了新的可扩展性挑战
- 营销能力差 缺乏高级工具或解决方案
- 缺少持续优化的数据
- 重复性/手动任务因 大量产品而恶化
总体来看,销售工作流程分为两大类:自动化和手动。根据我们的调查对象,两者之间的理想比例是大约 70%自动化和 30%手动。对自动化的强调将允许人们专注于更具战略性和/或更复杂的任务。大多数团队认为他们没有达到理想的比例,目前做了太多的手工工作。他们希望实现更多的自动化,但经常发现自己专注于紧迫的日常任务。更具体地说,他们的工作流将是一个混合体,其中手动任务仍然为异常或非典型的实例提供价值,以反映在他们的自动化流程中。
另一个重要的相关维度是创意和数据驱动的活动/策略之间的动态关系。大约 70%的人认为数字销售是一种数据驱动的活动。客户发现,通过使用大数据,他们可以获得最成功的答案来完成上述关键任务,如优化 KPI 等。另一方面,创造力在一些事情上扮演着重要的角色,比如对新信息、类别等的实验进行构思。,建立视觉体验,如页面布局和产品图像,以及其他目标,如建立差异化的品牌形象和竞争优势。
这是一个 艺术与科学的理想融合 根据手头的问题,一个优先于另一个。一家企业零售品牌的实验负责人说:“ 这一切都是为了确保网站是商品化的或风格化的,这样产品才能以一种特定的方式得到推广和视觉展示,从而促进销售和交易 。”
在 Algolia,我们相信这可以通过 智能销售能力 来实现,这些能力利用数据和人工智能的组合力量来构建快速、相关、可扩展和高转化的体验。在本系列的第 2 部分(即将推出!),我们将分享旨在帮助商家取得成功的高性能数字销售解决方案中不可或缺的关键原则!
开发者评估 Algolia 的综合资源列表
你好。如果你在这里,你可能正在评估 Algolia 是否是你试图解决的问题的正确解决方案。您可能正在寻找第三方的真实信息来做到这一点——您的同行对我们技术的观点可以加分。
我们知道你可能想根据除我们之外的任何内容来伪造你的观点,我们鼓励你这样做,☺,但我们仍然希望在这个过程中帮助你!因此,我们在这里参考了我们在互联网上能找到的所有东西——无论是有利的还是不利的——以及我们所有的技术内容(文档、代码交换、客户实施等),我们相信这些可以帮助您对 Algolia 做出自己的判断。
我们希望上市更多可用的资产。如果你发现了什么新的东西,或者我们错过了什么,请 让我们知道 。
说够了,这是清单。
关于阿洛利亚的不请自来的讨论和意见
我们没有问,人们只是分享了他们对 Algolia 的想法。
人们把我们和一些竞争对手相提并论。
**## 主动和被动的 Algolia 评论
任何人都可以随时在这些网站上留下评论。在某些情况下,我们主动联系用户留下评论。
阿果搜索与直播实现
自己评估最终用户体验。
Algolia 文档& Algolia API 文档
评估 Algolia 是否适合您的使用案例和堆栈。
看看你能用阿洛利亚建造什么
自己试试
我们希望在您的评估过程中对您有所帮助。如果您想在此处推荐任何其他资产,请联系我们。更多资源,请访问我们的 开发者中心 。****
新冠肺炎如何加快零售数字化转型
还记得生活 BP(疫情之前)吗?
从电子商务的角度来看,数字事物非常不同。虽然一些网站和 市场 已经接受了先进的数字商务,而其他人在时机成熟时采用了新技术来扩展他们的业务流程,但许多人只拥有相当于数字门面的东西——有吸引力的在线店面,在主页后面有空的虚拟房间。而且对许多消费者来说,实体店和商场仍然是的去处。因此,这是公司集中精力(非数字业务转型)的地方。
沿着 COVID 走过来
谁能忘记 2020 年 3 月?在一个不确定的时期,世界各地的消费者听从了留在家中安全的呼吁,锁定并放弃外出进行“零售治疗”。实体零售业会得重病还是会死于 COVID?
正如我们后来了解到的那样,不确定的时代会催生革命性的变化,事实证明,电子商务中的数字技术尤其如此。消费者被困在家里的一线希望?发现他们仍然可以 做 各种各样的事情 ,比如买菜、 被允许远程工作 ,减少开车,从而帮助 让大自然休息一下 ,并通过从等在线零售商订购令人振奋的装饰来装修他们的生活空间
对于那些在家里发疯的人来说,一切似乎都没有失去。在数字升级方面进行了初步投资的企业进一步加大了提供在线资源的力度,以帮助消费者在持续的危机中恢复正常。许多数字领导者做了一些有见地的事情,如 升级他们的搜索和发现 功能,以更好地满足他们客户的需求。
与此同时,那些在疫情之前没有多少数字化业务的企业,比如那些深深扎根于实体模式的企业,很快就接受了数字颠覆(Gartner definition)的困境。他们注意到了这一点,并在许多情况下开始对数字化转型工具进行快速投资,以避免错过即将到来的数字化转型淘金热。
电子商务销售额开始上升。毕竟,疫情或者没有疫情,人们需要和想要 的东西。 他们中的许多人喜欢(或热爱)购买非必需品和必需品,无论他们只是浏览或查看他们最喜欢的在线零售商的新产品。他们中的许多人甚至更喜欢当他们被困在家里用电脑或移动设备的时候。
……还有变焦的特质
当然,在疫情,人们开始成群结队地购买各种不同的东西,比如上班时穿的漂亮衬衫。他们很大程度上不再购买其他东西(比如裤子,因为没人能看到你穿了什么,或者忘记穿什么,除非你犯了站起来的错误)。
无论如何,似乎现代的疫情,尽管对人类生活具有破坏性,但也可以成为消费者花掉他们因不能旅行而攒下的钱的借口,从而对张开双臂等待他们的精明的零售商来说是一个福音。
据 数字商务 360 ,“电子商务在新冠肺炎来袭之前发展很快。但疫情将更多的美国消费者推到了网上,并推动更多的消费者更多、更频繁地在线消费。”DC360 估计,在过去几年中,疫情通过电子商务获得了约 2180 亿美元的收益。
当你被困在家里时,首要任务是:获得足够的食物并储备足够的食物,这样你就可以养活你的家人。此外,因为你坐立不安或无聊,买一些垃圾食品或酒精?人们使用在线渠道购买大量的食品杂货(当然,如果能找到的话,还会在 TP 上囤积)。毫不奇怪,一年比一年,网上杂货销售额增长了 103%,根据 Adobe 数字经济指数 。好消息,除了那些不幸获得了“COVID 15”磅的人或者那些因拥有太多 快乐时光 而应对紧张局势的人。
这的确是令人着迷的社会心理学数据,不是吗?但是让我们回到疫情时期的零售业。
在家庭经济中,某些行业,如电子产品和家庭装修,可以理解地脱离了图表。而其他板块【旅游、能源】遭遇惨败。对于每个类别中的一些公司来说,他们在疫情开始时的数字化转型工作状态是一个关键因素。对于全球的零售商来说,这无疑是一个变革的时代,无论是好是坏。
砂浆砖的耐久性
对一些人来说,这是一个惊喜,但当亲临现场的购物者消失时,实体零售并不一定会消失。即使在新的数字时代,实体商店也是零售业的一个重要组成部分。根据 杂色傻子 :“你可能认为美国的大部分零售都发生在网上,但事实并非如此。据美国人口普查局(Census Bureau)统计,包括汽车在内的零售总额中,只有约 13%是通过电子商务渠道实现的。
在疫情,实体商店不仅 不会 消失,它已被证明是成功数字化转型的支柱,也是人们可以购物的无数“全渠道”方式之一。消费者可能希望在商店购买或在网上下订单并获得送货上门服务,或者亲自去商店、路边或储物柜取货。然后,他们可能会选择通过邮寄、通过第三方或走进商店来退货。
能够促进所有这些选择的零售商(当然,以经济的方式)会增加他们的市场份额。
一切都好,但数字渠道中仍有相对较大的资金,所以让我们继续关注经济中的这个子集。
一个“历史性的转折点”
这里有一些令人瞠目结舌的信息:根据麦肯锡对全球企业高管的调查,由于新冠肺炎——一个“历史性的转折点”,企业加快了“其客户和供应链互动以及内部运营的数字化进程,时间长达三到四年。数字或数字产品在他们投资组合中的份额以惊人的速度增长了 7 年。”
在 COVID 期间,一些公司敏锐地意识到消费者不断变化的需求,这使它们在盈利能力方面成为更大的赢家。例如,PYMNTS 提到了疫情孤立期间“拿来经济”的兴起,包括食品杂货和家庭必需品。
自从限制放松后,这种趋势在在家生活和工作的人群中愈演愈烈。皮姆茨补充道,“消费者现在认为鼓励他们去实体零售商那里购物的最常见因素是 根本不用去商店;他们想要店内提货和路边送货服务。”提供这些选项来满足或超越客户期望是一项成功的数字化转型计划。
疫情零售业成功的一个例子是 Target,它为消费者提供了多种在线购物和提货的选择,此外,消费者还可以在巨大的商店过道中漫游。《福布斯》指出:“塔吉特的电子商务业务增长比沃尔玛和好市多都要快。你可以在 Target 网站上订购一件商品,然后不用排队就可以在商店里拿起它,开着你的车把它送到你面前,或者让它送货上门。这家零售商还继续致力于简化数字创新,其运营模式反映了一种预测,即在不太遥远的未来,电子商务将成为长期增长的最重要驱动力。
什么是数字转换?
一般来说,“数字化转型”指的是在企业中整合数字组件以促进成功的总体思路。然而,美国职场趋势专家梅丽莎·斯威夫特指出,“数字化转型”这个术语有点问题。它是模糊的,可能会引发争论,并被用作一个总括,以及其他事情。
好了,让我们避开这种模糊的讨论,专注于数字化转型的一个环节: 零售 数字化转型。 问问任何一个从实施成功的零售数字化转型战略中获得回报的商人:潜在的业务成果是不是很棒 还是什么?
更重要的是,在与电子商务相关的数字化转型方面,企业可以做些什么?
数字转型趋势的例子
那么数字化转型的趋势是什么, 您的 后 COVID 数字化战略有哪些可能性?
在做出重大决策之前,第一个合乎逻辑的步骤是与你的利益相关者一起重新构想你所在行业的可能性和独特的商业价值主张。在头脑风暴之后,你可以创建一个客户友好、易于导航的电子商务网站,或者改进你已经有的网站,然后投资 社交媒体广告 来帮助潜在买家访问该网站。并在此基础上提供一些更高级的功能。
都是关于你的客户体验
首先,就像砖头和砂浆一样,记住 一切都是为了你的客户。 另外,你实际上还有另一个客户,你的员工,我们稍后会谈到。
所以回到你的购物顾客。在这样的疯狂时期,关键是确保为他们提供精彩的零售疗法客户体验,这是一次伟大的购物之旅,在他们与你联系的各个方面都大放异彩。
在零售客户眼中,你可以通过哪些方式让你的零售客户之旅更有趣、更有回报、更神奇、更难忘、更值得,从而提高你网站的收入和留存率?
数字化转型和成功的客户体验密不可分。创建无缝的用户体验可能意味着修改您的数据集成工作流以及您的内部系统如何相互关联。例如,当你有一个索引良好、可搜索的数据库,再加上一个 以人工智能为中心的搜索引擎 ,你的购物者可以快速找到他们想要的产品。在他们这么做的过程中,你可以让他们的生活变得更加轻松。
一场不断演进的数字化转型之旅
数字零售商在大流行后(目前)应该做些什么来获得或保持领先地位?值得在大流行后进行网上购物的客户体验的几个要素包括:
提供无接触支付
自疫情以来,企业实施的一个数字化转型项目是在实体店购物时建立非接触式支付。COVID 的世界已经发生了有趣的变化,其中之一是没有人愿意拿着一支带菌的笔或在触摸板上签名,即使它已经过适当的消毒。
无接触支付是显而易见的。精明的零售商决定加入这个项目,跳过实体签名(就像你在网上买东西一样)。当商店或餐馆的顾客可以简单地在他们的移动设备上打开该公司的应用程序,并通过扫描二维码支付时,他们也在实现同样的事情。
通过人工智能使购物个性化
你可能听说过人工智能辅助的 个性化 已经成为在大数据推动的数字零售世界中取得成功的必要条件。这种明智的策略在现代疫情时代变得更加及时。人工智能促进的个性化是成功数字化转型的关键组成部分。
人工智能正大举进军主流数字购物体验。例如,如果你最近碰巧是一名Lands End在线欧洲购物者,你会对这一点有所了解,因为零售商正在使用人工智能来 反映店内体验 。董事总经理 Constanze Freienstein 指出,“如果(顾客)正在寻找一件特定的商品,或者想从我们的网站上转移,我们可以通过根据以前的购买建议类似或匹配的商品来帮助他们了解还有什么。”
在拥抱现代化的过程中,一些零售商更进一步,在购物体验中提供 增强现实 或虚拟现实。例如,如果你在宜家网上购买一件笨重的家具,你可以通过使用该公司的一个应用程序来查看该物品在你的实际空间中会是什么样子,从而避免以后的麻烦。
零售商也在实施智能搜索引擎,帮助购物者轻松找到他们想要购买的商品。关键是 个性化搜索 ,它的智能会注意到人们在搜索什么,例如,向他们显示协调的服装项目。
英国在线运动服装零售商 Gymshark,其 收入在 2020 年达到 5 亿美元 ,是一家发现在其网站上个性化购物体验对扩大其客户群有很大帮助的公司
提供协调的全渠道体验
现在,大多数购物者通常使用不止一种方法来识别、获取和购买他们想要的产品。他们使用各种购物体验入口和出口点。例如,消费者可能在他们的社交媒体订阅源上看到某个产品的广告,去该公司的网站购买,然后决定立即购买,所以他们会去实体店购买(或在路边购买)。
全渠道营销让零售商以更高层次的细节来微观定位这些购物者。 当所有适用的渠道对消费者可用,品牌一致,彼此联系良好,以便给人们带来令人满意的整体购物体验,这就是胜利。
美妆零售商 丝芙兰 是一家拥有全渠道客户体验和最先进的个性化服务的公司。顾客可以通过多种渠道获得无缝集成的零售体验,他们可以远程使用该零售商功能丰富的移动应用程序,也可以在店内查看产品。
设置“环形通道”
你可能已经注意到,自从疫情开始以来,许多零售网站已经增加了“从商店发货”和“送货到商店”选项。无尽的通道是无缝购物体验的概念,让人们开始浏览或搜索网络,并在商店中完成购物,或反过来,创建一个“循环”无尽的通道还消除了实体商店货架空空如也的问题,让人们可以使用移动设备、信息亭或平板电脑订购商品。
令人印象深刻地实施了无尽走道的一家公司是 百思买 ,其管理层注意到了实体电子商务的融合,并积极应对。
通过手机应用提供便捷的访问和优势
由于许多狂热的购物者在外出时会持续使用他们的移动设备,因此全渠道的一个关键要素是提供一个移动应用程序,根据你的商业模式提供任何有意义的功能。如果你想让人们喜欢从你这里买东西,一个好的、高度可用的应用程序是必不可少的。即使你的客户只是在家沙发上冲浪,他们也会很高兴能够快速找到他们想要的东西。例如,如果他们真的带着他们的移动设备在你的实体店闲逛,他们可能仍然在使用你的应用程序来查找商品的评论。
家得宝的 产品定位器 应用程序是另一个一流的全渠道努力的例子。该公司在其网站上解释说,它“就像你购物清单上的全球定位系统”。在手机上,购物者可以立即在网站上搜索他们需要的商品,指定他们当地的商店,并查看该商品是否有货。酷毙了。现在他们要做的就是去仓库,按照 GPS 的指示找到物品。家得宝仍然是一个巨大的、没有人情味的地方,但你可以说,该公司通过提供这种易于喜爱的购物帮助以及其他努力来弥补这一不足。
照顾你的 其他 客户:你的员工
最近你为你的员工做了什么?在后大流行时代,关注他们的需求对于取得成功同样重要。
通过努力改变他们的数字生活,你可能会让他们更喜欢为你工作,因此可能会计划呆得更久。例如,你可以给他们一些伟大的实时数字化转型成功工具,如 Slack 这样的在线交流场所,或者一个经过深思熟虑、可直观搜索的知识库,以帮助他们简化工作。你还可以做得更多:一些公司甚至转而采用每周四天工作制来帮助员工减压。
你也可以给他们灵活的工作地点。你知道吗,2020 年皮尤研究中心 的一项调查发现,71%的受访者在疫情期间在家工作,能够做到这一点是一个游戏改变者。54%的人说他们还想在疫情之后继续在家工作。
因此,如果你是一家真心想取悦员工的零售商,你该如何进行数字化转型呢?
一种选择是采用一种 混合工作 模式,这种模式让员工可以灵活地在某些时间远程工作,而在其他时间进入办公室。
如果员工真的需要亲自到场,需要尽力工作,那更进一步呢?当然,在零售业,完全远程工作对一些员工来说可能有点挑战。另一方面,如果你的销售助理可以从使用混合模式或完全远程模式中受益,那么如果你想吸引和留住最优秀的人才,这是值得考虑的。因为自从疫情让员工在家的客房和地下室工作以来,最优秀的人才经常坚持认为他们仍然可以在家工作(毕竟,他们已经证明了他们可以在家工作好几年了)。
企业家项目 很好地总结了这一点:“对于许多工人来说,远程工作已经成为一种不可协商的职业要求。如果公司取消了远程工作,远程工作的员工甚至可能会寻找另一份工作。在当前的就业市场上,许多雇主都面临着严重的技能短缺,不准备冒险让员工流失。”
一些公司还让他们的零售店员工在等待顾客时,通过与他们在网站上注意到的购物者在线联系,从整理商品中拓展业务。这种做法可以提高转化率和销售佣金(如果适用)。在某些情况下,比如 COVID 再次关闭实体店,这种联系可能完全是远程发生的。
简而言之,在这个不断变化的电子商务环境中,你为员工提供的灵活性越多,你作为一家接受数字化转型的公司的声誉就越好。
精简你的运营效率
分析师认为,后新冠肺炎时代的零售环境已经成熟,可以燃放数字化转型烟花了。疫情迎来了以客户为中心的范式转变,通过拥抱数字化转型的各种原则做出回应的公司正在推动他们的运营,并从新的商业模式中获得丰厚的利润。
如果作为一家在线零售商,你没有使用数据分析和机器学习来为你的主要商业决策提供信息,这是你可以获得重大收益的一个领域。所有类型的数字零售商都在使用人工智能来收集数据驱动的见解和评估趋势。预测分析可以有效地增强您的库存并提高您的效率。你还可以专注于创建一个更好的(数字)供应链,并在任何有意义的地方拥抱自动化,比如在电子邮件活动中以及通过使用社交媒体。
数字化转型外卖
到目前为止,新冠肺炎·疫情已经讽刺地变成了一件对某些企业来说非常健康的事情。
因此,从疫情的角度来看,你的公司如何保持良好状态,并为接下来发生的任何事情做好准备,无论是另一种令人讨厌的 COVID,更多的消费者因为他们在封锁中被宠坏了而要求巨大的全渠道优惠,还是病毒威胁的缓解,导致更多的购物者开始在商场爬行?
不管有没有疫情,升级你的 电子商务网站 搜索功能是一种低成本、高投资回报率的方式,无论发生什么,都可以启动(或继续完善)一个有效的数字化转型框架。
投资 Algolia 搜索和发现技术是获得数字化转型的好处、增强您的业务战略并实现大流行后业务目标的一个好方法。当你准备好了, 我们的团队 期待听到你的数字化转型需求!
语音搜索和电子商务的未来
原文:https://www.algolia.com/blog/ecommerce/the-future-of-ecommerce-and-voice/
世界各地的消费者越来越频繁地以“好吧,谷歌”这句话开始他们的在线体验在过去的几年中,数字语音助手主要用于相对简单的任务,如查看天气、播放歌曲或开灯。然而,这些功能每天都在扩展,业务影响可能是巨大的。
但是随着语音识别技术的进步,语音搜索不再仅仅包括数字助理。人们也开始在移动设备、商店和智能电视上使用语音搜索和其他语音功能。
会话式商务在许多方面都在增长。例如,Apple TV 用户可以对着遥控器说话,同时检索多个应用程序的结果,而不是手动搜索多个流媒体平台来查找特定的节目。零售商也开始在他们的实体店中使用语音搜索,使消费者能够通过对应用程序说话来快速了解产品细节和他们在商店中的位置。
随着在线用户每天在手机、商店和电视上与数字语音助手和语音搜索功能的互动越来越舒适,购物和其他形式的商务将继续向客户所在地转移。即使消费者还没有通过语音搜索进行购买,随着人们开始更经常地使用语音搜索功能来研究和建立与品牌的关系,语音商务将成为日常生活的一部分。
什么是语音商务?
语音商务是允许在线消费者使用他们的声音来探索和购买产品的一组技术和系统。通过允许用户通过更 的对话界面 与品牌互动,商家可以减少传统网站和移动应用的一些摩擦,提供更人性化的体验。
在实体零售中,销售代表提供了一种人际互动,让顾客自然地了解他们可能有兴趣购买的产品。然而,随着电子商务的兴起,这种体验大部分已经丧失,客户只能自己照顾自己。语音商务是一种新颖的方式,通过在计算机系统之上增加一层对话来弥合两者之间的差距。
虽然与电脑对话购买产品听起来可能有些奇怪,但事实上,近十年来,世界各地的消费者一直在与这些类型的系统互动。像苹果的 Siri 或亚马逊的 Alexa 这样的流行语音助手已经 训练我们向我们的设备 提问,就像我们向任何其他人提问一样。随着这成为一种更加正常和被接受的做法,这些公司几乎肯定会试图通过推广购买产品来更好地将这些服务货币化。
虽然语音助手仍然是最受欢迎和最受认可的语音搜索形式,但机会远不止于 Siri 和 Alexa。消费者正在通过语音进行研究并与品牌建立关系,包括在智能手机、智能电视、智能扬声器甚至商店内的移动应用程序中。
随着用户开始以这种新的方式与在线服务互动,电子商务品牌通过这种系统和界面让自己易于访问是非常重要的。仅仅有一个网站和在线广告来吸引用户购买你的产品已经不够了。
语音商务的重要性
数字语音助手预计到 2023 年将上升到 80 亿活跃单位——比 2019 年增加近 2.5 倍。到那时,由这些数字助理产生的语音商务市场预计将达到每年 800 亿美元。未来十年对品牌的影响是惊人的,所有电子商务企业都应该认真考虑。
随着越来越多的消费者通过语音搜索开始他们的购买之旅,浏览不同产品选项和竞争品牌的过程几乎肯定会发生变化。付费植入广告和大品牌可能会主导通用产品搜索,因此较小的企业将不得不重新思考如何获得客户。
虽然语音技术的兴起可能会增加竞争,但它也为各种规模的品牌带来了许多机遇。如果企业可以区分他们的品牌形象,并为他们的客户提供良好的体验,这些语音技术实际上可能会提供新水平的客户忠诚度和参与度。关键是要确保你的竞争对手不会击败你提供这种水平的经验。
语音商务的挑战
语音商务为品牌发展和赢得忠诚客户提供了巨大的机会。
对于较小的组织来说,挑战在于选择合适的语音技术合作伙伴,并以与语音搜索兼容的方式建立您的在线商店(和在线形象)。
对于拥有大量产品目录的大型组织来说,挑战在于以一种语音友好的方式组织大量内容。
但是,无论组织规模或在线目录如何,语音搜索都有一些固有的挑战需要解决。其中一些挑战可以通过语音搜索技术合作伙伴来解决,而其他挑战则需要解决方案提供商和品牌之间的合作。
然而,各种规模的企业都必须解决许多问题,才能让这些系统以可持续、长期的方式运行:
- 自然语言 。语音商务本来就是一个技术难题。它需要高级的 自然语言处理 (NLP)。对于国际业务,这必须用许多不同的语言和方言来完成。
- 隐私顾虑 。鉴于语音商务和自然语言处理需要用户对着他们的设备说话,公司需要向最终用户提供隐私保证。许多人只有在确信该应用程序不会监听所有内容或与第三方分享他们所说的话时,才会使用它。
- 对商家缺乏信任 。除了对技术安全的担忧,还有一个简单的事实:消费者对科技公司失去了信任。语音搜索技术的合作伙伴需要在市场上建立信任,才能完全采用这项技术。使用这种技术的个体企业将不得不弄清楚如何向客户传达他们的政策,以确保他们对收集的信息感到满意,并了解这些信息是如何被使用的。未来几年,我们可能会看到对这些做法的一些监管审查。
- 对 ASR/NLU 缺乏信任 。 自动语音识别(ASR) 和 自然语言理解(NLU) 是语音商务的关键组件,允许数字语音助手分解和理解语言。虽然人们已经习惯了这些系统,但仍有许多人对它们感到不舒服。企业将不得不找出如何训练用户信任这些系统,并减轻公众对他们家中的 【老大哥】设备 的担忧。
前瞻:语音商务的未来
短期来看,电子商务品牌和科技公司面临着诸多挑战。他们需要继续改进他们的自然语言处理技术,让用户习惯于使用它,建立安全管理数据和满足法规要求的系统,并弄清楚产品发现和交易的流程。
这些问题会很快自行解决,因为语音商务是用户与他们喜欢的品牌和网站互动的一种更加自然和个性化的方式。因此,消费者将拥有更直观的在线体验,不再受小屏幕或键盘的束缚。这将为新技术、新系统和新业务带来机遇。
随着所有这些变化,现有的电子商务品牌将需要想出如何接触到客户,无论他们在哪里。要做到这一点,他们需要一个强大的技术合作伙伴,能够为他们提供工具来接触所有这些渠道,而无需大量的定制开发工作或昂贵的技术投资。 通过我们的网上技术交流讲座 了解更多关于为语音搜索的未来做准备,打造卓越语音搜索体验的最佳实践 。
电子商务营销指南
原文:https://www.algolia.com/blog/ecommerce/the-guide-to-e-commerce-merchandising/
实体零售商并不是唯一能够利用产品、服务等的战略布局来促进购买者旅程的零售商。电子商务和在线零售商可以通过在线销售对他们的商店进行数字化管理,以确保关键产品和促销活动得到充分强调。
什么是网络营销?
在线销售或电子商务销售是在网站上构建、组织和管理产品供应的过程,以实现特定的商业或营销目标。这个过程通常包括管理促销、管理搜索结果和测试改进,以引导用户完成他们的客户之旅。
为什么网上销售很重要?
在当今 竞争激烈的电子商务格局 中,营销人员必须为顾客提供独特的购物体验。建立有效和差异化的用户体验不仅能提高转化率,还能创造持久的品牌形象,让顾客长期回头客。
网上销售也有助于企业实现其战略商业目标。营销活动可以通过促销和特别活动直接在网站上实施,您可以突出战略合作伙伴关系,以确保您和您的合作伙伴的成功。
销售流程有助于电子商务企业管理大量不断变化的库存。例如,季节性产品或清仓商品可以战略性地放置和促销,以确保库存及时周转。
4 网上营销策略
在线销售是一个持续不断的迭代过程。这里有四个战略最佳实践,你可以遵循来提高你的努力:
1。聚焦首页
作为从搜索、社交媒体等进入你的电子商务网站的入口,主页必须提供引人入胜的互动体验,以最大限度地降低跳出率,吸引顾客浏览网站。主页应该:
- 讲一个品牌故事。品牌故事有助于吸引顾客,让你在竞争中脱颖而出,并向他们展示为什么他们应该和你一起购物。
- 展示系列产品和特色产品。主页是突出您希望客户参与的机会的绝佳位置。当顾客进入网站时,摆放得当的产品和促销罐会立即抓住他们的注意力。
- 确保主页是可扫描的。这个页面应该提供简洁而有用的信息,让客户可以快速浏览,很好地了解你的情况,以及他们可以在你的网站上做什么或找到什么。
- 包括 CTA和。主页上的行动号召可以鼓励客户采取某些行动。这也为他们提供了一条清晰的途径。
- 加入“社会证明”客户生成的内容(评论、社交媒体照片等)进一步吸引您的客户,并验证您产品的质量和实用性。
- 确保搜索栏可见。通过确保搜索栏易于查找和使用来锁定搜索者。
2。撰写强有力的产品描述
产品描述通常是顾客了解他们感兴趣的产品的第一个地方。你可以把这想象成销售代表在网上向感兴趣的顾客推销产品。
描述应该包含关于产品用途、规格、材料、生产和益处的有用信息。你还应该强调运输和生产时间,特别是如果你提供免费运输。所有这些都应该用与你的品牌声音相匹配的信息性语气来完成,这样客户会感到与你有联系。
3。使用在线视觉营销
在线视觉营销是在网站上战略性地展示视觉和设计元素的过程。有效地实现这一点可以帮助传达品牌形象,验证品牌的合法性,并增加客户的参与度。
网站上使用的照片以及总体设计是这一过程的关键。除了获得高质量的产品图片和通过设计进行思考,重要的是迭代和调整视觉设计网站,以确保它是最有效的。这些变化应该通过 A/B 测试 来衡量对 KPI 的影响。消费者对这些类型的变化很敏感,很难预测对他们行为的影响,因此量化措施可以确保变化产生积极影响。
4。根据电子商务客户数据更新您的销售策略
作为一个在线零售商,你可以有效地 跟踪你的顾客从搜索到购买的每一个举动 。这对于确定销售策略、尝试不同的布局和产品描述、制定未来产品供应策略等都是非常有价值的信息。此外,电子商务网站可以使用社交媒体重定向像素来运行重定向/再营销活动,并收集人口统计信息。
搜索如何推动电子商务的营销努力
搜索日益成为客户购买之旅的入口。然而,许多营销人员没有充分利用搜索,结果他们错过了销售机会。搜索营销(Search merchandising)允许对搜索体验进行管理,以推动业务和营销目标。
这里有一些网站搜索可以用来改善销售流程的有效方法:
- 个性化定制用户体验 。线上和线下营销的一个关键是向顾客提供 个性化 和相关产品。网站搜索允许您在用户搜索时向他们推销特定的产品。如果用户有你的商店的历史,你可以使用过去的购买行为来提供他们更有可能购买的相关内容。
- 推荐同类产品 。当客户在站点搜索界面中查看产品时,这使您能够立即向他们展示其他相关产品。这增加了他们找到想要的产品并最终购买的机会。
- 在搜索结果中显示横幅 。当用户搜索某些查询或查询组时,可以显示自定义横幅。例如,当客户搜索与类别相关的产品时,可以向他们推送特定类别的促销信息。
- 推广特定产品 。出于各种原因,企业通常喜欢促销特定的产品——季节性、节假日、新的产品线等等。有了网站搜索,这些类型的促销可以针对特定的查询或查询组。促销也可以基于用户简档来定制。
- 使用滤镜和刻面 。过滤器和方面允许用户通过产品类别快速缩小搜索范围,方面允许用户基于多个不同的搜索维度来这样做。这些可以通过向客户突出或推销某些类型的产品来构建。
- 针对热门或值得关注的查询 重定向到特定的 URL。当用户搜索您的企业指定为重要的特定产品时,您可以将他们重定向到包含产品和品牌相关内容的页面,以满足他们的需求。这对于与交叉销售和追加销售可能性较高的品牌或商品相关的查询尤其有用。
- 使用自动完成和查询建议 。 自动完成和查询建议 让您不仅可以通过加快搜索过程来提高点击率,还提供了一个将用户推向特定产品的机会。用户在搜索时会主动寻找产品,因此这为引导他们的产品探索之路提供了一个很好的机会。
- 在搜索 中提供文字和视觉建议。包括视觉助手,如产品图片或高亮显示的结果,可以吸引用户对这些产品的注意,并增加他们点击它们的可能性。这有助于在推广产品的页面上获得更多流量。
- 收集并展示客户评论 。顾客评论提供社交证明。然而,他们不必局限于产品页面。当用户搜索时动态显示它们可以快速验证他们正在搜索的产品。
利用出色的网站搜索进行电子商务营销
搜索是在线销售流程的重要组成部分。 观看我们的网络研讨会“ 加速购物车之路 ”,了解如何利用搜索吸引用户并增加销售额。
与 Algolia 首席执行官 Bernadette Nixon 的内幕
原文:https://www.algolia.com/blog/algolia/the-inside-track-with-algolia-ceo-bernadette-nixon/
Adrian Bridgwater 就最近宣布的 D 轮融资采访了 Algolia 首席执行官 Bernadette Nixon。Adrian 是一名专门研究软件、数据和云的科技记者,三十多年来一直在撰写科技行业的文章。
阿德里安·布里奇沃特: 你能给我们透露一点你的背景吗?
伯纳黛特尼克松: 绝对!我真的是那种懂得努力工作,并带着同情心和决心一路向上的人。我喜欢建立企业,但我这样做是出于对这样一个事实的核心认识,即这意味着首先要建立团队。
我早期职业生涯的一部分时间是在英国和瑞士为联合国(UN)从事商业工作,但一次滑雪事故促使我改变了人生计划,我前往美国,在科技领域的商业企业工作。通过在公共部门和私营部门的工作,我认为我看到了生活的两面。这一现实促使我建立了一个我称之为“混合高管团队”的团队,将多样性、能力和包容性放在首位。
我对卓越运营有一种 GSD 式的态度。我也意识到团队的构成自然会随着时间的推移而变化,但我的一个不变的观点是,不仅需要智商,最重要的是情商,这样人们才能有自我意识,有社交能力,最重要的是,有人情味。
Adrian Bridgwater: (根据TechCrunch中对你的任命档案分析)你被认为是一名走向市场的战略家和冠军,这一过程对你在 Algolia 是如何体现的,你对公司以客户为中心的中长期目标是什么?
伯纳黛特·尼克松:是的,你绝对可以把我描述为顾客至上,这是我的工作,我就是这样的人。理解(并满足)每个客户的细微需求是最重要的,这也是我每天工作的主要任务。
但是在这方面——根据你的问题考虑中长期——我坚持采用由外向内的方法,以确保我们不仅仅是将产品推向市场的供应商。太多的公司变得与世隔绝,对市场中出现的真正问题视而不见,而 Algolia 永远不会是那种公司。
我从客户和整个市场的角度看待业务,这意味着将客户问题置于我们产品战略的核心。这迫使我们客观地看待我们自己的产品开发,并设计它不仅解决今天的问题,而且解决明天的问题,以不同于竞争对手的方式
Adrian Bridgwater: 当你只有“电梯销售”的机会时,你如何定义 Algolia 并解释公司的核心技术主张?
**Bernadette Nixon:**Algolia 是一个 API 优先的搜索和发现平台。每个人都可以联想到其中的“搜索”部分,并在脑海中描绘出网站或应用程序中的搜索框。但我们也支持“发现”…该功能在网站或应用程序中提供导航,根据实时预测意图的能力向用户(以及未来可能的智能机器)提供建议。结果是搜索和发现提供了个性化和高度相关的实时动态体验。我们为三种类型的公司这样做:电子商务、SaaS 和大型企业。我想那大约是六层电梯,加上大厅,对吗?
Adrian Bridgwater: 请告诉我们目前在 Algolia 的投资活动,以及该公司目前 22.5 亿美元的估值。
Bernadette Nixon: 我们完成了由 Lone Pine Capital 领投的 1.5 亿美元 D 轮融资。其他投资者包括 Fidelity Management&Research Company LLC、STEADFAST Capital Ventures、Glynn Capital、Twilio,以及现有投资者 Accel、Salesforce Ventures、DAG、Owl Rock 和世界创新实验室。
Adrian Bridgwater: 你当时在寻找新的资金吗?
伯纳黛特·尼克松:不,完全没有,但我们从投资者那里获得了很多投资兴趣,所以即使我们资金充足,不需要钱,那也正是你应该筹资的时候。但是在我们进行融资之前,它被抢先了,我们收到了一些条款清单,这导致我们最近以 22.5 亿美元的事后估值完成了我们的 D 轮融资
Adrian Bridgwater: 考虑到这笔重大投资(这笔投资不是 Algolia 本身直接或最初寻求的),你在哪些方面做得如此正确——为什么这些公司在你身上投资这么多钱——你打算如何处理这笔资金?
Bernadette Nixon: 这可以归结为三件事第一件是增长,这是拥有一个杀手级的 API-first 产品和一个经验丰富的管理团队领导公司的结果。当你关注增长时,市场会根据你的年同比收入增长以及你的净美元留存(NDR)率来看待这一点,净美元留存率是衡量你如何留住和发展客户的一个指标。
投资者告诉我们,我们在这些方面是一流的,所以当他们从外部向你提出这样的事实时,你真的无法反驳,对吗?
Adrian bridg water:Algolia 什么时候会上市?
**Bernadette Nixon:**IPO 可能是我们的未来,有些人会说,我们现在拥有执行这一进程的规模、范围和广度。我们对 IPO 的看法是,作为一家公司,它是我们保持卓越运营的整个旅程中的一个里程碑,而不是一个终极目标。你可以说,我们正朝着“值得上市”的方向努力,但在很大程度上,我们正在跨越这个里程碑
Algolia 出版社: 在你看来,Algolia 的独特优势是什么?
我们是业内唯一一家大规模提供 API 优先平台的公司,这让我们成为了明显的领导者。从第一天开始,我们就通过 SaaS 交付模式进行部署,我们拥有固有的云原生 DNA,这再次让我们在当今的现代开发堆栈中占据了特殊的位置。另外,在大多数其他搜索技术公司依赖 Apache Lucene 算法的地方,我们开发了自己的专有技术;掌控您自己的智能引擎可以提高速度、相关性和灵活性,让我们的客户受益匪浅。
我们在另一方面也很特别……虽然我们的根基是产品导向型增长(PLG)和自助服务模式(这是我去年决定加入 Algolia 的原因之一),但我们也在早期打破了自上而下的销售导向型增长。作为融资的一部分,我们通过与投资者的讨论了解到,这很不寻常,许多来自 PLG 的公司经常难以解决企业销售问题。例如,我们最近与一家大型企业客户达成了一笔超过 350 万美元的 ARR 交易,我们对此感到非常荣幸,并致力于让该客户获得巨大成功。所以我们在顶部和底部都赢了,我们相信这给了我们在市场上不公平的优势。
最后,我们在传统上也与众不同,因为我们成立于法国,并从一开始就和 Y Combinator 一起来到美国,所以我们从第一天起就全球化了。这使我们能够在大约 120 个国家发展一定程度的市场覆盖面和多样性。
Adrian Bridgwater: 在路线图开发方面,你与产品工程团队的合作有多紧密?
Bernadette Nixon: 自去年 5 月加入 Algolia 以来,我一直与我们的联合创始人兼首席技术官朱利安·莱莫因密切合作。我领导了公司新愿景的工作,这使我们从一个单纯专注于搜索的单一产品公司转变为一个拥有 Algolia 预测、搜索和推荐功能的多产品公司。这是朱利安和高管团队其他成员的合作过程。直到上个月,Julien 还是我们的 CTO 和 CPO,但上个月我们聘请了 Bharat Guruprakesh 担任我们的 CPO,因此我们充满活力的二人组现已成为三人组!
阿德里安·布里奇沃特: 随着你进一步扩大公司规模,你希望在多大程度上坚持 Algolia 的联合创始人尼古拉斯·德塞格恩&朱利安·莱莫因的核心价值观和最初愿景?
Bernadette Nixon: 我真的很喜欢 Nico(我这样称呼他)和 Julien 创立公司的核心价值观:勇气、谦逊、关怀、坦诚和信任。它们只是一套很强的原则,我没有改变任何核心价值观。
我唯一详述的是信任基石的一个方面。我们过去常说“赢得信任”,我把它改成了“信任是给予的,不是赢得的,但信任的破坏是一件大事”,因为我认为这表达了现代商业真正的动态本质。
我与新员工的“每周价值观”会议是我一周的亮点之一。但我也是一个实用主义者,我意识到尽管我们的价值观保持不变,但我们作为一家公司的运作方式必须随着规模的扩大而发展。我们正经历着非常高的增长率,这就造成了这样的情况和环境:过去行得通的,今天可能不再行得通。所有这一切意味着,我们将作为一家公司不断发展,同时忠于我们的核心价值观。
Adrian Bridgwater: 您的合作伙伴战略处于什么样的“状态”,您将如何定义出色的合作伙伴体验……它们发生在何时何地?
Bernadette Nixon: 我们的合作伙伴战略是我们解决客户问题使命的关键要素。我们与合作伙伴的合作是进一步扩大我们与大大小小的公司合作的机会,因为他们基于我们的产品来满足他们不断变化的需求和要求。通过与其他软件公司(其中一些现在也是投资者)合作,我们可以进一步扩大我们自己的未来平台,从而使我们的客户受益。和系统集成商的关系是我们关注的另一个领域。
Adrian Bridgwater: 我们故意不询问你关于女性在技术领域的问题,以强调我们应该超越这个讨论——但是你个人对平等、包容和精英管理的态度是什么?
Bernadette Nixon: 我坚信多样性、包容性、精英管理以及最重要的归属感。相反,我不喜欢等级制度或特权制度。这个千年已经过去了大约 20 年,我们应该走得更远。
我之所以强调归属感,是因为如果我们处在一个不认同的环境中,就不可能有归属感,如果我们处在这样的环境中,就不可能把工作做到最好。我直接与所有新员工团队合作(通常在他们加入 Algolia 的几周内),以确保人们知道他们可以提问、质疑、挑战,甚至在需要时大喊大叫。在整个疫情,这可能是一扇虚拟的门,但我的办公室永远是敞开的。
当我在联合国工作时,我们在基于配额的系统内运作。虽然我对配额制度又爱又恨,但它们确实在短期内起到了对抗群体思维的作用,但它们不应该代表或表征当代组织在任何部门或任何行业的长期运作方式。
Adrian Bridgwater: 在当今注重可持续发展的管理世界中,我们必须确保增长出于正确的原因,而不仅仅是为了增长和扩张,对吗?
Bernadette Nixon: 我喜欢这样的想法,一个组织不仅可以是股东的生意,也可以是每个层次的利益相关者的生意,从员工到合作伙伴到客户,再到不是你的客户(现在还不是,或者可能永远不会是)的人,以及其他人。我喜欢 商业圆桌 谈论利益相关者管理的方式。作为一个星球,我们已经发展了很多,所以为了发展而发展业务不应该完全合理,除非有更广泛的使命以某种形式或功能帮助其他人,这就是为什么我们的愿景是为其他人服务,而不是在市场上成为 Algolia # 1-这是愿景的副产品,而不是愿景本身。
知识管理流程的 4 个步骤
原文:https://www.algolia.com/blog/ux/the-knowledge-management-process-4-steps-to-corporate-success/
确保集体知识——智力资本——的保留,无论是作为正式的组织知识还是非正式的技术诀窍,都是很困难的。组织、分析和分享你设法保留的知识会变得更加难以捉摸。
这就是 知识管理 流程工具的用武之地。专注于快速知识检索、 智能搜索功能 ,以及卓越的组织结构和能力,它们对于企业的平稳运行至关重要,在这个大数据时代,可以帮助公司在整体客户满意度方面获得竞争优势。
知识管理流程包括四个步骤,可通过管理计划实施。
一、知识是什么意思?
组织每天都被知识——数据和信息——所淹没。了解不同类型的工作场所知识是很重要的,这样你就可以正确地组织它们,并得到最佳的处理。
三类知识
就组织学习而言,有三种不同的知识类别:
- 显性知识: 可以被记录和共享的信息。员工能够轻松获取和传递显性知识。
- 隐性知识: 即学习到的信息。例如,显式知识可能是案例研究中存在的关于产品的信息。隐性知识是指当你“应用”这些信息(使用知识)时发生的事情,例如在与客户的会面中提及这些信息。
- 隐性知识: 可能难以正式传达给另一个人的信息。例如,在商业环境中,它可能是员工与客户互动的方式的代码,如穿着特定的服装。
好的知识管理意味着更好的效率
有效的知识管理流程可让您轻松访问公司信息,避免在多个数据仓库中搜寻关键信息的需求。良好的信息管理可以大大减少员工挖掘数据所花费的成本高昂、令人沮丧的时间。此外,改进敏感数据(如个人身份信息、PII)的管理有助于防止违反数据合规性法规。
更好、更快、更直观的分享
知识管理系统还促进 员工之间的数据共享 ,帮助员工快速检索信息,加快时间相关流程。遵循知识管理过程有助于团队识别存在哪些知识,以及哪些领域可能由新知识的文档提供服务。
这里有几个知识管理流程示例:
例 1:定位一个重要案例研究
准备就绪后,销售顾问如果需要快速获得特定案例研究以支持潜在客户的产品主张,可以使用您组织的知识库快速访问它。
例 2:使需要的信息可用
同一名顾问可能意识到组织的销售宣传材料没有反映产品或服务的全部投资回报。当她这样做时,她可以与适当的利益相关者一起促进该信息的创建。因此,遵循知识管理流程并使用正确的知识管理工具可以帮助员工在任何需要的地方积累所需的公司知识。
知识管理流程生命周期的步骤
对于考虑知识管理工具以及如何灌输重视公司信息的组织文化的公司来说,工作流程相对容易遵循。以下是关键步骤:
1。知识发现
第一步,知识获取,是关于识别值得保存的知识,以及任何知识缺口和适合知识创造的领域。做出这个决定后,就需要寻找对员工有用的知识。
例如,考虑一名认识到需要更多推荐内容的销售团队成员。他们的销售线索需要投资回报的证明,因此在转换销售线索时,记录案例分析会有所帮助。
2。知识获取
当关键知识被识别时,它可以被捕获、创建、编辑或以其他方式产生以供使用。认识到需要感谢信的销售代表可以以正确的格式制作感谢信,或者要求营销团队制作感谢信。
通过文档,知识变得明确,以一种可访问的格式存在,并且可以被共享。知识管理过程将可能存在于员工头脑中的信息——或者可能在非正式笔记中草草记下的信息——转化为可以在整个企业中使用的有形信息。
3。知识组织与优化
当你已经识别并获取了必要的知识时,它必须被 组织成知识库中的 。
WordPress 是一种常用的内容管理系统,用于建立知识库,市场上还有许多其他好的选择。
您可以像对待数字图书馆一样对待您的知识库,所有内容都用元数据进行索引和标记,以便存储知识和查找文档变得简单。还应该使用正确的工具(如 智能企业搜索 )对其进行优化,以便用户能够以最高效的方式查找和访问资料。
注: 通过分析,你可以跟踪员工如何使用你的知识库。了解哪些文档阅读量最大,哪些文档是员工下一步要浏览的,哪些文档已经过时,可以帮助您的团队做出明智的决策,建立归档,并更专业地组织您的内容。
4。知识分享
知识共享就是交换有价值的信息。拥有一个包含正确内容的经过组织和优化的知识库有助于知识管理过程的最后阶段。
许多组织不遗余力地建立文档管理系统并促进知识转移,无论是跨他们的 内部网 还是其他形式的数据管理,但他们的员工共享知识的能力往往微不足道。为什么?员工可能习惯于旧的方法,或者知识库没有被广泛宣传,或者业务流程没有被更新。
拥有一个没人使用(或知道存在)的知识管理系统就像出版一本没人愿意打开的书。这可能是一部不朽的文学作品,但如果没有读者,它的智慧几乎毫无用处。
经验教训:有了良好的信息知识管理流程,要实现知识管理的好处,必须读取、处理数据,并与能够使用这些数据的团队成员共享。通过协作工具(如 Slack)分享内容可以促进其作为参考材料的传播。
知识是(企业)力量
分享知识可确保员工获得所需的数据,以尽可能最好的方式完成工作。一个经过组织和优化的有效知识库使得共享信息和利用信息成为可能。
作为成功的知识管理解决方案,Algolia 的 搜索工具 值得一看;它可以优化您的知识库,以便进行一流的知识发现。凭借无与伦比的速度和人工智能(AI)能力,您可以提供卓越的搜索。我们的软件将员工与他们需要的知识联系起来,促进信息吸收,并为您提供关于您的用户如何与您的数据交互的见解。
想要建立自己的知识库,并追求使用正确的知识管理软件产生强大知识资产的潜在更好指标?联系我们的 产品专家 了解我们著名的 搜索和发现平台 以及我们如何帮助您实施非凡的知识管理战略。
语义搜索的过去、现在和未来
原文:https://www.algolia.com/blog/ai/the-past-present-and-future-of-semantic-search/
设计搜索解决方案的技术人员开始听到很多关于语义搜索的说法。但是,什么语义搜索呢?最先进的语义搜索是什么样子的呢?
语义搜索没有单一的技术。这就像术语“AI”——一个营销术语,可以指几乎任何与机器学习相关的东西。1999 年,蒂姆·伯纳斯·李是最早将 引入语义网的概念 的人之一。从那以后,“语义搜索”这个术语就指的是查询处理中使用的许多不同的技术。
在这篇文章中,我将解释语义搜索,并描述一些用于深化查询处理的主要技术。我将探讨这些技术的来源、工作原理和发展方向。
剧透警告 :无论你是在电子商务网站还是企业内部网添加搜索,语义搜索技术 与更传统的关键词搜索 相结合,可以提供最完整、最相关的结果。
简史查询了解
关键词搜索及统计排名:从 20 世纪 70 年代开始
关键词搜索已经存在很长时间了,它的工作方式很像一本书后面的索引。关键字搜索引擎创建所有文档中所有单词的索引,并根据简单的匹配算法提供结果。
为了提高搜索相关性和结果排名,搜索引擎引入了词统计,如 TF-IDF 和 BM25。 统计搜索查看一个词在文档中的逆频率(IDF)与一个词的术语频率(TF)来确定其重要性。例如,像“the”和“or”这样的停用词在任何地方都频繁出现,而像“牙刷”或“水”这样的词出现的频率较低,也就是说,它们更不常见。词频可以作为一个指标来表示有多重要,或者 相关, 文档是
基于频率的统计非常初级,依赖于精确匹配。用 Lucene APIs 构建的关键字搜索算法今天在广泛的应用中仍然依赖于这些统计公式——实现起来非常简单和快速。然而,为了提高准确性,客户必须创建同义词库,添加规则,使用额外的元数据或关键字,或者采取其他类型的变通办法。
NLP 简介:始于 1980 年代
统计排名有用,但还不够;有太多的用例中单词与查询不完全匹配。例如,单复数术语,动词变化(现在时与过去时,现在分词,等等。)、粘合或复合语言等等。
这导致了自然语言处理(NLP)功能的发展,以帮助管理语言的复杂性。这些过程包括:
*** 词干化: 词干化是通过去除前缀和后缀,将单词转换成其基本形式的过程。这减少了资源使用并提高了计算能力。例如,“change”和“changing”转换为词根形式“chang”。
- :与词干化类似,词汇化将单词转化为其基本(或根)形式。它通过考虑每个单词的上下文和形态学基础来做到这一点。比如“changed”转换为“change”,或者“is”转换为“be”。需要注意的一件重要事情是,词干化和词汇化都是用来将单词还原为原始格式的,所以大多数项目都使用其中的一种。
*** 分词 :在英语和许多基于拉丁语的语言中, 空格 是单词分隔符(或单词分隔符)的一个很好的近似,尽管由于每种语言如何组合和分隔单词部分的可变性 ,这个概念具有局限性。 比如很多英语复合名词都是不定写的(ice box = ice-box = icebox)。但是 空格 并不是所有书写的文字中都有的,没有它,分词就成了难题。没有琐碎的分词过程的语言包括汉语和日语,其中句子而不是单词被定界;泰语和老挝语,其中短语和句子而不是单词被定界;和越南语,其中音节而不是单词被定界。
- 语音标注 :语音标注,也叫词性(PoS)标注,是一种将单词列表分类为名词、动词、形容词等的方法。,以便更准确地处理查询。它着眼于一个句子中单词之间的关系 来提高准确性 通过更清楚地“识别”句子的意思。
Image via Medium
- 实体提取 :实体提取是自然语言处理的另一项技术,对于语音搜索变得尤为重要。顾名思义,实体抽取是一种识别查询中不同元素的方法——人、地点、日期、频率、数量等。—帮助机器“理解”它包含的信息。实体提取对于克服简单的关键字搜索限制是一个非常好的解决方案,但是,像下面讨论的本体论和知识图一样,它只对特定的领域和查询有效。
本体和知识图:从 2005 年开始
开发对查询的更好的语义理解的另一种方法是使用本体和知识图。知识图表示不同元素——概念、对象、事件——之间的关系。本体定义了每个元素及其属性。
总之,这种语义方法试图表现不同的概念以及它们之间的联系。例如,谷歌的 使用了一个知识图 来不仅匹配搜索查询中的单词,还寻找查询所描述的实体。这是一种绕过关键字搜索限制的方法。
然而,在实践中,知识图和本体方法很难扩展或移植到不同的主题,主题很快就会过时——运动队、世界领袖,甚至产品属性。你为一个领域建立的知识图和本体不会轻易转移到下一个领域。虽然您可以为一个主题构建高度健壮的解决方案,但对于需要不同专业领域的不同主题,它可能会完全失败。只有包括谷歌在内的几家大公司能够自动开发知识图表。大多数其他公司不得不手工制作。
自动完成:2004 年开始
Autocomplete 是一个非常有用的语义搜索工具,可以有效地帮助客户更快地找到结果。最流行的例子是 Google 在 2004 年底发布了自动完成。
自动完成是一种尝试预测搜索词以帮助客户输入查询的方法。它还提供上下文建议,帮助用户避免打字错误,并根据用户的位置或偏好过滤内容。这些建议由一系列算法生成,这些算法依赖于多种机器学习和自然语言处理算法和模型来生成匹配,从简单的前缀字符串开始,以识别、匹配和预测未完成的搜索查询的结果。
为了使自动完成有效地工作,搜索引擎必须有大量的数据来处理所有的会话,此外,它还必须能够根据每个用户的行为、以前的搜索、地理位置和其他属性来预测他们的搜索词。
预测自动完成现在已经成为任何现代的、有竞争力的搜索引擎的预期特征。
AI 排名:2007 年起
像 BM25 这样的早期关键词概率模型已经使用术语频率建立了相关性,如上所述。人工智能排名向前迈出了一大步,纳入了用户的反馈,以进一步确定相关性。这方面的一个例子是 强化学习 。强化学习的基本思想很简单:使用反馈来强化积极的结果。强化学习不是很少进行大的改变,而是经常进行增量改变。这样做有很多好处,比如持续改进结果和更快地显现其他潜在结果。此外,通过滚动实验,表现不佳的结果往往会很快消失。
和 Autocomplete 一样,强化学习需要大量数据才能返回有意义的结果;没有重要的历史性能数据,这是一个糟糕的解决方案。此外,强化学习往往对搜索结果排名非常好,但它并不能帮助识别记录,它仍然依赖于关键字和语言资源来识别匹配记录。
这就是矢量发挥作用的地方。
矢量搜索:从 2013 年开始
矢量表示的文字是 非常古老的 。它的理论根源可以追溯到 20 世纪 50 年代,在过去的几十年里有几个关键的进展。我们也看到了 2013 年开始的伟大创新:基于利用大型训练集的神经网络的新模型(特别是谷歌在 2018 年推出的 BERT)已经设定了标准。
Image via Google. This diagram shows vector dimensions along simple axises. In practice, there can be thousands of dimensions in use.
什么是矢量搜索?最简单地说,这是一种找到具有相似特征的相关对象的方法。匹配是通过检测索引中对象之间的语义关系的机器学习模型来完成的。向量可以有上千种维度,但是为了简化,我们可以用一个三维图(上图)来可视化向量。向量搜索可以连接单词之间的关系,相似的向量聚集在一起。像“国王”、“女王”和“皇室”这样的词会聚集在一起,像“跑”、“快步”和“慢跑”这样的词也会聚集在一起。
几乎任何对象都可以嵌入和矢量化——文本、图像、视频、音乐等。早期的向量模型使用单词作为维度;每一个不同的单词都是一个维度,值就是单词的个数,这太简单了。随着 潜在语义分析(LSA) 和潜在语义索引(LSI)的出现,这种情况发生了变化,潜在语义索引通过减少维度的数量来分析文档和它们包含的术语之间的关系。今天,由矢量引擎驱动的较新的人工智能模型能够快速检索高维空间中的信息。
这已经改变了游戏规则。 更新的基于向量的解决方案现在可以知道“雪”、“冷”和“滑雪”是相关的概念。这一进步成就了上面提到的一些其他技术——如实体提取、本体、知识图等。—过时。
那么,为什么矢量不能驱动所有的搜索呢?主要有两个原因。一个原因是它们扩展速度慢且成本高。另一个原因是,在一些重要的用例中,向量搜索返回的结果质量不如简单查询。
在网上,消费者期待即时的搜索结果( 亚马逊 和 谷歌 都对消费者行为滞后 100 毫秒的负面结果进行了研究)。你可以加速和扩展向量传递,但是它很贵,而且在速度上永远比不上关键词搜索。
对于某些查询,向量也不能提供与关键字搜索相同的相关性。在单字查询和精确品牌匹配查询上,关键字搜索仍然比矢量搜索效果更好。向量更适合多词查询、概念搜索、问题和其他更复杂的查询类型。例如,当你在关键词引擎上查询“阿迪达斯”时,默认情况下你只会看到阿迪达斯品牌。向量引擎中的默认行为是让所有鞋品牌用于“阿迪达斯”查询(例如,耐克、彪马、阿迪达斯等)。)因为都在同一个概念空间。关键词搜索仍然能提供更好的——也更容易解释(和调整)的——结果。
怎样才能两全其美?这就是混合搜索的用武之地。
混合搜索:2022 年及以后
混合搜索是一种将全文关键词搜索引擎和矢量搜索引擎结合成单一 API 的新方法。
对于同一个查询,同时运行关键字和矢量引擎非常复杂。一些公司选择通过顺序运行这些过程来规避复杂性;他们运行关键字搜索,然后,如果没有达到某个相关性阈值,运行向量搜索。这样做有很多糟糕的权衡——速度、准确性和训练每个模型的有限能力。
真正的混合搜索是不一样的。通过将全文关键词搜索和向量搜索结合到单个查询中,客户可以快速获得更准确的结果。当然,为了让矢量搜索像关键词搜索一样快,它需要搜索引擎在不增加疯狂成本的情况下提升性能。对于今天的大多数矢量引擎来说,这是不可能的。
这就是从 Search.io 获得的新技术neural search 能够提供帮助的地方。Neuralsearch 是唯一真正的混合搜索服务之一,无论规模或查询吞吐量如何,都可以提供个位数毫秒级的查询时间。
这是通过使用 散列 技术实现的,该技术将向量减少到文件大小的 1/10,并且不需要专门的硬件或 GPU 来扩展。我不会在这里详细介绍哈希是如何工作的——我们有一整篇关于 向量 vs 哈希 的博客文章——但是我要说我们已经看到了一些令人难以置信的结果…
- 与当今最快的关键词搜索不相上下
- 由于同时利用了语义和关键词检索,明显更加准确
- 由于我们在 UI 中添加了一个一键式教学模块,重新培训异常变得更加容易——很快会有更多相关信息!
未来十年
很难预测下一个 10 年的搜索会是什么样子,但几乎可以肯定的是,它将由混合搜索功能组成——结合全文关键词和矢量搜索技术——这比任何一种单独的技术都更准确。
如果你是一名负责实现语义搜索的技术领导者,我希望我已经帮助你了解了语义技术的一些主要里程碑,我们现在的状况,以及未来的技术发展状况。****
网站搜索的(几乎)终极指南
原文:https://www.algolia.com/blog/product/the-ultimate-guide-to-site-search/
我们认为说我们是网站搜索专家是公平的。我们拥有大大小小 9000 多家客户,包括一些世界顶级品牌,如安德玛、鳄鱼、Medium 和 Twitch。
那么,为什么我们称之为几乎终极指南呢?
首先,因为网站搜索是一个复杂的话题。搜索 UX 由研究公司和机构研究。相关性本身就是一个值得一书的主题。这样的例子不胜枚举。
其次,搜索是由各种各样的人构建和使用的,从开发人员和产品技术人员到销售人员和数字团队。为不同的搜索用户和专家写一本指南看起来会非常不同。
最后,搜索特定于您的行业、用例以及项目的复杂性。我们一直在为电子商务巨头提供开发者文档搜索,以及高度丰富和个性化的体验。为每个用例编写一个指南可能会有好几本书。
然而,这篇文章的目的是给你一个基本的工具包,让你能够:
1)了解网站搜索最重要的方面
2)准备好评估您正在使用或计划使用的工具,以及
3)确定有机会改进您的网站搜索及其结果的领域
说到这里,让我们开始吧。
我们所说的站点搜索是什么意思?
首先,让我们确定术语。
我们的工作定义是:网站搜索是一种功能,它使用户能够快速、有针对性地搜索网站或应用程序的内容或产品目录。
十多年来,谷歌一直在以极快的速度提供超相关的 as-you-type 网站搜索建议 (也称为查询建议)。我们对这种功能已经习以为常,甚至不再注意到它。
在另一个不同的使用案例中,亚马逊彻底改变了我们的购物方式。为了提供对他们庞大目录的访问,他们建立了一个快速自动建议下拉菜单和强大的动态细化。
我们在这里关注的正是这种类型的搜索:它将人们与产品、内容和关键的结构化数据联系起来。它快速、可靠,可在多个平台上工作,并提供高度相关的结果。
在 Algolia,我们通常称之为“搜索”,并有一个单独的基于爬虫的解决方案,称为站点搜索。人们也称之为站内搜索、内部站点搜索、自定义内部搜索、网站搜索,但为了清楚起见,我们将使用最常用和众所周知的术语:“站点搜索”。
伟大站点搜索的要素
“伟大”对网站搜索意味着什么?
您可以为用户提供最精致的站点搜索体验,但是这种体验昂贵且难以构建,更难维护、优化和分析。
另一方面,您可以应用一个开箱即用的搜索工具,它非常容易实现、使用和修改,但是会使用户体验变得暗淡,或者更糟,变得不相关。
优秀的网站搜索应该对最终用户来说是相关的、丰富的和吸引人的,但对企业来说也是易用的、敏捷的和高效的。
以下是优秀网站搜索的关键要素
对用户而言:
- 相关性:只显示最相关的结果
- **速度:**现代用户不等待;他们反弹
- 大 UX/UI: 让它丰富、美丽、迷人
- **发现功能:**用户可以从中获得阅读或购买的灵感
- **全渠道可用性:**用户可以在任何设备上找到他们需要的东西
- **个性化:**让用户感到被了解、被理解和高效
对于企业而言:
- **分析:**这样你就可以最大化业务成果
- **销售/促销能力:**这样你就可以控制你的产品
- 对开发者和非技术用户的易用性
站点搜索相关性
出色的数字体验与高搜索相关性最直接相关。无论你提供的是产品、新闻、课程还是食谱,你越善于确定用户的意图并为他们提供相关的结果,用户体验就越好。人工智能在现代关联策略中起着关键作用。
语篇关联性
产品的名称、品牌、描述中的关键词——我们称之为属性——构成了文本相关性。以下是一些与文本相关的元素:
允许输入错误:即使用户拼错了一个单词或使用了停用词(the、and、at、with…),也能正确理解用户的意图。
同义词:向用户提供一个同义词结果(例如,当他们输入“夹克”时,一件皮大衣)。这包括前缀搜索(如果您的用户搜索裤子,那么搜索“p”、“pa”、“pan”应该显示“pants”和“pants”的结果)。
复数:确保复数被考虑在内(搜索“暖脚器”会显示暖脚器)。
业务相关性
为了创造良好的用户体验,为用户提供他们最有可能采取行动的内容或产品是非常重要的。您可以使用季节性、受欢迎程度或点击率等业务指标来调整相关性,还可以使用站点搜索来推广和过滤项目。
定期调整和优化
定期评估调整相关性的机会非常重要。转到搜索分析查看以下内容的结果:
1)您最常用的搜索
2)具有高点击位置的搜索(例如,最受欢迎的项目在位置 6 而不是 1)
3)没有结果的最受欢迎的搜索
通过这种方式,您可以识别没有为用户提供正确结果的搜索,然后调整您的相关性。定期调整搜索很重要,因为用户的需求和搜索模式会随着时间而变化。当你的网站内容或产品目录有较大变化时,做 18 也很重要。
伟大的 UX/UI
在一个理想的世界里,你的大多数客户会在第一次尝试时找到他们想要的东西,并且它会出现在前三个搜索结果中。但是如果他们被迫继续寻找,不满将会抬头(随之而来的是,跳出率和网站废弃率的增加)。
让您的用户能够找到他们想要的东西,并以直观的方式进行提炼,这是充分利用您的搜索的关键。以下是方法。
显示第一次击键的结果
就像在真实的对话中一样,让最终用户感觉到 UI 对他们的意图和查询做出了反应是很重要的。不要等到第二次或第三次击键才返回结果!
即打即搜的体验鼓励用户输入两倍的搜索词,这反过来会产生更多相关的搜索结果。
【T2
显示并突出显示可搜索的属性
假设你的顾客正在搜索你的目录寻找舒适的家居服,并寻找用氨纶制成的物品。如果你只是简单地显示含有氨纶的衣服的结果,但是用户不明白为什么这些结果会出现,他们可能会认为他们遇到了搜索错误,并失望地放弃你的网站。这就是为什么显示和突出显示可搜索的属性总是最佳实践,在这种情况下,在结果中突出显示“spandex”。
使用联合搜索
联合搜索让你可以向用户展示你创建的所有优秀内容。用户的查询可以显示您的数字财产上任何产品或内容目录的结果。看看 PubNub 如何让他们的用户从不同的内容来源发现相关的结果:电子书、博客、文档、解决方案。
https://www . algolia . com/doc/guides/solutions/gallery/federated-search/
T7T9 个性化
考虑一下这个:
像亚马逊和网飞这样的在线巨头已经把个性化的搜索和发现体验变成了必须。但是在开始个性化之路之前,了解你的用户、他们的需求和信号是至关重要的。
定义你的产品或内容的哪些属性对个性化最重要:品牌、颜色、产品类型、尺寸、作者、它们的组合……有时重要的是你的客户的购买历史,有时是他们的品牌亲和力。
决定什么样的用户操作对个性化最重要:点击“添加到购物车”比用户打开产品页面更有意义吗?
使用 A/B 测试评估您的个性化策略对您的搜索指标的影响。假设您想要基于两个视图(例如,用户是否看到了产品页面或登录页面)和点击(用户点击了什么)来个性化搜索结果。A/B 测试这一策略,看看它是否会对您的搜索指标产生积极影响。然后,作为下一个测试,您可能会测试基于转换数据的个性化结果,比如当用户向购物车添加商品或购买商品、观看视频或阅读文章等。
**迭代!**无论你实施什么策略来改善用户体验,一定要做好测试、调整和迭代的计划。第一次几乎不可能把所有事情都做对,所以迭代对于从搜索中获得实际的商业结果是必不可少的。
全渠道搜索
客户之旅从搜索开始。随着全球超过 38 亿互联网用户在网上搜索任何东西,伟大的搜索不仅必须以即时的方式满足用户的意图,而且必须在用户发现自己的任何地方:无论是在他们的手机、平板电脑还是笔记本电脑上。
移动搜索
打造卓越的全渠道搜索始于移动。用户在移动中,时间更紧迫,容易被通知分散注意力,所以他们在你的应用上的体验必须尽可能完美和无摩擦。
然而,移动带来了独特的挑战,从更小的屏幕到连接挑战。这里有一些克服它们的建议——你可以在这本电子书中找到更多。
- 让你的搜索栏突出且位置恰当:
- 除了 1-2 个“丰富”的搜索结果(有几个属性和一张图片),一个很好的选择是显示查询建议:用户可能已经想到的完整查询。
充分利用设备功能。
尽可能使用:
- 钱包/Apple Pay/Google Pay,而不是要求用户输入信用卡号码
- GPS 来预填地址
- 生物传感器,而不是询问密码
- 用于输入的语音、语音转文本和图像
所有这些都减少了摩擦,提供了更好的用户体验。
了解 Lacoste 如何利用网站搜索将移动转化率提高 62% 。
语音搜索
直到最近,消费者不得不在键盘或屏幕前与品牌建立关系并做出购买决定。起点总是一个搜索框。
但今天,对话式搜索——用户与技术互动,并以自然对话的形式获得回应——成为上下文相关和个性化互动的渠道,包括搜索和发现。
语音搜索影响到每个拥有网站、手机或语音应用的人。
这为人类如何与品牌和企业互动开辟了一个新的可能性世界。然而,与传统的文本搜索相比,成功的语音搜索更具挑战性:
- 语音查询比基于关键字的搜索更复杂;用户通过自然语言使用更丰富的词汇。
- 对于纯语音界面,您只能向用户返回一个结果,这需要更高的相关性。
- 结果必须以消费者看来的思维速度交付,模仿自然语言对话的速度和风格。
现代搜索和发现技术必须应对这些挑战,以确保每种终端用户体验不仅实用,而且令人愉快。
了解 WW(前 Weight Watchers)如何使用语音搜索来增强用户的数字体验。
搜索,可以,但是发现呢?
用户通常会访问您的网站或其他数字资产,以便:
- 搜索,努力找到他们想要的东西..某一品牌、颜色和尺寸的一条牛仔裤),或者
- 浏览,可能想要得到某样东西,但不确定是什么(例如,一套商务休闲装,可能包括一条牛仔裤)。
您应该允许用户从搜索或导航开始,然后通过利用其他策略进一步细化他们的结果,例如在用户执行搜索后提供方面,或者使方面可搜索:
换句话说,你应该为他们提供统一的搜索和发现体验。
搜索分析
应该对网站搜索进行衡量,并将其作为发展业务的杠杆。定义 KPI,然后分析你的搜索,这是从你的网站搜索中获取价值的关键的第一步。输入搜索分析。
搜索分析应该让你能够跟踪用户的每一次搜索:他们得到的结果,没有结果,“空”的结果,等等。通过将用户的搜索分解成流行搜索、点击位置、“无结果”数量和过滤器使用等指标,它可以帮助您对用户的行为进行建模。
【T2
搜索分析将让你更客观地思考如何构建你的产品数据,以及如何配置你的排名和相关性。
您将看到您的产品是否得到了正确的描述或表示,正确的产品是否出现在您的搜索结果中,以及根据搜索结果,您是否有太多的一种产品而没有足够的另一种产品。
推销你的产品,推广你的内容
您的业务团队可以使您的搜索结果策略与您的目录、收入目标、促销活动和营销策略保持一致。例如,您可以:
方便开发者和企业用户使用
在每一次出色的用户搜索体验背后,都有忙碌的团队:开发或实施、维护搜索技术的开发人员,以及拥有搜索数据并希望深入了解这些数据的业务团队(产品经理、业务员、电子商务营销人员和全渠道策略师)。
- 开发人员希望解决方案能够跨平台和设备轻松实现和维护,同时保持对微调、发展和创新的控制。
- 业务利益相关者希望了解并调整用户体验,而不必了解背后的技术,也不需要依赖 IT/开发人员来做出改变。
伟大的网站搜索意味着平衡两者的需求。
想充分利用你的网站搜索吗?
让您的业务团队(数字战略家、产品经理、业务员、营销人员和内容编辑)能够管理和优化您的搜索。首先,他们是为你的产品或内容定义增长策略的人。其次,他们最直接负责投资回报和改善业务成果。最后但并非最不重要的一点是,这将释放宝贵的 IT/开发团队时间,用于改善用户体验。
总之…
虽然一开始考虑网站搜索的所有这些方面可能会让人不知所措,但请记住,它们可以按照对您的业务和带宽有意义的顺序分阶段解决。把它看作一个容易的成功路线图:每一次迭代都将有助于更快乐的用户和更好的业务结果。它的美妙之处在于,通过网站搜索,一个可以直接转化为另一个。
如果你想知道你的网站搜索在所有这些元素中处于什么位置,我们有一个简单、免费的自助式搜索评分器。
请不要犹豫给我们这个帖子的反馈和建议:hey@algolia.com。
开发者关系的何人、何事、何地、何时和为何
原文:https://www.algolia.com/blog/algolia/the-who-what-where-when-and-whys-of-developer-relations/
2018 年 9 月,我坐在巴黎一个公园的长椅上,旁边坐着一位和蔼的老太太。问题是,我不会说法语,她也不会说英语。不管怎样,我们试图进行一次谈话。当她谈到我只能猜测她的孙子们有多棒时,我问自己:我是怎么走到这一步的?
今天,我是一名开发者拥护者。在过去的生活中,我是一名软件工程师。如果你允许的话,我会告诉你我在过去几个月里学到了什么,并分享一些可能对你有帮助的信息。
谁是开发商关系?
你!我!所有人!这就是开发商关系让我措手不及的地方。任何人都可以参与倡导社区的过程。事实上,如果你渴望成为一名官方的开发者拥护者,我认为最好的开始时间是… 现在!找到你感兴趣的项目,和/或你有兴趣接触的观众,并进行互动!
什么是开发者关系?
这是我问过自己也问过别人的问题,每个人回来都有不同的答案。问题是,开发者关系对不同的人来说意味着很多不同的东西。这个角色很大程度上依赖于你工作的产品或项目、你团队的氛围、公司的主动性,最重要的是,你所服务的社区的动态。
换句话说,我认为开发人员宣传/关系/布道就是发现并交付最有效的方法来支持开发人员社区。
开发商关系在哪里?
那么开发者关系在更大的技术生态系统中处于什么位置呢?广义地说,开发者拥护者是比传统工程师更接近市场营销的工程师。一种可视化开发倡导者职责的方法看起来有点像这样:
对于对公开演讲、写内容(比如这个博客!)并且对支持开发人员更感兴趣,可以考虑离开工程城,进入营销领域,在那里他们的技能可以得到更好的发挥。开发者关系的另一个很好的类比类似于超人和克拉克·肯特之间的关系。开发倡导者可以过着工程师的生活,但是经常被要求转换到超人模式,去参加会议或者承担更广泛的创造性责任。
什么时候是开发者关系?
据我所知,开发者福音始于 20 世纪 80 年代的苹果公司,创始人是迈克·博伊奇。从那时起,这个职业就一直在发展,并且随着技术的发展而发展,因为你提倡技术!这在今天是一个非常令人兴奋的领域,因为开发者关系给了你很多机会去学习新工具,结识新朋友,并通过公开演讲、写作、阅读,当然还有编码来发挥你的创造力。
Brandon West 在这里有一个关于 DevRel 历史的精彩演讲。
为什么是开发者关系?
最重要的问题是为什么。*为什么是开发者关系?*关于“为什么”的问题在于它是极其动态的。没有两个人会有相同的“为什么”,因为没有两个人有相同的投入和动机。在组织层面,这变得更加复杂。所以,请允许我告诉你我自己的“为什么”,希望能帮你找到你的。
让我们回到几个月前我坐的那张长椅上。我以前从未去过巴黎,作为一名软件工程师,我一直感到不满足。我喜欢这份工作解决问题的一面,但我觉得缺少了一些东西。我想要一个能让我变得多才多艺的角色,去尝试许多不同的事情,接触来自世界各地的不同的人。我想拥有一份能让我教很多东西,甚至学到更多东西的职业。当我坐在那张长椅上的时候,我:
- 我去了伦敦的一个会议,了解了文档中的移情作用
- 与三个不同的工程团队坐在一起,为他们每天面临的 GitHub 问题出谋划策,尽可能做出最好的产品
- 参加与其他组织的合作会议,集思广益,寻找增强开发人员体验的创造性方法
- 学到了很多营销知识,特别是向不同受众讲述故事的微妙之处,以及品牌一致性的重要性,并帮助为巴黎的开发者活动设计了标语
- 看了史奇雷克斯在拉斯维加斯 AWS re:Invent 的表演
- 使用和学习 Algolia API 编写任意数量的演示应用程序
- 编辑社区贡献者的博客,讨论我们试图向他们的读者传达什么价值
- 从终身贡献者那里了解开源
- 与才华横溢的人建立了无数的联系,激励我学习新的想法
- 为我们办公室的工程师与城市中的其他人建立了一个联系框架
- 为公司内部的人建立了一个内部交流思想的渠道
- 帮助人们构建他们的 Algolia 实现
- 我参加过多次会议,在那里我可以和其他开发者直接交流
还有更多!成为一名开发者倡导者很有趣,但绝不容易。我非常感谢过去几个月我所做的一切,我对接下来的几个月更加兴奋。
一个变革的时代,一个展望
原文:https://www.algolia.com/blog/algolia/time-of-transformation-look-ahead/
对于 Algolia 来说,2018 年带来了超乎寻常的快节奏发展和创新。我们已经看到企业如何看待搜索和发现的持续变化趋势:它不是交易性的一次性在线交互的工具,而是新一代鼓舞人心的个性化体验的一部分,使用户保持参与并回来获得更多。
Forrester 告诉我们,“医疗保健、零售、金融服务和其他行业的数字业务领导者 必须掌握网站搜索的市场力量和选项——否则会危及 他们在这些高优先级新兴业务领域的投资的预期投资回报率。”在互联网零售商的首次 网站搜索和关键绩效指标调查中, 88%的受访者表示推进他们的产品搜索和发现战略很重要 。 最重要的是,这是我们从 客户 那里得到的反馈:搜索和发现必须加快用户参与度,提高 KPI。
进入新的一年,以下是 Algolia 如何应对这些市场发展和客户反馈的综述。
2018:更有影响力的一年发布
我们清楚地听到,我们需要更加清晰地强调我们为企业整体创造的价值。我们在 2018 年的发展(这里是对我们公司发展势头的快速总结这里是)很大程度上专注于这一反馈。 这一年,我们构建了一系列工具来增强我们核心 API 的功能,旨在成为一套全面的解决方案,为特定和确切的业务需求提供定制、组合和优化的可能性。
我们致力于对业务 KPI 有直接影响的功能,如电子商务的转换率或媒体的现场时间。2018 年,我们发布了 A/B 测试 和 点击和转换分析 :这些功能有史以来第一次让企业了解和衡量其搜索策略的变化对关键绩效指标的影响。我们还推出了新版本的 个性化 ,通过根据用户之前的行为动态显示用户更可能感兴趣的内容和对象,解决了“一刀切”方法的问题。
我们从先进组织那里了解到,他们面向用户的内容通常位于由不同团队管理的不同系统中,这增加了依赖这些内容的项目的复杂性和成本,包括站点搜索和发现。这就是我们推出 Algolia 定制爬虫的原因,它消除了复杂且成本高昂的内部项目管理需求,并加快了价值实现。像 LegalZoom 这样的客户已经从这个解决方案中受益。
“我们意识到搜索应该是 LegalZoom 企业的核心竞争力,我们将 Algolia 视为创收产品。”
Mrinal Murari,工具团队领导/高级软件工程师
继续关注我们的最终用户,我们重新设计了我们的仪表板,既现代化了用户界面,又提高了基于用户反馈的可查找性。我们的新文档关注于用例,而不仅仅是特性:我们为找到一种全新的方式来构建信息并使其更容易被发现而感到自豪。
因此,我们的发展势头持续加速,2500 多家新客户加入我们,其中包括普罗旺斯欧舒丹、世界野生动物基金会、Amplitude Analytics、PayPal、PubNub 和 Rent the Runway。在他们的帮助下,我们学到了很多关于如何处理关键业务话题的知识。
2019:架构数字商业的未来
我们将继续提供高度相关、可靠且快速的搜索和发现体验,并根据客户的特定业务需求定制我们的产品。与此同时,我们希望帮助公司认识到将搜索整合到他们的商业战略中的更大好处。
这对我们 2019 年的产品意味着什么? 随着我们客户需求的发展,Algolia 将帮助提供鼓舞人心的个性化体验,不仅满足用户需求,还能预测用户需求。我们将围绕以下三个方面开展工作:
1)独特的人工智能搜索方法
人工智能对于自动化一个非常具体和复杂的问题,比如搜索,是非常棒的。作为一个拥有超过 6,500 个生产客户的托管搜索解决方案,我们可以学习他们的配置,我们在解决这个问题上处于非常独特的地位。我们正在构建人工智能,通过利用来自我们各种产品配置的匿名聚合信息,主动帮助每个客户进行更智能的搜索。
但是人工智能不是银弹,也不是完美的系统。我们只在“白盒方法”中使用它,在这种方法中,我们可以向用户提供结果的透明度和控制权,并让他们手动覆盖特定的元素。这种方法对于相关性这样的复杂问题至关重要。
2)对话式搜索
在过去的十年里,我们已经看到人们搜索方式的巨大变化。最新的重大转变是对话式搜索,我们已经在一些助手用例中进行了工作,并帮助我们的客户将语音添加到他们的移动存在中。
3)继续打造市场上最直观的搜索技术
除了我们对开发人员体验的高度关注,我们还在扩展我们的仪表板,以确保所有业务用户——产品经理、电子商务业务员、媒体内容经理等。—让他们需要的信息触手可及。
我们一直致力于识别并消除任何及所有最终用户的不满。随着语音搜索的出现,我们可以预见,随着技术变得更加无形和直观,最终用户对搜索的失望将会消失。
新包装&定价
我们在 2018 年的定价侧重于底层托管搜索 API 基础设施,这与我们向客户提供的结果没有直接联系。现在,我们很高兴 推出新的套餐 ,通过将您支付的价格与您的搜索量更紧密地结合起来,更好地满足客户的需求和我们提供的价值。
我们的新开发人员计划有助于从免费社区开始启动项目,我们的付费启动和专业计划可根据您的规模提供批量折扣。我们的企业计划具有最高级别的功能、安全性和支持,可在您的旅程生命周期中随着您的需求而扩展,并增加了功能&。有了这些新的定价包,Algolia 可以与您的组织实现的任何增长水平相匹配。
如果你现在是 Algolia 的顾客,并且对你的计划感到满意,那太好了!你可以无限期地保持现有的计划。我们支持您第一次注册我们的服务时所做的承诺,并将让您决定什么最适合您的发展。
我们将这种对我们计划的重新思考视为我们产品的下一次发展:更好地为您的用户和您的公司提供价值。
我们对沟通、细节和反馈的关注依然不变:与您的产品专家交谈,发送电子邮件至hey@algolia.com,关注新的一年更多令人兴奋的发展。
最佳和最先进的搜索和发现体验
今天的网上消费者品味高雅。在预测他们期望的数字体验时,自满不是你的朋友。因此,即使您已经为 Algolia 打下了良好的基础,提供了易用性和相关性,您还可以增加更多价值。我们开发解决方案,侦察趋势,并探索新的使用案例,以帮助我们的客户领先,而不是落后。我们很高兴能继续与您分享我们的发现。
开始吧,探索这六种见解如何帮助你从 Algolia 获得最大价值。然后 从那些在各个行业取得成功的 Algolia 客户那里获得灵感 。
1.交付他们想要的结果,甚至更多
我们 估计 电子商务公司可以通过提供卓越的用户体验来提高 30%的转化率。如果你的网站没有交付,访问者可能会反弹,并把他们的业务转移到其他地方。
那么,你如何确保你的网站能够交付成果呢?检查这些 7 个伟大的网站搜索 UI 的例子,并考虑你可以优化什么。
2.这(完全)是私人的
根据 Instapage 的 统计,74%的客户在内容没有个性化时会感到沮丧。埃森哲表示,绝大多数消费者“更有可能选择那些认可、记住并向他们提供相关优惠和推荐的品牌”。
迪卡侬新加坡 了解这一点的重要性:在实施我们的个性化功能后,他们的转化率增加了 50%。学习如何使 个性化 你的网站体验为用户和 从不同的公司获得灵感 关于他们如何利用个性化。
3.让数据填补空白
你的客户不会总是在聊天、离职调查或采访中清晰地表达他们的需求,因此快速准确地解读他们数字行为的信号至关重要。永远不要忽视他们在寻找什么,或者从他们如何在你的网站上搜索中收集到的见解。
从技术角度来看,搜索分析,以及点击和转化跟踪,可以帮助你更客观地思考如何构建你的产品数据,配置你的排名和相关性。它们还可以引导您使用更高级的 API 设置来改善用户的搜索体验。
对于业务团队来说,分析可以帮助您了解并确保您的用户能够找到他们正在搜索的内容。查看这个大师班,了解如何使用 Algolia Analytics 来 提高相关性并提供更好的内容 。
https://www.youtube.com/embed/aNBhABWe1nU
视频
4.随着强大的(人工智能)能力而来的是巨大的责任
人工智能支持的推荐已经成为成功的零售和媒体体验不可或缺的一部分。然而,为了提供高质量的消费级搜索,推动可衡量的商业结果,公司需要一种全面的人工智能方法。这并不容易,所以我们建立了 一个人工智能算法家族 来解决最重要的搜索问题。
在零售商 Staples Canada 通过 Algolia 利用人工智能的力量之后,他们看到了两位数的转化率增长,现在他们 65%的问题都通过构建同义词自动解决了。了解 他们是如何做到的 并观看关于我们的 人工智能功能燃料转换 的网络研讨会。
5.强烈推荐
你知道当你推荐的东西很受欢迎时那种令人愉快的感觉吗?这就是我们希望您对客户的感受。个性化推荐系统可以推荐与人们相关的商品,使他们更有可能购买他们觉得有吸引力的商品。
有了 Algolia 的推荐,Gymshark在黑色星期五,新用户的订单率增加了 150%,同时成功处理了极端的网站流量。看看 Algolia 推荐 如何用少至 6 行代码实现:
https://www.youtube.com/embed/XEfFCJ5_uBI
视频
6.充分利用 Algolia 搜索
如果您选择了 Algolia 作为您的搜索和发现解决方案,我们希望确保您的投资获得最大回报。利用这些 7 种方法,扩展您使用 Algolia 构建的搜索体验并最大化您的投资回报,从而从 Algolia 搜索中获得更多收益 。
https://www.youtube.com/embed/A64YUQloITE
视频
准备好进一步提升您的搜索体验了吗?立即联系您的客户代表或 联系我们 。
突出流行产品如何增加销售额
哪些类型的小众产品——如——是本周社交媒体上最具影响力的运动产品?
新款 iPhone 出来了吗?
Google Trends为“泰勒斯威夫特”展示了哪些统计数据?
最酷的新款空气炸锅、shapewear 文胸、宠物用品、环保护肤品、徒步背包、姿势矫正器、手机小工具有哪些?
你能在你最喜欢的电子商务商店的主页上抢到一件当季流行商品,在它售罄之前,甚至在更广泛的谷歌搜索中也找不到它吗?
从电子产品到家居装饰再到收藏品,总有一些必须购买或流行的利基产品——通常是由影响者营销推动的——每个人都在谈论并放入他们的在线商店购物车(或在凌晨 4 点排队,在实体店争夺)。无论是最新的健身追踪器模型还是迎合所有身材类型的太阳裙,潮流商品——当前时间段的热卖品——都在不断地让特定的消费者群体陷入狂热。
趋势项目,稳健收益
最酷的新款空气炸锅、shapewear 胸罩、宠物产品、环保护肤品、日间徒步旅行背包、姿势矫正器、维生素或补充剂、手机小工具是什么?
对于一个渴望一切都是最好的,而且是即时的社会来说,潮流产品是一个狂热的焦点。如果你是一名电子商务企业高管,你肯定会想记下来。因为当你在网上销售时,在你的网站或手机应用程序上突出热门产品,就投资回报率而言,可能会像你的客户一样大获全胜,因为他们需要不断购买酷的东西来提升他们的自尊心。
趋势商品通过在你的主页上显示流行商品或畅销商品(或商品属性)来补充其他以商品为中心的商品推荐模式,购物者可以很容易地注意到它们并引起兴趣。这也是一种吸引人们注意与季节相关的畅销产品类型的方式——无论是 5 月的背心还是 11 月的派克大衣。
如何利用潮流产品提升你的商品销售
好消息:Statista 表示,到 2023 年,美国的网上购物收入预计将超过 1 万亿美元。如果你是店主或电子商务经理,这意味着你的目标受众中有大量的销售机会。
您如何确保将趋势产品推荐作为成功的电子商务平台战略的一部分?这里有一些网上商务的想法
激励你的移动用户
智能手机是电子商务如此火爆的一个微小但强大的原因。
例如,你知道在时装业,移动设备占了网上销售的大部分(根据 SaleCycle 的数据,66%)吗?
由于多渠道营销,忙碌的消费者有多种方式完成与零售商的交易。部分由于疫情的限制,他们现在可以在网上订购并在商店提货。他们可以在商店里浏览,然后在谷歌购物上进行价格比较后从竞争对手那里订购。而且,他们可以在附近可信赖的手机上轻松开始或完成伟大产品的整个购物过程。
假设一位购物者爱上了她在几个谷歌广告中看到的一件商品——一双靴子,现在它正在她最喜欢的社交媒体网站上流行。
她跑到零售商的商场里试穿。然后,她拿出手机,在搜索引擎中键入品牌和款式名称,并打开产品详情页面,在那里她可以阅读顾客评论,观看如何为不同服装搭配的快速教程,并确保它们真的足够时尚,足以让她投资购买。如果这些靴子碰巧在她那里缺货,她可以通过零售商的移动应用程序订购。售出。
也就是 如果——而且是一个很大的如果——卖家的手机 app 体验从头到尾都不在话下。
不幸的是,一些零售商并不专注于实现(或保持)移动交易的完美,因此这可能是一个问题。没有一流的,无故障的移动体验,你的转换可能会受到影响。关键是能够以一种易于看到、有吸引力的方式向您的移动用户介绍流行产品,邀请他们探索新的和受欢迎的产品,以至于没有什么可以阻止他们去掏他们的虚拟钱包。
在搜索框下面列出热门查询
你网站的搜索框下面有一大片空白区域吗?如果是的话,我们有一个建议:好好利用它。
我们的客户它的成功技巧之一是:在搜索框下面,当有人开始输入时,会显示其他人一直在搜索的热门项目。这是一个显而易见的方法:利用搜索框下面的空白空间做一些对你的底线有潜在帮助的事情。
以下是 Birchbox 的建议:
凸显久经考验的人气
你有没有在亚马逊上搜索一件商品,调出一堆搜索结果,被大量的选择所淹没,然后,作为这种反应的结果,你发现自己被明显高质量的商品或被称为“亚马逊的选择”的版本所吸引?
也许真的只是伪装成推荐的偷偷摸摸的推广。但你认为它必须成为潮流,亚马逊才会认可它,所以管它呢。尤其是当你时间紧迫,并且现在绝对需要这个东西的时候。被适时告知某样东西可能是其类别中的赢家,可以产生一种近乎催眠的效果,说服你盲目地点击添加到购物车或立即购买。
作为零售商,你可以像亚马逊一样,使用徽章或醒目的文字来突出你的“选择”和顾客喜爱的商品。在在线市场中,Etsy 是做得很好的一个网站;它惊呼“买家在胡言乱语!”关于各种卖家的物品。
除了表示潮流产品,对于多样性,您可以关注您的:
- 获得大量赞的物品
- 新产品
- 虚拟购物人群购买的“流行”商品
- 社交媒体关注的项目(“在抖音上看到的…”)
- 受欢迎的选择(从技术上讲,可能只在一部分人中受欢迎)
- 低库存商品
- 流行属性(例如,流行产品类型)
- 缺货商品现已售完
- 最高评分项目(根据其星级)
- 有热情推荐的物品
- 畅销书(有或没有显示销量,而不是根据标签,如下所述)
涵盖所有准搜索词
即使你的网站搜索质量非常好,它也不一定总能提供给人们需要的搜索结果,因为他们输入了“错误的”搜索词,让你的搜索引擎无法理解。
例如,假设有人在英国搜索一款流行的浅灰色服装——慢跑者。如果他们在一家美国网站上做这件事,这家网站销售运动裤和紧身裤,但其搜索引擎从未引入过短语“慢跑者”,他们可能不会出现任何结果。这么快就找到一条运动裤。
解决办法?关键词优化。您可以添加“慢跑者”的备用标题属性,并添加慢跑者的同义词。另外,您可以使用一个颜色属性,其中包括欧洲拼写 grey 和美国 gray。
指向正面评论
很大一部分人觉得有必要在购买前阅读顾客诚实的在线评论,如果他们通过做一些产品研究来减少犯错的可能性,他们为什么不呢?人们喜欢考虑他人的意见,以获得充分的信息并确认他们的购买。无论你是在购买廉价的美容产品、车载电话支架还是昂贵的智能手表,在决定某样东西是否值得你的血汗钱时,有什么比真诚的积极评论更有洞察力的呢?
为此,让你的用户发布评论、评级,甚至是他们自己对正在使用的产品的照片被认为是明智的。然后,当评论非常好时,你可以简单地用醒目的徽章指出这一点,这些徽章表示趋势级别的荣誉,如“我们最受欢迎的”或“最受客户喜爱的”
推荐热门项目下面“没有搜索结果”
当有人进行搜索并得到令人失望的“对不起,没有结果”类型的消息时,你不必让他们感到烦躁,并可能去他们可能有更好搜索成功的地方。相反,你仍然可以通过 推荐 其他热门项目来激起他们的兴趣。
以下是 NBC 网站的做法:
或者,你可以突出热门类别,而不是指出热门商品,就像 RealReal 网站上的布局一样:
在搜索框下方插入趋势查询建议
另一种吸引购物者注意热门商品的方式是,配置搜索功能,当他们输入的词语相似时,将它们作为建议查询显示出来。当然,这不是一个“流行趋势”列表,但它可以达到同样的目的,将人们引向已知的想要的物品。
易贝汽车公司是这样做的:
在你的主页上高亮显示热门内容
在电子商务网站(和应用程序)的所有位置中,你的主页是人们最希望看到你的流行产品展示的第一位置,在那里,他们对随机购物想法的影响比较开放,然后才开始寻找他们来网站的目的。
这意味着全力以赴推销你传统上很酷的商品是值得的。你可以按产品类别对它们进行分组,或者说得更笼统一些。
你如何最有效地让你的访问者看看你有什么流行趋势?
不要使用诸如“你可能会喜欢这个”这样温和的鼓励性语言,要确保你的趋势项标签表明这些项目实际上急需查看。毕竟,趋势意味着令人激动,而不仅仅是你闲暇时点击收听的日常美食。
如你所知,A/B 测试总是很聪明,但这里有一些趋势项目的标签创意:
- 秋季绝佳(冬季绝佳,春季绝佳,夏季惊艳……)
- 当前趋势
- 什么是热门?
- 我们的订户喜欢……
- 必备行头
- 今日状元
- 我们最畅销的产品
- 在社交媒体平台上炙手可热(带有帖子链接)
- 新的和现在的
- 热门商品的大减价
- 我们的十大新趋势
有趣的事实:当谈到趋势时,跳过“畅销书”这个标签是个好主意,这个标签更好地用于表示在更长的一段时间内畅销的畅销商品。 “畅销产品”并不能传达你想要的刺激潮流的即时性。
指定一个类别内的流行趋势
什么颜色的棒球帽卖完了?某自行车品牌的哪些车型最受买家欢迎?
当顾客锁定一个类别时,他们会很高兴地看到你也提供了那个小地方的流行趋势的细节。你可以用流行的尺码、风格、刚上市的商品、人们评价最高的商品来表示流行趋势——任何你认为值得一提的特定类别的特征。
确保你正在摇摆搜索和过滤
热门商品引人注目,但它们并不是吸引那些在你的网站上寻找酷东西的潜在买家的唯一途径。一些购物者根本不关心需求量大的最新最棒的东西;他们特别专注于寻找他们想要的东西,即使它绝对没有趋势,并且主搜索查询的搜索量很低。所以,不要忽视你可以帮助目标市场购物者的其他方法。
你知道吗,43%的网站访问者到达后会直接进入搜索框(Forrester )?这意味着有效的搜索和商品过滤应该永远是你的网上销售策略的主要部分。请记住定期检查您的搜索功能,以确保它的行为符合您的预期,热门搜索不会给用户“没有结果”的消息,并且您没有阻止轻松转换的关键字标签故障。
Algolia 的趋势项如何工作
我们的趋势商品模型在您的产品目录中寻找根据转化事件最近人气上升的商品。趋势可以是全球性的,例如,从您的整个产品目录中提取。它们也可以在特定的方面或类别中,例如,DIY 景观照明(例如,太阳能 LED 灯)。
为了确定指数中每条记录的“趋势性”,我们查看了过去几天每项记录的转换事件总数,以及转换事件数量随时间的变化。然后,我们的模型为目录中的每个项目分配一个分数,或者是全局的,或者是在一个特定的方面值内。
随大流
谁是趋势产品创意领域的趋势?那应该是阿尔戈利亚。
现在就联系我们 ,了解正确的 趋势项目 功能如何改变您的网站性能。当你能够有效地突出显示热门商品时,你就离奖励转化为高利润率的电子商务体验更近了一步。
通过可搜索的全公司数据访问组织知识
组织购买、构建和使用软件的方式正在发生变化。
首先,我们有本地技术。组织购买软件并部署自己的基础设施。然后是云技术和软件即服务(SaaS)。云代表了一个巨大的飞跃。破旧的服务器堆栈时代已经结束。供应商可以向他们的客户提供始终如一的完美服务。
但是云生态系统并不完美。绝大多数工具都是孤立的。它们存在于自己的生态系统中,锁定内容和组织知识。它创造了一个不同的知识管理工具的马赛克,而不是一个内聚的系统。组织 可以接受这样的技术堆栈,但是这造成了低效率和巨大的维护负担。
例如,假设您想要显示上一季度的财务报告。你可能需要搜索大量不同的系统,比如云存储、财务报告和 CRM。这是一种低效的内容搜索方式。
但是还有一个更严重的问题:发现。
除非你在一个非常小的公司工作,否则你不可能了解每一个系统、工具和服务。如果你不知道你的财务团队使用一个独立的会计平台,那么你就不会在里面搜索内容。在这种情况下,分散的后端系统不仅会降低您的速度,还会阻止您发现内容。
谢天谢地,变化来了。
2020 年初,Gartner 的四位研究人员发表了一篇关于未来应用的 论文 。他们提出了一个新想法:可组合企业。
他们写道:“一个可组合的企业是一个交付业务成果并适应业务变化步伐的组织。”。“它通过组装和组合打包的业务功能(PBC)来实现这一点。PBC 是已经购买或开发的应用程序构建模块。”
换句话说,组织不再购买功能狭窄的工具,而是获取“构建模块”,并组合它们来构建他们所需要的东西。
考虑一下新冠肺炎疫情早期的热情好客。由于大多数酒吧和餐馆被禁止在室内为顾客服务,他们不得不转向路边收集和递送。有多少餐厅网站平台有这种功能?很少——如果有的话。
有了可组合企业,公司就不会被他们平台的默认功能所束缚。他们可以将灵活的构建模块组合在一起,以令人难以置信的速度推出新功能。
这种购买、构建和使用软件的新方式可能会改变组织使用技术的方式。没有什么比内部搜索和发现更真实的了。
一搜。多个后端系统。
现在,你拥有的每一个知识管理系统都有自己的内置搜索功能——有些很好,有些很糟糕,有些介于两者之间。可组合企业意味着我们可以抛弃那些可变的组件,投资于一个专用的搜索引擎。
专用于搜索和发现的独立组件集中了数据。实践中是什么样的?想想标准操作规程(sop)。不同的职能团队往往有不同的内部维基偏好。设计师喜欢 concept,开发者喜欢 Confluence,营销人员使用 Google Drive,等等。有了 Algolia 这样的专用搜索引擎,这些后台系统可以将数据的子集推送到集中的接触点。这些数据是可搜索的和多样化的,这意味着它是结构化的和无模式的。
如果营销人员想要了解更多关于他们公司的软件开发生命周期(SDLC)的信息,而不是通过无数的内部维基进行搜索,他们可以进入这个全系统搜索界面,并搜索 SDLC。 从公司所有后端系统中提取的结果将显示营销人员正在寻找的精确信息(摘要、报告、PDF 等。)或者到后端系统上的内容片段的链接。
把它想象成谷歌式的内部体验。它将整个公司的数据呈现出来,为您提供丰富的历史知识。您可以看到这是如何解决我们之前描述的两个问题的:搜索效率低下和发现障碍。它搜索 一切— 甚至你不知道存在的数据源。但这不仅仅是地毯式搜索。
作为集中化的一部分,前端(终端用户所看到的)通常是联合的,提供多种视图、过滤器和不同内容的切片。因为这个可搜索层是完全 API 驱动和可组合的,所以您可以替换、重构、改进和扩展它。不像谷歌,你完全拥有搜索算法。它没有被锁在黑盒子里。相反,您可以访问、编辑和操作它的内部工作。
解锁组织知识
我们仍处于搜索和发现的发展初期。不久前,搜索还是一个功能复选框:你的网站有搜索还是没有?但现在,各家公司都开始重视搜索 和 应用的广度。我们一次又一次地看到“啊哈”的时刻。
我们的一个客户是一家时装零售商,他将整个产品目录索引保存在一个可组合的搜索工具中,并在他们的电子商务网站上提供了令人惊叹的搜索体验。但接着他们又问:“这个产品信息还能怎么用?”他们意识到销售代表能够访问公司范围内的产品数据会非常有用,因此他们开发了一个允许他们搜索目录的应用程序。
假设一名顾客去我们客户的商店购买一款新手袋。通过访问其所有内部数据,销售代表现在可以就可用的面料、尺寸和风格提出建议——不仅是在特定的商店,还包括邻近的商店。
或者假设一位顾客在去机场的路上,包的带子突然断了。支持代理可以查找当地商店的库存,并在他们到达时等待替换。突然间,他们将通常被视为成本中心的支持变成了创收渠道。
全公司可搜索数据最令人兴奋的是 机会 。
我们将 Algolia 打造成了无头产品——前端和后端都是如此——这使得它具有灵活性和可塑性。组织可以按照自己的意愿部署可组合构建块。这正是我们的服装零售商客户所做的。没有人告诉他们为销售代表创建一个应用程序。他们采用了这项技术,进行了试验,并自己创造了这项功能。随着技术的传播,越来越多的公司经历他们的“啊哈”时刻,我们迫不及待地想看看他们创造了什么。
如何在工作时间为兼职项目腾出时间
原文:https://www.algolia.com/blog/engineering/unlock-time-side-projects-working-hours/
Algolia 是一家快速扩张的公司:当我在 2017 年 8 月加入时,我们大约有 120 人,到我写这篇文章时,我们已经增长到 300 人。我们在世界不同的地方有很多办公室,这意味着不同的时区,所以很容易感到失落,与彼此的日常生活脱节。这对新员工来说尤其如此。这可能属于我所在的内部工具团队的范围,因为我们的任务是提高生产力和内部沟通。我们想创造一些东西来“欺骗”距离,让人们感觉他们更像是属于一个公司。
我们首先想到的是一个循环播放一周活动的电视新闻屏幕:人们的生日、招聘纪念日、新员工、活动和聚会、候选人现场面试、职位空缺以及时区——集中公司一周的亮点似乎是帮助文化升级工作的一个好步骤。
现在每个办公室都安装了屏幕!
这个项目花了 10 天时间才完成,从手动更新谷歌幻灯片到全自动解决方案 today.algolia.com。然而,我们不得不面对的挑战是为它腾出时间,而我们的产品路线图已经相当雄心勃勃。当你没有工作时间的时候,这里有一些关于如何开展兼职项目的建议。
从概念证明(POC)到路线图
第一步是验证项目的附加值。我花了几分钟在谷歌幻灯片上建立了一个幻灯片平台,上面有生日和本周的事件,每周五下午还会更新一些。这都是手动操作,但电视屏幕在我们的巴黎办公室得到了积极的关注,使得几周后自动操作成为合法的。
为此,我需要释放一些我没有的工作时间,因为这个项目完全偏离了路线图。这个策略是在我空闲的时候建立一个 POC,并把它展示给内部工具团队的经理兼技术主管 Baptiste Coquelle。它只不过是一个 API,处理数据并证明我们可以自动化一切,使它成为一次性项目,将维护时间减少到零。由于该项目对 Algolia 的文化意义重大,并且已经得到了良好的规划和控制,这是一个双赢的局面,并使 Baptiste 明显地得到了验证。
优化生产时间
尽管我的经理同意给这个项目一些时间,但仍然有很多事情要做。Algolia 的设计师与许多团队合作,通常有很多事情要做。我和设计师 Nicolas Meuzard 谈过这个项目。他对此印象深刻,并希望做出贡献。为了防止这个兼职项目占用他的时间,我们需要快速工作,快速发货。我们使用了一些策略来优化我们的协作,减少来回奔波的次数。
铺路
第一步是给 Nicolas 构建 UI 所需的所有信息。为此,我使用 Google Slides 并在每个屏幕上创建一个页面,写下 API 返回的简单数据模式,并为特定的视图逻辑添加一些注释。这是在关于项目目标和全球形式的一些快速聊天之后——那里不需要其他文件,因为大局对我们两个都足够清楚。
重用 UI 元素
Nicolas 重新使用了我们以前一起做的内部工具的布局,使它成为下一个项目将依赖的内部设计系统的第一步。主网格是相同的,我们从营销网站的全球设计系统中获取颜色和字体,只留下一些 UI 元素来定制和组装,以构建最终的 UI。
任职值
在 Algolia,我们使用 Sketch 来设计 ui,尽管我对它有足够的信心,但它仍然不是开发人员工作的最佳选择。尽管 Sketch 有一些不错的导出特性,但它们仍然离我们很近,很快就会增加构建完整样式表的延迟。
Zeplin 被标榜为“设计师和开发人员之间的终极协作工具”,它让我可以访问所有的值,如边距和填充,元素之间的距离,以及与字体相关的度量,这些都可以在右窗格中一目了然地看到。它还导入和计算本地草图文件,使其无缝集成到 UI 设计人员的工作流中。在我这边,我现在完全自主地构建 UI。使用泽普林的决定是显而易见的。
处理更正和反馈
正如任何涉及设计的项目一样,最初的模型和实际版本之间存在差距。电视屏幕的颜色校准不同于电脑屏幕的颜色校准,我们在 Algolia 有不同型号的电视屏幕,所以我们必须解决对比度问题,使它们看起来都很好。纵横比也不一致,所以我们必须重新定位一些元素并创建一些新的响应规则。人们不能正确地阅读我们的第一个分页,所以我们也必须迭代。再添加一些像这样的小细节,你很快就会在发布前有两个星期的额外延迟(特别是因为我们没有全职工作)。
因此,我们决定一次性收集所有的修复和反馈。为此,我在桥上坐了一整天,这是我们巴黎办公室的主要房间,屏幕就在这里,所有员工都来这里喝咖啡休息。许多人带着小小的反馈自然而然地来到我这里。
一天结束时,我和尼古拉斯在屏幕前坐了半个小时,实时调整小问题。第二天,他把设计的最后一次迭代发给了我,我在旅途中实现了它。它看起来像这样:
为副项目解锁时间提示
以下是我在不影响计划项目的情况下,在紧迫的时间期限内完成附带项目的最佳建议:
- 展示对公司的价值。创建世界上最简单的概念验证,以围绕项目制造轰动和刺激。
- 制定一个好的计划和一个简单的时间表,让你的团队和你的经理更容易同意。
- 预见和你一起工作的其他人的需求和限制。知道他们需要在繁忙的工作时间之外抽出时间。提前与他们交谈,获得他们的认同。
- 使用简单的工具,使你能够从其他专业人员(在我的例子中,是我们的设计师)那里接管部分项目。
- 实时沟通和修复,而不是异步。
- 了解项目需要什么,去掉不必要的步骤。在我们的情况下,这意味着没有测试,因为它不是一个面向客户的生产应用程序,或者没有广泛的响应,因为它只适用于电视屏幕。
早餐吃文化攻略
这个项目在 Algolia 可行的另一个原因是内部工具团队比其他开发团队有更少的约束,这使得我们更容易变得敏捷。我们也没有技术上的限制,所以我们可以选择我们最擅长的语言和库。
Algolia 非常重视信任和所有权,鼓励人们从事与公司相关的兼职项目。然而,我们知道并不是所有的公司或团队,甚至时间框架都支持这样的计划。我曾经在一家服务公司工作,那里没有副业文化,因为每一个工作时间都需要被证明是合理的。然而,我仍然设法处理一些内部项目:我在空闲时间预测并准备了一个 POC,以最终获得 CTO 的批准,并腾出工作时间来完善它们。如果你能证明这对公司有价值,而且事情可以轻松完成,同时不影响你的日常工作,你就有可能成功。
Algolia 如何使用人工智能提供更智能的搜索
原文:https://www.algolia.com/blog/ai/using-ai-to-deliver-smarter-search/
人工智能是 Algolia 战略的重要组成部分。我们不断投资于人工智能,以增强和扩展我们现有的经过战斗考验的解决方案,解决搜索中最复杂的问题。每年有 1 万亿次搜索,每天有六分之一的网络用户和 9,000 多名客户,我们可以访问强大的数据集,使我们能够开发市场上最全面的智能自动化功能套件,同时保持我们严格的数据隐私政策。
为什么 AI 在搜索中很难
搜索是一个复杂的问题,也是一项重要的业务优势。正如《相关搜索》(Relevant search)一书的作者、著名的相关性专家道格·特恩布尔(Doug Turnbull)所说:“提供真正相关的搜索体验一直难以实现,如果不是大多数组织的一个关键盲点的话。”即使是消费级搜索的市场领导者,如网飞和亚马逊 也在努力用他们的人工智能栈 优化和调整他们的搜索结果。
建立伟大的搜索引擎需要公司通过解决多个问题来发展他们的相关性:
- 干净的结构化数据。 搜索数据——通常是大量的数据——在用作搜索输入之前需要被索引和清理。例如,产品可能缺少某些“属性”,如颜色或材料,或者描述混乱,需要进行组织和结构化,以便搜索引擎能够识别它们。自定义代码和 AI 可以用来从算法上解决这个问题,从而节省大量的时间和资源。
- 用户意图检测。人类以“杂乱”的方式进行搜索:我们使用不同的同义词来描述同一件事(“红裤子”代表“红裤子”),我们打错别字(“咕咕”代表“烹饪”),并且提出问题,而不是键入或说出干净的搜索术语。此外,我们说不同的语言,有各自的特点,如很长的单词或不带空格的单词。这就是自然语言处理(NLP)的用武之地,NLP 是人工智能的一个分支,帮助阅读、理解和理解人类语言。
- 成绩排名(和重新排名)。 一旦搜索引擎“理解”了用户的意图,它就需要返回经过排序的结果,这样用户就能感觉到它们与自己的查询最相关。 单独的排名公式 是一个重大的挑战:即使是其中最好的,也会有主配置没有覆盖的边缘情况。 此外,呈现与用户最相关的结果只是等式的一半。在这种情况下,企业希望对结果进行重新排序,以提供针对“业务相关性”进行优化的结果:可用性、利润、受欢迎程度等指标。 微调排名公式逐个查询非常耗时:这就是人工智能可以用来分析用户行为并根据发现建议改进排名的地方——然后迭代和自我学习以进一步改进。
- 透明度。鉴于上述每一个问题的复杂性,对于企业来说,理解人工智能的每一层如何影响搜索结果,它们如何在编排中协同工作,以及最重要的是,能够根据研究结果做出改变,都是至关重要的。甚至在人工智能出现之前,好的搜索解决方案只为开发者提供相关性理解和优化。复杂的排名公式(例如,为每个文档分配一个唯一的分数,并混合许多信息,如属性权重、单词之间的接近度等。)实际上是一个黑箱,使得搜索团队几乎不可能理解为什么结果以某种顺序出现,以及如何调整以实现预期的相关性。
为了成功应用人工智能,它需要解决上述每一个问题,同时确保所有人工智能算法整体上工作良好。换句话说:为了提供高质量的消费级搜索,推动可衡量的商业结果,公司需要一种全面的人工智能方法。
这就是为什么 Algolia 建立了一个 AI 算法家族 来解决搜索最重要的方面。把它想象成一个搜索的 AI 工作室: 一组解决大多数复杂搜索问题的 ,打包在一个 易用灵活的 API 里面。
2020 年阿哥利亚的 AI 平台
2020 年,我们将继续增强现有的人工智能实践,并扩展到新的实践:
自然语言处理 (NLP)是人工智能的一个分支,帮助阅读、理解和理解人类语言。Algolia 的搜索引擎使用先进的机器学习算法来自动识别通常难以破译的单词,例如日语和汉语等亚洲语言中没有空格的单词,或者德语、荷兰语、芬兰语和瑞典语等日耳曼语。一个例子是经常被引用为最长的荷兰语单词:Kinder carnavals opto cht voorbereidings werkzaamheden plan,意思是“儿童狂欢节游行的准备活动计划”。
Automated personalization. Personalizing search results is a surefire way to improve the user experience and maximize business KPIs. Algolia’s automatic personalization analyzes user signals (like a click on a product page, a purchase, an add to cart, an add to wishlist, etc.) to deduce a profile for each user according to a business configuration, and serve a personalized search and discovery experience for each user, while preserving user privacy. What’s unique about Algolia is how we handle the ranking. We are able to personalize while respecting all other key elements of relevance. Our customers can understand how results are ranked based on personalization and each relevance factor (textual factors like synonyms, plurals, lemmatization, and business relevance factors like margin or popularity). They can then iterate and adjust to get to that perfect search result formula.
Personalization simulator showing the impact of personalization for one user on the right column
动态同义词建议。 配置同义词是提高搜索相关性、增加其商业影响力的最重要——也是最复杂——的方法之一。然而,搜索中的同义词不是基于字典的;它们特定于每个业务和每个用例。这使得它成为一个耗时的手动过程,即使对了解其内容和产品目录的专家来说也很困难。Algolia 根据真实用户如何使用同义词建立了一个简化的推荐流程,然后很容易接受或拒绝这些推荐。这项功能目前处于测试阶段。
动态重新排名, 本季度内测,根据分析用户行为的发现 建议改进查询排名。 例如,如果特定查询的第三个结果是点击次数最多的结果,推荐或自动化会将其移动到第一个位置。随着对来自用户行为的额外反馈循环的分析,该特征将在准确度和精确度上有所提高。按照白盒方法,客户将对算法计算完全透明,并有能力覆盖行为。此外, Algolia 是唯一的解决方案,可以让您确切地知道这些计算如何影响体验 。
语音和自然语言理解。 用户越来越多地以自然语言而非关键词的形式表达查询,尤其是语音搜索。因为搜索引擎习惯于理解和处理关键词,所以我们在 查询到达搜索引擎之前,引入一层 AI 来分析用户意图 。这个新的 NLU 引擎启用了新的对话界面,其中搜索和 NLU 结合起来,以增强对方。Algolia 的 NLU 引擎检测 意图 和 实体 来了解用户真正想要的是什么,例如识别说“在我的购物车中添加一件价格低于 500 美元的上等黑色连衣裙”的用户想要执行与说“给我看看所有黑色连衣裙”的用户不同的动作
结合 Algolia 与客户的 ML/AI 模型和技术 。Algolia 客户可以使用任何数据点(点击率、产品或内容受欢迎程度等。),甚至将自己 ML 模型的结果插入到 Algolia 的可扩展排名公式中,以增强自己的反馈回路。随后,Algolia Analytics 和 A/B 测试套件有助于直接衡量他们决策的影响。
我们的愿景是能够在 Algolia 中使用任何类型的定制人工智能算法。我们在这个方向上发布的第一步是在我们的引擎中高效地处理数百万条规则;我们的客户可以使用这些规则作为他们的人工智能算法的输出,来重新排列结果,提升类别等。
透明易懂
我们清楚地陈述了人工智能功能做什么,它们在哪里以及如何影响体验,并且我们清楚地陈述了它们如何与其他功能一起工作。我们确保我们的客户对如何计算他们的相关性有透明度,而不是盲目信任他们不理解的算法。我们将这种 称为白盒方法 ,我们认为这是保持客户授权、接受迭代方法见解教育以及信任 Algolia 的关键。
Showing how textual relevance (criteria 0-7), custom ranking (8) and personalization (9) generated a specific query result position.
白盒方法对于持续改进至关重要。如果一家公司不能告诉你为什么结果按特定顺序排列,你就不可能测试其他方法来调整和改善结果。
接下来是什么
我们将继续探索、开发和拓宽我们的 AI studio:一套集成算法,帮助我们的客户利用人工智能的力量,同时保持易用性和灵活性作为设计原则。
例如,我们与 OpenAI 是发布合作伙伴,将他们的技术捆绑在我们的搜索引擎之上。目标是能够提供用户问题的答案,以及用户需要分析的结果列表(类似于谷歌对类似“为什么富兰克林·罗斯福支持成立联合国”这样的查询所做的事情)。您可以想象这种技术在帮助中心的环境中是如何有用的,对降低支持成本有重大影响,或者对新闻机构来说,让读者回来了解最新的事实。
我们正在评估许多其他人工智能解决方案,包括但不限于:
- 人工智能驱动的数据清理和结构化
- 动态营销建议:根据特定查询确定要推广的类别
- 自动配置可搜索属性(排名公式中最重要的元素之一,如产品名称或类别),确保它始终反映用户的搜索方式
- 动态过滤器优化确保您在 UI 中显示的顶级过滤器值与您的用户行为相匹配
随着人工智能的不断成熟,我们将继续努力降低搜索的复杂性,让我们的客户能够为他们的用户提供最佳的搜索和发现体验。随着自然语言处理(NLP)在分析意图方面变得更好,我们将更接近对话搜索中双向对话的理想状态。最终,我们人类将会像与人类助手一样与软件互动。请继续关注 Algolia 为这一不远的场景铺设的路线图。
使用 UI 套件创建出色的电子商务搜索和发现体验
为移动和网络定制页面和组件设计,应用行业最佳实践指南
有效的消费者搜索和发现产品的过程是任何电子商务网站成功的关键。用于搜索的 UI 套件包含可视和交互式组件以及屏幕布局,以确保一流的在线体验。
根据消费者洞察作家 谷歌的 Alistair Rennie 和 Jonny prot heroe, “随着互联网的发展,它已经从一个比较价格的工具转变为一个比较一切的工具。这一点在我们多年来看到的购买行为变化中显而易见……”
考虑周全的电子商务用户体验至关重要,因为 Rennie 和 Protheroe 称之为购买之旅的“ 【凌乱中间 ”:在线购物阶段,人们探索和评估他们的产品购买选项,在这里他们容易受到推荐、评级和评论的影响。
推动客户穿越混乱的中间地带的潜在功能是搜索。顾客来到一个电子商务网站寻找完美的商品。他们查看自己的搜索结果,这些结果可能包括从产品、功能和价格到评论、送货成本以及送货或取件选项的所有内容。如果满意,他们会继续搜索,直到找到他们想要的,但前提是搜索体验符合他们的期望。客户希望相关内容立即出现在他们的指尖。他们还不断评估网站整体用户体验的精细程度,以及公司的品牌和声誉。
为什么要用 UI 套件进行搜索?
用户界面套件有助于购物体验的设计,让顾客可以轻松查看所有需要的细节,以便在杂乱的信息中筛选。本质上,套件 清理了混乱, 为购物者的理想商品指明了一条清晰的道路,同时让他们享受进一步的购物探索和发现,并将他们转化为忠诚的顾客。
秘密在于设计的简单性和恰当的导航功能(搜索栏、小平面、产品类别和菜单)。最好的设计围绕着容易获得产品推荐和相关项目。它结合了突出相关或相关内容的视觉技术。它可能包含联合搜索,允许购物者找到非产品项目,如文章和常见问题解答以及产品,理想情况下,所有这些都由一个令人愉快的搜索和发现体验提供。
UI 套件还可以帮助 web 和移动设计人员创建和定制包含行业最佳实践的体验,从而在赢得网站访问者的同时最大化投资回报率。
奥利亚方法
如果你在网上搜索,你会发现大量针对电子商务的 UI 套件。他们倾向于专注于增强全球在线购物体验,而不是 创建有效的搜索、浏览和转换功能 。
在 Algolia,我们注意到这些广受关注的 UI 套件非常受欢迎,并意识到我们可以创建自己的版本,专门针对我们的强项搜索和发现。建立一流搜索的电子商务网站会给客户留下深刻印象并赢得他们的信任,最终增加收入并建立品牌忠诚度。我们的使命一直是让公司创造伟大的搜索体验,所以这是合乎逻辑的下一步。
在过去的几年里,我们一直在简化我们的软件,让开发人员更容易、更快地构建出色的搜索和发现体验——无论有没有搜索框。例如,我们增加了相关性功能,如商品销售人工智能驱动的 推荐,以及升级了我们的 即时搜索 和 Algolia 自动完成
然而,我们也意识到,在创建有效的用户界面和 UX 时,我们还没有足够重视让业务团队、设计师和开发人员设想一个强大的前端体验。我们确定在这方面需要更多的指导和资源,并着手实现这一目标。
介绍我们的第一个 UI 套件
我们创建了一个免费开源的 电子商务搜索和发现 UI 套件 ,让 web 和移动设计人员与业务利益相关者和开发人员无缝协作,建立一流的搜索 UI/UX,其中还包含搜索框之外的功能。
该套件旨在提高购物者对速度和相关性、搜索和浏览导航等的感知。 例如,我们加入了个性化产品传送带和包含交叉销售推荐的产品详情页面。我们还提供了让购物者搜索顾客产品评论的功能,以及轻松定位实体店的功能,顾客可以在实体店挑选自己购买的商品。
该 UI 套件包含两种资源:
- 可定制的屏幕布局 除了你自己的网站模型之外,你还可以根据自己的品牌和用途轻松定制
- 一个 UI 组件库 ,例如搜索栏、细化列表和传送带,您可以选择这些组件来定制现有屏幕或在创建原始模型时使用
该套件还提供了关于最佳页面布局和组件的 最佳实践建议 ,以用于您的特定行业和产品类型。
基于最佳实践
该 UI 套件诞生于多年来对我们阿尔戈利亚 UX 最佳实践的监控以及对搜索和发现模式的研究。此外,我们还纳入了行业领导者引用的关键发现,如谷歌 (在其【UX 零售剧本 :取悦用户的最佳实践集 ) 和 贝玛研究所(在其 电子商务 UX 研究文章 )。
受 Brad Frost 的 原子设计 概念的启发,我们的 UI 套件是 100%可定制和优化的,以反映现代工作流设计。我们确保满足这八项关键要求:
这个 UI 套件里有什么?
您的设计师可以访问移动、web 和桌面平台的完整搜索和发现解决方案的 30 多个响应屏幕模型。这些布局体现了购物者在访问现代电子商务网站时期望找到的用户体验模式。
设计师可以使用这些原型作为预构建的起点,然后对它们进行定制,以反映行业规范和品牌。
零售网页设计选项包括:
- 带有全球导航标题的主页布局和为探索而构建的用户定制的传送带
- 具有查询建议功能的多类别自动完成(“预测搜索”)搜索框
- 一个适合搜索和浏览的产品列表页面,带有过滤器和排序面板
- 一个包含推荐的产品详情页面,让购物者搜索用户评论
- 一个商店定位器,如果购物者更喜欢挑选商品,它可以让他们找到最近的实体商店
这里有一个移动主页设计的例子,它有一个内容转盘(可以由 Algolia 的 搜索个性化 )支持:
添加 自动完成 功能可以增强电子商务网站的可用性。您可以在一个视图中向购物者显示查询建议、特定品牌、产品类别页面、常见问题解答和商品,所有这些都可以使用 Algolia 自动完成 轻松构建。
这是我们 UI 工具包中的一个移动自动完成搜索栏:
在你网站的商品详情页面上,你可以让用户搜索顾客评论,同时查看交叉销售建议(相关商品和经常一起购买的商品,由 Algolia 推荐 ):
除了响应式页面布局之外,设计人员还会喜欢访问各种用于页面布局和导航的用户界面组件。这些组件都是使用自动布局和变体构建的,从简单到复杂。它们可以根据需要进行调整、混合、匹配和移动,以反映您的网站结构和品牌。 这种灵活性适用于页面、搜索栏和设计元素。
这里有一个示例搜索框,有手机和桌面的变体:
我们的 UI 套件还可以帮助促进设计和业务团队之间的对话,最终及时创造出一个出色的解决方案。设计师可以创建第一个可行的版本来展示管理,然后逐步简化后面的迭代。 当一切都被批准后,开发人员可以访问度量和代码片段,以平稳地过渡到开发阶段。
接下来是什么?
我们将改进 UI 工具包的视图和组件,并为构建工具包中的视图创建一个 UX 见解和建议的“剧本”。 此外,工具包将不再严格包含设计工具;我们正在创建开发者“模板”,提供可用的代码来实现视觉效果。T31
如何入门
准备好查看 Algolia 的 UI 套件了吗?在 Figma 我们的网站上可以看到。
如果你是一名设计师,你可以从预先设计的模型开始,定制它们以适合你的公司品牌,或者你可以将 UI 组件添加到你自己的模型和设计系统中
如果你是一名开发人员,开始浏览工具包的内容以获得灵感,看看你最终会构建什么。
我们希望您能深入了解并探索 UI 套件。 现在就来看看 !
你怎么看?
因为我们正处于持续开发模式,所以我们希望听到您对我们 UI 套件的体验:
- 这对您的设计团队或业务人员有什么帮助?
- 有什么你认为缺少的东西吗?
请在我们的 社区 分享你的想法。
用户体验
ux
手机应用和手机应用搜索:过去、现在和未来
社交网络、送餐、支付、游戏、音乐、锻炼、航空……似乎有一款应用可以满足几乎所有需求,无论是...
高级搜索引擎优化网络数字营销经理
了解为什么向量结束了,为什么散列是人工智能的未来
人工智能已经建立在向量算术的基础上。最近的进展表明,对于某些人工智能应用程序来说,这实际上可以被其他二进制表示(如神经散列)大大超越(内存、速度等),而不会有显著的精度损失。
一旦你研究了像神经散列这样的东西,很明显,人工智能的许多领域可以从向量转移到基于散列的结构,并引发人工智能进步的巨大速度。这篇文章简要介绍了这背后的思想,以及为什么这最终会是一个巨大的转变。
哈希
散列函数是可以用来将任意大小的数据映射到固定大小的值的任何函数。哈希函数返回的值称为哈希值、哈希代码、摘要或简称为哈希。
你可以在这里阅读 更多关于哈希 。维基百科的例子如下图所示。
哈希对于权衡准确性、数据存储大小、性能、检索速度等等非常有用。
重要的是,它们本质上是概率性的,所以多个输入项可能共享相同的散列。这很有趣,因为核心的权衡是放弃较慢的准确性,以获得极快的高概率。这里的类比将是在 1 秒钟的飞行到你在世界上任何城市选择的郊区的某个地方和 10 小时的旅行把你放在你选择的城市中你想要的确切的房子之间的选择。前者几乎总是更好,因为在 10 小时内在一个郊区内导航是小菜一碟。
当考虑向量时,浮点是首选的数据表示。尽管它们在本质上比散列更绝对,但它们仍然不精确。更多关于下面的浮动…
花车
为了理解人工智能,你需要理解计算机是如何表示非整数的。如果你还没有读完这个, 你可以在这里读一下 。
浮点数的问题是它们占用了相当大的空间,计算起来相当复杂,而且仍然是近似值。看 抢长枪谈一个 bignum 计算器 大概是我第一次多想。从那以后我一直很困扰。谢谢罗柏😁。
对于对模型预测几乎没有影响的微小数值变化(相对于矢量计算),二进制表示也可能有很大不同。例如:
取 0.65 对 0.66,在 float64 (64 位浮点)二进制中可以分别用这两个二进制数表示:
111111111001001100110011001100110011001100110011001100110011001101
11111111100101000111101100001010001111011100001011000010100011111
这不容易看出来,但是仅仅 1%的数值变化,几乎有一半(64 位中的 25 位)是不一样的!从向量的角度来看,在矩阵计算中,这两个数字非常非常相似,但在底层的二进制中(所有繁重的工作都在这里进行),它们是两个不同的世界。
我们的大脑肯定不是这样工作的,所以它们显然不会使用浮点二进制表示来存储数字。至少对于神经元来说,这听起来是一件奇怪的事情,除了有 的人可以记住圆周率 的 6 万多位小数,所以也许我根本不知道。但是说真的,我们的大脑是视觉的,视觉上我们大脑的神经网络非常擅长处理代表强度的分数。但是当你想到半杯或四分之一杯时,我敢打赌你会立刻想到半杯或四分之一杯,或者比萨饼或其他东西。你可能没有想到尾数和指数。
一个常用于加快浮点计算速度和使用更少空间的想法是将分辨率降至浮点 16 (16 位)甚至浮点 8 (8 位),这样计算速度会快得多。缺点是分辨率明显下降。
所以你是说浮点运算速度慢/不好?
不完全是。事实上,这是一个人们花费了毕生精力的问题。芯片硬件和它们的指令集被设计成使这更有效,并有更多的计算并行处理,以便它们可以更快地解决。GPU 和 TPU 现在也在使用,因为它们处理大量基于浮点的矢量算法更快。
你可以蛮力提升速度,但是你需要吗?你也可以放弃决心,但是你需要吗?无论如何,浮动也不是绝对的。这里不是说慢,而是说如何走得更快。
神经散列
因此,像对 位集进行 XOR 这样的二进制比较可以比基于浮点的运算快得多。那么,如果您可以在一个对位置敏感的二进制散列空间中表示 0.65 和 0.66,会怎么样呢?这能让模型在推理方面更快吗?
注意:看单个数字是一个人为的例子,但是对于包含许多浮点数的向量,散列实际上也可以压缩所有维度之间的关系,这就是神奇之处。
原来有一个哈希算法家族可以做到这一点,叫做【LSH】。原始项目越接近,它们的散列中相同的位就越接近。
这个概念并不新鲜,除了新的技术有更多的优势。历史上,LSH 使用过类似于 随机投影 和 量化 的技术,但是它们的缺点是需要很大的哈希空间来保持精度,所以其好处多少被否定了。
对于单个浮点来说微不足道,但是对于高维度的向量(很多浮点)呢?
因此,使用神经散列(或有时称为“学习散列”)的新技巧是用神经网络创建的散列来取代现有的 LSH 技术。可以使用非常快速的 汉明距离 计算来比较得到的散列,以估计它们的相似性。
这起初听起来很复杂,但实际上并不难。神经网络优化散列函数:
- 与原始矢量相比,保留了几乎完美的信息
- 产生比原始矢量尺寸小得多的散列值
- 计算速度明显更快
这意味着你得到了两个世界的最好的东西,一个更小的二进制表示,可用于非常快速的逻辑计算,几乎没有改变信息分辨率。
用例
我们正在研究的原始用例是用于密集信息检索的近似最近邻(ANN)。这个过程允许我们使用向量表示来搜索信息,因此我们可以找到概念上相似的东西。因此,哈希中的位置敏感性如此重要。我们现在更进一步,更广泛地使用散列来快速和近似地比较复杂的数据。
密集信息检索
你能想到多少数据库?可能很多。搜索索引怎么样?可能很少,而且大多数都是基于同样的旧技术。这很大程度上是因为历史上语言是一个基于规则的问题——记号、同义词、词干、词汇化等等占据了非常聪明的人的整个职业生涯,而他们仍然没有解决。
拉里·佩奇(谷歌创始人)曾说过,在我们的有生之年,搜索不会是一个已经解决的问题。想一想,一代人最伟大的思想,字面上几十亿美元的投资,它不太可能被解决?
主要由于语言问题,搜索技术已经落后于数据库,然而在过去的几年里,我们已经看到了语言处理的一场革命,而且这场革命还在加速!从技术的角度来看,我们看到基于神经的散列法为新的搜索和数据库技术扫除了障碍(包括我们在 Algolia!).
如果这引起了你的兴趣,可以考虑提交一份简历——!如果你正在研究基于散列的神经网络和索引,我很想听听你对下一步的想法!可以在推特@ hamishogilvy上找我。
视觉购物和发现:图片搜索改变了网上购物
科技继续改变着商业。最近的例子是 视觉购物 ,这是一种快速增长的在线功能,它利用图像识别和机器学习技术来创建强大的视觉图像搜索和发现体验。
智能手机和在线照片共享,结合机器学习和图像识别技术,推动了视觉搜索。在技术上,视觉搜索被称为图像识别,或者更广义地说,计算机视觉;但更常见的是,它被称为按图像搜索和反向图像搜索。
直到最近,构建这种功能的选择还很有限。谷歌和必应都为商家提供了强大的视觉图像搜索。然而,借助新的 矢量搜索 技术,任何公司都可以构建图像和视觉搜索解决方案。
如果你渴望了解视觉搜索是如何工作的…
本文的第二部分概述了图像识别背后的 AI/ML 技术,描述了使机器能够学习照片内部内容的机制。我们展示了机器如何根据最基本的特征分解图像,然后混合和匹配这些特征,最终根据相似性对图像进行分类。我们将描述神经网络的过程,或者更具体地说,卷积神经网络(CNN),它在图像识别领域非常突出。
但是首先,我们想更直观地向你展示视觉购物——一个实用人工智能的完美例子——是什么样子的。
第一部分——什么是视觉购物?它是游戏规则的改变者吗?
机器可以从大量的图像索引中发现产品的图案和组合,从而产生一个 完整的外观 特征。完整的 Look 功能可以从社交媒体照片中检测模式,并了解哪些风格的衣服、帽子、眼镜、包和鞋子一起出现。这些产品因其在现实世界中的穿着频率而成为“一种外观”。
大量共享的网上图片,其中女性穿着特定的服装组合,可以转化为你的网上商店可以推荐的造型。
有几个理由认为视觉购物是游戏规则的改变者:
- 图片细节丰富,作为搜索输入更精准。图像到图像的比较成功地匹配复杂的对象(古董吊灯,优雅的礼服)。
- 方便移动用户。视觉购物分为两步:拍照,上传到你的商店。
- 照片在社交媒体上的广泛使用。现在,您可以粘贴在社交媒体上看到的照片,开始购物。
- 图片最适合一些专业行业(如家居、时尚、艺术品),或者像 Etsy 和易贝这样的大型客户对客户市场。
- 正如您将在下一节中看到的,图像识别和机器学习已经增强,甚至发明了新的功能,如完成外观和上下文购物。
- 外语。我们不再需要说网店的语言。图片可以帮助非母语人士像母语人士一样进行搜索。
最基本的,图片搜索是文本搜索的替代。图像帮助用户用视觉例子而不是文字来查找和浏览产品。鉴于机器比较两幅图像的独特能力,图像搜索可以产生令人惊讶的相似性和推荐,并可以有许多现实世界的应用——不仅仅是在商业领域。仅举几个电子商务之外的例子:医生比较 x 光或受伤的照片,建筑师寻找相似的桥梁或房屋。
你能用视觉购物和视觉发现做什么
1——视觉购物中的精准匹配
智能手机已经成为第二只眼睛,机器学习模型可以利用世界上智能手机照片的丰富程度来指导网购者找到他们想要的。说 确切的说 一点都不夸张。
考虑在某人家中随机看到的一个非常旧的吊灯:
【T2
现在,消费者可以输入一个非常详细的描述,如“吊灯、黄金、古董烛台、链条、pendalogue”,但这需要高超的搜索技巧。他们需要将常识词汇(吊灯、黄金、古董)与更多的技术术语(烛台、链条、吊灯架)结合起来。这里有几个挑战:
- 买家需要知道这些术语
- 卖家需要使用这些确切的术语(或同义词)才能进行搜索
- 搜索词的数量很长,不方便,也不一定成功
很有可能如此详细且可能不正确的一组单词不会得到任何结果——即使该商品在该网站上有售!
输入图像。通过图像识别,公司可以构建应用程序,将上面的照片与其搜索索引中所有相同的照片和描述进行匹配。最好的 ML 模型可以实现高水平的准确性(在某些情况下,92%和99%),其中每个重要的细节都很重要,从而使搜索引擎能够检测到精确匹配:
2–视觉购物中的相似性匹配
在寻找吊灯的同时,你可能也想找到相似的风格。机器不仅可以学习匹配图像的元素,它们还可以使用这些相同的元素对图像进行分类或聚类,以便它们可以推荐 相似的 图像。图片搜索扩大了推荐的可能性。
必应提供精确和相似的视觉购物。在这张图片中,Bing 显示了完全匹配的照片,但它也给了用户许多方法来扩展他们的搜索,其中有facets(棕色玻璃,法国风格)和 相关搜索 (搜索棕色、法国、水晶、灯光)。方面和相关搜索之间有一个重要的区别:选择一个方面会减少当前的搜索结果,只显示那些匹配所选方面的项目;相关搜索会执行新的搜索,从而找到原始搜索可能未检索到的项目。图像搜索可以增强这两个发现选项的能力。
3–检测用于搜索和推荐的属性
让我们以时尚为例。时尚网站可以以超出精确匹配和相似匹配的方式利用图像识别;它们可以匹配颜色、样式和类别。考虑一张穿着时髦的红色运动鞋的女人的照片。
在这里,谷歌的图片搜索找到了完全匹配以及不同颜色和风格的类似物品。
一个技术瞬间:这是怎么回事?在第二部分中,我们将深入探讨机器如何检测属性的细节,但总的想法是,人们给图像加标签,以帮助机器对图像进行分类。他们不仅需要标注某样东西是什么(运动鞋),还需要标注它的属性(颜色、尺寸、形状、上下文用途等等)。一旦机器学习了一个对象的属性,它就可以将这些信息输入到推荐模型中,以产生上述推荐。
区分物体及其属性是机器学习的核心。标签是做到这一点的一种方法。但是,机器也可以在不标记的情况下区分*——通过自己检测属性而不命名。例如,机器可以根据区分红色和其他颜色的像素值来检测“红色”图案;并且它可以开始将“红色”对象放入“红色”组。它还可以通过检测形状来分组:鞋子的像素模式不同于其他物体,跑步不同于站立。它还可以在不命名的情况下检测“运动鞋”。然后,它可以使用这些像素模式将所有这些未命名的对象分类成组,并推荐形状或颜色相似的项目。我们将在第 2 部分讨论这一点。*
4–裁剪图像以实现更精确的匹配
下一个例子也向我们展示了裁剪功能如何使搜索更加强大。通过移动作物,您可以切换搜索。
通过移动裁剪,您可以开始获得慢跑者和运动鞋组合的报价。
将作物向上移动一英寸,你会看到穿着各种鞋子的慢跑者,与上面的不一样。
正如这个例子所展示的,视觉购物可以是一个视觉发现过程,用户可以移动图片来帮助他们立即发现完整的在线目录。
5–视觉购物风格建议–完善外观并添加背景
我们在上面看到了这张图片,它展示了完成一个造型的想法。
底层机制依赖于一种已经讨论过的技术:图像分类和属性提取,并增加了另一种:检测图像中的多个对象,并找到“频繁穿在一起”的模式。换句话说,如果这些项目频繁地一起出现在你的照片索引中,那么机器就会学习它们构成一个“外观”。
网上家居设计商店也能从同样的功能中获益。它可以使用图像来提出完整的家居装饰,以及推荐装饰中的单个产品。
- 当场,上下文购物
你还可以更进一步,根据图片的背景推荐有意义的产品。夜总会中的图像会产生与森林中的图像不同的推荐。在这个场景中,背景为系统提供了另一组线索或属性来构建它的推荐。
一个男人出去跳舞,很欣赏朋友选择的衣服的风格。他想要类似的东西,所以他拍了张照片并上传到一个时尚网站。结果包含许多不同的服装,都与图像中男子的外套相似。但是时尚网站也可以考虑到照片的语境,比如派对或者夜店。 网站然后可以推荐 晚上 穿。这可以称为 语境购物 。语境就是背景。如果这个男人在跳舞或坐着,也许这些建议会改变。
**
那么,搜索栏呢?是不是已经不需要了?
图片搜索并没有取代搜索栏。关键词搜索的本质——单词匹配——对于搜索和发现仍然至关重要。大多数搜索只需要一个或几个关键词就能找到你要找的东西。
首先,并不是每个人都拥有智能手机或拍照。此外,对于那些喜欢文字胜于图像、认为思考和打字是搜索和浏览的最佳方式的人来说,搜索栏将永远是最直观的工具(尽管语音搜索有可能取代打字)。此外,机器学习和语言处理的进步使得关键字搜索和神经(基于 ML)搜索成为强大的混合搜索和发现体验。
最后,这两种方法——图像 和 关键词搜索——形成了一种强大的组合。
在机器学习中,我们用“feed”这个词来表示“输入”——我们 将 图像馈入机器,教它们如何看。人类也通过图像来理解世界。从史前到现在,人类对环境的认识开始于只认识简单的形状,并发展到更复杂的物体表征。一个孩子遵循同样的进程。正如你将在下面看到的,机器也从最简单的形状开始——几何图案。
机器学习的 技术 也从识别简单的几何形状发展到了更细致的。今天,机器几乎可以像人类一样理解现实世界的细节。
快速历史
为了解释机器如何识别图像,我们只能追溯到 20 世纪 50 年代,当时神经科学生物学家从理论上解释了大脑如何看待图像。大脑从简化和抽象开始,只看到线条的变化,比如它们的大小、方向以及它们是直的还是弯的。
受到这个出发点的启发,工程师们实现了同样的抽象过程。线条或边缘识别已经成为计算机视觉的基础:
如你所见,几何起着核心作用。它从简单的特征,如直线、曲线、立方体和球体,到数百或数千个特征,代表深度、纹理、材料,最终是现实世界中可以检测到的一切。因此,毫不奇怪,几何数学(例如,余弦和矩阵)在机器学习中起着关键作用。
虽然机器学习技术的每一项进步都至关重要,但图像识别的广泛使用来自于它对 和 名称 对象进行分类的能力。识别图像之间的模式以及相似性和差异使得能够对对象进行分组(聚类)。但这还不够,还需要对物体有的含义*:汽车需要从红灯中分辨出人。由此可见,图像的明确命名和标注语义分类是 图像分割(分类) 的核心,也是 图像理解**图像匹配 的核心,后者是我们的主要课题,视觉搜索。*
总而言之,机器学习的历史已经将计算机视觉从初级阶段带到了现实阶段。机器可能已经比人类看得更清楚:
但是因为机器实际上并不像人那样理解 物体,所以机器错误与人为错误不一样……或者说它们是吗?你能认出这只可爱的小狗吗?你花了多长时间?
大图像数据——数量质量
*在机器学习中,数据的重要性怎么强调都不为过。在图像识别的例子中,图像的大规模增长(每天数十亿)使机器达到了成熟,正如本文第 1 部分中的用例所证明的。原因有二:质量和品种。
图像的高清质量,以及允许任何人拍摄高质量照片的智能手机技术,极大地改变了光学识别技术。
得益于如此丰富的高质量图像,机器学习工程师已经能够创建基准图像数据集,如 ImageNet,它包含超过 1400 万张各种各样的图像,所有图像都进行了分类和命名:
为什么这个免费的数据集如此重要?因为来自世界各地的工程师可以使用相同的图像索引作为基准来测试他们的模型。这些图片是经过精心挑选的。它们质量很高,并且包含一定程度的多样性,这对于机器学习来说是必不可少的。高质量的图像有助于更高效、更准确的学习。而且,正如您将在下一节中看到的,多样性确保了学习的广度,它使机器能够理解现实世界中存在的细节和内容的变化。
要理解变化的重要性,有必要进入过度和欠适应的主题。
变化——找到合适的契合点:避免过度契合和不契合
你需要给机器输入各种各样的手写 6,它才能学会识别所有的手写 6。
机器通过我们输入的特征来学习。但是我们需要给它一些真正有所作为的功能。如果你喂它一件外套,你需要用几种不同的方式喂它在同一件外套上:扣上和解开,熨好和揉皱。这种多样的特征称为拟合。
装配不足
机器需要足够的信息来做出有用的区分。如果我们仅仅给它一个虎、猫、马、狗的轮廓,它会把它们都归入一类动物。轮廓不包含足够的信息来区分动物(狗=猫)或物种(蓝鸟=鹦鹉)。轮廓包含的信息只够区分两足和四足动物与鸟类和鱼类。
正确安装
我们给计算机提供的细节(特征)越多,它就越能发现相似之处和不同之处。添加特征,引出体重、力量、鼻子形状、眼睛和多种皮肤和毛皮的想法——这样的细节可以帮助区分猫和狗、山羊和绵羊、蓝鸟和鹦鹉。添加额外的特征也是很好的,比如姿势、视角和表情,给坐着的狗和站着的狗,或者悲伤的狗和愤怒的狗赋予意义。
过度拟合——让一切变得有意义
然而,有一件事,就是给出太多的细节。有一个专家 如果我们将数百万张照片输入电脑,并要求电脑考虑每一个重要的细节,这可能会扭曲我们的分类或简单地过度描述我们的动物。每只蓝鸟都会自成一类。我们将失去计算机实际学习有用信息所需的所有区别。
您可以通过将一些细节视为噪声来解决过度拟合问题。下面是两个常见的噪声例子:
- 糟糕的摄影。 曝光不良不应视为特征。一张曝光过度的 1000 只蓝鸟的黄色照片会扭曲蓝鸟的识别,除非计算机可以消除曝光的噪音。
- 视角变化 。一张比格犬看着相机的照片和一张它侧面的照片不应该消除有一个单独的比格犬类的重要性。如果小猎犬在奔跑——你需要问问自己 奔跑 是否是一个重要的细节,从而创造出一个奔跑与不动的狗的类别。
使用正确的图像–每个应用一个模型
最后提到的这个例子,一只奔跑的狗和一只不动的狗,带给我们这个结论:学习过程的最终目标决定了你需要多少信息和细节来实现这个目标。图像识别依赖于太少和太多信息之间的平衡:如果运动对您的应用程序很重要,那么您的图像索引必须包含各种运动——不仅仅是行走和跑步,还包括跑步者的视角、上坡和下坡、不同的步态等等。如你所见,挑选合适的图片并不是一项简单的任务。
因此,您希望使用与您的应用目标相关的图像来定制您的模型。对于这篇博客,上下文是 视觉购物 。商业目标将明显不同于科学目标:蓬松狗和细毛狗之间的特征差异可能是一家出售狗外套的企业所需要的;但是研究狗的科学家显然需要更多的细节来研究每一种狗。
因此,时装店将专注于服装;家居用品商店储存了所有与设计家居内部相关的东西。但在所有情况下,合适的原则——而不是不合适或不合适——都适用。
机器如何学习识别图像?
我们(终于)来到了让这一切成为可能的人工智能技术。
机器使用数字、统计和深度神经网络来参见。这意味着图像的像素被转换成数字,称为向量,然后被馈入一个复杂的软件过程,称为神经网络,或者更准确地说,称为 回旋神经网络(CNN) 。
CNN 使用一系列被称为 模型 的统计函数,不断计算和重新计算数字 的像素化向量,直到图像被机器准确识别和分类。
学习部分是当数以千计或数百万计的图像被输入到网络中时,模型本身正在适应图像,自我校准,并经历其自身数字的微小变换,称为 权重 。完成的模型已经将其所有的权重设置到近乎完美的平衡,可以准确地识别(几乎所有)未来看不见的图像。
让我们潜入更深的地方。
将像素转换成数字和矢量
如前所述,机器将像素转换成矢量,矢量是一系列数字。向量代表一定范围的像素-黑白的灰度等级,或彩色的三维 RGB 等级-其中向量中的每个数字(像素)都在灰度或彩色等级内。例如,灰度模型可以从 0 到 1 改变数字(从无强度到高强度)。该模型还可以使用 0 到 1 的范围来捕捉完整的颜色光谱。
一旦建立了向量,学习过程就开始了。
总体思路是将向量输入到模型中,并在它通过网络时转换其数字。网络由多层组成,每层将矢量数字解释为代表一个 特征 。每一层都添加了为图像添加更多细节的功能。特征的数量称为一个 尺寸 。这里有一个图像,它给出了添加特征(或参数)如何帮助机器学习图像内容的想法。
假设第 1 层看线条或边缘(直的或弯的)。第二层然后将两条线或更多的线放在一起,并寻找角度。第三层将形成正方形和圆形。以此类推——第 4 层到第 n 层添加越来越多的特征(纹理、姿势、视角、颜色),直到网络识别出足够多的特征来输出可以正确分类的重建图像。
当然,一台机器 看到的线条、方块、纹理,以及鼻子、脸、电视机等物体与我们不同:
关于学习的一句话——用不用标签
我们在这个博客中的模型依赖于 监督学习 ,它使用带标签的图像来帮助分类图像,并测试建模过程的成功。明确地说,当机器处理每张图像时,它会将输出图像与一堆标签进行比较,包括输入图像的标签。机器必须猜测每个图像的正确标签,才能认为它 100%成功。没有机器能正确猜测每个标签。
图像也可以在没有标签的帮助下进行分类。这就是所谓的无监督学习,它从输入到输出遵循一个相似的过程,但它不是使用标签来测试成功,而是使用一个统计的模型来确定是否对图像进行分类,或者聚类,具有很高的准确性。看看我们最近关于 监督学习和非监督学习 的区别的博客。
流程是这样的。下面这张照片,名为 莱娜 ,是瑞典模特 莱娜·佛森 。自 1973 年以来,Lena 一直被用作数字成像处理领域的标准测试照片。
如前所述,图像被转换成像素矢量。但是,机器并不看全貌。它从小开始,将图像分割成更小的向量,例如 5×5 的小部分。例如,一个 10×10 像素的小图像将被分割成 25 个更小的图像。
将图像分割成小图像允许网络检查更小的像素矢量
这样,网络不断地将小矢量转换成新矢量。
将较小向量中的数字转换成新向量。这些变换由乘以数字权重的统计函数计算,从而将输入向量(a)变为输出向量(b)。
输入的照片在通过第一层时,被转换成只显示其边缘:
在接下来的层中,网络检测更多的特征,如纹理。
当向量通过网络时,向量被赋予更多的特征,直到过程结束时,有一个单一的、最终的向量代表图像的全部维度。但是我们不能证明这一点,因为事实上,神经网络的输出并不像我们所理解的那样。值得记住的是,向量只是一系列数字,因为计算机只知道数字,所以产生的“图像”看起来与我们看到或预期的完全不同。
答对了
那么,机器如何知道自己是对的呢?它将输入与预期输出进行比较。在带标签的监督学习场景中,网络将输入与所有带标签的图像子集进行比较,如果网络以很高的可能性猜测出正确的图像,那么我们认为机器已经学习了该图像。
要明白这一点,请看下面的笔迹例子。手写数字 7 被输入到网络中,并在最后与(非手写)标签进行比较。如果模型做出了准确的预测,那么你可以说机器已经学习了关于 即 的图像。该机器需要对许多图像继续这样做,直到它对几乎所有的新图像都获得高水平的成功。
这是一个复杂的神经网络(CNN)如何模拟笔迹的例子。它基于 MNIST 数据集 。可以看到,在最后, 输出层 代表的是图像。将该输出向量与 7 应该匹配的标签进行比较。这里,因为向量中的第 7 个元素具有最高值,所以模型已经准确地预测了该数字是什么。
预训练模型/数据集–vgg 16
已经有许多模型被训练用于图像分类。使用 预先训练的模型 避免了重新发明轮子。使用预先训练的模型有很多好处:
- 不是每个人都有正确训练机器所需的数百万张照片
- 其图像包括高质量、标签清晰的照片
- 它包含各种各样的图像,适合任何用例
- 预训练模型已经过严格测试和基准测试,其预测精度已经确定
公司可以下载预先训练好的模型,它带有图像数据集及其所有计算出的权重。公司可以将这些数据应用于构建独特的图片搜索解决方案。然后,他们可以使用自己的内容进一步训练模型。进一步的培训会根据公司独特的数据和业务用例来调整和定制模型的权重。
视觉购物是游戏规则的改变者由于致力于推动实用人工智能边界的科学家、工程师和零售商的创造力和辛勤工作,视觉购物继续向前发展。*****
2020 年你需要知道的语音搜索统计数据
原文:https://www.algolia.com/blog/ux/voice-search-statistics-you-need-to-know/
在过去的几年里,语音搜索和语音优先设备的日益普及改变了人们使用互联网和与他们喜爱的品牌互动的方式。事实上,语音搜索甚至已经成为一些用户浏览网站的首选方法。随着这项技术的使用越来越多,很明显,语音搜索是一个设计良好的搜索界面的关键部分,企业需要适应这种不断增长的用户需求。
那么,关于语音搜索,你的企业到底需要了解什么?我们将讨论语音搜索的重要性,以及一些顶级的语音搜索统计数据对企业、用户和未来的影响,让你为未来做好准备。
为什么语音搜索很重要
有价值的搜索体验必须满足并预测用户的需求,以保持用户的满意度和参与度。对于任何品牌来说,现在投资语音搜索都很重要,原因有很多,包括:
用户期望高—由于亚马逊、谷歌和网飞等大品牌的不断创新,用户现在希望在每次互动中都使用尖端技术。随着主要品牌扩展和完善其语音搜索功能,其他公司也需要做同样的事情,为用户提供无缝、高质量的搜索体验。一夜之间为你的用户调整语音搜索是不可能的,所以早期投资是关键。
用户对语音搜索越来越满意–随着人们在移动设备上使用语音搜索,他们已经习惯了这项技术及其优势。这种舒适意味着用户可能能够并愿意在更多的设备、界面和网站上使用这一特性。你需要做好满足这种期望的准备。
对话式查询取代关键字搜索–语音搜索对许多领域都有广泛的影响,包括传统的搜索方法。因为人们对着他们的设备说话进行搜索,他们的 查询开始模仿对话 ,这些说话模式也进入了文本搜索。对于公司来说,了解如何针对这些变化优化网站和站点搜索是非常重要的。
你需要知道的语音搜索统计
语音搜索正在稳步改变用户的搜索方式和企业对用户需求的响应方式。当然,有许多语音搜索预测、趋势和统计数据。在这里,我们将最重要的统计数据分为三个不同的类别,以便更清楚地了解您的业务和用户可能受到的影响:
- 语音搜索的使用和采用
- 语音搜索商家
- 语音搜索的未来
语音搜索使用和采纳情况统计
为什么这些语音搜索的使用和采用统计数据很重要?
这些语音搜索统计数据都强烈表明,语音搜索不仅仅是一种时尚——它是人们生活中一个可行的、有价值的功能。虽然某些市场肯定会比其他市场更快地看到语音搜索的饱和,但所有公司都必须关注用户如何与功能互动,以最好地满足他们的需求。
智能助手和语音扬声器,如亚马逊 Alexa,推动了消费者对语音搜索的采用,他们希望在每次品牌互动中都能获得同等程度的便利。希望创造和维持品牌参与度的公司应该注意到,利用语音搜索进行研究、客户服务和产品购买的消费者数量正在持续上升。
T3T5
商家语音搜索统计
为什么这些语音搜索统计对商家很重要?
为了保持品牌的相关性和竞争力,企业需要考虑优化语音搜索。我们已经看到越来越多的组织投资于该技术,以推动转化率和收入,这些数字不太可能很快放缓。这是因为采用语音搜索策略的好处不容忽视,因为公司看到了更好的用户体验和更低的客户服务成本,以及其他好处。
我们已经知道,消费者已经准备好并愿意利用语音搜索进行品牌互动,因此利用这一增长趋势的企业将更好地满足客户需求。收购带来了一定的挑战,但包括语音搜索功能可以为企业提供竞争优势。不这样做可能会使公司落后于形势,因为许多竞争对手已经在采用这一功能。这使得非采纳者更难竞争、满足用户,并最终赶上用户的期望。
展望未来:统计语音搜索的未来
为什么这些统计数据对语音搜索的未来至关重要?
随着品牌向前看,他们需要考虑如何最好地满足顾客的需求。随着购买和品牌研究从实体互动转向数字互动,公司应该计划通过网站和应用为用户服务。随着越来越多的品牌在语音搜索上投入更多资金,做好准备跟上对语音搜索功能不断增长的需求非常重要。
如果语音搜索尚未成为贵公司战略的一部分,您可能需要考虑采取 的方式,近距离观察一些即将到来的趋势 以及它们可能如何为该功能铺平道路。
2 种优化语音搜索的方式
虽然开发语音搜索策略的需求是显而易见的,但对从哪里开始的理解可能有点模糊。如果你的公司希望优化你的网站进行语音搜索,这里有一些基本的最佳实践可以遵循
1。注重了解用户需求
尽管一些网站过分关注搜索引擎优化,但一个好的语音搜索策略应该强调根据自然语言的要求定制网站及其内容。这样做需要了解你的用户和他们的需求,以及他们如何搜索。 搜索分析数据 可以成为很好的资源,帮助你更好地了解用户行为和搜索趋势,并找到 潜在的错失机会。
随着语音搜索的继续发展,交互将更具互动性,而不是交易性,语音优先的设备将成为探索和发现的工具。优化你的网站内容以满足用户的整体需求,将会为你提供更具互动性的体验做好准备。
2。让你的搜索成为对话
用户与语音搜索的交互方式不同于与文本搜索的交互方式,而且语音系统的输入通常是杂乱的。设计对话式搜索需要采用结构化输入的策略,包括利用上下文,删除无关的单词或短语,以及总体减少数字草堆。这些有助于系统以更高的相关性更快地响应用户。
借助语音搜索功能获得竞争优势
理解搜索的发展方向并采取相应行动是维持良好用户体验的重要组成部分。 Algolia 帮助企业提供无缝体验 语音搜索,易于实施,确保每次都能为用户提供正确的结果。
要了解语音如何重新定义搜索,它是如何工作的,以及企业需要优化的方式,请查看 Algolia 的电子书, 下一次技术革命将被提及。
2022 年语音搜索趋势、统计和业务用例
也许你见过它们:人们在街上漫步或在镇上开车时聊天。几年前,这确实会是一个怪异的景象。现在完全正常了。人们希望即时获得信息,他们习惯于多任务处理。他们越来越多地在自己的安卓手机 或 智能音箱 上进行 语音搜索 ,询问数字强国的方向、天气更新,或者哪个 当地商家 携带他们刚刚在网上找到的商品。现在,我们几乎不会注意到有人在谷歌语音搜索“我在哪里可以买到口罩?”或者问“ Alexa 为什么音乐不放了。那些 没有 有 智能音箱 的人都开始显得有点过时了。
为什么不使用语音搜索,因为在我们的现代世界里,这是一种超级方便快捷的方式。与必须在屏幕上的搜索栏中键入查询或者试图在非常小的手机键盘上进行本地搜索相比,这是一种乐趣(尤其是如果你笨手笨脚的话)。获取语音搜索结果在很多情况下自然更快更简单。这项研究证实了这一点:71%的美国人表示,他们宁愿使用语音搜索,也不愿在键盘上输入查询( 【普华永道 )。
统计上来说
那么 语音搜索 的最新进展是什么——谁在使用它,他们用它做什么,他们有多喜欢使用它,以及一切都将走向何方?
毫不奇怪,首先,智能音箱市场继续制造噪音。据估计,2022 年,55%的美国家庭有望拥有智能音箱( 【瞻博研究 ), ),随着 5G 网络的上线,这一数字将继续攀升。
与许多新兴技术一样,年轻人最活跃:千禧一代目前是语音搜索的主要用户。但是,包括老年人在内的所有年龄段的人也在更多地使用它 ( eMarketer )。毕竟,爷爷应该可以坐在轮椅上对着他的亚马逊回声大喊来演奏他的古典音乐。
Alexa,为什么有人喜欢语音搜索?
这里有一些关于人们如何使用 语音搜索 以及他们打算用它做什么的统计数据:
- 2020 年,52%使用语音助手的人几乎每天都会使用它们,或者一天使用几次(NPR)
- 大约一半的消费者通过语音在线研究产品(),而略多于一半的消费者使用语音购买杂货(PWC)
- 据凯捷称,估计有 70%的消费者使用语音购物,而不是去实体店
- 48%的声控扬声器用户希望获得品牌的个性化提示和信息(谷歌)
嘿,谷歌,移动搜索怎么样了?
当你现在可以对着你的电话说话时,打电话似乎已经过时了。
- 网络浏览仍然是移动设备上使用的主要功能,但语音搜索排在第二位( 熟练 )
- 半数美国司机在四处乘坐飞机时使用过语音搜索(voice bot . ai)
- 71%的穿戴设备的消费者表示,他们将来会使用语音搜索
- 63%的营销人员认为为智能手机用户提供语音应用“极其重要”(Voicebot.ai)
- 到 2023 年,大约 80 亿台设备将提供语音助手(Statista)
金钱万能
当然,语音搜索不仅仅是方便消费者;这关系到企业收入的大幅提高。企业以各种方式采用语音搜索的前景依然乐观
- 71%的公司高管认为语音搜索将改善整体在线用户体验;66%的人说它可以帮助提高转化率和增加收入
- 大多数(四分之三)企业表示,他们已经从语音或聊天助手计划中获得了可量化的好处。这些好处包括客户服务成本降低 20%以上( 【凯捷 )
- 语音驱动的购物预计将达到 400 亿美元( 方式 从 20 亿美元上升到 2022 年(Siteefy)
- 2030 年,全球基于人工智能和语音识别的市场应达到 273 亿美元(insightSLICE)
特定行业更新
语音搜索被用于潜在商业收益的最新方式是什么,它的使用在哪里最相关和最有价值?
电子商务
数字营销和网上购物中的语音搜索( 【语音商务】 )是一个持续火爆的趋势,也难怪,
像 【苹果】 【谷歌】和 亚马逊 这样的公司拥抱 语音助手 技术,并将其推广到人们可能想要的任何地方。还有什么比请求 亚马逊 的 Alexa , 苹果的 Siri , 微软的 Cortana ,三星的 Bixby,或者其他一些 语音助手 帮你储备一些清洁用品,或者给你指一个在线的冰箱更容易的呢
提供语音搜索选项对在线企业来说是非常有利可图的,因此许多公司都在升级和优化他们的电子商务网站,使其支持语音搜索。一个有说服力的统计数据是:到 2022 年,基于语音的广告收入预计将达到 190 亿美元。
语音驱动购物还为营销人员提供了在 网页 上建议个性化促销和促进业务的机会。例如,想象一下你正在网上购物,就在你准备付款时,一个 弹出窗口 虚拟助手 告诉你一个诱人的附加软件,只需多花你几美元。很有可能你会倾听,并且很可能会说“管它呢?”并购买额外的物品。一个 语音助手 还可以提醒你之前买过的产品,可能还想再买。
通过 优惠券跟随 对网上购买行为进行的深入研究发现:
- 方便和节省时间是人们使用语音助手帮助他们购物的最受欢迎的原因;一些人也认为节省时间和金钱是主要的好处
- 使用语音的网上购物者比只在网上购物的人平均多花了 136 美元
- 大约三分之一的“狂热网购者”每月至少使用语音购物一次
- 最常使用语音购买的物品?杂货。
普通商业
网上购物很方便,但有时需要或更喜欢去实体店,要么在向你的 语音助手 询问信息后,要么除了进行第一次【对话】之外例如,假设你没有咖啡了,需要快速补充咖啡因。星巴克提供了一个方便的语音应用程序,可以让你重新订购你的“常用”商品,并查看你的会员卡余额。
一些零售商也开始在他们的实体店内提供 语音搜索 选项,让购物者快速找到商品在地板上的位置,并获得产品细节。潜在客户可以走向自助服务亭,谈论他们正在寻找什么,而不是被销售人员问候,询问他们是否需要帮助。
信息亭语音技术仍在完善中,面临一些挑战,比如背景噪音会干扰设备对购物者需求的理解。然而,如果语音搜索可以有效地在网上使用,它最终也可以部署在任何相关的地方,从大型商店到小型精品店。
媒体
另一个越来越流行的语音搜索趋势出现在娱乐领域:让设备在 Spotify 等应用上播放音乐,或者在网飞等应用上查找电影。例如,观看 苹果 电视的人可以说出一个查询,以跨多个应用程序调出 搜索引擎 结果。
新闻机构也融入了这种精神。例如,《经济学人》有一个每日版,通过 语音请求 提供早间新闻。《哈佛商业评论》 让消费者使用语音应用程序访问电子邮件通讯的音频版本。
语音搜索何去何从?
由于疫情和大量新产品涌入在线市场导致在线购物激增,专家预测对以语音为中心的用户体验的需求将会增加。
我们还没到那一步。有些人仍然对信任语音设备持保留态度;他们担心安全或“老大哥”监听他们,这是可以理解的。
尽管如此,人们对使用声音作为搜索方式越来越适应,也越来越有信心。这是一个双赢的局面,因为随着他们 更多地使用语音搜索 ,额外的数据被收集,这反过来改善了机器学习和人工智能预测,从而生成对语音搜索查询的更高质量的响应,这使得该技术对用户更具吸引力。简而言之, 语音搜索 功能 将根据客户和公司对它的接受和投资程度进行改进。
随着其功能的不断发展,便利性和个性化将是人们期望看到改进的关键领域。他们可能会发现 语音搜索 变得更加“直观”
当下一个巨大的飞跃将会发生,当人们全体都能感觉到他们信任这项技术的时候。凯捷预测说:“一旦建立了信任,消费者就愿意进入下一阶段的互动,包括更高层次的个性化、情感联系和价值。”。
关于语音搜索为何胜出的更多凯捷统计数据:
- 超过三分之二(68%)的消费者表示, 语音助手 让他们可以同时处理多项任务并完成任务
- 59%的人表示,在个性化方面,聊天助手正在继续改进
- 人们希望与他们的语音助手进行更多“类似人类”的互动,例如,超过一半的人说他们想给他们的助手取名
正如这些有趣的事实和趋势所表明的那样,语音搜索现在是人们在一个永远互联的世界中轻松找到他们想要的东西的一种自然方式。它将继续存在,前景光明,发展迅速。哎 Alexa ,能不能把 语音搜索 统计一下,这样在 语音搜索 更主流的时候这篇文章就可以更新了?
如果你对最新的语音搜索统计数据印象深刻,并准备为你的用户提供 语音搜索 选项,只需 说出 即可,我们的专家将很乐意告诉你更多。
了解更多信息
下一次零售革命将会讲 (电子书)
语音搜索课程:打造卓越语音体验的最佳实践 (网络研讨会)
如何在零售领域驾驭语音搜索 (用例)
了解更多关于 Algolia 语音搜索的信息(产品提供)
深入研究 Vue 即时搜索版本 2
原文:https://www.algolia.com/blog/engineering/vue-instantsearch-v2-deep-dive/
这篇文章是与布拉姆·亚当斯合作完成的。
在之前的帖子中,我们宣布了 Vue 即时搜索 2.0 库的发布。那篇文章向我们介绍了该版本中包含的新特性。这一次,我们想更深入地了解我们是如何更新库的,以及我们为什么做出这样的决定。
当你的腿不像以前那样工作的时候🎶
自从我们在 2017 年发布第一个 Vue InstantSearch 以来,我们学到了很多东西。该库开始落后于我们更新的 InstantSearch.js 库,我们能够将学到的许多经验教训应用到 Vue 中。
Vue InstantSearch 的最初版本是由 Raymond 的一个小黑客开始的。我们对 Vue 的发展轨迹感到非常兴奋,并希望能够发布一个库,使 Algolia 用户能够更容易地将其集成到他们的框架中。
我们的 Vue 库的第一次迭代有一些问题。主要问题是我们是在黑暗中建造的!嗯,我是说,不完全是,我们的电脑是背光的。从某种意义上说,我们在没有太多社区投入的情况下建造了这个图书馆,这是黑暗的。
另一个主要问题是,我们的许多组件缺乏可定制性,需要人们经常完全复制我们的组件,以便能够充分地编辑它们。
通过承认我们的弱点,我们能够建立一个更好的图书馆。我们希望你也会喜欢它。如果你已经使用了 Vue InstantSearch 的前一版本,并且想知道增加了哪些新功能,请查看前一篇文章。
米罗,墙上的米罗,他们中谁最抽象?
Joan Miro – Portrait IV (1938)
说到抽象,Vue InstantSearch 现在已经涵盖了你。我们希望扩展组件的可定制性,让最终用户(就是你!)决定 Algolia 体验的外观和感觉。
在下面的段落中,我们将讨论如何定制即时搜索组件。每一层都比上一层更加可定制,允许您决定是喜欢易于集成的已构建组件,还是完全控制外观、感觉和功能。
想象一个搜索框的例子。这似乎是一个简单的组件,但它实际上是我们更复杂的部件之一,支持所有这些不同级别的定制。
The default ais-search-box component
作为道具的文本
最容易修改搜索框的部分之一是placeholder
。这是将在输入元素本身中可见的文本。我们特别选择将这个属性转发到内部输入,因为我们将输入包装在一个表单中(更多关于我们为什么这样设计搜索框的信息,请参见关于搜索框的详细博文】)。
当一个 prop 被转发到一个内部组件时,它总是保留在你的外部组件上,或者有相同的名称,或者有一个一致的前缀来指示它被应用到哪个内部元素。
<ais-searchbox
placeholder="Search for flavors: e.g. vanilla, chocolate…"
/>
作为插槽的子组件
在搜索框中,我们还有一个带有图标的按钮,让用户清除查询。此时,不仅字符串是有效的,任何 Vue 组件也是有效的。因为它不需要访问依赖于它的渲染的任何状态,所以它是一个常规的插槽。
如果你不熟悉,你可以在这里阅读更多关于 Vue 插槽的信息。
<ais-searchbox>
<template slot="resetIcon">✕</template>
</ais-searchbox>
将整个 DOM 重写为作用域槽
最后,我们还在组件的根内添加了一个作用域槽。我们向该槽提供从小部件的数据层(connector
)检索的信息。该模板中的任何内容现在都可以访问currentRefinement
、refine
以及呈现该组件所需的任何内容。
多亏了slot-scope
,我们现在不用离开模板就可以轻松地重写小部件的外观。
<ais-searchbox>
<template
slot="default"
slot-scope="{ currentRefinement, refine }"
>
<input
type="search"
:value="currentRefinement"
@input="refine($event.target.value)"
/>
</template>
</ais-searchbox>
编写全新的 Vue 组件
有时候,slot-scope
提供的控制水平仍然不足以满足你想要构建的东西。这有两个不同的原因:需要访问组件生命周期中底层业务逻辑(connector
)提供的范围,或者自己编写一个定制的连接器。我们通过从连接器中抽象出创建“小部件”的逻辑,并用createWidgetMixin
mixin 将它注册到其根组件,从而简化了这个过程。
假设您想要呈现自己的搜索框(而不是ais-searchbox
)。我们可以使用connectSearchBox
获取数据,使用createWidgetMixin
将 Algolia 数据直接插入到我们的模板中。从这里开始,天空就是极限。你可以让你的组件看起来像你想要的那样!我们这样做的原因是在created()
钩子期间数据被填充到state
键。这允许您完全控制呈现逻辑和转换业务逻辑。
<template>
<form
v-if="state"
action=""
@submit="onFormSubmit"
@reset="onFormReset"
>
<input
:value="state.currentRefinement"
@input="onInput"
/>
<button type="reset">reset</button>
</form>
</template>
<script>
import { connectSearchBox } from 'instantsearch.js/es/connectors';
import { createWidgetMixin } from 'vue-instantsearch';
export default {
mixins: [
createWidgetMixin({ connector: connectSearchBox }),
],
methods: {
onInput(event) {
this.state.refine(event.target.value);
},
onFormSubmit() {
const input = this.$el.querySelector('input[type=search]');
input.blur();
},
onFormReset() {
this.state.refine('');
},
},
};
</script>
在这个组件中,没有太多使用完全自定义的小部件的情况。然而,对于包装更高级的第三方组件,或者修改connector
的工作方式,这是一个非常有用的 API。
但是让我们先来看看为什么我们可能想要拆分逻辑。
拆分逻辑是否不理智?
在 Vue InstantSearch 2 中,我们选择在呈现组件和负责业务逻辑的连接器之间进行分离。当您创建自己的自定义组件并希望使用 Algolia 结果中的数据时,这非常有用。通过将业务逻辑与组件本身分离,概念上与另一个现有组件相同的组件不需要从头重写它们的业务逻辑。
一个抽象应该能够适应任何具有相同概念的用例
拆分逻辑需要找到一个平衡点。你不能把它分开太多,因为构建不同风格和框架所需的所有样板文件会变得乏味。然而,您也不能让它过于特定于视图,因为这样您就失去了将来添加新组件的灵活性。我们在这里使用的一个经验法则是,任何连接器都应该能够适应所有具有相同概念的组件。
这里的一个例子是显示为列表的菜单(只有一个选择的列表),或者显示为下拉菜单的菜单。如果在一个业务逻辑抽象中,你用代码来处理选择逻辑,这将超出它的界限,你更有可能为每种情况做一个抽象。
在这一点上的选择是决定逻辑是否足够容易在视图层被重写(使用事件处理程序之类的东西),从而只进行单一的业务逻辑抽象。另一方面,有时候一个想法变成了两种完全不同的抽象。
在这种情况下,两种完全不同的抽象是命中(即结果)和无限命中。这两种方法都从查询结果中读取数据,以显示当前应用的结果,但是无限命中抽象将包含诸如将以前的命中保留在范围内这样的内容,以便可以将所有可见的命中连接起来。
业务逻辑抽象之间的一致性
Algolia 以拥有最好的开发者体验而自豪。为了实现这个目标,我们专注于在不同的 JavaScript 风格之间建立一个一致的基础。无论您是在 Vue、React 还是普通的 JavaScript 中,这些连接器都可以工作。如果您的商业案例超出了我们的小工具所能处理的范围,我们鼓励您查看它们!
事实证明,在创建像 Vue InstantSearch 这样的库时,向一致抽象的转移非常有用。我们只需要在 Vue 组件中考虑一种类型的 API(使用一个connector
)就可以让它一致地感知业务逻辑(从状态中读取,以及改变精化状态)。
如果我们选择将它分解成函数,每个函数都有自己的 API,那么这些函数会变得更简单——但是更难协同工作。这里的目标是使视图层尽可能简单,使添加新的框架风格更容易。
结论
我们希望你喜欢我们新的 Vue 库的内部,我们希望你和我们一样喜欢这个库。
让你的生活更加丰富多彩的小贴士😎
原文:https://www.algolia.com/blog/engineering/vue-instantsearch-v2/
这篇文章是与 Bram Adams 合作完成的。
大新闻!我们自豪地宣布我们的第二个主要版本 Vue InstantSearch 。我们增加了许多有益的优化和新功能。我们长话短说,专注于我们最喜欢的。让我们开始吧。
新增 Vue 小工具!
我喜欢玩新玩具,你呢?Vue InstantSearch 2 附带了一系列新组件,将使您的搜索变得非常棒。这里有一些你可能会感兴趣的。
把你的小工具包在一个容器里
ais-panel
是一个容器小部件,可以用来为你的站点提供一致的外观和感觉。您可以使用这个小部件在小部件周围一致地显示页眉和页脚。因为它将有一个ais-Panel--noRefinement
类,所以如果小部件不能使用,以不同的方式隐藏或显示它也变得更加一致。
有条件地显示结果
你有没有想过,我希望我可以只在某些时候展示这些结果?现在你可以了!使用ais-state-results
,你可以选择向你的用户显示什么。它可以用来显示一个特定的“没有结果”页面,或者当有人细化一个特定的案例时显示一个特定的横幅。
显示面包屑
我把那只鞋放在哪里了?…哦,对了!使用ais-breadcrumb
,你可以让用户发现路径,并给他们另一种方式来浏览你的产品。我一直在概念中使用我的面包屑!
执行内嵌配置
配置的力量。住在 Vue 的舒适!使用ais-configure
,你可以向 Algolia 提供原始的搜索参数。这将允许您在前端做一些强大的事情,比如限制每个查询返回的命中数,或者只返回不同的结果。
显示下拉菜单
一个强大的小部件,ais-menu-select
给你一个下拉菜单,显示用户可以与之交互的菜单项。这个小部件是高度可定制的,允许你预先渲染结果,让你有机会在结果显示给用户之前对它们进行操作!微小的下拉菜单,巨大的潜力!
查看您应用的细化
ais-current-refinements
小部件显示用户选择的每个当前细化的药丸。作为开发人员,您可以决定允许在这个小部件中显示哪些属性子集。看到这里的趋势了吗?可定制性已经存在!
显示更多结果
这个ais-infinite-hits
小部件的名字非常贴切!它给你的组件添加一个“显示更多结果”按钮,当按下时,将显示更多的项目。继续滚动,继续滚动…
创建数字菜单
这个ais-numeric-menu
小部件是一个可预先配置的小部件,它创建一个数字对象的单选按钮菜单,可以用作过滤器。要使用这个小部件,只需创建一个包含不同数值的对象列表,如下所示。数学!
[
{ label: 'All' },
{ label: '<= 10$', end: 10 },
{ label: '10$ - 100$', start: 10, end: 100 },
{ label: '100$ - 500$', start: 100, end: 500 },
{ label: '>= 500$', start: 500 },
]
切换一个细化
上蜡,下蜡。也就是说,至少,如果“蜡”是一个 Algolia 属性!您可以使用ais-toggle-refinement
来显示一个可切换的组件。和以前一样,你也可以用slot-scope
编辑 CSS 类来实现深度定制!
新增 Widget…名称!
名称又能代表什么呢我们已经更新了小部件的名称,使其更接近我们的即时搜索风格。完整的列表可以在这里找到,但主要的想法是,你过去使用 Algolia InstantSearch 的任何经验都应该无缝地滚动。
服务器端渲染(SSR)
我们彻底改进了服务器端渲染与 Vue InstantSearch 的工作方式。与前一版本相比,服务器端渲染的功能没有太大变化,但主要区别在于它是如何在幕后实现的。不是等到所有请求都完成(不一定总是正确的),而是使用静态方法来完成后端请求。阅读文档中关于如何实施 SSR 的更多信息。
URL 同步
以前,您必须手动读取和翻译“搜索存储”中的每个参数,并使其与 URL 保持同步。这不是一个简单的过程,所以我们用一个专用的 API 来简化它。我们现在映射这些参数,将它们转换成 URL 友好的格式,并提供一种根据需要修改 URL 的方法。在文档中阅读更多关于那个的内容。
定制的小工具
让我们以一个我们自豪地宣布的特性来结束。我们的小部件现在是完全可扩展和可定制的。在不久的将来,我们会就这个主题发表第二篇博客,但是我们可以给你一些细节。为了定制一个小部件,现在有四个级别来尽可能平滑地定制:
简单定制
定制小部件最简单的方法是改变简单的文本和图标。为此,您将使用常规的“插槽”。一个例子是ais-search-box
上的复位图标。
定制完整 HTML
如果您想进一步定制和覆盖组件的整个 HTML 输出,您也可以通过“作用域槽”来实现,每个小部件的根上都有这个槽。一个例子就是使用你自己的组件来代替搜索框。您将获得对当前查询的访问,以及将查询更改为新查询的功能(refine
)。
使用 widget mixin
如果您发现还需要访问提供给这个小部件的数据的生命周期方法,您可以添加小部件 mixin 并使用 InstantSearch 中提供的连接器。
矩阵级控制
最后,您还可以进入“超矩阵模式”(我喜欢这样称呼它),并制作自己的连接器来封装直接修改搜索状态的逻辑。
触手可及的完全控制!查看我们的教程如何定制一个小部件。
得出结论
从添加小工具到允许完全定制它们的外观、感觉和行为,我们一直在努力确保 Vue InstantSearch 为您提供 Algolia 强大搜索技术的最佳功能!试试 Vue InstantSearch v2 现在这里,或者阅读文档。
搜索的网页内容可访问性指南(
全球约有10 亿残疾成年人 可以访问您的网站和应用程序搜索功能吗?
例如,用户是否可以轻松地看到搜索栏,并使用文本选项导航到他们想要查找的内容?他们有足够的时间在你的网站上完成他们的目标吗?你的视觉效果容易被视力受损的人看到吗?
【网页无障碍(很多)】
如果你是这些人中的一员,那么残疾人能够像健全人一样访问网络对你来说显然是非常重要的。网站越能确保他们的服务和产品是可访问的,并准备好帮助所有用户,对残疾人就越好。(有些公司因不采用标准而起诉 的可能性越小。)
残疾类型
在设计可访问的网站和界面时,开发人员和设计人员应该注意用户可能会有各种残疾、暂时的限制和情况问题,包括:
- 视觉相关损伤(如色盲)
- 听觉障碍(如耳聋或重听)
- 认知障碍(如痴呆)
- 神经损伤(如光敏性癫痫、自闭症、癫痫发作障碍)
- 言语障碍(如口吃)
- 身体损伤(如手臂骨折)
- 与年龄相关的损伤(如各种疾病)
- 丢失的眼镜(临时)
- 工作空间明亮的阳光(情境)
- 网速慢(情景模式)
- 无法播放音频描述的环境(情景)
主要玩家:W3C 和 ADA
为了帮助用户,鼓励公司满足 网站内容无障碍指南 (WCAG)和 美国残疾人法案 (ADA)网站和应用的数字标准。
WCAG 指南由 万维网联盟 (www。W3.org),该组织致力于开发互联网的国际标准。这些准则定期更新;例如,该组织最近从版本WCAG 2.1转移到了版本WCAG 2.2。
ADA 的一套指南适用于网站和其他数字体验,但 ADA 并没有明确提供数字无障碍成功标准。网络符合 ADA 基本上意味着符合 WCAG 标准。
WCAG 一致性原则
就数字无障碍问题而言,WCAG 成功标准由四大支柱组成。为了符合可访问性指南,网站必须:
可感知
根据 W3C 的说法,“信息和用户界面组件必须以用户可以感知的方式呈现给用户……它不可能对他们所有的感官都是不可见的。”一个例子: 使用 重排 放大文本有助于视力受损的人避免滚动问题,清楚地看到字符,并成功阅读内容。另一个有用的步骤:提供额外的输入方式(例如,一个指针)而不仅仅是一个键盘。
可操作性
数字无障碍专家表示,用户必须能够轻松地“操作”用户界面中的组件,并成功导航。
可以理解
人们必须能够理解信息以及界面如何工作。W3C 的一个有助于轻松理解的建议是确保所有观众有合适的 阅读水平 。其他建议:确保标题和标签容易理解,缩写不会让人混淆。
稳健
无论是现在还是将来,网站都应该在结构上合理,这样内容才能被可靠地解释,加上网络标准需要与辅助技术兼容。
公司近况如何?
好消息是越来越多的公司开始采用网页可访问性标准。根据 Forrester的调查,84%的公司都在努力使他们的网站具有可访问性。
你的网站怎么样?例如,您的 搜索 功能的易用性如何?
通过确保 WCAG 合规性,您可以让各种能力水平的人更轻松地访问您的搜索引擎、浏览您的用户界面,并获得他们需要的内容。作为一个额外的好处,通过以一种可访问的方式提供内容,你可以大大拓宽你的市场。
什么进入 WCAG 一致性?
尽管听起来令人生畏,而且肯定会有一些 挑战——进行 WCAG 合规性审计并做出任何必要的改变可能没有你想象的那么复杂。你也可以将项目分解成更小的任务。例如,为了解决与视觉相关的障碍,您可以评估网站的各个方面,如颜色对比、动画和过渡,然后提供适当的可用性替代方案。
这里总结了构建和管理搜索界面时需要考虑的一些重要的可访问性方面。每个原则包含不同的指导方针,可以在三个一致性级别中的一个级别上实现:
- A 级(最低)
- AA 级(中音)
- AAA 级(最高)
A 级是最低的——聊胜于无。通常,组织试图实现 AA 级别。为了达到 AAA 级,组织必须满足更严格的前景色和背景色对比度要求。
如果您正在构建一个自定义搜索界面,或者在您的网站上查看一个 站点搜索 安装,您希望确保您的网站搜索体验符合【WCAG 2.2(或更新版本)AA 标准,以及满足视障用户的可访问性标准。
注: 如果您的搜索界面或网站体验的任何其他组件不符合与您网站其余部分相同的合规性级别,则该网站整体被降级为较低的合规性级别。
如何保证你的搜索界面 WCAG 合规
你可以从这本 W3C 快速参考指南 开始,评估你的网站搜索功能的各个方面的可访问性。
如果你正在使用 Mac 测试你的网站合规性,一个简单的方法是使用 Mac OS X 中的voice over实用程序
如果你在用微软的 Windows 测试合规性,你可以使用Jaws(语音作业访问)或者其他一些语音辅助软件。
用户体验测试评估:
- 视力障碍者的无障碍环境
- 与无障碍软件和辅助技术的兼容性
- HTML 结构(画外音只有在内容结构正确,有正确的描述和 alt 标签的情况下才有意义,才能正常工作)
通过测试,您将发现许多需要解决的问题,以便实现 WCAG 合规性。
首先:你的搜索栏怎么样了?
搜索栏或图标
如何让那些看不见的人“看得见”你网站上的搜索栏或搜索图标,因此他们需要借助一个方便的屏幕阅读器来导航?您可以为搜索栏提供一个标签,或者提供一个辅助技术可以通知的图标。
您的用户搜索体验应该:
被预见
例如,搜索栏应该放在人们期望找到它的地方,通常在屏幕的右上角。
用颜色区分开来
当涉及到图像、按钮和图标时,颜色的对比度,如文本颜色和背景颜色之间的对比度,应该 足够 以便于查看和阅读。
合并可选文字属性
如果你使用放大镜(或其他符号)搜索图标,图片应该在< img >标签中包含一个 alt-text="Search "属性。搜索栏中的图标应该有一个 alt-text 属性来描述它,因为它是非文本内容。
Aria-label 属性用于为对象提供标签,然后用户可以读取这些标签。如下所示,符合 WCAG 标准的网站搜索接口在 button div 类中使用 aria-label="Search"。
被键盘访问
用户应该能够使用键盘上的 Tab 键在搜索栏内外导航:
使用右焦点顺序
残疾用户应该能够轻松地搜索和导航。有一件事有助于旅途顺利:当他们在搜索栏中输入查询时,键盘焦点应该保持在搜索栏上,这样,如果需要,他们可以继续输入或修改他们的查询。
如果他们使用 Tab 键盘按钮导航,焦点顺序应该是连续的,并与 HTML/DOM 相匹配。理想情况下,他们应该能够使用键盘从搜索栏导航到他们的搜索结果,然后到分页,然后到他们浏览器中页面的 URL,然后回到网页。
识别文本输入的目的
当提供搜索栏时,文本输入字段应具有标识其功能的标签。
在这个网站搜索栏的代码中,你可以看到 aria-label 描述“搜索整个网站内容”:
怎样才能让搜索结果更易访问?
根据你的网站设计和用户体验需求,你可以用多种方式设置你的搜索结果页面,比如网格或列表。标准的方式是列表,但是指导方针适用于您选择的任何设计。
保证无缝键盘访问
当显示搜索结果时,用户应该能够使用 Tab 键在其中导航。使用 Tab 键无法访问描述和状态消息(例如,“149 个‘站点搜索’结果”)。但是,屏幕阅读器软件或画外音工具应该能够向用户阅读描述和状态消息,这使得所有必要的信息都可用,而不会干扰导航。
添加角色= "状态"消息
当用户输入搜索词时,页面内容会更新并显示搜索结果。屏幕阅读器应该自动获取并阅读状态消息。通过向代码添加一条 aria 状态角色 (role="status ")消息,您可以允许屏幕阅读器宣布返回结果的数量。
不用担心搜索结果中的图片
装饰图像 不为网页提供内容,因此当用户浏览结果时,出现在搜索结果中的装饰图像不需要被关注。这些图像也不需要 alt 属性,因为不会丢失信息。
提供键盘可访问的分页
如果你使用分页来允许用户浏览搜索结果,它也应该可以通过键盘来访问和操作。
视觉上区分元素
为了便于查看,标题、描述、URL 和其他元素中的文本颜色的对比度至少应为 4:5:1。
你可以使用这个 工具 来测试你的对比度。
提供适应性强的功能
在桌面和移动设备上检查纵向和横向搜索结果的外观。结果文本的大小必须调整到 200%,而不会丢失任何内容或功能。
优化你的叠加界面
如果你在覆盖窗口中显示搜索结果,用户应该能够导航到关闭按钮,并且关闭按钮(如果是图标)应该有正确的 aria-label 或 alt-description 属性。
检查你的滤镜和刻面可及性
您所有的 过滤器和刻面 都应该可以从键盘上访问和操作,并具有适当的 aria 标签描述,以及这些特性的状态。
通过更好的访问提高可用性
这为每个人总结了优化你的网站用户体验的关键因素。在 WCAG 标准的帮助下,通过搜索功能确保网站的可访问性是你可以做出的最重要的改进之一,让各种能力水平的人都能在你的网站上找到自己的路,并以最丰富的方式体验你的网站。
寻找其他方法来改善网站的用户搜索体验?可以帮忙。 请告诉我们 您有兴趣了解伟大搜索的好处,我们将很乐意查看您的网站并提供个性化建议。
什么是媒体中的内容推荐?
个性化将成为未来几年营销成功的关键。技术进步正在推动消费者网络空间中更多的人类体验,随着后疫情时代数字行为的激增,组织适应日益增长的个性化交互趋势至关重要。
内容推荐是个性化家谱的一个分支。最简单的是,可以根据内容的受欢迎程度向用户提供一般性的推荐。在更复杂的层面上,人工智能驱动的内容推荐引擎可以根据产品目录和客户/消费者/用户数据进行训练,以提供更个性化的推荐。
什么是内容推荐引擎?
内容推荐引擎是一种软件解决方案,它利用人工智能和机器学习技术来分析数据,以便在网站或应用程序上提供更个性化的用户体验。
先进的引擎不再由“大科技”公司赞助,如谷歌、亚马逊、网飞或其他市场领导者。现在,第三方 推荐解决方案 使企业能够充分利用其网站的数据,提供个性化的内容或建议,从而实现更高的留存、消费或转化。
什么是媒体中的内容推荐?
媒体中的内容推荐系统根据消费者数据和趋势为用户和订户提供个性化内容。个性化推荐可以应用于视频和音乐流媒体网站、出版商、社交媒体网络以及其他媒体和新闻机构,以创建吸引用户的相关体验,并增加用户在网站或应用上的停留时间。
店内书店会强调雇佣受过充分文学教育或博览群书的员工。在此基础上,销售助理可以根据客户的书籍偏好提出建议,或者向站在“小说”通道的客户推荐类似的、更受欢迎的、甚至更相关的内容。
在网上,算法取代了知识渊博的销售助理的角色,根据消费者数据提供实时建议,为消费者创造个性化体验。
为什么媒体内容推荐很重要?
double verify 开展的“2020 年 ”媒体广告的四大根本转变研究发现,内容消费正在飙升,47%的消费者花更多时间阅读在线新闻,同样比例的消费者增加了对视频流媒体服务的使用。
内容消费的激增为数字媒体企业提供了一个机会,利用内容推荐算法和引擎的力量,在拥挤的市场中提高用户参与度和忠诚度。
媒体中的内容推荐是如何工作的?
推荐通过算法工作,通常由人工智能驱动,利用用户数据来优化和个性化内容建议。这些建议将基于 cookie 数据收集和指标,如年龄、性别和其他人口统计信息,以及过去的收视率和搜索历史。
推荐引擎的算法将在各种模型上运行,前提是:
- 流行内容: 基于流行度的算法根据流行或趋势提供内容。如果某个特定的内容(例如一篇文章或一段视频)越来越受欢迎,它将被提供给其他用户。这些算法确保一个趋势性的内容“驾驭”其成功的浪潮,利用其受欢迎程度,并以此为基础扩大受众和网站或应用程序访问者的范围。
- 关联内容: 基于关联的算法评估相似内容的各个片段之间的关系强度。例如,如果两篇新闻文章之间存在相似性,并且大多数用户都阅读这两篇文章,则该数据可以被建议性地使用,从而促使其他用户考虑第二种选择。这些提示存在于网站的标题下,如“客户也阅读这些”,或“查看更多这样的”。
- 历史内容: 基于内容的算法查看用户过去访问过的内容类型之间的相似性,以提示现在和未来的推荐。有了忠实的和经常性的用户,可以基于喜欢、不喜欢和消费模式建立复杂的用户偏好简档。诸如流派和格式(“恐怖片”、“电视节目”)的分类缩小了给定用户的偏好,以及时间消耗数据等等。所有这些数据为用户提供了更加个性化的媒体产品。这降低了他们内容搜索和发现体验的复杂性,并实现了更有针对性、更有价值的交互,从而提高了效率、参与度和留存率。
媒体内容推荐的好处
媒体内容推荐的好处很多。这里就举几个:
- 消费者留存: 一个成功的内容推荐引擎会模拟出一个高绩效销售助理所提供的体验。建议将是知识驱动的、相关的,并迎合用户的特定口味。一个成功的建议路径(例如,一系列被网络浏览者认可的建议)将会在一个网站或应用上创造很高的留存率。
个性化推荐可能是消费者参与两分钟或 45 分钟的区别。定制和个性化已经嵌入到当今所有领先技术公司的产品中,因此拥有这些功能对于在现代市场中竞争是必要的。
- 顾客&消费者忠诚度: 建立品牌忠诚度需要信任。消费者的时间是宝贵的,如果内容推荐不尽人意,他们会转向“更了解他们”的竞争对手。
借助 高级内容推荐引擎 ,企业可以确保消费者花在产品上的时间是有意义的、优化的,让他们感到愉悦,并帮助培养忠实的读者或观众。
- 更多消费&转化: 个性化推荐意味着更多转化。在视频流媒体网站上,如网飞或 YouTube,数据驱动的推荐可以促进向更高价值的订阅包的转换(“如果你想观看这部电影,或定制你的个人资料,你需要购买这个包或层”)。
对于主要收入来源于广告或订阅的在线新闻网站来说,消费者参与创造了一个更具粘性、价值更高的网站。这有助于推动广告业务模式和额外的推荐内容,在 X 免费件有助于推动更多的订阅采用。
个性化的力量
要了解个性化的力量,你不必看得太远。内容推荐现在是媒体属性和平台上的“标准”,正如一份 Twilio 细分市场报告 中所概述的,提供了品牌成功的关键指标。2021 年,60%的消费者表示,在个性化网站体验后,他们可能会成为回头客,高于 2017 年的 44%。
然而,只有不到四分之一的企业采用了这种解决方案,这意味着消费者对个性化的期望与大多数企业提供的用户体验之间存在巨大差距。
第三方内容推荐引擎,如Algolia Recommend,为那些希望利用先进推荐引擎的力量将自己与主要技术领导者相提并论的企业提供了一个解决方案。
通过 Algolia Recommend,开发人员可以使用简单的 API 在媒体网站或应用程序上构建人工智能结构的推荐,只需六行代码。缩小消费者期望和网站表现之间的差距对于企业留住用户、建立品牌忠诚度和增加收入至关重要。在一个饱和的媒体市场,是时候变得个性化了,而且要快。
如果你想用更个性化的内容吸引消费者, 联系 Algolia 团队 或 请求免费演示 。
什么是个性化推荐?
如果你不得不在没有首先查看你的个性化推荐的情况下做出网上商店(甚至实体商店)的购买决定,那会怎样?你知道,那些数据科学驱动的相关产品的营销想法,专为你而想。这些电子商务网站对相关产品的推荐基于机器学习智能,这些智能是由关于用户行为和购买历史的输入数据产生的。
如果连一个 基于人工智能的推荐都没有,比如“你可能会喜欢…”或“看看这些受欢迎的产品”或“喜欢这个的人也喜欢…”会怎么样?连一句“经常一起买”都没有
嗯。你会觉得有点失落。你会对购买该商品感到矛盾,即使它的伟大功能在专业的图片中有详细的描述,营销文案很有吸引力,网站宣传免费退货。
然而,如果网站的产品推荐引擎 主动地、全心全意地主动推荐特定的产品,因为它本质上知道你想要什么,你就不会犹豫了。
基于深度学习的推荐系统肯定会让网上购物变得更容易,不是吗?
个性化产品推荐工作
针对购物者和媒体网站订阅者的深度学习生成的推荐已经成为电子商务发现和购买体验不可或缺的一部分。为了使你的网站指标获得最大的成功,你需要确定正确的产品推荐模型。事实上,在 的一项调查 中,54%的零售商声称产品推荐功能作为 的关键驱动因素 的平均订单价值更高。
每个人都知道,像亚马逊和网飞这样的大公司在个性化推荐方面设立了很高的标准——这种量身定制的指导是人们现在所期望的,即使他们只是浏览较小公司的网站,这些公司没有同样的能力来实施或预算最先进的数字资源和功能。
有了网购,一个相关的推荐就能改变一切。就像一个个人购物者在你喜欢和不喜欢的每一个方面接受教育一样,推荐功能会为你进行搜索,搜索网站以找到你可能想要的信息检索,然后在适当的时候礼貌地建议你可能想要查看一下。
所以,是的,你要提供正确的推荐,让你的顾客感受到在你的网站上购物的乐趣。你想展示他们愿意考虑的产品。你希望他们习惯于考虑你的建议,然后回来。
客户保留是利用个性化推荐的一个有据可查的好处。2018 年 Monetate 的一项研究 发现,55%的零售网站回头客在购物期间更有可能购买推荐的产品(如通过阅读产品描述)。对于新客户呢? 高达 70%。
什么是个性化推荐?
简而言之,在线个性化推荐是由推荐引擎(又称为 推荐系统 )基于对客户现场参观的了解,使用算法和过滤选项生成的相关建议。前瞻性线索:
- 他们输入了什么搜索查询?
- 他们的浏览历史是怎样的?
- 他们最近买了什么?
- 还有哪些项目可以补充他们一直在看的东西?
- 其他购物者购买了哪些他们似乎想要的商品?
- 他们的购物车里有什么,他们有没有抛弃?
- 他们是否在社交媒体上分享了某件物品的一些信息?
- 在在线电影订阅网站模式中,他们在看什么?
- 他们的人口统计是怎样的?
产品类型推荐
推荐引擎必须对所有可用的数据进行分类,并给出他们对推荐内容的最佳猜测。有三个不同的焦点:
协同过滤系统
这种类型的推荐引擎收集并分析用户活动和偏好的数据,根据用户与其他用户的相似性推测用户的喜好。有趣的是,内容本身(物品、书籍或电影)不在考虑之列。这种方法以矩阵形式的公式为基础,在具有相似偏好的人群中应用有关用户偏好的逻辑,并根据早期活动进行预测。
协作过滤有两种方式:基于记忆和基于模型。
基于记忆的 协同过滤识别用户群,并查看用户交互来预测相似用户的交互。它还识别由用户 A 评级的项目群,然后使用它们来预测用户 A 与相似项目 b 的交互
依靠机器学习和数据挖掘, 基于模型 协同过滤专注于训练模型进行预测。例如,它可能使用与某个项目的交互来预测喜欢的项目。它可以向更多的人推荐更多的商品
比基于记忆的协同过滤。
内容过滤系统
当你看到“如果你喜欢那个,你可能也会喜欢这个”时,或者如果你几周前看了某个东西,而你现在得到一个提示来查看类似的项目时,你知道过滤是基于内容的。对于基于内容的推荐,相似的项目根据特征进行分组。推荐算法着眼于顾客偏好加上商品描述(例如,流派、类型、颜色)。
混合推荐系统
当您可以享受 两者的好处时,为什么只利用内存或只利用内容协同过滤? 网飞就是这样做的。它考虑了用户的兴趣(协同过滤)以及电影描述和特征(基于内容的过滤)。
如何利用个性化推荐来提升参与度、转化度和绩效?
合适的定制推荐可以让你的网站与众不同。当您可以使用大数据来打动客户并让客户满意时,您就实现了参与的崇高目标。足够的持续参与会带来网站绩效的提升。
当然,最终的回报是更高的转换率,这是因为你从客户开始搜索到他们在购物车页面上前进的过程中,不断努力适应他们的需求,无论他们是否意外地放弃了购物之旅,或者购买了多种额外的推荐产品,然后第二天又回来寻找更多产品。最终,使用个性化推荐对零售商和购物者都是双赢的。
我们为 的你推荐什么?
因为你已经和我们在一起这么久了,所以你很可能对添加直观的推荐感兴趣。是时候为你的网站寻找最佳的推荐方案了。你可能想知道,除了我们著名的 搜索技术 之外,这也是我们在 Algolia 专攻的功能。
我们久经考验的电子商务推荐系统可以做到这一切:实现快速、可扩展的产品发现,促进一流的用户参与,确保重复的客户访问,并最大限度地提高转化率。我们的相关内容模型使用混合引擎以及协作过滤和用户信号来提供高质量的推荐。
你可以将用户推荐显示在最合适的地方,无论是在产品页面、主页还是产品类别页面。你甚至可以整合 推荐 在结账时展示互补产品,以增加你的平均订单价值。您的开发人员可以利用我们可靠的 API 来构建和完善您的最佳推荐体验。
使用“推荐”功能推荐不同颜色和功能的类似产品,有助于人们继续寻找相关信息,最终做出最佳选择,而不必在主页上重复搜索。我们怎么知道推荐对于构建增强个性化体验的推荐系统来说是一个非常好的选择呢?在客户数据的帮助下,我们收集了一些令人信服的统计数据。
战略性地推荐使用,提高每个接触点的客户参与度。我们已经计算出这会导致一个:
- 订单率增长 150%
- 篮子增加 20%
- 整体站点转化率增加 13%
- 跳出率降低 24%
当然电子商务商店 喜欢 推荐商品,但是像电影推荐这样的事情呢?无论您处于哪个行业,也无论您最关注的是更高的购物车价值、更好的客户保持率还是更高的转化率,您都可以提供令人愉快的用户体验优化,并取得成效。Algolia Recommend 将根据有监督的机器学习算法,从您的索引和用户事件中专业地构建模型。
让我们来聊聊 Algolia 的推荐如何帮助你提升客户体验以及 发展业务 。我们会给你一个 个性化演示 ,你可以 免费试用我们 ,每月有 10,000 次推荐请求。了解如何通过正确的推荐策略增加流量和销售额。谁知道呢?像我们的许多客户一样,你可能很快就会显著改善你的顾客之旅,然后亲自推荐 Algolia。
什么是预测搜索和自动完成?
原文:https://www.algolia.com/blog/ux/what-are-predictive-search-and-autocomplete/
今天的网络用户对搜索有很高的期望。多亏了谷歌和其他网站,他们已经开始在所有的搜索体验中期待某些搜索模式和功能,比如自动完成。自动完成或预测性搜索尤其重要,因为它可以引导用户获得更好的搜索结果,从而改善用户体验。在本文中,我们将解释什么是自动完成,描述它的好处,并给出一些在搜索中使用自动完成的提示。
什么是自动完成和预测搜索?
自动完成是一种搜索功能,搜索引擎可以预测用户的查询,并在用户键入时提供建议。用户可以选择任何自动完成的建议并得到结果,而不必手动键入每个字符。
自动完成和预测性搜索,通常与自动建议、 查询建议 和随输入随搜索等术语互换使用,对于提高用户保留率和转化率非常重要。这在很大程度上是因为它们帮助用户更快地找到相关结果,从而降低了因常见问题(如用户困惑、分心或因搜索引擎无法解析查询而无法找到产品或内容)而导致的跳出率。
任何行业的任何网站都可以受益于预测性搜索。例如,电子商务网站可以使用它来帮助用户浏览他们的产品目录,而媒体公司可以使用它来帮助用户找到相关的新闻、视频和其他内容。
自动完成搜索对用户有什么帮助?
用户习惯于有效搜索,但自身搜索技能相对较弱 。 事实上, 只有 1%的用户知道如何转移搜索策略以获得更有效的结果。自动完成可以用几种方式减轻这个问题:
- 报价成功查询 。当适当优化时,自动完成的建议总是会带来结果,因此 减少了没有结果页面 的几率。通过向用户展示一些肯定会带来结果的热门查询,你可以增加用户停留在网站上并接触更多内容的机会。
- 向用户介绍你的网站。用户可能不知道你的产品范围。自动完成功能可以显示与业务优先级一致的产品和内容类别,以扩大用户对您站点的了解。
- 减少搜索时间 。由于自动完成功能可以快速提供上下文建议,用户很少需要键入整个查询。这可以帮助用户避免键入冗长、复杂的查询和 错别字 ,这些都是一个 未优化的搜索引擎 可能会遇到解析困难的。Autocomplete 可以减少这些错误,让用户更快地找到相关结果,最大限度地减少搜索失败的可能性。
- 提升用户体验 。让用户更快、更容易地获取内容只是提供了更好的整体体验,从而让客户对你的服务更满意。这样可以提升品牌形象,增加转化率。
打造有帮助的预测性搜索体验的 3 个技巧
一个伟大的自动完成体验需要像谷歌一样。为了提供最佳的用户体验,自动完成和预测搜索工具应该:
- 提供即时结果。自动完成建议需要在用户开始输入后立即显示,没有延迟。快速交付的建议也使界面感觉更具 交互性和对话性 ,这改善了整体用户体验。
- 凸显差异 。为了确保用户能够容易地阅读和区分建议,请使用突出显示或粗体来让用户清楚地看到不同之处。
- 优化你的建议。只有当建议相关时,自动完成才有帮助。这些建议应该基于许多因素,包括业务相关性、从 站点搜索分析 生成的数据以及业务目标。一个优化的自动完成搜索引擎也应该允许输入错误,并使用与你的搜索引擎相同的相关因子。
用自动完成搜索构建全面的用户体验
虽然自动完成是一个网站搜索的必要组成部分,但单独为你的用户微调相关性可能很难。与像 Algolia 这样的搜索服务合作伙伴合作,可以为你提供搜索用户界面、分析和其他你需要的工具来创建最好的搜索。阅读我们的电子书 搜索超越框框 看看搜索功能如何像自动完成一样帮助您的企业提供更直观和响应的网站搜索体验。
什么是基于搜索的应用?
原文:https://www.algolia.com/blog/ux/what-are-search-based-applications/
基于搜索的应用程序是一种应用程序,它使用搜索引擎作为其核心基础设施,从不同的数据源中查找并呈现信息。
通过基于搜索的应用程序(SBA),用户可以输入关键字或短语来访问不同位置的不同类型的数据,无论是结构化、半结构化还是非结构化数据。SBA 连接器将以用户友好的格式拉取、聚集、标准化和呈现数据,即使是来自不同后端系统的信息。
如何使用基于搜索的应用程序
SBA 支持不同行业的各种用例。一些重要的应用包括:
客服
对于客户服务代表来说,SBAs 可以是强有力的工具。无论是在现代呼叫中心还是在现场支持台中,SBA 都可以从一系列数据库中收集信息,并通过 为客户服务代表提供信息 以快速解决客户的问题和顾虑。例如,如果客户打电话给旅行社提出最后一分钟的旅行请求,旅行社可以使用 SBA 快速查找各种航空公司的大量航班信息,以实时回答他们的问题。
电子商务
SBA 常用于为网上购物者检索相关产品信息。在线零售商可以使用 SBA 为 购物者的查询提供闪电般的、高度相关的结果。
以时尚网站为例,用户正在搜索不同类别的各种产品。当用户搜索牛仔裤时,小型企业管理局会从卡尔文·克莱恩、列维、真实宗教和其他品牌收集结果。如果建立在强大的搜索引擎上,小型企业管理局可以推荐相关的搜索,类似的产品,甚至关于最新趋势的博客内容。这提供了更个性化的搜索体验,实现了交叉销售和向上销售,并增强了整体客户体验。
房地产
房地产经纪人和潜在购房者在研究房地产时,都可以从基于搜索的应用程序中受益。小型企业管理局可以整合各种常见来源的结果,以获得更全面的资产视图。这些来源可能包括不同的房地产网站、市政数据(关于学校、公园等的信息。),以及附近的交通选择;这个信息,在一个用户友好的地方,给用户所有相关的信息,他们需要作出住房决定。
企业搜索能力
当今数据环境的分布式本质意味着组织可以在内部、外部、内部、云中或不同的地理区域存储信息。SBA 可以从所有这些地方提供统一的搜索结果。因此,无论数据存储在哪里,消费者都可以搜索大型商业网站并快速获得结果。
基于搜索的应用程序和搜索即服务如何协同工作
搜索即服务工具为 SBA 提供了必要的搜索引擎基础。
最好的搜索即服务工具不仅是现成可用的,而且可以深度定制。这使得你可以立即开始搜索,同时根据业务需求不断调整、测试和改进你自己的排名因素。
搜索即服务工具优先考虑 可靠的基础设施 以防止停机,并且能够随着您的小型企业的增长而扩展。它们也是构建 SBA 的一个很好的基础,因为提供商处理搜索引擎本身的维护和管理。使用搜索即服务,您可以从搜索提供商的持续创新中获益,而不会占用您自己的开发人员资源。你的开发团队只需要专注于微调你的 SBA,而不是为搜索引擎的基本设计打基础。
对于全球航运物流公司 Flexport 来说,提供让客户快速跟踪货物的能力对于改善他们的用户体验至关重要。利用搜索作为服务工具的强大功能,他们的应用程序使世界各地的用户能够可靠地搜索多个索引来获取运输信息。Flexport 的搜索应用程序每月支持 400 万次搜索,平均搜索时间为 3 毫秒。Flexport 的应用以搜索为服务基础,为客户提供了对供应链的强大可见性,极大地改善了客户在这一过程中的体验。
和基于搜索的应用
像 Algolia 这样的搜索即服务工具是利用 SBAs 商业价值的关键。它们让组织获得这些技术的好处,而不必担心持续使用这些技术所需的底层维护、硬件和专业知识。建立在可靠的分布式搜索网络上的快速个性化搜索几乎可以满足任何使用情况。
今天观看我们的 演示 ,看看 Algolia 如何为您自己的网站提供无与伦比的搜索!
成功的电子商务个性化是由什么构成的?
原文:https://www.algolia.com/blog/ux/what-does-ecommerce-personalization-actually-mean/
什么是电子商务个性化 假定 的意思与 it 实际上 的意思可能大不相同。
个性化?哦,是的,这是每个人都在做的很酷的人工智能驱动的事情。它结合了机器学习来改善客户体验。你可以只设置它然后忘记它。简单易行,保证你的利润暴涨。
不完全是这样……有点复杂。定义的方式取决于你问的是谁。
电子商务个性化是什么意思?
如果你想从不同角色的角度得到一个定义,你可能会听到稍微不同的强调。
- 到 数字营销人员, 电子商务个性化意味着对用户进行技术研究,根据人口统计和购买历史等信息创建非常具体的目标,实现个性化功能,如产品推荐和电子邮件中的个性化信息,交叉手指,然后赚大钱。
- 对于网上购物者来说, 这意味着在网上购物的快乐时光,享受网站“了解”你并迎合你的奇思妙想,从你开始网上购物冒险的那一刻起,直到结账,预测你在产品发现中想要什么,这一过程会导致更多的在线零售疗法和金钱支出。
- 对于想要更好的客户参与度 和更高收入的公司来说,这意味着你必须创造个性化的购物体验,才能跟上其他知名网站(尤其是亚马逊)的步伐。
所有这些听起来都合理有效。那么,什么是 实际的、 正式的、官方的、最好的、权威的方式来描述被称为 电子商务个性化 ?
基本上,它是捕捉用户在网站上做什么和买什么的数据——他们的浏览行为和浏览历史——然后使用算法处理的、基于人工智能的洞察力来创建专门为他们的个人需求定制的有益的相关体验,从而创造令人满意的客户旅程并增加销售额。
听起来很简单,但似乎还缺少点什么,不是吗?比如电子商务个性化 实际上 在 实现 方面意味着什么?
什么难道不是电子商务个性化?
为了澄清,我们来看看什么是个性化 不是, 这应该有助于阐明它是什么。
个性化不是什么: 定制(由用户)。
个性化和自愿定制不是一回事。这只是让人们能够通过头像和控制屏幕显示等机制,让他们在网站上的体验更加独特。定制是朝着正确方向迈出的一步,但在转化方面不太可能走得太远。
什么是个性化: 你对网上零售功能的实现,让人们因你对他们的了解和他们想要的东西而感到欣喜。
简而言之,个性化就是确切地知道你能做什么来帮助你独特的顾客,然后勇往直前去做。
- 他们想要什么?
- 你应该向他们推荐什么?
- 他们愿意花多少钱?
- 你应该给他们什么样的折扣?
- 还有什么会让他们在你的网站上的体验更有吸引力?
- 怎样才能让他们最终开始点击购买?
什么是个性化不是: 从战略上来说,这不在话下;一个有保证的方法来大幅增加转化率和提高你的网上商店收入,而不是真的举手之劳。
什么是个性化: 在某些方面潜在的实施挑战,加上完全依赖良好的网页内容和已经坚实的用户体验来产生切实的结果。
那么,谁能以正确的方式实现电子商务个性化呢?
亚马逊再次出击
当你想到个性化,你可能会立即想到 Amazon.com。每次你去那里,你都会看到你的个性化主页,它是根据最新最棒的人工智能数据编译的,比如你最近浏览的内容,类似的产品,以及你多年来购买的所有东西,以防你想重新订购。
他们总是比你领先一步——似乎预见到你对新产品的渴望,擅长向你交叉销售,增强你的客户忠诚度——并且远远领先于你可能会屈尊拜访的任何竞争对手。他们在个性化方面的深入探索得到了回报。例如,根据 Forrester 的数据,与其他在线品牌相比,亚马逊推荐的转化率高出 60%。
那么,像亚马逊一样建立自己的 卓越的网站个性化,并获得令人惊叹的首次(甚至超越)效果,岂不是很棒?
这能有多难?你所要做的就是收集所有正确的客户数据来定义你的受众和客户群,根据人们似乎想要的东西来个性化你的内容,测试它以确保你正在做所有正确的事情,实现正确的个性化水平,让它发挥它的魔力,并开始获取收入。
是的,本质上就是这样!但是和其他有价值的努力一样,让你的网站个性化策略正确可能需要一些工作。
底下藏着什么?
就成功的个性化而言,容易“看到”的东西实际上只是个性化的冰山一角;许多准备、监控、调整和管理工作都在水线下进行。
有些活动很有挑战性。在线零售商在建立有效的网站个性化时面临的一些障碍包括:
- 无法收集足够多的关于新客户的正确个人数据
- 拥有过量的回头客信息
- 需要做一些复杂的数学运算(例如,在一对一的水平上计算出统计显著性)
- 无法实时响应收集的数据,以便立即打造最佳客户体验
- 仍在使用阻碍个性化策略有效实施的传统 CMS 和后台系统
所有这些看起来是不是有点令人畏惧?这可能解释了为什么尽管个性化有很多好处,但当许多公司经理意识到个性化过程实际上需要什么时,他们会失去兴趣,他们会有意识地或通过潜意识的惯性决定继续使用他们所拥有的任何 web 功能。
我们知道很多公司都会发生这种情况。根据 Algolia 2021 电子商务搜索趋势 报告,只有 20%的受访零售商完全准备好提供个性化体验,而 79%的人表示他们还没有准备好。
因此,也许我们需要先弄清楚一家公司实际需要做什么,并强调这确实是完全可行的。就待办事项列表而言,个性化意味着什么?
给猪涂口红:不是一个伟大的战略
如果你的用户体验对你的网站访问者来说很糟糕,那么个性化不是有效可行的。就像如果你没有高质量的产品图片,你的营销文案没有说服力,你的产品页面缺少相关信息,或者你有一堆出现在搜索结果中但目前缺货的商品。
在一般的营销活动中,缺乏内容相关性会导致回复率降低 83%。换句话说,在一个内容杂乱无章的网站上巧妙地添加个性化就像给猪涂口红一样。如果你的网站没有为你的购物者提供无缝、卓越的体验,个性化不会奇迹般地修复它,也不会对你的转化率或收入产生一点影响。
什么是个性化: 一个潜在的巨大转化和利润发生器 如果 你的用户体验是健全的,你的网站内容是为转化而优化的。
Algolia 估计,通过提供卓越的用户体验,电子商务网站可以提高 30%的转化率。
分解一下,如何建立有效的个性化并获得令人印象深刻的结果?
如何在个性化上真正成功
第一阶段——也可能是最关键的阶段——是做前期工作:通过收集用户在你的网站上做什么或不做什么的数据,找出他们到底想要什么。这里有几个地方可以收集必要的购物者数据:
- 同时通过社交媒体(尤其是移动应用)、搜索引擎优化广告和有机内容(如顾客评论)等途径为你的网站带来流量 。谁从哪个平台点击进入?
- 从人们如何在你的网站上搜索 和导航:他们是使用搜索栏还是通过浏览他们面前的东西来发现物品
- 来自人们的互动, 比如他们点击你的产品登陆页面
- 来自自愿输入的个人信息,,如服装尺码和品牌名称
- 从人们放在购物车里的东西 然后要么买要么弃
- 根据人们对您的电子邮件活动的回复, 例如购买后放弃购物车或追加销售
当你收集了足够多的关于你的网站访问者在做什么的数据,并且你可以智能地分析它,你的用户档案就开始成为焦点。所有这些信息,无论是明确地还是隐含地从你的顾客那里收集来的,都可以让你通过各种各样的指标来确定你的目标顾客。
只有这样,有了你的关键数据,你才能使用电子商务个性化软件,通过向顾客展示他们可能喜欢的商品来吸引他们。
应用最佳实践以获得最佳结果
准备好开始第二阶段了吗?您可以应用个性化 最佳实践 来实质性地反映每个购物者的需求和偏好,潜在地增加您的平均订单价值以及更多。以下是一些电子商务个性化的例子:
根据人们正在浏览或购买的内容,进行个性化的产品推荐 。例如,如果他们在看桌子,你可以推荐一把任务椅与之搭配。
根据顾客之前的购买和浏览活动编辑顾客导航 。他们刚买了婴儿车吗?给他们介绍其他婴儿用品。
在博客帖子和横幅广告 等元素中向人们展示按地区或人口统计排列的内容 。
鼓励人们写评论。 “口碑”,即使来自陌生人的网上,也是强大的。让真正的、积极的用户创造的内容来做你的营销重担。
提供相关折扣。 例如,考虑以组合价格捆绑一组相关商品,或者对他们一直购买的商品(如尿布)打折。
一种多维现实
个性化不是什么: 一维或单通道。
什么是个性化: 多维度全渠道。
大约四分之三的购物者在购买一件商品时使用不止一个购物渠道(例如,移动设备上的社交媒体或直接进入公司的电子商务网站)( 【哈佛商业评论】 )。在每一个适用的渠道,每一次客户互动中,从有人虚拟踏上你的网站的那一刻到任何访问后的电子邮件营销,应用一致的个性化是值得的。当每个接触点 与其他 无缝协作时,你的个性化努力很可能会打动你的用户。
什么叫个性化不是: 一个 一刀切的解决方案。
什么是个性化: 为您的业务量身定制最有效。
不同的商业目标需要不同的策略。你的客户群有多大…你的销售量是多少…你想用哪个软件来推广你的个性化技术?这些问题的答案将帮助你决定最恰当的方式来获得最大的回报。
设定并且(不要)忘记
个性化不是什么: 设置好了就忘了。
什么是个性化: 一个为你的销售团队持续改进的项目。
在你实现了你的个性化功能后,你的跟单员必须保持警惕,监控事情是如何运作的,然后根据需要进行调整。
例如,你不能随便放下一个搜索栏就说它好。嗯,你可以,但如果你不留意它是如何工作的,你的电子商务业务结果可能不会如你所愿。根据【bay mard Institute research的调查,61%的顶级电子商务网站的搜索性能“低于可接受的水平”此外,15%的网站被发现有“坏”的搜索查询类型的性能。
您可以根据购物者在搜索框中输入的内容对他们的搜索结果进行个性化设置,还可以优化呈现给特定目标群体的搜索结果,例如,定制呈现给对某一特定系列的鞋子感兴趣的人的搜索结果。
根据您的电子商务个性化策略,个性化搜索还可能涉及使用 【定制排名】动态重新排名查询建议 来满足您的客户需求。
电子商务商店搜索实际上是如何工作的?
使用 Algolia,您可以使用仪表板来配置每个事件和方面的加权重要性。您可以模拟和测试您的个性化内容(A/B 测试),然后进行微调,使一切恰到好处。
例如,假设您有一个销售迷你零食的网站。您运行 A/B 测试来评估类别页面浏览和搜索结果页面的不同个性化策略。根据忠实顾客对食物种类和价格的偏好,你可以调整策略来提高点击率。
其实成功了
个性化不是什么: 易于内部开发人员构建和维护。
什么是个性化: 如果你与合适的个性化专家合作,相对容易实现。
让我们面对现实:建立一个真正有效的个性化电子商务体验是一个复杂的命题。但是有了正确的 电子商务个性化工具 ,你就增加了你所做的事情会奏效的几率,甚至会把做得非常好。
Algolia 的网站搜索个性化平台随时准备帮助您实现转换和收入增长。要了解成功的网站个性化对您独特的电子商务网站指标来说实际上是什么样子,只需 告诉我们 您想要实现什么。我们将引导您创建并自信地维护个性化解决方案,直接带来健康的转化和收入。
就搜索而言,什么是“近实时”?
你是否曾经在网上拍卖中出价,在最后一分钟投出你的最高价,结果却被人用卑鄙的竞价软件在 微秒 内击败?你能想象在 完美的 时间交易一只股票,然后交易网站的软件反应如此之慢,以至于你损失了一大笔钱,这是多么令人不安吗?
在这个谷歌搜索的时代,人们认为数据处理速度是理所当然的,而且,正如在上面的场景中,如果有滞后,这将是一个严重的问题。这个问题与搜索以及通过浏览购物和媒体网页进行的更被动的信息“发现”活动同样相关。
如果你是在线零售商,每一次搜索都是潜在的转化机会。如果你是一个网上购物者,每一次搜索对你来说都很重要,因为你可以找到你需要的东西,而且不会浪费时间。如果你不能很快找到你想要的,你就不会留下来。你想找到你想要的 现在, 实时。好吧,如果不是实时,那么就在附近实时。
什么是近实时数据搜索?
谈到大数据,近实时是一个定义松散的术语,因为“近”的定义因应用程序和网站而异。
根据 的免费字典, 【近实时】(NRT)肃“对数据或信息的时效性进行电子通信和自动数据处理所需要的时间。这意味着没有重大延误。”
嗯;听起来有点像实时处理,不是吗?让我们更深入一些。有三种类型的数据处理:
你知道 实时处理 是最快的类型,通常用在信息必须立即可用的情况下,比如当经纪人在交易股票时。
批处理 是一种更经济的选择,可以容忍一定的延迟。系统中的成批内容,例如银行交易或软件更新,被保存起来,然后一次全部处理,但如果时间真的很重要,这种频率可能会比预期的要低。批处理可能需要一段时间(甚至几天)才能完成,但这是一个可靠的、在商业世界中广泛使用的选项。
即接近实时处理的 , 介于这些快速和慢速处理之间。NRT 是在需要某种速度时使用的,但是相对适中的“可接受”速度就足够了。
就检索而言,NRT 指的是。例如,教育机构数据库中的文档可以在被索引后“几乎立即”被学生检索到。“几乎立即”可能意味着几分钟、几秒钟或几毫秒的时间范围。
当然,你可能会想,这不太好。说到搜索,实时似乎比好得多。一个实时搜索引擎将是最好的,所以你为什么想要别的呢?
没错,近实时 相比之下就是 技术上不合格;这意味着你没有优化以尽可能快地提供更新。但在你决定这是不可接受的之前,让我们客观地看待这里的事情,并思考这样一个事实:当涉及到人类使用软件时,近实时仍然是 超 快。
此外,和任何事情一样,自吹自擂的实时处理也有一些缺点,比如需要安装昂贵的高性能硬件,以及难以审计数据。
好的,我们现在可能都同意,如果你有一个具有搜索功能的网站,那么向你的用户或客户提供近乎实时的搜索结果将是一件非常好的事情。但是如果你仍然偏爱实时的概念,并且不太相信近实时的美妙,让我们来数一数近实时搜索值得庆祝的方式。
近实时处理在搜索中的好处
在您的网站上拥有现代化的搜索功能,可以随着目录内容的更新而动态更新网页,从而带来更好的用户体验,这可能包括:
购物者更快乐
这里有一个理论上的网上零售用例:几周后你要去露营,所以你要买一个基本的帐篷。你进入一家户外用品商店的主页,输入你的帐篷搜索词(“基本露营帐篷”),浏览许许多多的选项。
该网站还推荐你去看看一些更好的帐篷类型(比如网格状的),当你细读那些简单的帐篷时,你会发现。
你选定了一顶看起来物美价廉的普通帐篷。“完成了,”你说,想象着在野外的帐篷里醒来。
但是等等,购买按钮在哪里?
在产品详情页面的右侧,您会注意到这样一条信息:“请稍等,我们看看这款帐篷是否有货。”(嗯,也许不是这些话,但你得到了大意。)
或者更糟,消息说你的梦想帐篷确实没货了。(实际上,一批货刚刚到货,但是销售团队还没有来得及更新清单。)
现在你要么去汽车露营,要么重新开始寻找帐篷。 Grr。
如果这个网站只是提供快速有效的搜索会怎么样?这个露营者可以很快找到他们喜欢的帐篷,然后离开。
更好的个性化
可以肯定地说,个性化的网上购物或浏览体验是大多数人现在所期望的。购物者希望被迎合,他们不想浪费时间,这是可以理解的。你的网站给他们一个类似于“坚持住!我们正在准备您的个性化内容。”
如果你公司的搜索引擎不能以接近实时的速度运行,并且被个性化任务所困扰,这当然是一个严重的问题。你的用户可能会放弃并跳出网站,也许永远不会回来。不太好。
满意媒体消费者
假设你正在运营一个新闻网站。你可能关心你的搜索查询处理时间,这是理所当然的,因为当涉及到新闻时,及时性是必须的。习惯于经常访问谷歌新闻(Google News)等网站的媒体消费者,很高兴在记者点击发布后不久就能知道最新的更新。如果你的“热门话题”甚至有点过时,习惯于每隔几分钟点击“刷新”来获取最新独家新闻的用户就不会对你的平台产生信任。
精简的客服体验
客户服务是数据处理时间至关重要的另一个领域。如果你是一个不高兴的客户,打电话给客户支持,你希望他们能够立即调出你的所有数据。您不希望的是,客户服务代表要求您提供已经在手机键盘上或网上输入的详细信息,但这些信息显然还没有经过处理并存储在系统中,也不允许在信息孤岛之间传输。你不想因为一个愚蠢的原因而被搁置。
近乎实时的信息支持有助于快速解决问题。
更好的业务敏捷性
数据处理需要能够跟上它所支持的业务。为了促进这种数据灵活性,公司需要一个有能力的搜索工具,让人们能够访问他们正在寻找的最新可用的可搜索数据。例如,在一个电子商务网站上,你会希望你的库存绝对是最新的,以便商人可以访问关键的细节,以便规划战略和从事生产决策。
对于商业智能和运营成功来说,处理速度是至关重要的。
加速你的搜索
既然你已经了解了搜索数据更新过程的细微差别,你可能会考虑如何在你的网站上升级到接近实时的内容搜索。为什么不立即向用户提供他们需要的信息,从而让他们高兴,同时也为您的底线带来积极的结果呢?
Algolia 的 近实时分析 API 是一个经过验证的选项。我们的搜索引擎使用先进的机器学习算法,并近乎实时地索引数据,为您的用户提供快速的搜索结果,引导他们直接找到您网站或应用程序中的正确内容。然后他们可以继续他们的一天(如果可以的话,给你留下积极的评价)。
就 Algolia 的响应时间而言,多快算快?从搜索者在搜索框中输入一个字母到他们得到一个搜索结果页面来阅读之间没有延迟。我们确保 99.99%的搜索可用性。那几乎和…嗯,不是那个,但是很快。
如果你已经准备好了解我们如何通过近乎实时的搜索来加速你的网站或应用程序体验,我们希望你能联系到 我们的团队 。你是开发商吗?你可以开始 免费构建出 你网站的新搜索解决方案。了解 Algolia 如何帮助您的企业发展。
什么是顾客旅程图&为什么它很重要?
原文:https://www.algolia.com/blog/ux/what-is-a-customer-journey-map-algolia/
在古代,为了寻找食物,人类会通过索要洞穴图来进行研究。
试图记住一个蚀刻的石头图,显示类似“刚过第三个岩层,水牛在黎明漫步,”被证明有点不稳定。
随后出现了纸质地图,这是一个明确的升级,直到地形或对地形的了解发生了变化(比如当地球看起来可能是圆的,你实际上不会从地图上的那个悬崖上掉下来。)
即使有先进的现代 GPS,编程中的怪癖也会让你绕圈子或走一些奇怪的弯路。
因此,尽管地图无疑是一项辉煌的发明,但它的过去多少有些波折。
有一种类型的地图很可能会让 而不是 失望,然而,这就是客户旅程地图,也称为用户旅程地图。这是因为由这些看起来往往很艺术的东西绘制出的数据金块可以引导一家公司对他们的网站或移动应用程序进行积极和高利润的改变。
什么是客户旅程图?
这种现代地图是在 1985 年由一对富有创新精神的商人, Chip Bell 和 Ron Zemke 发明的。基本上,客户旅程图是典型客户如何浏览公司营销和销售渠道的可视化表示或“时间线”,包括所有相关渠道中的所有相关接触点。
用户旅程地图是如何绘制的?
创建这种地图的第一步是获取与你的典型客户互动相关的所有适当内容,无论是在你的网站上还是在其他线上或线下场所。
开始制作地图,你需要收集:
- 营销指标:如何获得客户的细节
- 用户研究:对购物者旅程的逐步分析
- 市场研究,例如,通过采访客户和调查数据收集的数据
- 关于您的买家角色如何使用产品的数据
您的数据宝库可能包括从客户接触点收集的信息,例如:
- 邮件互动
- 社交媒体访问量
- 竞争网站的研究活动
- 产品概述和产品详情页面上的点击和互动
- 放弃部分装满的购物车(这种情况经常发生)
- 弃船后返回现场
- 与销售或支持代表聊天
使用旅程映射工具创建洞察力
映射过程中的下一个任务是以一种清晰的、吸引人的方式将所有这些数据输出。为了实现这一点,您可以使用任何可用的客户旅程地图模板和格式,最理想的是:
- 综合它们所涵盖的步骤和观察。 一个优秀的用户旅程图有效地记录了整个客户体验,从人们可能不知道产品或公司的存在,到他们越来越感兴趣,到他们购买,到他们留下评论等等。该地图记录了每个用户行为接触点——用户的感受、观点、他们在网站上提出的问题、他们在想什么或想要什么、他们的客户痛点——为您提供他们购物体验的最复杂的画面。
- 视觉上吸引人 引人入胜:例如,一张地图可以包含一个或几个信息图、图表、视频和故事板(连续图像的集合)
- 便于贵公司团队破译 并用于得出结论
客户旅程映射的好处
真的值得去费心费力地创建现实生活中的用户旅程图吗?
毕竟,这是你的公司,或者你是一个精通业务的高管。你知道你的产品的优点,以及人们喜欢它的原因。你觉得自己对客户的需求了解得差不多 太 了,毕竟这是显而易见的。就像你相信你可以很容易地校对你自己的写作,找出明显的错别字,对不对?
错。
是的,你可能真的需要一个独立的“用户体验校对者”来仔细检查你的用户之旅。很容易完全忽略和不知不觉地最小化——或者不经意地忽略和淡化——用户体验的问题。
你可能还遗漏了一些东西,这些东西 看似 次要但实际上相当关键。客户购物体验中的一个看似微不足道的小问题,比如你的电子商务网站上的一个断开的链接或一个不允许潜在客户快速提交的表单,都可能导致他们不买东西就说再见。如果这个小混乱碰巧影响到多个客户,或者你有多个小混乱,你可能会有很高的流失率。
你需要一张完全准确的体验图,来展示你的客户角色正在做什么,这样你就可以应用这些信息来更好地引导他们踏上购买之旅。
一份精心设计的顾客旅程图可能会给你带来惊喜,因为它提供了有价值的修正和顾客反馈。
你还能做得更好吗?
当然,你希望你的顾客总是购买,并对他们的购买感到兴奋,但如果他们不这样做,你还是想知道为什么。以及你如何改变他们的体验或提高你网站的可用性或他们购物的质量。在所有情况下,客户旅程图都可以作为支撑落后客户体验的蓝图。
有了足够的数据,在对用户流量做了透彻的分析之后,你可以得出一些相当准确的结论。然后,您可以利用这种洞察力来实施以客户为中心的改进,并开始满足或超越客户的期望。
因此,当进行“客户之声”类型的研究时,一张最新的典型用户旅程图——就像穿着客户的鞋子从 A 点到 B 点——会有很大的不同。
将有价值的金块分发给各队
此外,顾客旅程图可以成为你向产品团队成员提供的便利工具。他们可以从自己独特的专业角度指出他们看到的任何问题。营销和销售团队是明显的利益相关者,他们应该得到你的地图,但客户支持也可以通过更深入地了解客户需求来学习。
从客户的角度出发,发掘并让每个人都了解你的用户需求,你就可以找出摩擦点,并计划如何利用机会来提高 UX。您可以集思广益,找出简化当前用户体验的方法。然后,你可以实现网站或应用程序优化(并随后通过创建另一个用户地图来检查它是否工作,你猜对了)。
客户旅程图示例
在你的网站或应用程序中,典型的顾客购物过程的生命周期中可能会出现什么问题?这里有几个不同的客户用例场景:
- 您的定价 与您的 建议 中的物品的定价相冲突。当购物者看到这些替代品在他们走向购物车前弹出时,他们不是高兴地继续,而是查看相似的产品。嗯;这些商品看起来是一样的,所以他们选择扩大搜索范围,在其他网站上查看价格。他们离开了,不幸的是再也没有回来,因为他们在亚马逊上找到了更便宜的商品。这就是你出色的转化率。
- 你没有协调好你的 全渠道 体验 ,以至于你的最新客户数据占据了你所有的客户联系渠道。这意味着,举例来说,你试图追加销售一个最近的买家的电子邮件可能不包括这个人的名字,这似乎太没有人情味了,因为他们最近向你提供了一堆个人数据。因此,他们失去了兴趣,你也失去了一个潜在的忠诚客户,这一切都是因为互不相连的信息孤岛。
正如你所看到的,对你从顾客路线图中收集到的 UX 设计做一点小小的改变,并采取行动改善你的顾客体验,可能会产生巨大的连锁反应。当你提高了客户满意度,你不仅可以获得更好的收入,还可以获得更好的声誉、更高的信任度、更高的客户保留率,等等。
你的网站搜索工作如何?
从典型客户的角度来看,如果你的搜索功能或用户界面设计不尽如人意,你可以创建一个买家旅程图,帮助你的客户在首次尝试时轻松找到他们想要的东西。
搜索不仅仅是输入查询;它包括通过选择类别、注意促销横幅、阅读内容和查看产品页面上的图片,以及消化他人的评论来缩小关注范围,以便做出明智的决定。
现在您已经知道了客户旅程图是如何工作的,您可以创建一个关于您的搜索功能的客户旅程图。然后 联系我们的团队 ,我们会帮你创造 寻梦体验 既能满足你潜在客户的需求,又能帮你潜在粉碎你的商业目标。
什么是无头 CMS(内容管理系统)?
原文:https://www.algolia.com/blog/product/what-is-a-headless-cms-content-management-system/
无头 CMS 这个词听起来很搞笑吧?毕竟,在人类中,头部是控制中心——大脑——而身体只是对头部的想法和冲动做出反应。
因此,无头内容管理系统(CMS)的想法看起来像是某种未锚定的东西……一只被砍掉了头的科技鸡。而一个无头模型会唤起更奇怪的意象,因为一个运行良好的无头 CMS 在头部并不缺乏;它通常长着多个脑袋,就像一个长相吓人的 九头蛇 怪物。
尽管如此,从优化内容交付的角度来看,无头模型是目前最有意义的。这是因为 headless CMS 的优点和主要优势在于它可以容纳多种类型的内容呈现平台,如网站、手机、CRM 和智能手表。
【政法委书记】(传统)CMS 的演变
标准 CMSes(也称为“耦合;例如,WordPress)在万维网首次亮相后首次亮相,通过让公司使其网站内容更容易管理来赚钱。
传统的 CMS 既有后端(“主体”;内容储存库)和前端(“显示层”),它们相互连接。It:
- 允许创建和更新内容
- 将内容存储在本地数据库中
- 为开发者提供了一种严格定义的方式来获取显示在前端的内容
- 不允许内容重新用于不同类型的演示(除非添加插件)
- 不一定能很好地与相邻的信息系统配合,例如产品数据库
总之,老技术。
哪些仍然有效,哪些许多公司仍然在使用,特别是如果他们不需要将内容发送到多个表示层。
但是内容传播的选择一直在扩大,公司已经开始关注【内容建模】。现在,除了通过浏览器提供的内容之外,它还可以被特别定制,以出现在其他设备和其他应用程序中。消费者希望在从智能手表到语音助手的各种设备上获取内容,当然,还有他们可信赖的智能手机。
什么是无头 CMS?
进入现代 无头 CMS 。它的后端——创建、管理和存储信息的界面——与它的前端操作(信息显示的方式)是分开的。前端不与后端通信,只渲染内容。
虽然“headless”听起来确实像是丢失了一些重要的东西,但更多的智能功能可以弥补这一损失。
使用无头 CMS 架构你可以得到的一件事是几个“婴儿”头,负责引导内容到特定的地方。
hydra 怪兽还活着,而且活得很好:不是后端控制所有信息流向一个地方,即一个带有模板的网站,而是 RESTful API(或 GraphQL API)将内容释放到其他地方,如 iOS 或 Android 手机。它的读者可能在玩虚拟现实游戏或使用他们公司的客户关系管理(CRM)工具,以及其他数字体验。
因此,在这种模式中,内容出现的位置以及如何促进其呈现并不重要。相反,重点是让内容编辑者创建和协作提供结构化内容,这些内容可以根据需要提供给各种目标平台。
最终结果是:无论发生在哪里,读者都能获得出色的客户体验。
无头用例
正如内容管理顾问 Deane Barker 在CMS Wire中指出的,无头(和“解耦”)架构已经存在了一段时间;助长“最新”无头热潮的是,公司现在需要将他们的内容交付到标准网络浏览器之外的平台。这要容易得多,而且事情可以进展得更快,没有不灵活的前端的限制。
无头 CMSes 用途广泛,因此被用于多种应用,例如:
- 网络应用
- 电子商务网站
- jam stack工具,开发者可以使用这些工具来提高性能、降低扩展开销等等
- 静态站点生成器(如 Next.js)
- Javascript 框架(如 Vue.js)
- 产品(想象内容被传送到商店中的数字信息亭)
- 服务(例如,语音助手)
为什么去无头?
无头模型到处都在推出,因为它可以轻松地将结构化内容分发到多个目的地。它是全渠道数字交付的首选工具,这是一种向客户提供内容的集成方式,就像集成的、响应迅速的、多接触点营销、销售和客户服务一样。
无头的好处是什么?可以:
授权内容创作者和编辑
在传统的内容管理系统中,作者和编辑依赖开发者来设计网站的内容界面。作者可以写,但是在显示结构到位(渲染)之前,他们不能发布。
当您丢失 CMS 的头时,您就不再需要呈现内容,这些内容将在堆栈中单独处理。
无头 CMS 的另一个术语是内容即服务(CaaS ),因为真正的无头 CMS 不会生成前端代码。这意味着没有代码与内容纠缠在一起,编辑不必为了让他们的内容在线而做任何编码。例如,他们可以专注于他们作为创造性内容提供者的角色和工作流程,而不需要任何 HTML 经验。如果他们注意到某个已经上线的东西出现了拼写错误,他们不必给开发团队发电子邮件要求他们修复,然后等待。它们是完整的。
当 CMS 的头被移除时,编辑并不是唯一的工作变得简单的人。营销人员和销售人员受益于无头 CMS 的内容独立性。他们不需要作为管理步骤与开发人员交互,这加快了他们的流程,并让他们在需要更改某些内容(如某个项目的价格)时立即做出反应。
对于非技术人员来说,另一个好处是拥有一个中央内容中心,他们可以在这里更新从死链到产品可用性的所有内容。当他们做出一个改变时,就是这样:每个内容呈现平台都被更新,这节省了大量时间。
无头系统中的这种角色分离也意味着员工和团队可以按照自己的节奏工作,而不是必须与开发人员通常僵化的推出时间表保持一致。
赋能开发者
如果编辑对 headless 感到兴奋,这是否意味着开发人员吃亏了?不管他们是专注于为 Web 还是移动应用程序创作,当使用 API 处理无头内容时,开发人员都会受益匪浅。
首先,他们获得了巨大的灵活性。他们可以自主选择自己喜欢的前端编程语言、工具和工作流程。在不搞乱 CMS 的情况下,他们可以互换部分技术栈,或者转换框架。
前端开发人员可以为各种渠道开发功能,而不管后端发生了什么。
开发人员可以只关注创造出色的用户体验,然后将一切交给适当的 API,继续做其他事情。他们可以处理应用程序,然后自由快速地部署它们。这是一次有益的经历,也可以节省大量的时间(和费用)。
成为真正敏捷的
编辑和开发人员不仅发现自己享受着无头 CMS 带来的新的独立性和权力,他们还发现无头模型改善了他们在需要联系时相互协作的方式。
一个集中、敏捷的无头工作环境意味着发布时间表可以更短,例如,因为当一个主内容项目被重新用于多个渠道时,没有耗时的内容重新创建。用户可以随时处理出现的需求。此外,在单一位置管理多渠道分发的内容意味着用户只需学习一次该系统。
移动更快
因为一个无头的 CMS 可以让编辑通过一个通用的界面轻松地改变不同内容类型的用途,这个过程被加速了。
您可以向频道添加内容,而不必先在网站上发布内容,从而节省时间。单个请求负责发布任务,从而减少了请求。随着请求的减少,响应时间可以缩短,从而形成一个更精简、更高效的企业。
您还可以更快地添加新频道,因为它们可能会从已创建的来源中提取内容。
提高安全性
砍头似乎会增加安全风险,但事实恰恰相反。为什么?
无头内容与表示层上发生的事情是分开的,所以存在风险的区域较小。前端的安全入侵无法访问独立的后端。如果网页上存在安全漏洞,它不会危及其他页面或网站功能。此外,潜在的黑客也没有办法访问门户网站并输入数据。
秤易
虽然传统的 cmse 在可伸缩性方面受到限制,但无头 CMS 意味着高可伸缩性(高可用性)。开发者可以快速添加新的频道,然后,当添加一个频道时,它可以有效地从中央 CMS 获取内容。有了从一个主源管理的无头 CMS,您还可以根据需要更改开发人员工具,然后将内容发送到高性能的基于云的托管和构建服务。
缺少无头成分:搜索
无头 CMSs 天生缺少的一个东西是集成的搜索功能。
如果你认为在一个无头的 CMS 解决方案上构建搜索并不容易,更不用说如今通常使用的复杂类型的搜索用户界面,那么你是对的。
幸运的是,从头构建的方法不是必需的。Algolia 提供了一个与 headless CMSes 集成的 API 插件,以提供灵活、功能丰富的搜索,让您智能和大规模地处理索引数据,并将其推送到任何 CMS、设备或端点。
通过利用web hooks,你可以高效地将我们的 API 与一个无头 CMS 集成在一起。
如果你有网络服务器,你可以添加一个 API。
或者如果你在 Netlify 或者 Vercel(比如)上托管Sanity Studio(开源),你可以将 Sanity.io 与 Algolia 集成。其他选项有 肯蒂科 和 童话故事 。
了解更多信息
当你获得了一流的搜索,你就准备好(为你的脑袋)出发了。
我们很乐意帮助您采用无头架构,为您的前端提供专业支持,优化您的内容创建和重复使用,并让您的系统经得起未来考验。在 Algolia 与 美国 连线,让我们开始吧。
什么是无头网站?
原文:https://www.algolia.com/blog/ux/what-is-a-headless-website-a-definition-and-examples/
有了数字体验,变化就是生活的现实。无头网站肯定是这种情况,它们一直在篡夺传统 CMS 的旧的、有头有脸的守卫,以给客户带来数字内容的改进体验。
为首的网站架构框架不再满足现代电子商务网站的需求。对于寻求轻松内容交付的内容创建者和开发者的工作流来说,以及对于在他们最喜欢的电子商务商店中寻求引人入胜的用户体验的消费者来说,他们的“一切都在一个地方”的设置现在似乎很死板。在这个高度互联的世界里,灵活性是企业吸引消费者并保持他们兴趣的关键。这种需求导致了无头架构占据了中心位置,并赋予了数字领域用户界面所需的自由、速度和自主性。
无头网站 听起来可能是一个令人不安的命题,可能会威胁到你的理智,但真的没什么好害怕的。无论你的想象中出现了什么样的恐怖图片,无头网站正稳步推动着成功电子商务的未来。
“无头”是什么意思?
在看无头网站之前,我们先考虑一下无头架构。用最简单的术语来说,headless 意味着将前端和后端“解耦”,实现一个同类最佳的 API 架构。您正在将存储内容的——内容存储库——与显示内容的的表示层分开。
输出可以分发给多个终端,例如网页、商店展示和移动应用。这使您能够更好地专注于提供卓越的客户体验,而不管人们使用什么方法来联系您的产品。
所以无头网站是那些利用分离的 CMS 的网站。通过将您的内容存储在一个无头内容管理系统上,并将其发送到各种前端技术端点(可能在任何地方),您可以更加灵活地呈现内容。
尽管有名字,无头的意义不在于你不需要一个头(输出),而在于你可以到 挑选你想发送内容的头数 。您并没有真正切断功能,而是获得了内容传播的选择。在当今的全球市场上,在这个领域,越来越多的人被证明比一个人强得多。
不要害怕失去理智
你可能在无头网站上,甚至没有意识到这一点。从你的网站上删除单一的“头”架构并不是一个可怕的提议,尤其是因为你获得了一系列对你的在线商店团队和客户来说是巨大的好处。无头发展了团队如何营销你的品牌以及消费者如何与之互动。
以下是让您的网站无头化可以获得的一些好处:
为您的开发者带来更大的自由
无头 web 开发将前端开发人员从后端的约定和结构中解放出来。通过对用户体验的完全控制,您的开发团队可以设计出完全独特的东西来促进更好的交互。
提高网站速度
你会发现无头网站比标准的 CMS 网站运行得更快。更快的加载时间在很大程度上是由于内容从 CMS 中获取、缓存并在无头应用程序中显示的方式。
能够利用更多渠道分享内容
不局限于单一的输出模式,如电子商务平台网站,并能够充分利用无头前端,您可以通过多种渠道有效地找到您的受众并与之互动。您可以使用 headless CMS 来管理应用程序和网站的内容,让来自不同来源的内容快速、专业地出现在一个页面上。
加速内容编辑
由于集中式架构,使用 headed 架构进行内容编辑和渲染会占用大量资源。去 headless 意味着编辑和渲染被留给了技术栈中更专业的部分,所以它们不会耗尽你的 CMS 的资源。
无头电子商务网站实例
吸引和吸引消费者的新方法总是会很快流行起来,事实证明,当选择“无头”时也是如此。许多跨越 各种行业的企业巨头 在决定放弃传统商业并失去理智后,他们的网站业绩大幅提升。
这里有一些成功的案例
T22【耐克】
这家鞋类零售商希望实施移动优先的方法,以提高对移动消费者的销售。为了优化所有页面的用户体验,他们实现了 React SPA(单页应用程序)与 Node.js backend for frontend (BFF)的结合。SPAs 以一种简单、优雅的方式显示内容,并将所有内容加载到一个页面上,由于缺少其他导航页面而提高了速度。与 Node.js BFF 一起工作可以提供无缝的用户交互,而不管前端应用程序运行在什么平台上。这一变化确保了耐克能够在市场份额上超越主要竞争对手。
目标
注意到 80%的目标顾客通过不同的渠道开始和结束购买之旅(例如,在网站上购物,然后在商店购买),这家零售连锁店的管理层意识到需要进行重大变革。他们认为这是一个增长和连接各种渠道的机会。为了满足其全渠道市场需求,Target 利用 headless 方法统一了从网站上的产品页面到路边提货功能等各种接触点的客户体验。
纯公式
这个在线健康和补充品品牌被高弃车率和低转化率所困扰。在解决这一问题的过程中,该公司成为业内首家采用无头商务解决方案的公司。他们实现了一个渐进式 web 应用程序(PWA 本质上是一个具有类似应用程序的体验和应用程序的所有好处的网站),这导致其网站性能、速度和响应能力的显著改善。这一变化使得 Pure Formulas 专注于其电子商务解决方案的速度和可靠性。该公司成功减少了用户放弃,增强了用户体验,并提高了客户保留率。
联合航空
即使是最大的航空公司之一也认为,为了向前发展,它需要掉脑袋。为了改善乘客的机票预订体验(这是该行业成功的关键支柱之一),该公司实施了 React progressive web 应用程序。从旅行者第一次登陆页面的那一刻起,一直到预订步骤,这就产生了一个改进的用户流。
柯克兰
速度对于创造引人入胜的用户体验至关重要,这个流行的装饰品牌的网站速度缓慢令人担忧。我们需要一个跳跃式的开端,为顾客提供知名零售商应该提供的卓越网络体验。切换到分离架构解决了页面加载缓慢的问题,将 Kirkland 变成了最快的零售网站之一。不仅如此,新的无头商务平台还提供了一些实验性功能,包括一键登录和指纹结账。
什么时候是无头不是真正的无头?
一些公司声称已经实现了无头架构,但是他们忽略了一个重要的细节:他们还没有完全分离前端和后端。换句话说,头还拖着一根线。
你怎么知道什么时候是这种情况?下面是 如何识别 一个假冒的无头网站。
走无头路出人头地
整体架构已经成为过去;无头会一直存在。这就是为什么 Algolia 被设计成完全无头的并促进良好的用户体验。
我们的平台完全灵活且适应性强,可以处理您需要升级的任何设备和使用情形。它是在前端和后端之间有明确区分的情况下构建的,它可以支持 JS、React、Angular、Vue、Android、iOS、Kotlin 等。
了解更多关于无头网站的潜在回报。我们在这里提供专家帮助,将您的电子商务或其他类型的网站带入现代时代。
什么是产品推荐人?
原文:https://www.algolia.com/blog/product/what-is-a-product-recommender-or-product-recommendation-engine/
在“旧时代”,当人们需要购买某些东西(比如洗衣机或割草机)时,都是向信任的朋友和熟人寻求建议和产品推荐。我们会问他们是否有基于他们自身经历的想法,或者他们是否可以给我们指出一个人,这个人可以帮助我们感到舒服,我们正在做出最好的选择。
今天,人们仍然更有可能购买朋友亲自推荐的东西,但现在你也可以在网上浏览,从你的新虚拟朋友那里获得一堆不同的推荐,而不必打扰你的实际朋友。而且很有可能这些帮手可能比你真正的朋友更“了解”你,能够给你更准确的建议。这是双赢。
推荐技术
零售电子商务行业的增长速度令人震惊。它最初的兴起是因为人们不得不呆在家里在线购物,有些人是第一次,但许多消费者在网上发现的便利和速度对数百万人的购物习惯产生了一些巨大的持久变化。
随着在线购物功能越来越牢固,在线产品推荐已经成为客户服务的黄金标准。人们在电子商务商店中无法获得足够多的个性化建议,这是有充分理由的:人工智能“知道”他们以及他们喜欢什么,而且会毫不犹豫地说出来。
有如此多的零售商争夺消费者的业务,一些公司的网站上有大量的产品信息需要筛选,有效的产品推荐已经成为最好的方式之一,如果不是最好的方式的话创造一个伟大的客户体验,让购物者回来。
推荐系统就像一张地图,突出了购物者探索的未知领域。它还可以打开人们的思维,让他们看到他们可能喜欢的新的可能性。它根据人们的偏好推荐最佳产品,并让他们获得大量关于其他顾客喜好的“内部”信息。
自由选择的概念对我们如此重要,以至于它在第一修正案中被引用,但研究表明更多的选择并不总是 更好。与传统观点相反,当推荐的产品数量有限时,销量会更好。在现在著名的 果酱实验 中,研究人员发现,向杂货店购物者提供 6 种口味的果酱供选择,而不是 24 种,会导致更多的销售;人们被发现面对太多的选择而不知所措,他们没有绞尽脑汁试图从大量的选择中做出选择,而是失去了兴趣。
这项研究的一个结果是,在销售产品时,营销人员变得越来越聪明,并密切跟踪网站指标。随着数据采集和属性、产品嵌入和多设备跟踪方面的进步,产品推荐者可以高效地优化和精确地推荐客户想要的产品。简而言之,网上购物的世界正变得越来越个性化。
推荐引擎甚至可以在用户浏览时实时了解他们的偏好,并当场做出反应,例如,根据他们的用户行为提供折扣。
推荐帮助转换
由于产品推荐引擎在提高转化率和销售额方面的良好记录,它们是数据科学最受欢迎的应用之一。它们可能非常有利可图:推荐占电子商务收入的 31%(baril liance,2018)。平均而言,顾客总购买量的 12%归功于他们。
提供推荐还可以提高一个人购物车里东西的平均订单价值。举例来说,如果零售商能够利用交叉销售来引起顾客的兴趣,并运送一批商品而不是一件,他们的利润率就会提高。
数据科学专家 亚尼尔·塞鲁西 指出:“许多人似乎关心推荐系统的关键原因是钱。“但这是对事物更愤世嫉俗的看法。这些公司(和其他公司)看到收入增加的原因是因为他们向客户提供了实际价值——推荐系统提供了一种可扩展的方式,在有许多项目的情况下为用户个性化内容。”
不管使用这种技术的动机是什么,使用推荐引擎的电子商务网站可以通过建议来推动转化:
- 其他购物者购买的附加商品,以及顾客正在查看的商品
- 符合用户搜索查询内容的项目
- 与他们放入购物车的商品“搭配”的相关产品
以下是一些在线零售商,他们通过使用和改进推荐引擎来改善商品销售,从而创造了可观的销售额。
亚马逊
Amazon.com 从 2003 年开始一直在 研究推荐技术;它很久以前就开始应用它的发现,现在仍然是行业的先驱。
当你在亚马逊产品页面上看到“经常一起购买”、“与此商品相关的产品”和“查看过此商品的顾客也查看过”时,你会得到相关的促销建议。这些互补产品的组合可能听起来像是本质上不同类型的信息,但这些推荐的产品都旨在实现同一个目标:给你一个有益的客户之旅,最终让你购买更多的东西。
亚马逊的销售工具非常好用。据麦肯锡公司称,人们在亚马逊上购买的 35%来自基于复杂算法和预测模型的产品推荐。
网飞
人们经常评论说,基于订阅的网飞“很了解”他们的电影和节目偏好。这是因为生成个性化产品推荐的混合推荐引擎不断地记录其渴望媒体的客户的行为数据,以便随着时间的推移进行改进并保持他们的满意度。根据 商业内幕, 网飞推荐的引擎每年为公司节省 10 亿美元。
最好买
自 2015 年以来,这家大型零售商使用了一个电子商务推荐系统,该系统收集并分析购物者的查询和点击数据。然后,它会根据收集到的关于人们浏览和购买模式的信息提出建议。百思买的高管们将其在线销售额增长 24%归功于其推荐系统( 美国消费者新闻与商业频道 )。
Spotify
据彭博称,这家音乐流媒体服务基于算法的推荐系统,为其听众提供更新的“每周发现”播放列表和“发布雷达”(新发布),负责帮助该公司将月用户数量从 7500 万增加到 1 亿。
YouTube
有了 YouTube,一切都围绕着客户参与,因此相关内容推荐会定期更新,以反映用户的活动,并引起他们对他们可能喜欢的项目的注意。网飞管理层表示,人们从主页到视频的点击中,大约 60%是由推荐引起的。
引擎盖下是什么?
当我们在网上购物时,相关的推荐会神奇地出现,但是在后台发生了什么使这一切发生呢?
简而言之,推荐引擎技术使用机器学习和人工智能来生成产品建议和报价。收集的数据经过分析后用于创建客户档案。当配置文件可用时,它们用于帮助生成特定内容或根据客户的兴趣突出显示似乎非常适合他们的产品类型。
推荐引擎通过应用于客户数据的复杂推荐算法工作,包括:
- 浏览历史
- 购买模式
- 反馈人已离开
- 点击率最高的产品
- 首选项
- 早期购买
- 最近查看的项目
- 搜索历史
- 购物车里有什么
- 愿望清单上有什么
- 购买历史
推荐-创建关于购物者的数据是隐式收集的(通过观察他们做什么、看什么和选择购买),也是显式收集的(通过他们愿意在线提供的信息,如评级和产品评论)。
然后,使用算法根据数据自动生成相关建议,并显示最相关的建议。收集和分析新客户数据时,会更新建议。
推荐数据不仅可以应用在产品页面上,还可以应用在应用程序、营销内容、搜索中,甚至可以应用在 其他 网站上的广告中(这种做法常常让人觉得“毛骨悚然”因为他们会立刻意识到自己被“监视”
基于项目和用户之间的三种类型的关系进行推荐数据关联并获得理解:
- A 用户对物品 关系:人们喜欢哪些事物和物品类型?
- Anitem-to-item关系:哪些项目关注同一类型的题材,由同一作者撰写,具有相似的设计,或者属于同一体裁?
- A 用户对用户 关系:哪些人有相似的背景(例如,相似的用户是相同的性别或有相似的偏好)
此外,出于分析目的,零售电子商务推荐系统依赖于这些关键类型的数据:
- 用户在网上的行为: 他们如何评价产品,他们在评论中说了什么,他们在点击和浏览产品页面时有什么习惯?他们通常买什么?
- 人们的人口统计: 他们的收入和受教育程度如何,性别和年龄,种族;他们住在哪里?
- 产品属性: 尺寸、重量、颜色、手感、产品 ID 号等细节
过滤方法
当收集了大量数据后,信息会经过推荐引擎的产品过滤系统。数据可以通过三种方式过滤:
- 协同过滤: 关注用户行为、活动和偏好,以便根据他们与其他用户的相似程度来预测偏好
- 基于内容的过滤: 关注产品特性和项目相似性
- 混合: 利用协作和基于内容的过滤技术
然后,可以通过多种方式使用这些数据来增强购物体验,例如:
- 个性化搜索和分类页面结果
- 首页推荐畅销书
- 当搜索没有结果时推荐相似产品
- 在商品详情页面上推荐经常一起购买的商品及相关商品(如同一品牌的商品)
- 突出显示相关促销和优惠
- 在购物车页面推荐合适的商品
一个动态情况
许多算法根据购物者最近购买的东西提供推荐。然而,最好的推荐是动态的:引擎跟踪人们在电子商务网站上的实时活动,并立即调整显示给他们的内容。
动态推荐因素包括购物者正在看哪些产品,他们正在点击哪些广告,以及他们正在浏览哪些类别。从本质上说,这种体验就像是让一个售货员听完你的反馈,然后去给你拿额外的衣服来试穿或考虑。
谁知道 5 年或 10 年后推荐系统会是什么样子?
可以肯定地说,它们是创造吸引人的、能产生转化的客户体验的重要工具 ,它们的受欢迎程度只会增加,随着消费者进一步被智能在线帮助宠坏,它们会带来更高的客户保留率和忠诚度。
唯一的问题是,向我们真正的朋友寻求推荐的古老做法会发生什么?我们会烦恼吗?如果我们这样做了,也许他们的建议会是“查一下亚马逊;有一堆不错的新产品正在流行”或“我知道一家在线商店有很好的推荐。”
想要一个通过正确的个性化策略提高客户满意度的电子商务网站吗? 今天联系我们 。
了解更多信息
什么是推荐系统?
原文:https://www.algolia.com/blog/product/what-is-a-recommender-system-recommendation-engine/
最近你不得不做出重大决定吗?
也许你需要选择搬到哪里,或者想在市场上买一个像床垫这样的大件商品。也许你在网上做了大量的研究,并询问你的朋友或最近的邻居的意见,试图找到一个确定的答案,即哪一个选择是绝对最好的,会给你带来 100%的满意度:被推荐为最适合居住的城市,没有空气污染,有很棒的学校。或者拥有所有五星评价(不仅仅是 4.5 )和完全适合你的功能的产品;毫无疑问的赢家。
如果你像数百万人一样权衡决策,你会不知所措。你很难决定尺寸、颜色、品牌、型号和可选功能。你感觉自己陷入了精神流沙,你对最佳选择的清晰程度越来越模糊。
选择多,快乐少
你可能最终会感觉“被决定了”,以至于你甚至没有精力去做更小的、不那么重要的选择。
如果你像大多数想要做出完美选择的人一样,你已经被“选择麻痹”所折磨,根本无法选择任何东西,因为有太多的选项和太多的变化需要筛选。也许你最终放弃了购买一件新物品,或者放弃了从看似受欢迎的物品中随意挑选。你没有一整天的时间。
“选择太多”的现象听起来像个笑话,但这是一个被广泛记录的问题。 希克斯定律 指出,做出决定所需的时间随着可用选择的数量呈对数增长。而且作者已经写了整本书,包括巴里·施瓦茨的 【选择的悖论:为什么多就是少】 。“有些选择是好的这一事实并不一定意味着更多的选择是更好的,”他说。
人们有太多的选择可能会令人沮丧,但好消息是,使用数据科学,推荐系统可以简化你的选择过程,使选择过程更容易。
有什么推荐的引擎?
到底什么是“推荐系统”?这是一种数据过滤工具,使用机器学习算法来确定消费者的行为模式,预测用户的评级或偏好,并向他们推荐相关商品。简而言之,它是一个过滤信息以帮助用户选择的软件,它为用户提供最相关的基于用户的建议。
推荐系统专业地缩小了特定用户可以考虑的商品数量,以便他们可以继续冷静地浏览并最终做出正确的选择,自信地选择一个商品,并对用户体验感到满意,以至于他们觉得他们可以甚至想再做一次。
推荐系统风靡一时。大多数拥有在线业务的主要科技公司都在利用 的能力,根据用户资料做出“智能”推荐 ,这除了提高客户满意度之外,还可以通过提高用户参与度和保留率来帮助公司进行优化。
比如:
- YouTube 会根据这个人的用户历史推荐要观看的视频,以及接下来自动开始播放的视频
- 脸书建议添加用户在现实世界(离线)中可能认识的新脸书好友
- LinkedIn 根据各种因素推荐人们可能有兴趣申请的工作
经典的在线零售商也是推荐系统的忠实粉丝。深度学习驱动的产品推荐领域最著名的例子和先驱是亚马逊网站:2021 年,该网站占美国所有电子商务销售额的一半(Statista)。
大技术是个性化推荐的主要领域,但这项技术也用于更具体和更专注的应用,如餐厅选择、在线约会、社交媒体和金融服务。
推荐引擎如何工作
推荐系统的内部工作是怎样的?推荐引擎分四个阶段工作:
1。数据收集
从人们那里收集数据有两种方式:含蓄地,在他们不知情的情况下;明确地说。
隐式数据收集由软件组成,该软件基本上在网上跟踪用户并记录他们做了什么。当他们连续三次访问同一个页面或将一件商品放入购物车时,数据收集功能会记录下来,并根据收集到的信息来推断用户的典型行为。
当用户被要求或自愿提供信息时,显式数据收集就会发生,例如当他们写评论、给产品评级、在社交媒体上发帖或发表评论、关注作者或音乐家时。这种类型的数据收集也推断用户偏好。
显性数据收集的一个缺点是,由于人们并不总是花时间去评价或评论他们购买的产品,或者以其他方式提供信息,所以可用的数据可能是不完整的。
2。存储
所有这些有趣的用户数据都被存档(例如,在 NoSQL 或标准 SQL 数据库中)以备将来参考。
3。分析
通过过滤(如批量、实时、近实时),系统查看数据关系并识别显示相似用户参与度数据的项目。
4。过滤
最后,对数据进行过滤以收集相关信息,从而向用户提供智能、适当的建议。推荐产品时可以使用不同的算法。基于内容的算法和协作算法推荐相似的内容,而聚类算法也可以基于其他用户正在做的事情进行推荐。
人际关系在推荐系统中的重要性
收集到的数据中元素之间的关系是“粘合剂”,它让推荐系统了解客户的偏好,并帮助他们知道人们想要什么。
在数据分析中查看用户和项目之间的三种关系:
- 用户-物品关系: 用户对某些物品和产品类型有偏好
- 物品-物品关系: 人们可能喜欢看起来相似或者以相似的方式描述的物品,比如同一流派的书籍或者同一菜系的食物
- 用户-用户关系: 背景相似的人(例如,在同一个年龄段)可能有相似的品味
除了关注这些关系,推荐系统还关注以下数据:
- 用户行为: 关于用户在线活动的详细信息,这些信息是在用户访问特定网页、给出产品评级、点击商品、参与内容(例如,观看一部没有网飞的电影)以及购物时收集的
- 用户统计: 这听起来像是关于年龄、种族、性别、教育、职业、家庭结构、收入和宗教信仰的信息
- 产品属性: 产品相关信息,如项目流派或菜系类型
只要我们列出三个……就有三种不同类型的推荐系统:协同过滤系统、基于内容的过滤系统和两种都有。
协同过滤
协同过滤推荐引擎专注于收集和分析关于用户行为、活动和偏好的数据,以便基于用户与其他用户的相似性来预测用户喜欢什么。它并不分析或理解 内容本身 (产品、书籍或视频)。
这种类型的过滤:
- 使用矩阵形式的公式,根据它对用户的了解来建议商品
- 应用逻辑,如果一个用户喜欢项目 A,另一个人也喜欢它,以及项目 B,那么第一个用户可能也喜欢项目 B
- 根据先前的互动预测新的互动
协作过滤有两种方式:基于记忆和基于模型。
基于记忆的协同过滤方法
这种类型的协同过滤:
- 识别用户群;利用用户交互来预测相似用户的交互
- 识别用户 A 评定的项目群,然后使用它们来预测用户 A 与相似项目 B 的交互
- 矩阵稀疏性可能具有挑战性,因为用户-项目交互的数量对于生成高质量的聚类来说可能太低
基于模型的协同过滤方法
这种类型的协同过滤:
- 依靠机器学习和数据挖掘技术
- 努力训练模型进行预测;例如,它可能会使用用户与某个项目的现有交互来帮助模型预测此人最喜欢的 5 个项目
- 优于基于记忆的协同过滤,因为它可以向大量用户推荐大量项目
协作过滤的一个缺点是这种处理需要时间,而且必须从某个地方开始。网站上的新用户或新产品的引入是一个冷启动问题。你需要足够的用户-项目交互来使系统工作;在这个人与足够多的物品互动之前,它不能给出产品推荐。当人们在网站上注册时,公司可以直接询问他们的数据(如他们的年龄或兴趣),并将收集的信息与已经可用的项目元数据进行配对,以将新用户与现有项目相关联,从而缩短延迟时间。
基于内容过滤
通过根据内容过滤,相似的项目根据其特征被分组在一起。推荐算法会考虑客户的偏好以及商品的描述(例如,它们的风格、产品类型、颜色或单词长度)。当界面告诉你“如果你喜欢这个,你可能也会喜欢这个”时,你知道系统正在根据内容进行过滤或者当它向你展示一个它记得你过去感兴趣的项目时,认为你可能仍然对它感兴趣。
使用基于内容过滤的推荐引擎有什么缺点?
- 你见识有限;您只能推荐与某人正在查看、购买或使用的内容相似的内容
- 如果用户交互显示某人只对某些类别感兴趣,系统无法可靠地推荐其他类别的项目
- 新用户刚开始使用时,没有足够的可用数据
混合方法
使用混合过滤的推荐引擎利用协作数据和基于内容的数据。不足为奇的是,其卓越的过滤功能可以产生最佳信息。
网飞是一个在网站上使用混合推荐过滤的公司的好例子。它考虑了用户的兴趣(协同过滤),也考虑了电影描述和特征(基于内容的过滤)。
决定,决定
推荐系统 是一个理智拯救者,可以帮助人们在做决定时突破选择麻痹,自信地选择最好的,并让他们有足够的精力和脑细胞专注于做出那些更大、更艰难的决定。
我们是否会发展到将“重大”决策委托给在线专家的地步?你可能会问自己一个大问题,比如“我们去哪里度假?”或者“谁是修理我溢水的水槽的最好的水管工?”结果却在网上查询低价机票或者在 Yelp 上寻找水管工评论。
所以实际上,那个时刻已经到来了……
想要由合适的推荐引擎提供卓越的客户体验吗? 今日联系我们 。
了解更多信息
什么是关系数据库?
原文:https://www.algolia.com/blog/product/what-is-a-relational-database/
如果说数据是世界的 新石油 ,那么数据库就是数据桶,尽管是相当复杂的桶。最先进的容器可以帮助您的公司专业地处理现实世界中的数据管理工作负载-存储数据、对数据进行分类、共享数据,并提供问题的答案,所有这些都不会弄脏您的手和鞋子。
所有关于你是一个组织以及你的公司做什么的信息都存储在数据库中。他们对一个组织的成功运作至关重要;它们是智能的坚实基石,在网站和应用程序中满足 用户体验 。在这个机器学习辅助的大数据时代,随着企业日常创建、分析和使用的数据量(无论是在内部还是外部)的增加,考虑各种类型的数据库及其功能是值得的。
关系数据库是使您的企业所拥有的数据类型对需要信息的人更有用的关键。但是这些“桶”是如何工作的呢?
那么什么是关系数据库呢?
关系数据库模型的结构是什么?
关系数据库是一种专门组织的数据库,用于识别不同信息项之间的联系,即“关系数据”的类型它是由 IBM 的程序员 E.F. Codd 在 1970 年发明的。
与层次数据库相比,数据库设计更加灵活,它由不同的表格组成,这些表格可以混合和匹配,以各种方式放在一起,使用户能够轻松地准确定位他们正在寻找的数据点,以便能够立即获得他们需要的所有细节,进行关联,并得出结论。
关系数据库中的每个表包括:
- 列的类别
- 行(也称为元组或记录)
行是存储唯一数据的地方,每个表都有一个“主键”来定义它的信息。例如,为了存储日常采购订单的信息,主键列可能被标记为 Customer,其中包含诸如姓名、联系方式和日期等类别的列。旁边可能是一个“订单号”主键,包含客户、产品、价格和其他详细信息。
在设置了他们需要轻松解释纵横交错的信息的组织视图后,员工可以搜索数据库以找到适合他们需求的特定数据子集。例如,他们可能需要找到:
- 欠账
- 订单完成
- 在特定时间段内下达的订单
关系数据库的结构
关系数据库使用 结构化查询语言(SQL) 进行结构化,这使得用户能够对其进行查询,以汇集他们所需的信息。
最初设计时,关系数据库模型与 IBM 以前的层次结构不同,后者要求用户通过具有多个“分支”的“树状”设计来检索所需信息。
分层数据库如何工作
在分层数据库中,相同的数据需要重复存储在多个位置,这使得接近实时地搜索特定信息以及查看某些数据如何相互关联变得更加困难。要找到需要的信息,您必须从上到下搜索整个模型。在数据量不断增加的现代工作场所,建立联系并从数据中获得洞察力几乎是不可能的。
分级数据库的一个很好的例子是大多数人在某个时候都见过的:组织梯形图。信息是基于基本元素(如表、记录和字段)存储的。
- 位于层级顶端的是首席执行官或创始人
- 下一级是部门领导或团队领导
- 这一层之下是领导团队的成员
例如,人力资源部职员 John Smith 坐在人力资源部助理经理 Megumi Yee 的下面,Megumi Yee 坐在人力资源部经理 Adita Gupta 的下面,以此类推。
数据库的元素是设定的,信息是静态的。你得到了组织的一个特定视图,这个视图有助于一个单一的目的——容易地知道员工的职位和他们的工作关系。
但是这个设计有一些相当大的问题。例如,如果您想查看 John 加入公司的时间与 Megumi 被提升为助理经理的时间之间的关系,您会发现很难找出该细节。此外,如果您将人员详细信息存储在多个位置,并且需要进行一些更改,那么您需要在每个单独的数据存储位置进行相同的更改,而不是简单地更新一个主实例。
相比之下,关系数据库更加灵活。
关系数据库如何工作
这里有三个用例——关系数据库示例,说明如何处理数据复杂性。
关系数据库允许一个关系表中的记录链接到其他表中的信息。例如,每个雇员都可以用一个主键(也许是他们唯一的用户 ID)来标记,所有与他们的雇佣相关的信息都可以在这个唯一的标识符下连接起来。这意味着冗余的数据集信息被删除(不会在多个地方重复),您可以更容易地找到复杂问题的答案。
比方说,你拥有一家电子商务公司,正准备出售。如果您使用的是关系数据库,只需更新商品的销售价格就可以了。使用非关系数据库,您可以为销售价格的商品版本创建单独的记录。
创建越来越多的数据还会使数据输入过程变得非常繁琐——还可能导致你在输入信息时出现一些错误——所以数据库管理爱好者会告诉你避免这种选择。
如果您使用的是非关系型数据库,那么每当客户购买某样东西时,就会为交易处理创建一个单独的客户名称实例以及他们的产品购买信息。这为错误留下了空间。例如,对于每笔交易,客户姓名的记录可能略有不同(例如,拼写错误或在另一个实例中未使用中间名首字母),这取决于是谁输入的。如果您还添加了打字错误的可能性,您就会看到信息混乱的潜在可能性(更不用说需要配备更多的数据库管理员)。
关系数据库模型有什么好处?
关系数据模型背后的主要思想是能够让用户通过操纵数据库表来阐明和理解各种数据类型之间的关系,从而得出有意义的见解。
使用关系数据库存储和排序数据有几个好处:
很好用
使用关系数据库,您可以从多个数据存储位置快速收集信息,然后对其进行过滤,以满足您的特定信息需求。
卓越的准确性和数据完整性
关系数据库结构紧密,数据使用约束、检查和其他数据库软件“规则”精心组织这种先进的结构有助于高水平的准确性和完整性。
数据冗余少
由于强结构,在关系数据库中,不是复制信息并存储在多个地方,而是只保留唯一信息的单个记录。这可以防止事情变得过于复杂和多余,并确保您的员工和客户都使用相同的最新信息。
强安全
关系数据库系统可以被配置为只允许授权用户进入,它们通常提供基于角色的安全性等特性来保护敏感数据。您还可以在用户级别设置字段访问控制和控制权限。
升级你的关系数据库搜索
需要更好地搜索您的数据库吗?Algolia 是 数据库不可知论者 (包括 NoSQL 数据库)。此外,在索引关系数据时,我们的搜索 API 是 无模式 ,因此您可以非常灵活地组织数据,并确保您的员工和客户可以在不断增长的内容海洋中即时找到他们需要的内容。
好奇?通过与我们的团队联系或试用我们备受推崇的 SaaS 搜索解决方案,了解智能数据组织和管理对您的业务的潜在价值。
什么是 REST API?
假设你是一名软件开发人员。你需要在相对较短的时间内构建、发布和上市一款应用。你的网站客户不会满足于无法想象的最佳用户体验。而且,令人沮丧的是,你正在与街区里的新成员玩网络开发追赶游戏——一个叫做 Zip 或 Zap 或 Zip-zap-zonk 之类的时髦初创公司。
你觉得这个名字真的很傻,但是你不得不承认他们的 app太棒了。 你有点嫉妒。
然而,你从来都不是一个放弃的人。尽管您的工作岌岌可危,并且您的 web 服务开发团队很小,但是您的客户已经准备好了,并且在 REST API 设计方面,您有一两个锦囊妙计。
你知道 REST APIs(应用编程接口)的优势。您可以熟练地使用它们来添加功能,以最新的功能增强您公司的应用程序,并推动一流的客户体验。软件集成的世界是你的。你会想出什么?
现代 app 体验
美的 REST APIs(又称 RESTfulAPI;REST 代表具象状态转移),是他们简单但具有变革性的技术。REST APIs 已经迅速成为现代应用程序和网站体验的支柱和构建模块。
但是在考虑 REST APIs 的各个方面之前,让我们先来了解一下普通的标准API。
什么是 API?
API 是一种软件中介,它让软件程序相互连接和通信。这是一项重要的技术,因为在这个万物 24×7 互联的数字世界中,软件集成至关重要。应用和程序必须能够专业高效地联系和聊天,以便为人们提供各种数据和功能。API 是让这一切发生的特殊调料。
原料药有不同的种类。或者更准确地说,有不同的 准则 或 架构风格 来管理两个软件程序如何使用 API 进行通信。
什么是 其余 API?
REST 是开发者创建 API 时遵循的规则集合;管理不同程序如何通信的一组原则。所以 REST API 只是一个应用这些原则的 API。
当客户端(请求与 API 连接的程序)请求资源(可以使用 API 进行通信和共享的信息)时,资源的现有状态由服务器以标准化的表示传送回来。
REST 的一个规则是,当你链接到一个特定的 URL 时,你应该得到一段数据(一个资源)。REST APIs 允许将资源请求从客户端发送到服务器,然后将相关信息作为响应发送回来。
一个请求包含一个端点(你请求的 URL),一个方法,它定义了发送到服务器的请求的类型;头,表示元数据;和数据。
休息方法
你可能听说过与 REST APIs 相关的主要方法:
GET: 使用 GET 请求时,服务器找到请求的数据并发送给你。
PUT: 使用 PUT 请求意味着服务器更新数据库条目。
POST: 使用 POST 方法,服务器创建一个数据库条目。
删除: 顾名思义,服务器用删除请求删除一个数据库条目。
REST API 示例
您知道 Gmail、Twitter 和 Instagram 都是众所周知的 REST APIs 吗?是的,这项技术相当普及。
REST API 的功能是什么样的?REST API 的一个例子是音乐流媒体服务 Spotify,其 API 允许应用程序开发人员将有关歌曲、专辑、艺术家和播放列表的信息带入他们自己的 应用程序体验。例如,想象一个健身跟踪应用程序,它让人们访问 Spotify,并被他们最喜欢的锻炼音乐所吸引。API 是使这种多面功能成为可能并推动应用成功的连接器。
其余最好的
虽然还有其他 API 架构,包括 SOAP(简单对象访问协议)和 XML-RPC(远程过程调用),但 REST 是最突出的。一致认为 REST 架构 API 即将成为基于 web 的软件开发的行业标准。
是什么让这个过程在软件开发界如此特别?REST APIs 相比其他架构有什么优势?
REST API 因其简单性而脱颖而出。它们允许任意两个 web 应用程序连接、通信和共享数据。使用 REST,您可以将您的应用程序或软件程序与任何其他软件应用程序或程序集成,无论宿主组织是跨国公司、政府机构还是小型初创企业。
下面是使用 REST APIs 的主要好处:
- **灵活性:**REST API 可以处理大量不同类型的客户端请求和数据格式
- 简单: 客户机请求资源所需要的只是服务器的 URL
- 可伸缩性: 随着应用的增长,REST APIs 确保添加更多资源或各种请求不会影响性能
有了这种自由,应用程序开发人员可以拼凑现代应用程序体验的构建模块。创建市场领先的功能来增强和补充您的应用程序既快速又简单。
现在你知道为什么 REST API 是某些特性的必备组件了。你也应该知道一些必须遵守的准则。
规则显示休息
开发者使用 REST APIs 有什么要求?为了确保成功的 REST API 功能,开发人员必须遵循以下公认的软件架构约束:
客户端与服务器分离
客户端和服务器只能以一种格式进行通信:从客户端向服务器发出请求。这种客户机-服务器设置意味着范围有限。服务器不能发出请求,客户端也不能发送响应。为什么这种操作方式有帮助?它使服务器和客户端完全独立运行,这意味着它们的操作不会相互产生负面影响。
使用统一的界面(UI)
用于客户端和 REST APIs 通信的格式化语言必须相同,否则错误的通信可能是一个问题。在大多数情况下,RESTful web 服务使用 HTTP(超文本传输协议)作为客户机和服务器之间的语言。
无国籍状态
无状态事务是独立于交互的事务,而 REST 是无状态的。服务器将每个请求解释为全新的,即使已经提出了完全相同的请求。客户端和服务器之间的每次通信都必须包含所有必要的信息。优点呢?使用更少的服务器内存,并且交互是可伸缩的。
因为 REST APIs 是无状态的,所以它们通常用于云应用。出现故障时,可以重新部署和扩展组件,以应对工作负载的变化。REST APIs 的一些其他相关应用:云服务、iOS 应用和客户端 web 项目。
一个分层系统
在客户端和服务器之间看似简单的交互中,实际情况是它们之间的附加服务器(“层”)通常是通信过程的一部分。除了其他有用的功能之外,额外的层还可以分配流量和增加安全性。
可缓存响应
使用缓存可以节省服务器资源,缩短页面加载时间——将信息存储在客户端。REST 在这里有优势,因为它比 SOAP 更易于缓存。
按需编码(可选)
服务器可以通过发送可由客户端执行的代码来赋予 REST 客户端更多的功能。一个例子是使用 REST API 的 JavaScript 支持的 web 应用程序;服务器可以向浏览器发送 JavaScript 代码。然而,一个主要的缺点是按需编码(COD)降低了可见性。
我们休息我们的情况……
好了,这就是总结——希望你已经从这个小小的 REST API 教程中学到了你想知道的一切。
现在您已经了解了 REST 的所有知识,您无疑正在考虑如何使用它为您的客户创造世界级的网页搜索体验。 安哥利亚 为现代 app 的两大基础提供企业级 API, 搜索 和 推荐;我们的 REST APIs 可以帮助您立即实现您的目标。
我们的Search REST API,我们产品的核心,被一个由库、工具和仪表板组成的生态系统所包围。你可以使用我们官方的 API 客户端和库,它们都是开源的,代码就在 GitHub 上。
要了解如何开始你的时尚竞赛,请联系我们的团队。很快,你就会拥有 超个性化的 用户体验,可以想象,这种体验会和亚马逊的一样棒,和 Spotify 的一样受欢迎。
什么是搜索引擎数据库?
原文:https://www.algolia.com/blog/product/what-is-a-search-engine-database/
说到“搜索引擎”,你可能会想到谷歌主页上的搜索框,它可以给你一个与某个主题领域相关的搜索结果的有序集合,对吗?
或者你可能更喜欢认为幕后的网络爬虫使用像必应或雅虎这样的网络搜索引擎进行万维网搜索,以获取特定类型的信息。或者你想到了你最喜欢的社交媒体搜索功能。也可能你只是想到了 SEO。
无论如何,你肯定不会想到在一个老派的图书馆目录中寻找全文,或者给一个布尔搜索词加一个星号。你使用搜索引擎,所以你有这个。你知道搜索引擎软件是如何工作的。
但是说“搜索引擎数据库”(或“数据库搜索引擎”)和啊哦,你可能会有点茫然。
那是因为“搜索引擎数据库”不是一个常用短语。(见鬼,它甚至没有在 维基百科 中定义)。然而,引号中这些听起来很花哨的东西之一是商业网站成功的一个重要因素,当用户在网站上寻找某些信息时,它会对用户的搜索体验产生实质性的影响。
在这篇博文中,我们将看看“搜索引擎数据库”是什么意思,以及考虑搜索引擎和数据库之间的差异,这些差异相当微妙。
搜索引擎数据库定义
搜索引擎数据库是具备搜索功能的数据库。搜索功能可以帮助您快速找到数据库中的信息。此外,该搜索引擎针对大量半结构化或非结构化数据进行了优化(例如您在研究数据库中进行学术搜索时会发现的数据)。
搜索引擎数据库也是一种 NoSQL 数据库或非关系数据库。
关系数据库与非关系数据库
关系型
关系数据库(例如,SQL 数据库、MySQL)是以表格形式存储信息的数据库。这些表通常有可以在它们之间共享的信息,使得信息检索过程“关系化”
示例用例:一家小企业可能使用两个简单的数据集表来处理客户订单。第一个是客户信息表,包含客户的姓名、地址、账单信息和联系电话。第二个是客户订单表,包括订单 ID 号、订购的商品、数量、大小和颜色。
这两个表有一个链接它们的公共键或 ID 号。有了这个数字,关系数据库就可以在两个表之间创建一个关系。当客户下订单时,可以将数据库中的信息从每个表中提取到用户界面中,以创建和提交订单。
非亲属关系
非关系数据库以非表格形式、以诸如文档的结构存储数据库文件。文档可以包含大量信息,并且具有更灵活的结构。当有大量复杂多样的数据时,使用非关系数据库。
例如:一家大型企业可能有一个数据库,其中每个客户由一个单独的文档表示。该文档包含每一条客户信息,从他们的姓名和地址到他们的订单历史和产品信息。与关系数据库不同,尽管这些数据块的格式不同,但它们都可以存储在同一个文档中。
然后,当在企业网站上创建订单时,信息可以从单个文档中提取,而不是从多个表中提取。这使得非关系数据库非常适合存储频繁变化或采用不同格式的数据。它的搜索速度也比关系数据库快。
搜索引擎 vs 数据库
因此,我们定义了一个搜索引擎数据库。但是单独的搜索词呢?
- 搜索引擎 是搜索数据库并识别与关键词相对应的项目的程序。搜索引擎将数据库中的数据链接到需要它的用户。
- 数据库 是由计算机系统内的结构化数据组成的。
理论上,没有搜索引擎,数据库也可以存在。然而,搜索引擎的缺乏使得查找信息变得非常困难,尤其是在存储大量数据和复杂性的非关系数据库中。
数据库引擎(又称存储引擎)
我们习惯于能够轻松地进行各种类型的搜索。我们希望像 Google 和 Bing 这样的搜索引擎能给我们高质量、快速的搜索结果,并把我们送到正确的网页。
不幸的是,公司的数据库并不总是与高质量的搜索工具结合在一起。也不是所有的搜索功能都是一样的。
搜索引擎数据库的结构使得整合高质量的搜索变得容易。以下是搜索数据库的一些特性:
全文搜索
当消费者输入搜索查询时,他们习惯于从基于机器学习辅助算法的内容库中获得相关信息。但是许多数据库仍然使用简单的搜索模式,这种模式需要精确的措辞才能产生结果。
什么是全文搜索?在搜索者的查询中提供包含或 所有 词语的搜索结果。搜索引擎数据库使用全文搜索,即使你输入了一个错别字或没有完全匹配,也能提供相关的结果。这不同于传统的搜索,传统的搜索只提供精确匹配的结果。
日志分析
数据库搜索引擎内置了对索引和存储日志的支持。您可以从日志中提取数据进行分析,潜在地获得有价值的洞察力,从而改进您的业务决策。
地理位置搜索
搜索引擎数据库有一个叫做地理位置搜索的功能。如果你使用像谷歌地图这样的应用程序,在某个地理半径范围内搜索某样东西,你就可以看到这种功能在起作用。在标准数据库中,实现地理位置搜索需要一个插件。
快速搜索
搜索引擎数据库是为了速度和效率而构建的。它的查询响应速度很快,处理全文搜索的速度比关系数据库快。例如,当使用数据库搜索时,搜索者立即接收到 、自动完成 和建议。
您对搜索提供商的搜索已经结束
大多数网站和应用程序都是建立在数据库之上的。其中许多仍然被简单的搜索引擎使用。初级搜索技术不允许用户执行全文搜索(使用自动补全和建议)或获得即时结果,也不允许业务团队分析搜索数据。
这就是 Algolia 的高级搜索 API 的用武之地。
我们的 搜索引擎 是专门为提高网站数据库的搜索能力而构建的。它提供带有实时结果的即时搜索,智能地处理错别字,并允许您通过相关性和流行度来平衡搜索。它占了 自然语言 的因素。它为用户提供了快速、高效和可靠的搜索体验,简化了搜索过程,并为您的业务增加了优化价值,无论您是否需要用户能够找到电子商务产品、学术期刊的主题词、教程、医疗保健数据、报纸文章的主要来源或常见问题。它甚至还占了 同义词 。
你可以使用 Algolia 的搜索功能搜索任何数据源,包括【NoSQL】或非关系数据库。它被设计为适应文档搜索、大数据搜索和对象搜索(与 Elasticsearch 不同,elastic search 的 不支持 所有这三种功能)。
有了 Algolia,你可以让你的网站用户在搜索策略方面得到很好的帮助,让用户快速找到他们需要的内容。希望将最佳搜索添加到您的网站数据库中,以改善您的网站指标? 联系 我们的队伍出发吧!
什么是搜索索引?
原文:https://www.algolia.com/blog/product/what-is-a-search-index-and-how-does-it-work/
当您在线或在应用程序中使用搜索功能时,会发生什么?搜索引擎如何接受你的输入并从中产生相关的结果?
剧透:这不是魔术。它围绕着搜索引擎索引。
什么是搜索索引,它是如何工作的,使用搜索引擎索引对你的业务有什么帮助?
什么是搜索索引?
如果你使用过百科全书之类的参考书,你会对索引的概念很熟悉。要在百科全书中查找信息,通常要从翻到后面的索引开始,索引中的主题是按照字母顺序和各自的页码组织起来的。
你可能不太熟悉搜索索引的概念。它是组织和构建数据的方式,以便搜索引擎可以生成相关的搜索结果。搜索索引可以将任何和所有数据和文件类型转换为可搜索的数据。
我们的目标是使搜索尽可能地快速、准确和相关。这很重要,因为我们大多数人每天都在使用搜索功能,无论我们是在谷歌或微软必应主页上输入搜索查询,在网上搜索当地餐馆,试图在脸书找到一位老朋友,寻找常见问题解答或关于产品问题的教程,搜索 CRM 中有用的内容,还是试图在 Dropbox 中跟踪文档。
那么什么是搜索索引呢?基本上,搜索引擎检查的一组结构化数据,查找与搜索者的查询相关的信息。搜索索引是根据搜索引擎算法检索信息的特定方式定制的。
搜索索引是如何工作的?
网站的搜索索引是由网络爬虫(也称为网络蜘蛛)生成的,网络爬虫从网页中收集内容,并按关键字对其进行组织。许多搜索工具在生成搜索结果时也会考虑搜索意图和 语义 含义。爬行通常在持续进行的基础上进行,以便可以覆盖新的内容,并且搜索索引保持接近实时地更新。
创建搜索索引本质上是突出显示、标示和告诉搜索功能页面或文件中的信息。当涉及到网站时,搜索索引会指出关键术语(“关键字”),这些术语表明该页面是关于什么的、它的目的是什么以及它应该被发现用于什么内容。这样,每当有人搜索某样东西时,搜索功能就会寻找信息标志,从而消除了大量的工作量。
在工作场所应用程序、电子商务网站以及新闻和媒体网站中,搜索功能以类似的方式工作。
一个没有搜索索引的世界
我们可以谈论搜索索引的好处,但相反,让我们做相反的事情:想象一个没有 搜索的世界 来理解搜索索引如何从根本上改变一个企业的前景。
没有搜索索引的世界会是什么样子?
一句话,老古董。
没有好的搜索索引,互联网搜索引擎会产生非常不同的搜索结果。你不会马上得到结果,你只能在爬虫发现它们的时候得到它们。
这很难想象,因为我们太习惯于像谷歌这样的搜索引擎在谷歌抓取了大量内容后几毫秒内就显示相关结果。但组织网站的搜索功能通常不像谷歌搜索那样工作,尤其是在必须搜索多个系统和大型数据库的情况下。对于遗留系统,集成和访问孤立的信息可能会有问题,一些网站所有者的数据仍然是禁区。因此,搜索可能会很慢。
因此,知道如何优化搜索索引是至关重要的。你可能在一家提供电子商务或软件即服务(SaaS)工作场所应用或媒体平台的公司工作,你希望为你的客户提供更好的搜索体验。或者,您所在的组织为客户的新网站构建定制应用程序,而网站管理员也要求出色的搜索功能。
关注搜索索引可能会有回报。如果组织不能或不愿改进他们在应用程序中的搜索索引,他们可能:
失去客户……而且快
搜索是现代在线客户体验的基础。人是急躁的,善变的;如果用户体验不符合他们的期望,他们愿意跳槽去尝试竞争对手的产品。搜索时间越长,你失去的顾客就越多。
- 据 谷歌 报道,与耗时 1 秒的页面加载时间相比,3 秒的页面加载时间增加了 32%的用户反弹可能性。如果页面加载需要 10 秒钟,那么反弹的概率会增加到 123%。
- 来自Unbounce的研究显示,大约 70%的人表示页面加载速度会影响他们是否从电子商务网站购物。
看到自己的生产力直线下降
随着组织采用远程和混合工作场所模式,他们发现无缝数字体验对员工工作效率有多么重要。除了将传统应用程序迁移到云中并将关键流程数字化,改进企业搜索也至关重要。跨应用程序和数据库建立搜索索引可以帮助员工快速高效地找到他们需要的内容。如果没有索引,你会被浪费的时间和缓慢的页面加载所困扰。
违反法律
拥有出色的搜索能力是符合各种数据保护治理和合规标准的重要组成部分。无论是为了遵守欧盟通用数据保护法规(GDPR)还是加州消费者隐私法案(CCPA),或者仅仅是为了符合您组织的内部治理政策,快速准确的搜索都是至关重要的。
当涉及到 GDPR 时,如果不能快速方便地提供客户数据,可能会导致高额罚款和公司声誉受损。好的搜索索引不仅能让搜索快速进行,还能让需要可见的内容变得容易访问。
获取搜索索引权限
Algolia 让跨越各行各业的组织在创纪录的时间内提供 有效搜索 ,借助该解决方案,您可以随着公司的发展而扩展。我们的搜索 API 支持在您的应用程序、电子商务市场或网站上检索文件、联系信息、事件等。API 中使用搜索索引来提供快速、信息丰富、可显示的搜索结果。
那么,什么是搜索索引呢?你现在已经掌握了基本原理。如果您想了解更多这方面的信息以及改进的搜索体验如何帮助您的组织取得成功,请立即联系我们的团队。
什么是搜索查询,它是如何处理的?
Where can I get ramen asap near me?
How many ants does it take to kill a human?
Check engine light youtube
What is the meaning of life?
这些是典型的谷歌搜索;当人们试图驾驭日常生活的复杂性时,这只是他们心中许多担忧中的几个。
能够使用许多可用的搜索引擎中的任何一个进行网络搜索,无论是公共的还是私人的,已经改变了并且仍在深刻地改变着发达国家生活的许多方面。很难想象,在人们能够把自己粘在电子设备上,并即时谷歌搜索任何突然出现在他们脑海中的问题——紧急和关键的,或者随机和不重要的——之前,我们幸存了下来,或者我们没有无聊到流泪。
所以你可能知道什么是搜索查询(是的,你每天都要处理它们)。但是让我们回顾一下以防万一,然后进入第二个不太明显的部分,关于搜索查询是如何处理的。
什么是搜索查询?
如果你在想“某人用来提问的一串单词”,太棒了!
“查询”听起来很像“问题”它们有什么不同?
根据WikiDiff,一个查询确实是一个问题或者一个询问。那么,相比较而言,什么是问题?寻求信息的句子、短语或单词
根据这个定义,如果一个查询和一个问题听起来还是一样的话,你并不孤单。嗯。下一个查询,呃,问题:WikiDiff 靠谱吗? 也许不是。
无论如何,让我们回到搜索查询 101。搜索框中输入的搜索词数量惊人(通过使用数字语音助手和语音搜索应用)。Google processes 大概 10 万次 搜索每一次 第二次 。这还只是谷歌。
人们在询问什么?主要是如何去网络上的某个地方,比如一个公司的主页;如何做某事,或如何(或在哪里)买东西。
据知情人士透露,搜索查询有三种风格。以下是你需要了解的三种不同类型的搜索查询:
导航搜索查询
这是指这个人脑海中有一个特定的网站(登陆页面或网站上的特定子页面,如 FAQ ),并打算去那里。也许他们知道(相对简单的)URL,但是懒得在浏览器中输入。也许他们正在浏览他们的社交媒体,看到了一个关于刷狗毛好处的对话,所以他们查询了当地一家宠物用品店的名称。他们可能不知道公司名称的确切网址或拼写,他们认为这样更容易查询。
导航查询有哪些例子?谷歌上排名靠前的只是“facebook”和“youtube”
信息搜索查询
正如这个人的名字所显示的那样,这个人正在寻找一般的指导、事实或数据——例如,如何做一些事情的步骤,比如烘烤一批红色天鹅绒蛋糕。
信息搜索可以表述为一个问题,比如“我如何回收一台冰箱?”或者“不含酒精的啤酒里有多少酒精?”,但也可以简单到一个词,如“拿铁”或“鹦鹉”
事务性搜索查询
是的,在这种情况下,这个人想在电子商务网站或实体店买东西。他们拥有所谓的“交易意图”使用搜索引擎优化(SEO)来定位关键词最适用于这种类型的查询,因为在数字营销中使用正确的词将使您的企业在人们的搜索结果中排名更高,并有可能带来更高的收入。
交易查询的示例:“购买布雷维尔浓缩咖啡机”、“iPhone 13 上的交易”、“最佳狗刷”。
一个搜索查询的旅程
当有人在搜索栏中输入搜索查询时,搜索引擎的“大脑”会发生什么?众所周知的内幕下发生了什么?
大多数搜索引擎解析查询,然后将其发送到索引服务器进行处理。
“有些搜索引擎可能会使用拼写检查或查询建议对查询进行“预处理”, (本质上是询问搜索者“你是说……?").
它与搜索引擎索引中认为相关的网页相匹配,并应用各种规则和参数。然后基于最佳相关性来确定搜索引擎结果页面(SERP)上的列表顺序。
为了想象这种机制,了解一个搜索引擎如何准备它的信息索引来被搜索是有帮助的。首先,“索引”是存储数据的地方。大多数搜索引擎以一种称为倒排表的结构化方式将数据存储在索引中。
对于即时信息检索,引擎反转逻辑并以“反向”流程构建索引。因此,它不是扫描文档寻找单词,而是将单词 与单词 进行匹配,以便定位文档。
下面是如何在这个模型中处理搜索查询:
正如你看到的,当你输入一个 a, 你会得到每一个以 a 开头的单词(并且每隔一个字母列被排除)。如果您不断向查询中添加字母( aa、 ,然后是AAR),每次添加都会缩小匹配范围。瞧,你最终会得到四个相关的搜索结果,它们会告诉你所有关于 土猪 的信息。T34
请记住,因为不同的搜索引擎使用不同的专有算法,它们对相关术语的操作和排序都略有不同。另外,除了实际的搜索查询,搜索引擎可能会考虑其他相关数据来帮助它决定如何对结果进行排名,包括搜索者的:
- 物理位置。他们在商场吗?
- 检测到的语言。西班牙语的查询值得西班牙语的搜索结果。
- 早先的搜索历史。他们之前是否在寻找同一类型的东西,只是不同的品牌或型号?
- 装置的类型。 他们是在自己的 手机上 ?
识别搜索者意图
对于每一个搜索引擎来说,关键是破译搜索者想要找到的要点。他们是想简单地了解一下加拿大的地理,还是对预订一次横跨加拿大的火车旅行感兴趣?他们想知道 检查发动机 灯是因为他们的车过热,他们被困在高速公路的中央隔离带上,还是因为他们只是好奇如果他们忘记安排一次推荐的调整,会发生什么情况?用户意图是什么?
因此,搜索引擎有点像试图读取搜索者想法的通灵者,只是它更像是科学家在尽可能快地浏览严格排序的清单。
当搜索引擎比较记录并计算排名时,它会问自己这样的问题:
查询中有错别字吗?如果有,一个还是多个?
错别字的数量 与排名有什么关系?错别字越少越好:
- 如果查询中没有任何错别字,页面内容 排名比如果有错别字更高 作为匹配
- 为带有 一个错别字 的查询生成的内容比带有两个错别字的查询生成的内容排序更高
- 如果用户是一个草率的查询录入者,并且有 三个错别字怎么办?嗯,他们可能会不走运,因为简单的文本匹配不能纠正拼写。
查询第一个字母匹配吗?它是匹配整个单词还是仅部分匹配?
在 前缀搜索 中,搜索引擎将整个查询与索引中某条记录的属性中的开头字符进行比较。比如,它把 比作 与 最好的 与 披头四。 但并不打散查询,以搜索*【b】*然后 be、 为例。
相关结果被生成为指示查询如何匹配内容中出现的短语的片段。
记录被分级为具有更强或更弱的相关性,这确定了从第一页开始的搜索结果的顺序。
查询上下文也起作用。为了评估上下文,搜索引擎问自己这样的问题:
查询中的单词是否匹配同义词?
如果是,搜索引擎将在排序过程中同等对待带有同义词的记录。例如,如果可用内容包含 紧身衣 但是搜索者要求 紧身衣、 他们将看到两者的搜索结果。
查询是否匹配记录的标题或描述?
使用 可搜索属性 ,标题与查询匹配的项目排名高于与描述匹配的项目。
一件商品比另一件更受欢迎吗?
如果你有三条完全匹配的记录,那么搜索引擎会使用 自定义排名 来添加“业务指标”,例如将销售额最高的记录、搜索次数最多的记录或最受欢迎的记录进行优先排序。如果两个记录匹配不同,则其他标准决定排名。
当一个有能力的搜索引擎绞尽脑汁、有条不紊地回答所有这些类型的问题后,它会列出相关的搜索结果。SERP 看起来确实像是一个精神科学家的杰作。更重要的是,搜索引擎做的关键工作是引导搜索者到一个网络目的地,用他们迫切问题的答案启发他们,或者指引他们在哪里可以买到产品。
例如,这里有一个 伟大的答案 来自谷歌对“生命的意义是什么?”
最后一个查询:Algolia 的搜索引擎排名如何?
答:作为一个 快 ,高级的搜索引擎,是遥遥领先的。我们先进的 搜索 API 为数千家全球公司提供数十亿次搜索查询,即时提供相关结果(不到 100 毫秒)。
我们的客户喜欢它的一个原因是:我们使用一种 平局决胜算法 来确保最佳搜索结果匹配首先出现。另外,我们的搜索功能是透明的。没有秘密,也没有复杂的公式;你可以看到方法和标准被用来寻找和排列你的内容。您可以根据公司的具体需求轻松配置搜索参数。
准备好了解更多信息了吗? 向 索取我们搜索引擎的免费演示,我们很乐意向您展示您的能力!
什么是网络爬虫?
原文:https://www.algolia.com/blog/engineering/what-is-a-web-crawler/
这是一种每天都会发生数百万次的常见经历,大多数人对此习以为常。你在网上搜索框中输入几个词,就能找到你想要的东西,例如,一个电子商务网站上的产品,瞧!它似乎是凭空出现的。
但是幕后是什么让一切如此神奇地发生呢?是什么驱动了这个看似超级强大的搜索引擎?
针对数字内容的网络爬虫
答案:网站爬虫:努力工作、鲜为人知的搜索引擎的重要组成部分。 网络爬虫是一个机器人 — 一个软件程序 — 系统地访问一个或多个网站,并对其找到的数据进行分类。这是一个比喻性的错误,它有条不紊地定位、咀嚼、消化和存储数字内容,以帮助创建一个可搜索的索引。
网络爬虫在幕后工作,但他们扮演着关键的角色。 没有爬虫 — 世界上有成千上万的爬虫 — 就不会有相关搜索结果的即时提供,也就不容易发现想要的信息和产品数据。 这一点尤为重要,因为根据 《福布斯》、 统计,世界上多达 90%的数据都是“非结构化的” 这是一个数字丛林。公司必须确定如何组织和管理数量不断增长的数字资料,以便既能创建优雅的在线用户体验,又能快速找到内部业务信息。
多种蜘蛛网
网络爬虫有几种类型。
有些致力于收集和索引在整个互联网上找到的数据。你肯定听说过谷歌臭名昭著的 Googlebot。该公司还有收集特定类型信息的“子机器人”蜘蛛。还有微软 Bing 的; 百度蜘蛛 ,中国主要网络爬虫;还有俄罗斯的网络爬虫,Yandex。
除了相对较少的著名的全网爬虫,还有大量较小的和不太出名的爬虫在网络的某些部分随意爬行。
特定内容抓取
一些网络爬虫仅用于收集特定类型的内容,如电子邮件、视频或图像。Googlebot 视频和社交媒体爬虫就是这样的例子。
一些爬虫不仅从网站或应用程序收集和组织内容,还从整个电子商务世界收集和组织内容:它们可以提取人们需要的特定产品信息,以便找到正确的产品并做出购买决定。
单点蜘蛛
一些网站爬虫被设计成与 特定网站上的内容一起使用。
- 八分解析 爬虫让你不用做任何编码就能从一个站点提取数据
- HTTrack 网站复制器 ,一个免费的实用工具,可以将整个网站下载到你电脑上的本地目录
- 可定制、可配置的 Algolia 爬虫 可以丰富提取的内容与业务数据,增强用户体验的相关性
专门蜘蛛
其他爬虫致力于特定类型的可用性和功能性。例如:
- 尖叫青蛙 SEO 蜘蛛 都是关于改善公司网站内容的搜索引擎优化(SEO)
- 用 Java 需要抓取内容吗?可以用 GitHub 开源的crawler 4j
- 如果你想从使用Ajax、JavaScript 或 cookies 的网站获得数据,你可以考虑parse hub
爬虫的劳动果实
如果我们没有网络爬虫,搜索引擎就不会知道网站有新的或更新的内容。此外,网站抓取、提取和结构化提供了许多其他好处。
当网络爬虫使搜索引擎更容易理解并准确呈现你网站上的内容时,你就更接近于向潜在客户提供正确的内容或产品。
当一个电子商务网站使其产品描述、图片、评论和购买信息容易被发现时,它就离最大化相关性和收入更近了一步。即时可用的最新信息确实非常强大。
爬虫还可以通过对元数据、使用数据、标签和相关性信号等“隐藏”内容的梳理,使更多信息浮出水面,从而丰富搜索结果。
在一个网站中寻找什么爬虫
当你在寻找一个完美的网站爬虫时,无论是一个有文字内容的网站,一个有媒体内容的应用程序,还是一个电子商务商店,你都很容易被你所有的选择淹没(当然,多亏了网络爬虫的努力,你才会知道)。
缩小你的搜索范围,集中精力确保你的新爬虫将是所有这些东西:
有效。你梦想中的爬虫会熟练地提取和构建你的网站内容,使其容易交付给你的访问者和客户,并带来所有可能的利润相关的好处。
可定制。 不管你的网站是什么类型,你都希望能够定制爬虫操作,以确保你的蜘蛛准确地解释你独特的内容并满足你的业务需求。例如,您可能希望爬行在一天中的特定时间自动开始。您可能只需要对站点的某些部分进行爬网。您的爬行器需要满足您独特的数据提取需求,并且具有毫不费力的适应性。
可扩展。如果你想在你的网站上发展你的业务并扩展内容或产品,你需要一个能够随着你组织的发展和不断变化的业务需求而有效扩展的爬虫。
生产准备就绪。你的爬虫应该包括数字工具,让你在用户的搜索体验中注入准确、及时的信息。例如,您选择的爬虫应该包括一个数据分析工具,让您评估您的爬虫挖掘的质量。它应该包括一个数据监控工具,告诉您在爬行过程中发现的任何错误。
那是爬行,乡亲们
恭喜恭喜;您现在已经了解了世界上众多不同的网站爬虫的一些关键事实、功能和可能的特性。
你知道网络爬行可以为企业提供的内在价值。您了解爬虫程序如何简化网站操作,在正确的访问者或潜在客户请求时快速获得正确的信息,并最终创造更好的用户体验,增加收入,促进广泛的成功。
如果你有一个电子商务网站,毫无疑问,你会意识到让这个重要的数据收集工具为你的公司服务,并尽可能高效地工作。
寻找完美网络爬虫的工作已经开始。你会选择哪一个?
使用爬虫创建领先数字 UX
在研究你的爬虫选项时,我们希望你能看看 阿哥利亚的 。我们的 搜索即服务平台使全球各国各种规模的公司能够为消费者提供快速、相关的数字体验,从而推动结果的产生。
我们托管的爬虫的独特之处在于,它可以跨越商业部门和行业 , 包括数字媒体、电子商务市场等等。我们已经帮助财富 500 强中的许多公司以及中型组织和小型企业创造了领先的数字体验。
这里有 一些方法 Algolia 可以帮助你的公司释放你的内容。
好奇?查看这个深入的 网络研讨会 ,了解我们的爬虫如何帮助您的企业取得成功。
感谢您的阅读, 如果您有任何问题请告诉我们 ,祝您的网络爬虫搜索顺利!
什么是人工智能驱动的网站搜索?人工智能搜索
原文:https://www.algolia.com/blog/ai/what-is-ai-powered-site-search/
随着人工智能(AI)技术的出现,使 Alexa、谷歌搜索和自动驾驶汽车等服务成为可能,下一代搜索是关于人工智能驱动的搜索。过去,大多数用户在搜索框中输入文本都会得到类似的结果。现在,人工智能的发展使得产生更相关的结果成为可能,这些结果可以根据浏览历史、通常与所用单词相关的意图以及类似搜索的高性能内容等因素进行实时调整。人工智能支持的搜索有可能给你的网站用户提供他们想要的东西,这反过来有助于帮助你实现更高的客户满意度、更高的转化率和增加收入的商业目标。
但是,人工智能驱动的网站搜索到底意味着什么?为什么关注对企业来说很重要?
什么是站点搜索?
有 74%的人可能会转换品牌 如果他们发现一家公司的购买体验太难,而那些进行搜索的人转换, 网站搜索已经成为客户体验的一个至关重要的元素。简而言之,网站搜索解决方案使您网站上的内容更容易找到,从而提高客户满意度和用户对您公司的参与度。
虽然优秀的搜索已经成为公司的差异化优势,但这种需求已经变得越来越复杂。感谢像网飞和 Pinterest 这样的网站,消费者对接收即时的个性化内容有很高的期望。人工智能支持的搜索可以帮助弥合用户期望和他们认为缺乏的搜索体验之间的差距。
什么是 AI 驱动的站点搜索?
人工智能是计算的一个分支,模仿人类的智能,可以学习和适应数据输入。通过人工智能支持的搜索,该平台从用户数据中学习,自动生成最准确和最相关的搜索体验。这种学习是实时进行的,当用户搜索时,会在后台调整结果。这种细化是基于编程到人工智能系统中的多个因素,如该人过去的购买记录、常见的拼写错误以及查询中语言背后的意图。
虽然这些因素中有许多可以人工解释或编码到搜索平台中,但人工智能部分反映了在没有人类干预的情况下大规模完成这些任务的能力。此外,智能机器可以针对准确性和相关性进行系统调整,并随着时间的推移进行改进——或像人一样学习。
在 Pinterest 等网站上,人工智能支持的搜索是幕后的,人工智能从人们每月进行的数百万次基于图像的搜索中学习。该公司拥有超过 3.2 亿活跃用户和数十亿个“pin”,拥有丰富的数据,它通过深度学习模型 来了解搜索背后的意图,并为每个人提供个性化的结果。例如,搜索“diy 厨柜”会返回从“如何打造自己的橱柜”到“厨房改造前后”的结果随着用户点击更多的大头针,模型更好地理解他们的意图,他们的搜索结果也更窄。
AI 搜索是如何工作的?
当应用于搜索时,人工智能通常指的是机器学习和自然语言处理(NLP)的子集,以确定搜索背后的意图,并返回用户想要的东西。
NLP 和机器学习
由于人类语言的非结构化性质和多样性,理解人类的说话方式并做出适当的反应对机器来说是一个巨大的挑战。在对话中,我们使用同义词,如“辣辣椒”和“辣辣椒”我们使用模棱两可的术语,比如“谁在格莱美上击败了它?”
有了自然语言处理,计算机能够检测语言模式,识别单词之间的关系,从而理解人们真正想要的东西。NLP 是 Alexa 和 Siri 等语音助手的核心,这也是谷歌通过让智能引擎阅读 2865 部爱情小说来训练其人工智能更具对话性的原因。
为了让计算机程序自动根据它们对人类语言的理解采取行动,并及时提供改进的响应,需要机器学习。机器学习是让机器执行动作的科学,而不需要使用数学公式明确编程。一台机器分析输入系统的数据,并利用算法不断发现其中的模式和联系,完成需要人工团队数周或数年才能完成的任务。这些任务可能包括根据类似用户的购买情况,向搜索“最佳政治传记”的人推荐书籍,并自动检测常见的拼写错误,如“easy zuchini bread recipe”中的错误,然后在搜索结果中补偿这些错误。
人工智能驱动的搜索需求日益增长
人们搜索的方式以及他们对与机器互动的期望正在迅速变化,人工智能搜索正在发挥核心作用。
语义搜索
在 2021 年搜索“最佳洗手液”,你无需指定任何其他内容,就可以获得对新冠肺炎有效的产品推荐,这与 2019 年你会收到的结果有很大不同。通过查询的上下文含义理解搜索者的意图,而不是依赖一个人输入的确切单词,是语义搜索的领域。随着搜索引擎更好地理解查询的含义,人们发现使用搜索引擎很容易,他们的期望也在改变。具有自然语言处理和机器学习的人工智能语义搜索意味着搜索可以独立运行,并返回更相关的结果。
语音和视觉搜索
搜索正日益超越基于文本的输入,语音和视觉搜索迅速成为移动搜索的首选方式,并为使用人工智能搜索开辟了更多途径。 Gartner 预测,到 2023 年,70%的客户互动将通过智能扬声器和助手开始。 随着计算机视觉的进步,加上机器学习,计算机可以解释它们在图像中“看到”的东西,以执行视觉搜索。
随着人工智能的发展,计算机理解会话语言的能力也在迅速提高,这在很大程度上构成了语音搜索。例如,你可以问你的移动设备,“贾斯汀·汀布莱克的最新歌曲是什么?”并添加“播放它”,而不需要具体说明“它”是什么意思
这一趋势在 Z 世代和千禧一代中尤为明显,他们高度依赖移动设备进行电子商务购物。一项 ViSenze 调查发现,这些群体中 62%的消费者希望能够进行视觉搜索(使用图像而不是文本)。然而,根据另一项调查, 72%的营销人员没有为视觉搜索、 进行优化的计划,只有 35%的营销人员计划在下一年为语音搜索进行优化,这可能为希望领先于竞争对手的公司带来机会。
零售商 Forever 21 利用了这一趋势,推出了一款人工智能视觉搜索工具 ,允许人们根据他们拍摄的照片购买服装。该公司报告称,在使用视觉搜索的购物者中,第一个月的转化率增加了 20%。
手机上的视觉和语音搜索可能只会越来越受欢迎。现在通过人工智能支持这些模式的公司将能够更好地服务他们的客户,并获得随之而来的财务回报。
使用人工智能搜索的好处
随着人工智能在搜索领域的更多使用案例和机会变得显而易见,人工智能搜索在企业与用户的日常互动中的优势也变得越来越明显:
- 规模优化
- 改进搜索建议
- 增加个性化
- 更高的客户满意度
- 更多客户转化
- 将员工从重复的搜索相关任务中解放出来,例如纠正拼写错误和识别同义词
如何开始将 AI 带入搜索
在 Algolia,我们希望看到我们的客户为他们的用户提供最好的搜索和发现体验。我们推出了Algolia AI,这是一系列基于 SaaS 的解决方案,允许您在现有堆栈中利用人工智能支持的搜索,同时保留控制和定制搜索体验的灵活性,以实现您的业务目标。Algolia AI 可以提高你对用户及其意图的理解,然后利用这些数据提供最相关的个性化搜索体验。
我们的人工智能解决方案可以帮助您:
- 理解所有语言的用户及其查询的总体意图。 使用 Algolia 自然语言处理可以支持任何语言的查询。你可以使用人工智能来理解复杂的查询,比如“网上退货是免费的吗?”通过应用 自然语言理解 中的 Algolia 理解来解释查询中最重要的实体。Algolia Answers 通过使用 AI 从语义上搜索您公司的索引数据,并根据用户意图而不是查询中的确切单词来找到最准确的内容,从而进一步提高了搜索的准确性。
- 交付最佳结果。 用动态同义词建议加强搜索词的相关性,它使用人工智能来识别常见的同义词,并在用户试图改进其结果时提出建议。有利于更高水平转化的一个功能是 AI 搜索动态重新排名,它使用 AI 来显示每次搜索中表现最好的产品。
在本次网络研讨会中了解有关 Algolia 人工智能特性的更多信息。
推荐内容来自阿哥利亚
什么是 AI 搜索排名?
原文:https://www.algolia.com/blog/ai/what-is-ai-search-ranking/
AI 排名是指用于优化搜索结果顺序的多种机器学习算法。
用任何搜索查询,都可能有很多 相关的 结果。这就是搜索结果排名发挥作用的地方。排名越来越多地由人工智能(AI)驱动,人工智能包括各种机器学习算法。
在这篇文章中,我将描述一些不同的人工智能排名方法,并简要讨论一些提供更好结果的挑战。
精度 vs 召回
为了提高搜索结果排名,你需要能够衡量它。相关性的两个简单度量是 精度和 。
- 精度 是 检索到的 文档中 相关 的百分比。理想情况下,搜索结果只包含相关条目,但情况并非总是如此。例如,搜索“iphone”可能会返回 iPhone 案例,而实际上客户正在寻找一部手机。
- Recall 是所有 相关 文档中 被检索 的百分比。 理想情况下,每个与查询相关的记录都会出现在结果中,但是有些相关的文档可能找不到 。例如,对于查询“纽约”,包含“NYC”的记录。
这些是帮助我们确定结果是否好的有用指标。理想情况下,召回率和准确率都将达到 100%,但实际上这非常困难。而且,相关性可以是主观的!
举例来说,假设是时候买一台新电视了,你在你最喜欢的卖家网站上搜索“大电视”你得到 119 个结果。在这些结果中,有些项目非常相关。但有些不是(比如下面的电视柜和柜子)。这就是 精度 。网站上还有许多其他相关产品没有包含在搜索结果中。我们称此为 回忆 。
为了获得更好的精确度和召回率,您可以细化搜索查询。你可以搜索“40 岁以上的电视”,这次(见下文)你会得到 262 个结果!看起来新结果中的电视机更多,但实际上只有一部分满足 40 英寸以上的查询参数。
事实上,精确和回忆之间可以有一个阴阳两极;改善其中一个可能会对另一个产生不利影响。
在上面的例子中,可以有许多相关的电视。而 最佳 结果是客户最感兴趣的结果,可以通过点击量、购买量、评分、最低收益等来确定。排名靠前的结果获得最高的参与度;相反,当人们不容易找到最好的结果时,他们很可能会放弃你的网站,或者找到另一种方式来回答他们的问题,比如开一张支持票。
精确和回忆可以帮助我们从概念上开始理解人工智能排名。当执行一个查询时,搜索引擎必须确定某个东西是否相关,然后按照从最好到最差的顺序对它们进行排序。
传统上,有多种 统计方法 用于基于一组文档内的术语频率对结果进行排名。关键词搜索引擎寻找查询词及其替代词,然后该算法可用于按最相关到最不相关对这些结果进行排序。这些方法非常高效和快速,但需要许多额外的启发。一些改进纯统计排名模型的新增功能包括:
- 同义词库,为初始查询术语提供更多选项(例如,“电视”或“电视机”或“电视机”)
- 规则处理某些类型的查询(如 )(如果查询包含“以上数字”则在尺寸上进行过滤变换,如“27 寸以上的电视机” )
- 查询处理技术,如错别字容差、分类、词干等
- 参与度指标(如点击量、受欢迎程度和转化率)
这些“信号”可以为结果提供一个很好的反馈回路。正如我将展示的,更高的参与度意味着结果可以相应地重新排序,这反过来可以产生更多的参与度。有各种各样的机器学习方法效果很好,我将在下面描述这些方法。
学习排名
Learning-to-rank(LTR)是一种机器学习的类型,提高排名,辅助精准。它包括监督学习、非监督学习和强化学习。也有类似半监督学习的变体。这些解决方案中的每一个都提供了人工智能排名功能,以提供比更简单的统计方法更好的结果。
例如,监督学习是一种使用数据集或标签来分类和预测搜索结果的机器学习。在“大电视”的例子中,您需要将结果的子集标记为“大电视”,以便算法知道人们在搜索什么。这方面的问题是,它存在认知偏差——什么构成了一台大电视?每一个训练这种算法的人都会有不同的看法,而且会随着时间的推移,随着新产品的出现而改变。电视没有屏幕怎么办,比如投影电视?你怎么给它贴标签?
无监督学习旨在部分消除监督学习的人为偏见,而是让机器学习在个体查询级别进行优化。通常,这意味着使用静态的人工配置方法计算结果,然后使用机器学习模型重新排列前 X 个结果。
这种方法非常聪明,已经被一些主要的开源搜索技术采用,产生了很好的结果。然而,也有不利的一面。
- 它仍然需要大量的工程工作来启动和运行,并且
- 查询-结果对索引分数是固定的,或者至多很少更新。这意味着算法输入保持静态。这是向前迈出的一步,但是通过使用强化学习和动态重新排序,我们可以做得更好。
在这两种情况下,您都可以手动调整排名,但结果是,这些排名通常对部分查询有效,但对其他查询无效。修复故障而不引起其他地方的问题是非常困难的(精确和召回!).一个很好的类比是拉动一堆杠杆,头脑中最重要的问题得到改善,但目前还不清楚这会如何影响其他一切。搜索不是一个简单的问题,人们无法在数千甚至数百万个不同的查询中平衡这个问题。
强化学习是另一种学习排序方式,它使用反馈根据积极的结果对结果进行排序。强化学习根据点击、销售、转换、注册和其他积极反馈等信号进行频繁的增量改进,并可以反馈到系统中。
在搜索领域,正面评价可能意味着不同的事情,搜索结果被点击,或导致后来的事件,如销售等。在 Algolia,我们主要关注点击,因为有更多的可用数据(更快地获得更高的可信度),但如果有足够的数据,我们也使用后来的事件。
使用点击量确定评分时,您需要修正位置偏差、短暂点击(对点击结果不满意)以及其他各种因素。然后,正面评级与更频繁点击的结果大致相关,负面评级与那些不太频繁点击的结果大致相关。置信区间通过计算概率分布来帮助校正样本大小。
已经有了 很多被开发出来的学习排序算法 。在 Algolia,我们提供了一种 动态重新排序 解决方案,这是一种强化学习。在引擎计算出您的结果的文本相关性并应用了您的 自定义排名 后,动态重新排名开始生效。它可以用来发现用户行为的趋势。它不仅可以提升更好的结果,还可以降低不相关或转换的结果。例如,两个网站可以有完全相同的目录或搜索索引,但根据客户对内容的反应,对搜索结果进行不同的排序。
个性化、商品化等等
关于排名,还有很多其他因素我还没有提到。比如个性化。使用地理位置、过去的搜索历史、过去的购买历史和其他因素,您可以提高搜索结果的精确度。如果做得好,个性化是改善客户体验的最有力的工具之一。如果做得不好——而且做起来非常复杂——会破坏体验!
通常需要“覆盖”基于短期优先级的有机搜索排名。例如,您可能希望对新产品发布、产品促销或新闻发布的某些结果进行优先级排序。当你向你的网站添加新产品或页面时,它还不会有任何点击或转换事件——这是强化学习算法进行动态排名所需要的。这就是为什么搜索引擎提供额外的功能,如自定义排名、销售、规则和“锁定”,让客户控制任何给定时间的结果。
脏数据和差排名
机器学习对于改善信息检索和排名非常有用。然而,正如谚语所说,坏数据进来,坏数据出去。机器学习模型的好坏取决于它们必须处理的数据。正如一篇关于 的文章,HBR 简洁地指出 ,“糟糕的数据质量是机器学习的广泛、有益使用的头号敌人。”
强化学习只有在你有足够的数据可以学习的时候才会起作用。人工智能排名对于全新的网站、产品或页面,或者数据质量差的网站来说效果不好。你需要数据——好的数据——来进行排名。
坏数据可能是一个质量问题——拼写错误、描述不当等。—它也可能是一个糟糕的信噪比。例如,搜索引擎优化策略会严重破坏谷歌搜索结果和排名。随着网站所有者争夺更高的排名,SEO 产生了很多“噪音”。网站搜索也有同样的问题。
Bad data in, bad results out. The meme illustrates how even great AI algorithms can lead to poor decisions when they have bad data. Image via Reddit.
你的网站也可能有相互竞争的所有者、糟糕的元数据和文档描述问题。市场是一个很好的例子,说明它可以有多复杂。市场拥有他们自己创建的或来自卖家的产品数据,以及用户提交的评论、常见问题解答、评级等其他数据。此外,产品目录会不断更新和更改。对于相同的查询,结果可能会越来越差。
市场是一个极端的例子,但它们说明了日复一日处理产品排名的困难。你不需要有一个市场来体验这些问题。 改进你的搜索索引 可以包括更新你的 HTML 模式,添加开放图元数据,增加你的搜索索引,等等。
智能搜索革命
按排名学习,尤其是强化学习,是改进排名的有力解决方案。它有自己的挑战,例如能够用很少的历史性能数据提供更好的结果,或者解释概率优化,但尽管如此,它仍比传统的排名算法提供了许多优势。
然而,这并不完全是黑白分明的。两阶段 学习排序解决方案 将利用搜索引擎的现有排序(可以是更简单的统计方法,如 TF-IDF 或 BM25,或更复杂的统计方法,如 Algolia 平局决胜 或向量相似度),然后采用一种或多种机器学习算法对 前 K 名 结果进行重新排序
人工智能排名也可以与混合搜索( 矢量搜索 和关键词搜索技术)相结合,以提供有力的 1-2 拳:令人难以置信的相关性和排名。混合搜索和人工智能排名之间存在微妙的相互作用。更好的初始混合搜索结果将影响点击、转换和其他信号,然后影响动态重新排名结果。这是一个改善结果的良性循环。
这些技术现在很少见,但随着机器学习进一步影响数据和底层存储结构,它们将成为未来几年的标准。
什么是 API?
你有没有想过不同的软件程序是如何相互交流的?因为他们有。他们可能不会参与复杂的辩论或共同主持时事播客或交换推文——至少现在不会。但是每天,软件组件都在相互交流,以使技术世界运转。
这是真的:数字技术之间的交流是现代世界的一项基本活动。没有它,我们的手机将失去智能,我们最喜爱的应用程序将毫无用处。社会越依赖数字技术,不同软件之间的交互就变得越重要。
这些技术是如何“对话”的?使用 APIs 应用程序编程接口。
它们是什么?
API 是允许软件产品连接和通信的东西。它允许多个软件程序根据预定的规范集交换数据。因此,无论你是在手机上购买一条牛仔裤,还是拍下自己炫耀的照片,或者在 Instagram 上分享这些照片,各种软件都在后台运行并交换数据。
为了理解 API 的用法以及 API 是如何工作的,我们来分解一下缩写词 API。
应用
任何软件程序,无论是你手机上的应用程序还是你在网络浏览器中使用的网络应用程序,都需要与各种技术进行通信才能运行。
在任何给定的时间,一个应用程序可能需要连接到另一个应用程序、互联网或设备。在传输数据的交互中,软件程序需要无缝连接、通信和执行数据交换。
一个很好的 API 例子是谷歌地图 API。当你在网上搜索一家咖啡店时,谷歌地图会连接到当地所有咖啡店的目录,以便立即向你展示在哪里可以买到一大杯摩卡咖啡。
编程
应用程序之间的通信不会自动发生。如果 Instagram 遇到 Spotify 进行深度对话,那只是因为每个公司的开发人员都为这种互动设置了条件。
在 API 开发中,程序员创建一套技术规范——API 文档——它决定了与其他产品交流的内容。该文档通过准确概述程序间数据传递的内容、时间和方式,消除了所有潜在的混淆。
API 由各种元素组成:程序员可以集成的服务和工具。程序员“调用”或请求必要的元素。API 请求被发送到端点,并可能调用方法或子例程。
界面
当人们交谈时,信息在他们之间无缝传递。当有人与计算机软件交互时,没有 API 的帮助是不可能的。取而代之的是,他们可以通过点击、打字或说话的界面来传递他们需要交流的内容。
软件程序和计算机也依靠接口相互连接。计算机程序员结合了这些界面,这些界面对最终用户来说或多或少是不可见的。当一个或多个软件程序交互时,使用一个 API 密钥,允许它们相互识别和连接的代码。
不同的 API 适合不同的人
API 有多种分类方式。下面是一些常见的 API 类型:
内部或私有 API
顾名思义,这些是为了方便数据传输而制作的,仅供公司内部使用;第三方无法访问它们。然而,一些公司最终公开了他们的内部 API。
软件组织可以在市场上发布其产品的 API,以便其特性和功能可以与其他应用中的特性和功能集成。Algolia 搜索 API 就是一个例子;Algolia 允许其他企业利用其搜索功能来改进他们的产品。
开放的、外部的或者公共的 API
免费提供给所有开发者(有时是免费的,或者通过订阅)。这些资产受限的开放 API 的特点是认证和授权措施相对较低。
一个组织可以 找到一个现有的 API 来实现改进其应用的功能。例如,一个企业可以使用 Algolia 的搜索 API 来改进其文档管理流程。优势?开发者节省时间。他们可以快速添加功能,而无需编写每一行代码或扩大他们的内部团队。组织可以构建具有人们期望的特性和功能的应用程序,从而维护卓越的用户体验,而不需要额外的时间和人力成本。
复合 API
各种数据和服务被组合在这种类型的 API 中,这可以减少 API 调用的数量和整体复杂性。一个应用程序:微服务,其中单个作业可能需要来自许多内部 API 的数据。
合作伙伴 API
为了更容易满足 B2B 需求,授权开发者可以访问这些类型的 API。
合作伙伴 API 通常具有强大的认证、授权和安全性。
服务 API
这些 API 促进了服务与服务提供商内部系统的集成。
Web API
这些都可以通过 HTTP 在网上访问。
API 如何工作
这里有两个在不同商业模式中使用的 API 的例子:
同单点登录
当一个忙碌的狗爸爸注册使用一个遛狗移动应用程序时,他可以选择通过将新的应用程序帐户绑定到他的谷歌帐户来加快注册过程。这样,他就不必在多个移动应用程序的网页上输入或分享他的个人信息。相反,他可以注册,然后使用他的谷歌帐户登录信息登录。一个后端 API 实现了这一点:每当狗主人登录组织下一次散步时,谷歌和 walk 应用程序就充当业务伙伴,交换必要的数据。
与第三方集成
一家电子商务初创企业的高管希望在她面向客户的店面 web 应用程序中加入复杂的搜索功能,以便与对手竞争。她没有资源或专业知识来进行 API 软件开发以构建用户界面功能。为了解决这个问题,她与一家专门从事搜索并知道如何创造卓越客户体验的第三方机构合作。这家公司提供了一个搜索 API,让她的团队可以访问他们需要的技术,并立即改善在线搜索体验。
API 架构风格类型
API 设计规定了 API 可以与客户共享哪些信息以及如何共享。REST(表述性状态转移)、SOAP(简单对象访问协议)和 RPC(远程过程调用)是常用的 API 架构。
- 一个 REST API(或“RESTful”API)是一个遵循 REST 准则的 API,用于将数据从服务器传输到发出请求的客户端。
- 开发者使用 SOAP 来方便跨网络的数据传输和构建 API。
- RPCAPI 调用流程(执行脚本)。在他们的调用中,他们使用 JSON 或 XML。
为什么搜索 API 很重要
无论一家公司是支持内部员工系统还是面向客户的体验来推动与客户的主要互动,复杂的搜索都是一项要求和客户期望。网站和应用程序用户希望能够轻松导航,并在尽可能少的点击中找到他们想要的东西。
领先的搜索和发现 API 平台, Algolia 为开发人员提供简单、 健壮的 API 用于利用搜索和发现功能。无论你是在电子商务,媒体,医疗保健,或其他一些行业,Algolia 的 SaaS 搜索可以增强你的网站。您可以实现并快速调整我们的 API,开始为您所有适用的用例生成令人大开眼界的业务结果。
您的开发人员可以:
然后,你可以让你的业务团队深入了解用户如何与你的搜索功能互动,以及改善商品销售以优化你的网站体验。 我们的企业级搜索已经准备好带您进入数字化转型的下一个阶段。要了解更多关于 Algolia 高性能搜索和 API 管理,以及如何释放 API 使用的全部潜力, 尽快联系我们 。
什么是实体关系模型/图表,它如何加强你的建议?
谁在购买你的产品?人们的购物车中最常组合哪些商品?您如何利用推荐来提高您的销售额?推荐是目前用来创造客户期望的高质量在线体验的主要工具之一。
这些都是很好的业务流程问题。幸运的是,前两个问题的答案可以在实体关系模型(erm)的帮助下解决,也称为 ER 模型、实体关系图(erd)和 ER 图。这些图片看起来像由不同样式的连接线连接的不同形状符号的流程图,让您掌握各种数据项(如产品、客户和订单)之间的关系类型。
当你能在数据库表中有效地做到这一点时,你就成功了一半。然后,您可以使用算法通过预测您的客户偏好来提供准确的建议。
什么是实体关系模型?
在软件工程术语中(谢谢,Techopedia),ERM 是一种“在软件开发中显示数据关系的理论和概念方法……一种数据库建模技术,它生成系统数据的抽象图表或可视化表示,有助于设计关系数据库。”
实体是名词,是事物;例如,一个产品。实体关系图以与类别相关联的符号(矩形、菱形和椭圆形等)以及连接它们的线条(例如,表示多对多关系)为特征,以说明这种关系。
ER 图工具也经常显示实体的属性,例如年龄或 ID 号。
识别实体和它们的关系,并知道它们如何以及为什么相关,对于各种应用是重要的。例如,如果你有一个零售网站,你想知道如何展示产品推荐,这将有助于你的顾客得到他们想要的东西,并成为回头客。
ERD 图的由来
让我们快速看看实体关系图是如何首次亮相的:
20 世纪 60 年代,美国计算机科学家和工业研究员 Charles Bachman 提出了数据结构图。
在 20 世纪 70 年代早期,使用了三种类型的数据库数据模型,称为网络、关系和实体集。问题是:它们都没有提供数据库的完整视图。
因此,1976 年,一位对改进现有数据库设计感兴趣的计算机科学家陈品山提出了 ERD 的概念。他想为用来描述实体关系的数据库术语增加清晰度。他的新模型消除了歧义,统一了数据库建模框架。
陈的模型为 [统一建模语言](https://en.wikipedia.org/wiki/Unified_Modeling_Language#:~:text=The%20Unified%20Modeling%20Language%20(UML,the%20design%20of%20a%20system.) (UML)奠定了基础。
20 世纪 80 年代,同样是计算机科学家的改进了陈的工作,引入了 IE 符号,它使用乌鸦脚符号来表示一对多关系(基数)。
最近,实体关系模型已经被人工智能先驱们所利用。通过映射实体的关系数据,分析师和营销人员可以开始 查看用户行为中的模式和趋势 ,这有助于预测用户偏好并帮助产生正确的推荐。
ERD 车型种类
谈到实体关系模型,有三种类型的图表:概念的、逻辑的和物理的。以下是如何区分这些风格的数据流图的方法:
- 概念性 数据模型是最抽象的;这是对正在发生的事情的概括。
- 一个 逻辑 数据模型详细描述了数据元素,并通过可视化的方式,帮助理解数据关系、实体、属性和键。
- 详细描述了一个 物理 数据模型,标识实体的主键和外键。这种风格被用作蓝图或工作设计。
实体关系模型如何帮助权力推荐?
现在你知道了实体关系模型的基础。然而,对你来说更重要的是,知道当你能够收集足够的客户数据并组合成一个有效的关系模型时,你能够产生非常有用的信息。您可以清楚地看到记录在黑白图表中的模式,并且您不必猜测您的客户可能喜欢了解哪些项目,例如结账时的潜在附加产品或有趣的新闻故事。
第一步,收集所有的详细数据,应该相对简单。为什么?根据埃森哲的说法,大多数顾客都愿意给你他们的数据,包括他们的在线活动、购买历史、喜欢和不喜欢、 如果 能给他们带来更好的体验。当然都是关于 他们。 但是谁在乎呢?当 你 得到这些宝贵的信息时,你就可以准备好为自己打造一个 强大的推荐引擎 。
那么,你如何将人们的网上漫游和浏览网站的偏好转化为智能、直观的推荐,从而取悦和吸引他们呢?换句话说,你如何释放出准确的建议来改善你的客户的在线体验,增加你的转化率和平均购物车价值,以及 yata yata?
人工智能如何推荐作品
想知道基于人工智能的建议是如何工作的,以便您的组织能够找出如何有效地部署正确的设置吗?
好吧,假设你有一个电影订阅网站。这意味着你的推荐引擎必须决定哪些电影是你的观众最想看的。推荐引擎有两种方法来辨别这种信息:
基于内容的过滤:仅电影
这种方法获取顾客的偏好(喜欢、不喜欢、用户活动),并根据他们的电影,尽力提供有益的推荐。
嗯,不是任何类型的推荐,尽管可能需要。例如,如果你的一个客户一周看五六次表情电影 ,你可能会认为推荐引擎会冒险推荐一位治疗师。目前还没有这种个人建议功能,但根据类型、子类型、导演、演员和电影长度等标签,该软件至少能够推荐其他家庭动画电影,这可能会打破令人上瘾的观看趋势,并恢复一些沙发土豆的正常化。
协同过滤:电影加其他人
第二种类型的智能推荐不仅考虑了相关浏览者的偏好,还考虑了网站上其他用户的偏好。通过在不同人的高度评价之间建立智能联系,该引擎可以向看似相似的电影爱好者提供准确的推荐。电影的内容仍然是推动这种方法的关键,但在(电影)幕后还有更多事情,将社区中类似用户选择观看的内容、他们喜欢的内容和他们不喜欢的内容联系起来。因此,基于各种数据点,那些一直专注于 表情电影 的人接下来可能会转向 【卑鄙的我】 或 玩具总动员 4。
要使这些方法中的任何一种起作用,某人或某物需要在大型数据库中捕获的数据点之间建立一些非常复杂的联系。幸运的是,我们的 AI 机器人朋友可以在睡眠中做到这一点(或者至少在我们 睡眠时 ),也就是说,如果他们有必要的数据。
因此,我们又回到了良好的旧实体关系模型——那些信息系统工具,它们对数据的综合视图使得有根据的猜测推荐成为可能。无论是基于内容的方法还是协同过滤的方法最适合你的业务,ERD 都可以帮助你找出实体之间的关系,并找到合适的推荐。只需要合适的工具。
如何提供 A 级推荐
由于像亚马逊这样的网站不断加大投入,卓越的客户体验现在比以往任何时候都重要。这意味着向你的网站或应用添加高度个性化的、击中要害的推荐可能会是一个胜利。
为此,Algolia 推荐 通过企业级引擎实现快速、可扩展的产品发现。您可以使用我们成熟的 API 来释放用户推荐的全部潜力,包括:
- 相关产品, 甚至可以是 更好的 适合你的客户第一次登陆页面时想要的东西
- 经常一起购买 商品:了解到现实世界中的购物者为一件商品买单,也会让人们觉得有理由把它加入购物车
- 相关内容 他们可能会觉得值得阅读或参与,这会让他们在网站上停留更长时间(总是一件好事)
想要你的程序员提供你的用户喜欢的推荐体验吗? 了解更多 现在关于 处理您的数据关系 以及我们广受欢迎的解决方案如何能够提供出色的建议来提高转化率和收入!
什么是智能职场?
你会如何描述一个智能的工作场所?
一家由粘在智能手机上的聊天机器人运营的公司?所有员工都赢得了拼字比赛?有咖啡机能告诉你什么时候该换成无咖啡因的吗?
埃森哲的雷切尔·麦考密克给出了一个听起来不错的定义:
智能工作场所的核心是为工作场所注入新的活力,实现以人为本的设计——在现场工作和远程工作之间实现无缝过渡,让我们享受两者的优势。
什么是智能职场?
2022 年,随着商业世界从改变范式的疫情走出来,这个定义变得有意义了。
越来越多的公司让员工继续远程工作,他们不再关注必须在办公室工作的员工,而是通过提供增强的工作场所技术来吸引顶尖人才,而不管员工在哪里。为了实现这一点,他们升级了数字安全系统,以保护远程工作人员或办公室人员之间交换的数据。
基本上,智能工作场所意味着数字化转型战略在工作环境中的成功应用。通过 【物联网】 和人工智能(AI),智能工作场所促进了日常工作流程的自动化,并通过无缝工作流程增强了员工的活动。它使员工(和承包商)能够轻松访问他们工作所需的信息。它使用社交媒体,以人们觉得自然的方式将员工与同事联系起来。
进一步了解未来技术,它甚至可能包括员工拥有虚拟助手,提醒他们即将到来的截止日期和会议,并指引他们去会议室。随着技术的进步,谁知道它还会做哪些很酷的事情来升级工作场所的体验呢?
简而言之,一个智能的工作场所完成两件关键的事情:
- 利用新兴技术创造卓越的员工体验,促进员工的生产力和协作
- 让员工感觉从日常经验的角度来看,他们的个人生活与职业生活并没有什么不同
因此,对员工来说,这一切都很好。但是对于公司来说,为提供一个智能的工作场所所做的工作和花费值得吗?
研究表明,为员工提供积极工作体验的组织表现优于标准普尔 500 指数,利润也更高,所以这应该是一个肯定的答案。此外,一个智能的工作场所是一个持续的双赢,因为公司是一个很好的工作场所的说法会给潜在的雇员留下深刻印象,并提高现有员工的保留率。
智能知识管理
出色的员工体验的一个关键要素是能够快速有效地获得他们工作所需的信息。这意味着访问所有收集和存储的公司知识,这些知识存在于这里、那里和任何地方,无论是小仓库还是在一个地方:文档、支持系统、会议记录、人力资源详情、营销材料、维基。
当你能够优化员工的信息收集流程时,你很可能会看到人们工作和保持高效的方式有了切实的改善。
因此,让我们探索智能工作场所作为有效企业知识管理的延伸的前景。
什么又是 知识管理 ?
它保存并提供组织的知识资本,这可以减少现有内容的重复创建,提高员工效率,简化业务流程,提高利润率,并带来一系列相关的好处。
随着智能软件和硬件的普及,工作场所知识管理技术在过去几年中得到了发展。与信息相关的一切都变得更加数字化:云应用程序、工作专用社交网站、便捷的信息应用程序、即时视频会议。
在家办公遇上知识管理
尽管现代信息具有虚拟性,但传统上,知识管理系统更多地被用于现场企业模式。在新冠肺炎之前,在家工作的人不一定能够通过企业知识网络进行知识共享,甚至不能访问系统的各个部分,这可能会给他们带来一些压力,迫使他们定期回到办公室。
但是在 COVID 期间,现代职场除了改变别无选择。当员工被困在地下室和家庭办公室里辛苦工作时,他们已经习惯了能够在数字工作场所访问信息。例如,他们喜欢穿着睡衣(上衣是有纽扣的衬衫)使用协作工具与同事联系并分享项目细节。
一个智能的工作场所……远离工作
因此,有了 COVID,知识管理不再以公司的物理办公室为中心,而是更加关注企业内容的安全、可靠可用性,而不管远程工作。当然,随着信息管理越来越虚拟化,数字信息安全比以往任何时候都更加重要。
但是,正如知识管理的原则一样,在地理上分散的智能工作场所,关键仍然是容易找到正确的信息。找到正确信息的关键是搜索。
创建新产品营销活动的人可能需要搜索:
- 文件,可能存放在一个旧仓库里
- 营销指南和竞争信息
- 开发方关键联系人姓名
- 贸易展览展示和活动的链接
- 关于产品的在线对话和会议记录
但是不管他们需要什么样的信息,他们必须能够轻松地搜索到 ,而不需要能够走进人们的办公室或在休息室与同事聊天,谈论从哪里开始寻找。
如果公司的搜索功能是智能的,而不是传统的,这也会有所帮助。
智能搜索与传统搜索
在智能工作场所,现代搜索包括根据搜索查询解释员工意图的能力。传统搜索会显示给定短语的最受欢迎的搜索结果,而智能搜索引擎结合了 自然语言处理 (NLP)和机器学习,以帮助它具体了解每个员工想要查找的内容。
寻找 PDF 格式的文档或模板?使用智能搜索,您更有可能更快地找到它们,智能搜索可以扫描文档并识别它们的类型和结构,从而更好地为您提供您想要的详细信息。
智能搜索还可以根据员工搜索的内容和他们的搜索模式做出看似“聪明”的观察,然后通过提供关于员工试图追踪的内容的“有根据的猜测”做出回应。例如,一名员工可能正在寻找他们将要访问的公司办公室的站点地图。智能搜索引擎可能会询问员工是否也想了解附近的当地设施或公司相关活动。它就像一个导游,提前预知你的问题。
那么,就提升企业职场搜索的智商而言,你可以从哪里着手呢?
智能职场搜索四步曲
提供智能职场搜索,升级您的知识管理平台,为您的公司带来竞争优势:
- 将所有企业内容放在一个可搜索的平台下。 即使您将信息存储在不同的仓库中,您也需要确保所有内容都可以通过您的搜索引擎进行最佳的内容管理。智能搜索意味着每个文档、聊天字符串和资源项目的可见性和索引。例如,您的搜索引擎应该能够访问您的社交媒体门户网站中迄今为止的所有对话,以及所有已发布的技术文档和人力资源内容。
- 个性化员工搜索信息。 你可以分析机器学习算法,找出员工通常在搜索什么。然后,您可以根据对他们最有意义的内容对他们的搜索结果进行排名。例如,如果营销部门的某人正在查找与发布相关的产品信息,您可以在他们的搜索结果中首先显示营销材料,然后显示任何可能相关的其他项目。
- 将个性化与推荐 相结合,智能解决员工需求。例如,通过利用 自然语言理解 (NLU),搜索引擎可能会捕捉到员工输入的短语的细微差别,然后在搜索结果的顶部向他们提出一个问题以进行澄清。员工提供的答案会很快引导他们找到他们需要的信息。
使用 建议 ,搜索结果显示员工在搜索时经常希望看到的内容。例如,假设 一名销售人员经常出差,喜欢阅读有关公司活动的详细信息。如果你的搜索引擎通过人工智能确定他们通常在每次旅行后提交一份费用报告,他们在活动后出现的搜索结果会给他们一个在线费用表格的链接,并提醒他们填写表格。
- 更新您的搜索结果界面 ,以便从您不同系统中检索到的所有信息以用户友好的方式出现在同一界面屏幕上。例如,展示相关的营销材料和数据表,或者展示客户的服务合同和客户支持电话记录。这肯定会简化你的员工的生活,节省他们的时间。
用阿果搜索变聪明
如果您想要智能搜索技术,让在家工作的人和在现场的员工都能找到并访问他们需要的信息,我们希望您能看看我们的 智能工作场所搜索 软件的成熟优势。你的员工会认为这是一个伟大的进步,不仅是为了他们的快乐和你的成功,也是为了他们所知道的工作的未来。 联系我们 并开始思考可能性,或者让您的开发人员立即开始 构建 智能搜索功能(免费)。
什么是内网搜索?
原文:https://www.algolia.com/blog/product/what-is-an-intranet-search-engine/
假设你是一名刚出差回来的员工,需要提交一份差旅费报销申请。你输入关键字“费用报销单”来搜索你公司的内部网,网站爬虫会抓取该表格的多个版本。
你浏览列表,根据描述中的日期选择看起来是最新的。你下载它。你打开它,花 20 分钟填写你的用餐细节,然后用电子邮件发给部门经理。
第二天,你收到了一封电子邮件,警告你使用了一份过期的报销申请表,其中有一个链接指向(已重命名的)更新版本显然藏在内部网的什么地方。
嗯。星期五了吗?
当一家公司的内部网维护不好时,这些类型的信息检索混乱是可以预料的。内部网不像网络那样是运转良好的机器;在查找信息的难易程度方面,他们往往有很多不足之处,因此,在数字工作场所,对员工的效率和生产力(更不用说情绪和态度)有负面影响。
什么是内部网?
首先,让我们确保我们在内部网站点的性质和定义上是一致的。传统观点认为内部网是:
- 某法人企业的私有内部网络
- 一个索引和存储文档、对话、营销报告、新闻稿、工程规格和其他来自所有适用来源的数据的系统
- 一个让管理层与员工(或许还有销售代表和承包商)轻松沟通的平台
- 可能是 企业 (内部网搜索是企业搜索的专门应用)
- 让员工(包括远程工作的员工)轻松找到彼此并愉快地一起工作的系统
- 公司的内部“面孔”,员工登录开始工作时看到其主页
上世纪 90 年代,内部网和万维网(互联网)一起诞生了。然而,它们过去和现在都与互联网、外联网和企业搜索系统有很大的不同。一些竞争优势:
安 外联网 听起来像是内联网的对立面;它实际上在核心上是相似的,但也为企业外围的授权外部人员,如客户、供应商和合作伙伴提供了受权限控制的访问
一个 企业 “网”是一个典型的更大、更全面、但仍然是内部的企业网络。企业系统可以由各种公司工具和实体组成并与之集成,例如软件平台和搜索引擎
当然还有 互联网 是公共网络,可以通过像谷歌这样的引擎搜索,几乎总是会出现一大堆令人应接不暇的内容供探索
消防栓与老式花园水龙带
应用开发者兼企业家米切尔·卡普尔说:“从互联网上获取信息就像从消防栓里喝水一样。”。
大多数内部网并不是这样的。差远了。在 Kapor 的上下文中,一般的内部网可能类似于打开一个旧的、扭结的花园软管,最终得到一股涓涓细流。我们可以假设,在信息过载或可用性方面,没有一个现代的内部网会接近互联网。尤其是如果它没有以一致的方式填充正确的信息,或者没有进行维护和更新。
尽管如此,如果你能越过这个不幸的事实,考虑企业环境中内部网的优点、缺点和特殊需求,你可能会同意内部网有一些明显的可取之处。
某公司内网奖励
当谈到公司友情这个善意的概念时,有什么不喜欢内部网的呢?
就功能而言,内部网可以戴许多“帽子”,例如:
- 在一个中央存储库中提供信息。 公告、新闻稿、入职视频。不同于公司通过不同的网站、登录名和密码访问各种孤立的系统(例如,人力资源和 IT ),内部网将所有内容保存在一个公司软件平台下,可以从一个搜索界面访问。
- 各类信息的组织者。 公司创建的每一项内容(以及员工之间的信息传递、会议记录等)都可以以直观的结构化、可查找的方式存放。所有公司系统和可用项目都可以在按字母顺序排列的菜单中显示。理想情况下,信息可以通过搜索、菜单和链接定位(在文档和系统架构中)。
- 内容管理的推动者。内部网软件可以方便地建立一个正式的公司内容管理系统(CMS ),监督从材料的创作到出版和广泛发行的一切。现代的 CMSes 不仅可以存放文档,还可以存放博客帖子和帮助台常见问题等项目。一个好的内部网可以让人们实时创建、编辑、访问、简化、谈论和共享任何内容。
- 公司数据的保护者 允许对内部网内容进行适当的多级访问,无论是在后端无缝访问还是通过要求密码访问。
- 员工敬业度的促进者。例如,通过提供员工名录、电子邮件地址和信息应用程序,一家公司可以确保其内部网用户能够相互联系,轻松建立联系并在项目上进行合作。
- 员工效率的提升者。一个简单的事实是,当人们能够及时找到他们需要的内容时,他们浪费的时间会更少,并且可以继续完成富有成效的工作。
- 企业文化的强化者。 一个用户友好、功能强大的内联网是一种行之有效的方式,可以让人们和团队认为自己是一个有凝聚力、有意义的工作团队,并对为公司工作感觉良好。
工作#1:节省时间
一个运转良好的内部网最大的回报可以说是 节省员工的时间, 带来更高的效率,从而提高生产力。
人们发现,依赖信息来完成工作的员工会浪费大量时间,因为他们面前没有正确的事实和数据。据 IDC 称,“数据专业人员花在管理、搜索和准备数据上的时间比花在提取价值上的时间还多。”
所有这些时间浪费的成本加起来:IDC 补充说,公司每年损失近 250 万美元,因为员工无法获得他们关键需要的信息。
当然,维护一个内部网——保持它的内容最新,确保所有的链接仍然工作,让员工不会对使用它失去兴趣——也需要大量的时间和精力。公平地说,任何考虑从零开始建立内部网平台的公司都应该知道一些与这一事业相关的其他事实和数字。
挑战内网生活
拥有内部网会有哪些缺点和潜在的陷阱?
我们已经谈到了最常提到的一个:习惯了令人敬畏的谷歌搜索体验和电子商务网站上同样愉快的游览的员工,对在公司的内部网寻找信息有着超高的期望。按照这些标准,内部网不禁令人失望。
为了满足公司不同的内部需求和要求,内部网的运行方式也不同于互联网。据 KMWorld、 “与网页搜索不同,企业搜索对一个信息访问平台提出了不同的要求:为了更好的准确性;安全性;更多格式;更多报告工具;更多的语言理解;以及更好的交互设计。”
因此,出于多种原因,在内联网上很难及时找到正确的信息,或者根本找不到。
据麦肯锡公司称,“员工平均每天花 1.8 小时——每周 9.2 小时——搜索和收集信息。”
内部网的挑战可能是车轮转动的一个主要因素。典型投诉包括:
- 文档太多。将大量信息(其中一些可能已经过时)集中在系统中通常意味着必须筛选层层不相关的材料。
- 文档不容易被找到 ,因为它们没有以一致的方式被创建和标记(例如,通过包括元数据,如作者的名字)。
- 存在不兼容类型的内容和信息系统。在特定的企业组合中,可用的东西并不总是能很好地配合,或者是完全对立的,这可以转化为固执和更多的浪费时间。
- 内容已过期。这可能是因为没有人管理常规的编辑维护和供给,这意味着必须花费更大的努力来追踪当前的情况。
- 系统已经过时了。内部网需要编辑、设计人员和关键人员(如部门经理)来保证它在进行任何必要的系统更新时不出差错。
- 单据不使用 链接进行对照,因此相关信息可能容易被忽略。
- 搜索定位的内容是杂乱无章的 并且不以与搜索者相关的方式提供。
- 搜索功能要花很多时间。 再来点咖啡,有人吗?
- 搜索结果不是为人们的角色或他们应该能够访问的信息而定制的 。例如,如果一名销售人员正在寻找营销材料,他们的第一个搜索结果页面不应该以 R & D 文档开始。
- 员工不是天生的搜索专家。 据《信息科学杂志》,“62%的不满事件[与企业搜索有关]是由于人(信息和搜索素养)而不是技术因素。”
由于任何或所有这些原因,员工可能会对公司内部网的用户体验感到失望,结果是他们很自然地很少使用它或干脆完全放弃它。
部分解决方案:大内网搜索
但是等待……所有的希望都没有失去。一家公司可以通过提供现代化、人工智能驱动的个性化搜索来帮助员工在内部网中找到他们需要的东西,从而显著提高其工作场所的效率。
一个选择是开源路线(想想微软的 SharePoint,Apache Solr,Elasticsearch)。这对于一些公司来说非常有效,而另一些公司则更喜欢一个完整的内部网搜索解决方案,既能处理操作又能管理搜索,而且可以想象将来需要更少的修补。
如果一家公司已经有了内部网,搜索功能可能在技术上可行,但并不起眼,例如,提供的搜索结果不是按照相关性组织的,或者不太相关的项目塞满了主结果页面。另一个不太理想的情况是:输入一个搜索词并不能找到所有可能对员工有用的东西。
根据 信息科学杂志的报道, 强调“系统思维”和双峰搜索策略和信息行为的公司可能会提高能力
换句话说,当内部网搜索功能出现时,可以节省大量的时间,员工对内部网(更不用说公司)的总体感觉也可以大大改善。
什么是“内网搜索引擎”?
你可能想知道内部网搜索引擎与其他类型的搜索引擎到底有什么不同。这个问题问得好。它有一个简单的答案:内部网搜索是简单的企业搜索应用方式,旨在帮助员工在需要时轻松找到他们需要的内部公司信息。
是什么造就了一个 A 级的内网搜索引擎?
简而言之,一个具有快速相关搜索功能的内部网可以在工作环境中做两件令人印象深刻的事情:
- 索引来自多个公司来源的各种类型的数据
- 让员工在一个单一的中心位置轻松获取信息
有了这两大基础,内部网搜索引擎就有了一个神话般的开端。理想情况下,一个内部网搜索引擎也:
- 有一个直观、平易近人的搜索界面。如果员工必须通过在线培训来学习如何搜索他们的内部网,那就太复杂了。需要灵感?查看热门电子商务网站的搜索体验。工作 1:突出搜索栏,因为这可能是员工的第一站。
- 提供完整、全面的索引: 以一致的组织方式汇总并呈现相关结果,而不管公司特定的后端系统。
- 将后台办公系统连接到内容管理系统 (CMSes),实现无缝体验。搜索也可以添加到 ERP 软件或 CRM 系统中。
- 采用多种类型数据源的同时梳理。这使得员工不仅可以调出高管新闻简报等“松散”的内容,还可以调出详细的产品信息,例如可能隐藏在谷歌表单或 Salesforce 等基于云的应用程序中的信息。
***** 很快, 让员工通过输入特定的搜索词并按回车键就能立即调出关键信息。* 是 可定制 。 每个雇主可能需要略有不同的内部网特性和功能。您可以灵活地集成自定义的内部网站搜索,以创建一个成功的员工体验。* 适用于 的检索词解释;例如,它考虑了自然语言特征和部分单词匹配。* 使用匹配: 注意用户错误,如打字错误和替代措辞,以便可靠地提供所有适用的搜索结果。* 通过增加公司的具体业务规则,使用排名;然后,最相关的匹配被放在员工搜索结果的顶部。例如,如果有一个重要的活动,HR 想提醒每个人在查看相关内容之前都要参加,你可以将该项目“提升”到结果的顶部。* 使用人工智能驱动的 个性化 定制员工的搜索体验。例如,您可以调整搜索以最好地满足特定部门(如工程部门)的需求。根据 Firstup 和 Pulse 对技术领导者的调查,44%的人认为内部网个性化是“很好的东西”当使用人工智能根据员工的期望定制搜索结果时,毫无疑问,它可以提高员工的满意度。* 收集搜索 分析 以便您可以找出员工在内部网中最感兴趣的定位以及他们认为有价值的信息,然后就如何改善搜索体验和根据需要调整搜索功能做出明智的决策。您还可以查看死胡同搜索,例如,这可能会导致某个特定团队创建员工正在尝试但未能找到的内容。****
如果你已经读到这里,你现在可能已经确信一流的内部网搜索可以给公司带来大量的运营收益,这些收益可以很好地叠加在一起,形成积极的企业氛围。
总而言之,一个优秀的企业搜索工具是一个欣欣向荣的企业内部网的支柱。有了最佳搜索的内部网,您的公司可以迎来:
- 更高的效率和生产率。 轻松的内部网搜索意味着快速的项目完成和快乐的员工。
- 重叠内容少。 井井有条的信息让员工只需输入一个搜索查询,就能快速找到目标信息。
- 材料越少,相关性越强。 与互联网的喷泉式消防栓不同,一个优化的内联网可以帮助员工专注于他们真正需要的和有用的东西。
- 支持的后台系统。一个有效的内部搜索引擎可以将完全不同的信息,如客户关系管理系统、员工的公司目标和聊天,整合在一起并建立索引,使之成为公司友好的内部形象。
- 更好的项目管理。一个优秀的内部网搜索引擎可以帮助员工获得关键规格和详细信息,还能找到合适的同事并与之联系。
- 提高员工参与度和忠诚度。一个高度可用的内联网可以让更多的人感到与同事有联系,并从他们的经历中获得力量,而很少有人感到需要寻找新工作。
打造励志内网
凭借灵活搜索 API,Algolia 提供即时、相关的内部网搜索,这可以转化为更高的员工生产率和上述所有其他好东西。
我们完整、快速实施的解决方案不需要太多的技术专业知识,而且它完全可以根据贵公司的需求和对贵公司内部网的偏好进行配置和定制。我们还通过提供分级、现收现付的价格,使我们的内部网部署变得经济实惠。
你的内部网还在等什么?填写这个简短的 表格 ,让我们开始吧。
了解更多信息: 面向客户和工作场所的企业搜索解决方案****
买家意向数据如何帮助提高销售额和投资回报率
在做出购买决定并进入相关产品页面之前,典型的在线购物者的数字体验包括哪些内容?
假设你是一个美食烧烤爱好者,你在你最喜欢的社交媒体网站上看到一个高度评价的 颗粒烤肉 的广告。嗯;你认为这看起来很棒,但现在你正在追踪朋友的度假照片。
第二天,幸亏你的网络活动被巧妙地跟踪了(哈;这太明显了),就在你喝着双份拿铁咖啡、阅读最新美食新闻的时候,这个好看的烤架的另一个广告弹出来了。经过昨天的明显的起点,你不能不被这些新的烧烤通知所吸引。这一次,当你看到烤肉架上冒着烟、多汁的排骨的照片时,你会忍不住点击一下。
只是在做尽职调查
许多人在掏钱购买他们购物清单上梦寐以求的东西之前,都会经历同样的过程。据 Gartner 称,网上购物的人有 50%的时间是从第三方意向数据源(如 Yelp 等包含反向链接的评论网站)寻找信息。一个原因可能是因为第三方信息,无论是正面的还是负面的,似乎更中立或更值得信赖,而不是网站访问者可能会在产品详情页面上上当受骗的发光营销副本。
回到你新搜索的烤架上。你已经决定通过在亚马逊上输入你的目标关键字“pellet grill”来查找这个华丽的项目,并阅读它激动(和不满)的买家对它的所有评论。
他们如何评价自己的购买行为?平均至少 4.5 星是你的要求。这些评论看起来像是制造商为换取免费烤架而征求的吗?最有说服力的新客户赞词是什么?一星评级的买家对什么感到愤怒(就像小偷在打开前门把盒子拖进去之前偷走了烤架)?还有其他值得注意的客户行为吗?
如果你对电子商务评论的组合感到满意,你会去制造商的网站查看详细的规格和零售价格,并进一步考虑你可能购买的商品。有什么原因(免运费还是简单退货?)在亚马逊上购买这头怪兽还是从卖家那里订购?
你决定考虑一下。撇开顾客数据不谈,也许明天你会从你认识的喜欢烧烤的人那里得到一些意见。
B2B:买家意向的沃土
如果你是一个想要购买的 B2B 买家,这个过程可能会以类似的方式展开,只是在更商业的层面上。有了 B2B,你可以提醒你的公司团队成员检查产品,看看你们是否都同意这是正确的举动。你们三个可能会花上几个小时记录搜索查询,阅读博客帖子和相关信息,甚至可能下载制造商推出的电子书。最后,点击购买按钮,你就可以开始一天的工作了。
所有这些详细的购物数据构成了我们今天的热门话题——买家意向。
买家意图是什么?
现在让我们换一下你的帽子,假设你是一名营销人员,能够洞察烧烤猎人的全渠道客户之旅。
作为对使用客户意图数据感兴趣的人,你注意到了所有这些相关的内容消费动向和潜在买家兴趣的迹象。你计算你的目标客户打开你的促销邮件的次数,他们在其他组织网站的不同页面上花了多少分钟,他们在你自己的网站上注册了多少次点击,任何似乎表明购买意图的事情,如果没有立即购买,那么最终购买。你在用户意图分析方面取得了进展。
为了记录在案,购买意向,也称为购买意图,是消费者或 B2B 购买者完成购买公司产品或服务的可能性。
这是人们的购买意图,通过他们的浏览活动和整个在线旅程来推断,这是从通过缓存收集的数据或他们的在线内容消费足迹来推断的。
买方意向成交
例如,与仅收集人口统计细分数据(可能用于经典个性化技术)相比,准确推断某人的购买意图有何优势?
人工智能 (AI)和机器学习正在实质性地影响内容营销工作的方式。基本上,指示性购买意向提供了一种方法,可以根据购物过程中的接触点来预测谁真正准备好购买。它允许对行为进行预测。如果你能聪明地预测买家掏钱的时刻,并解决阻碍他们的任何痛点,那么,你可以做各种事情来利用这种水晶球知识。
当你能够获得有价值的买家意向数据时,你或许能够主动提供足够多的正确信息,鼓励你的合格潜在客户放手一搏。
如你所见,有了对买家意图的实时洞察,营销人员和销售团队就能遥遥领先。
因人而异
在线营销人员创造了搜索意图、搜索者意图、用户意图、导航意图、信息意图、交易意图、购买意图、买家意图和客户意图等术语。意图显然是一个热门商品。所有这些类型之间有什么区别?
- 搜索意图 (也俗称 用户意图 与 搜索者意图基本同义; 还有 关键词意图 )可以认为是对某一特定商品进行网上购物的动机
- 导航意图 是一种搜索意图,其中某人在搜索引擎框中输入导航查询关键词以便导航到网页,而不是必须费力地输入网址
- 有了 的信息意图, 搜索者就专注于定位关于特定主题的信息
- 交易意向 与用户购买商品的意愿相关。交易查询可以是类似“购买替换过滤器”的短语
- 买家意向 (也称 客户意向 或 消费者意向 ),更特指某人在购买过程中所处的阶段
为了充分理解消费者的意图,用户意图的类型可以用更微妙的方式来分析,那些知道内情的人说,包括:
- 主动购买意向: 这个人正在商店网站和社交媒体网站上研究一种产品,所以他们很可能准备购买它
- 被动购买意向: 他们目前使用的产品或服务可能不太令他们满意,但他们没有意识到还有更好的选择。具有讽刺意味的是,如果让他们知道另一种选择,他们会比表现出积极意向的人更有可能购买得更快。
- 感知意图。购物者正在思考一些需要购买的个人挑战,他们想知道最好的选择。在搜索的过程中,他们可能会观看网络研讨会和下载数据表。他们乐于发现新的商品、品牌和服务。他们处于信息吸收模式。
这篇博文旨在提升你的业务底线,那么我们是否应该同意所有这些以意图为导向的变化基本上都是老掉牙的买家意图?如果有人对购买感兴趣,并且他们正在经历购买周期,无论他们是电脑上的人还是拥有 微时刻 的移动购物者,他们都有购买意向。
谈到消费者行为,我们不要忘记 B2B 买家的购买信号子集的重要性。
买家意向也适用于通过收集和准确分析 B2B 买家意向数据可能获得的潜在更高利润。如果 B2B 营销人员能够利用 B2B 意向数据在顾客旅程中的最佳点接近顾客,比如就在做出购买决定之前,他们可能会大赚一笔。此外,B2B 销售行业的回报似乎已经相当成熟:根据 需求生成报告 ,该行业的销售代表仅利用了 46%的可用意向数据和监控工具。所以在 B2B 的世界里有很多机会。
明确买家意图的(许多)好处
解读买家意图信号让你:
- 【窃听】 关于购物者对公司和产品的在线调查
- 智能猜测 人们在购买过程中的位置,以及他们接下来可能会做什么
- 识别ZMOT(零点时刻的真相;最初申请 Google 搜索),营销团队做外联的最佳时间
你收集买家意向数据,分析这些数据,然后让你的营销团队更新你的营销活动。你停止转动你的轮子,试图根据粗略的衡量标准对犹豫不决的顾客甜言蜜语。你缩小你的焦点来钓大鱼,降低你的反弹率,提高你的投资回报率。
通过对客户需求和潜在买家意图的深入了解,营销可以:
- 本质上,读取潜在客户的想法,导致销售线索的产生,并在销售代表联系公司之前偷偷让他们接近 他们
*** 基于可操作的意图分析, 呈现最相关的, 上下文正确的促销信息* 转换后, 继续利用 意图数据。例如,一个 B2B 购买者现在会输入搜索条件来研究竞争对手的产品吗?也许它们会引起一些新的关注* 根据意向数据调整具体的网站细节或营销策略 。例如,如果多个购物者表示有购买某个商品的意向,但由于某种原因,当他们进入产品详细信息页面(您刚刚更改了价格或内容类型)时,他们没有继续购买,您可以分析意向数据,也许可以重新查看价格或内容,看看这是否有帮助。**
在潜在客户的购买过程中,正确识别高意向并利用买家意向数据改善客户体验和底线的难度有多大?
如果你不是一个分析公司,意图分析可以有点,嗯, 涉及。
但是有一个解决方案:你可以与一个专家合作伙伴合作,一个像 Algolia 这样的 SaaS 供应商,它可以像专业人士一样帮助你专业地阐明目标受众的买家意图数据点,并优化你的网站营销。
如果 你的 意图是利用你的用户搜索意图,为你的数字营销注入新的活力,以更好地留住客户,并在你的 转换率 中实现预期的跃升,那么没有时间可以浪费了。在这个 登陆页面 上记下您的联系信息,让我们开始行动吧。**
让企业搜索更加“智能”
原文:https://www.algolia.com/blog/ai/what-is-cognitive-search-and-what-could-it-mean-for-your-business/
“找不到了。”
可悲的是,这一结论仍然是现代企业搜索经验的一部分。
但这不应该。消费者和员工需要由一流技术 驱动的快速搜索体验 ,该技术预测搜索查询并生成相关结果。无论是有人找产品,还是提取后端数据,搜索一定要高效 智能 。
这就是认知搜索技能组合隆重登场的地方。
认知搜索功能可帮助组织提供无障碍的用户体验,并让员工更高效地处理海量数据集。无论是找不到支持信息的客户,还是淹没在无关数据中的员工,认知搜索都会披上知识发现的红斗篷,前来救援。
什么是认知搜索?
“认知搜索”听起来好像搜索引擎正在基于它的认知技能——它的 思想——寻找存储在它的搜索索引中的信息。从某种程度上来说,虽然它不能像人类一样在技术上“思考”,但它正在做一些有头脑的事情:由于人工智能,它知道消费者想要什么。
Forrester将认知搜索描述为“新一代企业搜索解决方案,采用人工智能技术,如 自然语言处理 和 机器学习 来摄取、理解、组织和查询来自多个数据源的数字内容。”
认知搜索是如何工作的?它使用自然语言处理(NLP)和机器学习来理解和处理数据库中的产品规格、描述和图像。然后,通过这种人工智能的丰富,它为需要信息的个人创造独特的个性化搜索体验。这提高了他们的搜索相关性,也为他们的组织创造了更高的收入。
认知搜索与传统关键词搜索
这不是世纪之战,但这是一场重要的战斗。想象一下,认知搜索和它的定制技术在一个角落里,在另一个角落里面对着卫冕冠军传统搜索。
几十年来,传统的基于关键词的搜索一直是常态。但是仅从关键词中产生的搜索结果过于宽泛。消费者和员工都必须搜索,然后继续完善他们的搜索,以获取相关信息。这相当于浪费了大量令人讨厌的时间。迫切需要更大的搜索相关性和个性化。
认知搜索工作建立在传统搜索的基础上,但它为搜索体验带来了一些关键优势。
上级相关级别
差别越大越好,搜索结果越相关。与关键字搜索不同,认知搜索抓取 非结构化数据和结构化数据 ,识别模式和意义,并从所有来源生成高质量的搜索结果。这确保了无论您的用户或员工发起何种类型的搜索,他们都会得到适合其查询的结果。
假设您有一位潜在客户正在浏览您的电子商务网站,然后搜索关键词“冬衣”。他们很清楚自己在找什么。他们可以想象出来。他们可以在里面看到自己。现在他们想得到它。
但是首先他们需要找到它。
对冬装进行关键词搜索通常会得到一系列过于笼统或者不太符合购物者需求的结果。客户可能不得不细化他们的查询,以排除所有干扰,专注于他们到底想要什么。
增强语言理解
借助增强的语言理解,认知搜索更进一步。在开始搜索时,它可能已经“知道”了外套的面料类型、流行色、性别和其他相关细节。简而言之,认知搜索就像一个知识管理的图书管理员,他会给你指出正确的搜索结果,让你不再需要在书库里翻来翻去。
综合结果
员工可能需要提取关于产品的数据和信息——例如,可能是库存数字或销售数字——来编写报告。使用传统搜索,结果可能是零星的,并导致额外的尝试,只提取所需的内容。有了认知搜索,所有相关数据都可以方便地从一系列来源中编辑出来,让他们继续前进,开始撰写报告,而不是拔头发。
累积学习
随着时间的推移,您希望看到工作团队的成长和显著的生产力提高。搜索引擎也应该逐渐变得更加有效。关键词搜索不会发生这种情况,但是如果你正在实现认知搜索,就要小心了。你会发现这种搜索方法在处理和记录用户查询时会不断学习和改进。认知搜索就像一个教授,带着一个学生,他对一门学科一无所知,但忠实地参加所有的讲座,密切关注并应用学到的每一个细节,在学期结束时提交一份让你震惊的 A+论文。
让我们来看看认知搜索“学生”的实际应用。一位消费者搜索“LG 电视 55 英寸”,然后立即搜索“亚马逊 Fire Stick”。搜索引擎的机器学习功能引起了人们的注意。这两个搜索可能是相关的。它思考了一会儿,然后在第二次搜索时,更进一步,显示包含第一次搜索信息的结果。
但不止于此。将这些查询归档以备将来参考,它会随着时间的推移变得越来越“聪明”,并开始预测和连接其他查询。
商业认知搜索的好处
相关性和效率的提高,以及由此节省的时间,为企业带来了更高的转化率、更忠诚的客户群、更高效的销售队伍和更高的收入。
认知搜索更深入,为工作场所带来更高的效率,或增强客户与品牌的互动。
超高生产力
你知道吗,根据麦肯锡 的调查 ,员工每天大约有 19%的时间用于搜索信息。想象一下,这些被浪费的时间是如何被更好地利用的。在获取正确数据方面的延迟会减缓上市时间并降低效率。
假设一名员工需要各种客户合同。如果这种情况发生在几年前,他们可能会通过大量的企业文件系统(存储在各种数据库中的文档)进行搜索,依靠关键字搜索只能产生平庸的结果,并且需要更多的调查。现在,有了认知搜索,他们可以通过在搜索框中输入客户名称和公司,立即调出合同,而不是在大量数据中搜寻。认知功能不仅可以轻松检索到所需的合同,还可以检索到相关的电子邮件和其他项目,而不是根据关键词随意给出结果。
满足用户体验
这对企业来说可能令人沮丧,但这是真的:企业用户和客户希望网站和应用程序中的搜索能像谷歌一样高效。他们希望快速得到查询的答案,而不是像蜗牛一样缓慢地输入连续的查询。88% 的在线用户表示,他们不会再回到有过不愉快经历的网站,因此公司创造无缝的用户体验至关重要。
认知搜索更接近满足企业用户的期望。它“深思熟虑地”预测他们的需求,将他们与他们正在寻找的东西联系起来,并深化 搜索个性化 。
一个支持用例
想象一位客户需要购买产品的支持。他们使用该公司电子商务网站上的自助门户网站,该网站由认知功能提供支持。门户网站上有很多问题的答案,探索和寻找所需的支持可能需要一段时间。
然而,这可能会比预期花费更少的时间,因为认知搜索专注于提供个性化的搜索体验。因此,如果客户在门户网站上搜索“智能电视保修政策”,并且他们之前也搜索过与技术相关的问题的答案,他们可以很快获得更加准确、面向个人的结果,这些结果考虑了问题以及他们对保修细节的兴趣。
解锁数据
每个公司的企业数据的核心都有一个秘密。根据麻省理工学院的说法,80–90%的数据是非结构化的:其格式不容易搜索,例如文本和社交媒体帖子。挖掘这个烂泥堆通常不是一件容易的事情。
但是认知搜索技术可以使用索引、文本分析和人工智能技术来理解数据。假设您的营销团队想要确定上个季度的消费者搜索模式。通过传统的搜索方法收集数据将是一个相当宏大的项目。相比之下,认知搜索服务会加快这一过程,剔除组织的多个信息源,从非结构化的 表单 中提取相关数据,并确定要显示的最高优先级项目。
一个企业游戏规则改变者
企业搜索 应用程序是一个关键的商业工具。无论是员工还是客户,使用它们都应该是一种轻松的体验。
认知搜索提供了这种价值,让办公室内外的搜索变得更加容易。
想通过最先进的认知搜索解决方案创造更高的收入吗?我们的 搜索 API 是可扩展的、可靠的、安全的。我们报价也是分层定价。
让我们发挥认知搜索的力量,为贵公司的底线服务。 联系 我们今天的团队。
什么是概念搜索?
多年来,搜索引擎主要依赖关键词,就像你在书后面找到的索引一样。除非查询与索引中的关键字匹配,否则搜索引擎可能会空手而归。 当“匹配”的概念传统上驱动着搜索引擎的时候, 一场从“匹配”到“理解”的重大转变正在进行中。这是由人工智能驱动的,人工智能用于以数学方式表示文本,以便机器可以在概念上理解它。概念正在取代关键词,这对每个人来说都是好消息。
在这篇文章中,我将解释一下什么是概念搜索,以及围绕它的语义机器学习技术是如何变化的。首先理解传统的基于关键词的模型的局限性是有帮助的。
背景上搜索
围绕 所有适用于业务的数据中有 80%是非结构化的 (与年龄、体重、价格、地址等结构化数据相反。).为了在非结构化信息中找到东西,搜索引擎已经成为首选工具。这背后的主要方法是关键字的标记化,它将文本分割成公共部分(本质上是查找键),然后用于构建索引。
每个单词(单词、短语、ngram、词干、词条等)都链接到它出现的记录。然后将相同的标记化过程应用于查询,得到的标记可用于查找匹配项,并且该“匹配”过程形成了关键字搜索检索的基础。在这个上下文中,检索意味着检索查询的相关匹配。然后,排序通常用于以最有用的顺序对结果进行排序。
词频——逆文档频率(TF-IDF)
有一段时间TF-IDF是关键词搜索的标准。此公式查看术语频率(TF)和逆文档频率(IDF),前者是关键字在匹配文档中出现的次数(越多越好),后者查看关键字在文档语料库中的受欢迎程度(受欢迎程度越低越好,因此称为“逆”)。
BM25
TF-IDF 还行,但是今天的金本位是BM25的变种。BM25 希望解决 TF-IDF 的一些不足,主要是 TF 非常容易受到垃圾邮件的攻击。它为 TF 公式引入了一个阻尼,所以更多的匹配越来越不重要,如下所示。它还使用文档长度来校正包含更多关键字的较长文档。
via GitHub
BM25F
目前最重要的变体是 BM25F,它在计算中包含了相对字段重要性。这允许标题匹配不仅仅是文档文本等中间的匹配。
在指出 BM25F、 的问题之前,请记住这仍然是 2023 年关键字搜索的黄金标准 。这是学术界要击败的基准技术。
上面提到的一切都是基于“词汇袋”的方法。单词序列被忽略,只有它们与目标文档的个别交集才是重要的。这在现实世界的搜索场景中有很多问题,尤其是较短形式的结构化数据。
随着组织转向在线,企业搜索成为知识管理的一项关键要求。随着数据和信息资产在总体上进一步爆炸式增长,企业搜索的重要性也呈指数级增长。然而,如果没有智能元数据、自动分类、分类管理和其他增加结构的方法来丰富文档,相关性通常会很差。结果是工作中的人们找不到相关的文档——这是一个大问题。
为什么关键词搜索有问题?
关键词对于搜索引擎来说很难。你有同义词(多个单词有共同的意思)、多义词(单词有多个意思)、顺序(顺序有时很重要,但并不总是)、缩写、不对称(查询单词不应该出现在目标结果中)等等。
一般来说,关键词搜索意味着你已经知道你要找的答案,以及它将如何被明确描述。例如:
- 你搜索“圆领”,却找不到“t 恤”。
- “usbc”vs“USB-c”或“usbc”。有些变体有很多结果,有些没有结果。
- “连衣裙衬衫”和“衬衫连衣裙”返回相同的结果,尽管它们的含义非常不同
- “房间保险箱”和“安全室”使用相同的术语,但意思完全不同!
这些问题有解决方法,但它们可能会很耗时,而且永无止境。
从传统意义上来说,搜索的目标是获取一个查询,并尝试在一组项目中找到它的出现,就像书后面的索引一样。这假设查询和结果文本之间的关系是对称的,也就是说,您搜索的是答案,而不是问题。对称性假设你已经知道答案。
关键词的上下文通常不足以用来确定搜索者的意图。拿“银行”这个简单的例子。当有人键入这个时,他们的意思可能是:
- 金融机构
- 河边
- 篮球投篮
- 飞机转弯
以上是一词多义的好例子。这也可以扩展到不对称。例如,如果有人搜索“飞机转弯”,可能不会返回“飞机倾斜”的结果,但意思是相似的。“飞机”本身也是一词多义的例子,是“飞机”的缩写!
复合术语处理 用于将术语组合成具有不同于单个术语的含义的组。“新泽西”就是一个例子,作为单独的术语,它与“新”和“泽西”具有完全不同的含义。在实践中,关键字搜索通常可以很好地处理复合查询;它通常要求所有术语都匹配,比包含所有单个术语的序列得分更高。然而,它与部分复合条款斗争,“银行”是一个很好的例子。它将匹配“bank”的所有上下文出现,因为没有办法确定哪个上下文是正确的。
注意:以上还假设查询被视为 AND(要求所有术语匹配)。在实践中,一些关键字搜索使用 OR,它可以匹配任何查询词,因此更有可能返回上下文无关的结果。一些搜索技术还使用混合方法,将一些文本视为 AND,而将其他文本视为 OR,这在本质上可能是聪明的,也可能是幼稚的。这可能是有用的,但一般人搜索时通常无法理解。
关键字搜索对代表最流行搜索的“大头”查询很有效。然而,“长尾”搜索经常失败,它们可能占目录中查询的 50%或更多。关键词搜索失败的方式层出不穷。人们花了大量的时间编写规则、字典、同义词库等等。正如我将要展示的,关键词仍然非常有用,但是当它们与人工智能配对时就更好了。
概念搜索如何工作
关键词(及其相关标记)相对于搜索来说是二元的,特定的单词要么存在,要么不存在。概念搜索基于 向量 。向量的数学允许测量接近度,因此文本的关系不再是二元的,而是一种分布。
How vector search algorithms measure closeness.
文本表现为向量,概念意义相近的文本共享非常相似的向量。通常使用矢量方向而不是幅度,因此矢量之间的角度成为相似性的度量。这叫做 余弦相似度 ,任何做过高中数学的人都会非常熟悉!唯一的区别是,表示文本的向量使用数百个维度,因此很难按照上面的方式(2 个维度)直观地表示。
文字到数学
文字是如何变成矢量的? 神经网络 用于查看单词序列,构建基于向量的模型,可以将文本转换为向量,称为 嵌入 。这样的例子有很多,而且还在不断出现。例如,AirBnB 使用嵌入来帮助增强他们的相似列表功能。
使用概念进行搜索
概念很棒,但是它们也模糊了查询的含义,所以关键词实际上还是有用的。因此,最先进的搜索技术实际上是建立在所谓的“混合检索”之上的,这是基于关键字和概念的搜索的结合。
下面是我们在新的人工智能引擎中设计混合检索的一些方法。
- 稀疏检索 基于关键词。这就好比你在一本书的背面查找一个单词以及它出现在哪个页面。有一些语言上的调整,比如词汇、停用词、同义词等等,但是大多数情况下,查询要么在目标结果中,要么不在目标结果中。
- 密集检索 基于矩阵。文本被转换成数学形式(矢量或散列),邻近性被用来推断相关性。这解决了许多关于关键字搜索准确性的问题,但是这样做的成本会很高。也就是说,如果不与另一种称为神经哈希的技术相结合。对于稀疏检索,您查看与每个关键字匹配的项目列表(通常这是少量项目)。对于密集检索,你不知道向量/散列中的任何一个数字,所以你需要扫描大量的信息。虽然这使得它到目前为止成本相对较高且速度较慢,但 哈希已经改变了这种 。
- 混合检索 结合了密集和稀疏检索。关键字匹配找到适合对称的精确匹配(通常是头部查询词),密集检索填补了长尾空白,并处理上述关键字搜索的所有问题。密集检索消除了对同义词的需求&大多数规则,理解问题(不对称),等等。
随着神经哈希技术的加入,Algolia 成为唯一一家拥有可扩展混合产品的公司,能够开箱即用地支持多种不同的使用情形。我们现在可以提供和只搜索关键词一样快(通常更快)而且更准确的搜索。我最喜欢的一个例子是在 Best Buy 数据集上运行一个查询,查找短语“让我的啤酒保持凉爽的东西”如果有人走进你的商店,并要求“保持我的啤酒冷的东西”,你会知道他们的意思。一个只有关键词的搜索引擎会有一段艰难的时间。然而,混合检索引擎能够理解这些概念,在 0.001043 秒内提供令人难以置信的结果!
An example of concept search.
我们的演示站点不包含任何额外的元数据。“冷”和“啤酒”这两个词没有出现在网站的任何记录上,但是网站理解这些概念!
敬请关注。全新的 Algolia 搜索体验即将推出!或者, 报名,有空通知。
什么是内容发现?
的概念让你想起了什么形象——文字上的还是象征性的?
也许有人跪在一条浅浅的河边,注意到砾石中的一些金块。或者用一种新的方式看一些普通的东西,比如当你拿着放大镜看一朵盛开的花,发现一只可爱的小甲虫。或者把你在购物时扔在购物车里的令人满意的“发现”物品带回家。
嗯,你可能会想,这些都是令人感觉良好的东西,但我们不是在谈论以 消费者发现内容 的形式进行的内容营销吗?”
感谢您的关注。但是对发现(任何种类)的敬畏是很酷的,不是吗?
内容来了
早在 1996 年,富有远见的计算机极客比尔·盖茨就预言了内容创作的黄金时代,他在微软网站上发表的一篇文章中写道:“内容是我认为互联网上真正赚钱的地方,就像广播业一样。”
现在,25 年后的今天,我们在这片本该引人入胜的内容海洋中畅游,坦率地说,正在下沉。
标签众多的社交媒体网站只是一个耗时的内容儿童池,由谨慎的内容监管支撑。他们可以让你几个小时不停地检查原始内容,直到像你的手指和脚趾一样,你的大脑开始萎缩。
或者你沉迷于在 YouTube 上观看翻家装的视频内容。你不想错过一分钟的鳍状肢的最佳内容的想法。
你可能是那些迷恋迷你剧的网飞迷中的一员,粘在你的沙发上。
或许 LinkedIn 是你在工作时间首选的社交媒体内容聚集地,在那里你可以滚动和评论所有合适的内容,甚至可以实时观看网上研讨会。
当然还有 Reddit,以及所有那些令人着迷的 subreddits。
这听起来是真的吗?
救命,救命,我们溺水了
网上有如此多的热门内容,以至于你可能会觉得自己被激流拖了下去,好像你永远也征服不了它,尽管你坚持使用 CNN RSS 提要等信息的子集。你甚至可能被一条内容淹没,比如《大西洋月刊》上的一篇深入的文章(尽管它警告你要花半个小时才能看完)。
随着如此多的内容漂浮在网络空间的海洋中,人们必须能够在大量的垃圾中找到他们想要或需要的东西。我们冒着被重定向和迷失在社交媒体平台上无休止滚动的帖子中的风险,挑逗 点击诱饵 合法新闻文章底部的“故事”,一百万个妈妈博客的沉思,关于全球变暖和其他紧迫问题的详细信息图表,以及累积的一星、二星、三星、四星和五星产品评论的错综复杂(为了获得免费物品而写的合法输入或营销绒毛?)在电子商务网站上。
难怪人们发誓远离脸书和其他社交网络,或者不得不介入并限制他们孩子的网络游戏习惯,或者采取许多其他激烈的措施让自己或他们所爱的人远离互联网内容的流沙。当网络威胁要用一种你无法戒掉的内容瘾来洗去你的离线生活时,这是个问题。
内容发现的救援管
这就把我们带到了内容的重要性 发现, 至少在数字营销方面是如此。人类需要能够快速循环归档他们堆积如山的数字垃圾邮件,并发现那些他们期待打开的“卡片和信件”。
在某种程度上,消费者通过社交媒体营销陷入了非正式的内容发现,但在本文中,我们将内容发现平台称为一个完全不同的营销活动动物:一个专门用于帮助您增加和改善网站用户参与质量的工具。
技术上来说, 内容发现 (有时也称为“搜索与发现”)就是寻找和定位自己想要的内容。这是寻找和仔细阅读你的品牌内容的过程。它充当了跨越信息洪流的“桥梁”,将消费者与他们想要的内容联系起来。
就我们的目的而言,在线内容发现流程不应与在线内容发现 网络、 广告平台(如 Outbrain)混淆,后者允许企业发布链接。
总而言之,内容发现就是在网上,对能让你找到想要的东西的信息感兴趣。
内容发现对公司意味着什么
从企业的角度来看,内容发现当然都是关于钱的: 让相关内容容易被消费者找到 增加投资回报率 。
在搜索和发现的背景下,内容发现有助于您更好地转化网络流量。一个优秀的内容发现系统可以帮助人们轻松地搜索或导航到他们需要的内容,这可以阻止他们从网站跳转到竞争对手的网站,并促进转换,从而带来更高的收入。
最好的情况是,内容发现平台以真正有益、鼓舞人心和相关的方式将访问者与内容联系起来。它还可以提供直观的浏览体验,激励用户查看新的内容,并重新联系他们之前浏览过的内容。
在网站上,人们可以通过两种方式找到自己想要的内容:
想要具体的东西的时候
为了专注于它,他们从搜索框或网站导航功能开始。当他们键入或点击相关关键词时,他们的活动可能会触发搜索结果中出现促销横幅、屏幕边上的促销产品,或者他们甚至没有意识到自己需要的商品的“编辑”内容。最终,他们会访问产品页面并进行购买,即使这一过程会让他们离线到实体店或通过其他渠道进行内容探索。
只是浏览
人们可能会去一个网站简单地浏览一下,探索一下吸引他们注意力的东西。一次成功的内容发现探险仍然可以从在搜索引擎中输入一个关键字开始,但在大多数情况下,它涉及到阅读促销横幅、策划的社论或推荐等内容。通过这种方式,被动浏览的人可能会被温和地引导到相关产品,并成为购买或订阅客户,他们也希望回来,因为他们非常享受购物或购买体验。
如何让内容被发现
那么,如何让你的客户轻松找到高质量的内容——他们的个人金块呢?你如何创造伟大的内容发现经验,可以很好地转换?
当正确的访问者提出要求时,向他们展示你网站上最好的、最相关的内容。
你可以借助基于机器学习的 user PErsonalization和推荐,算法驱动的工具来瞄准和提供最合适、最有趣的内容供你的访问者考虑。
如果你选择踏上这条可能有利可图的旅程,这里有一个简单的三步走流程:
- 根据你的潜在客户和顾客在你的网站上搜索的内容和行为,找出你需要了解的****信息。他们想要什么?网站搜索的一个重要方面是,人们会很自然地告诉你他们到底想要什么。例如,“如何清洁烧烤架”或“购买乌克兰产品”没有拐弯抹角:你确切知道他们要找什么。你做研究是为了明确找出,下至购物者个人层面,人们想要阅读什么,与朋友或同事聊天,在社交媒体帖子上发表评论,为自己购买,作为礼物购买,购买多个版本,作为购买该品牌其他商品的出发点,成为他们生活方式的一部分。借助搜索和发现分析,您可以收集并理解所需的所有数据,以便共享内容来满足客户的需求。
*** 学以致用。 现在,您已经完成了内容研究,您可以通过各种形式(横幅、内容传送带、内容架)恰当、明智地引导人们找到他们想要的内容。* 提供目标站点搜索 到 驱动内容发现 。基于你对用户的愿望和需求的了解,你让你的搜索算法在他们的搜索结果中嵌入相关的、个性化的与关键词相关的“线索”。**
**你根据两件事来塑造浏览体验:你的用户趋势和你的商业策略。您的推广内容会根据这些趋势和策略动态变化。
这种体验塑造包含两种技术:
- 根据用户的个人资料为他们定制个性化内容 。个性化的浏览和搜索体验大大增加了转化的可能性,并改善了整体用户体验。搜索和探索可以根据用户的交易历史进行定制,而不仅仅是为了追加销售。
- 根据你对人们表达的兴趣的了解,提出直观的建议 。在现实生活中,大多数人在购买产品时都会情不自禁地喜欢向他们提供的适当建议。(如果你在亚马逊上,它的推荐引擎明确地“为你”推荐了一些东西,你不觉得迫切需要去看看吗?)
你不是一次而是不断地经历这个提炼过程。您定期查看您的常见搜索查询,从而决定如何继续 优化您的搜索结果 以改善您客户的网站浏览体验。
搜索启用内容发现
所以从本质上来说,搜索是有效内容发现的重要推动者。它“回答”某人的浏览行为,并影响他们如何接收内容推荐。基于你所了解的,你可以让你的搜索算法在他们的搜索结果中嵌入相关的、个性化的关键词相关的“线索”。这类似于为目标受众中的人物角色创建一个经过验证的有机营销渠道。
作为您营销策略的一部分,您是否想为您当前和潜在的客户提供 优秀的内容发现 ?
你肯定会帮你的生意一把,因为满意的顾客永远是你最好的资产。当你预测他们的内容发现愿望并努力优化他们的在线体验时,他们会注意到这一点。
你发现了阿哥利亚
曾经在 Medium、Lacoste 或 Hacker News 等网站上寻找内容吗?那么你已经参与了 Algolia 技术带来的好处。我们广受欢迎的搜索和内容发现平台是您实现个性化用户体验的一种方式。
我们的客户从初创企业到 80 多个国家各行业的巨头都有。查看我们的 灵感库 了解他们使用内容发现工具提高收入的方式。
感谢您阅读本内容发现流程指南。我们很高兴 您 发现了 我们 现在知道如何将内容发现应用于您网站的成功。 取得联系 让我们开始吧!**
数字营销:从古代历史到现代策略
原文:https://www.algolia.com/blog/ecommerce/what-is-digital-product-merchandising/
当你的顾客无法亲自评估一件产品时,你该如何销售它:拿起它,感受它是由什么制成的,知道它的尺寸,看到它的真实颜色,试穿它,沐浴在商店里飘散的令人愉悦的香味中,与售货员谈论一件商品的利弊?
对于零售商来说,这至少是从 90 年代中期开始的问题,当时互联网开始受到消费者的欢迎。
当供应商蜂拥到网上,在这个新影院销售他们的产品时,他们发现传统的商店销售努力,如眼睛水平的商店展示和端盖产品放置,在帮助销售产品方面几乎没有用处。在网上,他们无法提供令人眼花缭乱的商店橱窗,无法让人在人行道上分发促销传单,也无法提供友好的销售助理倾听并提出建议。
面对这一令人生畏的电子商务销售挑战,零售商不得不找出他们在网络空间而非现实零售空间中的生存方式。他们需要有前途的数字营销策略。他们必须想出有效的方法来吸引他们的数字客户,并引导他们到虚拟销售点的收银台完成销售,否则。
并想出他们所做的网络营销策略。他们的一些想法失败了,但另一些却成功了,成为了指导原则。随着在线营销人员评估和应用关于如何取悦在线购物者并获得他们的忠诚度的数据,通过反复试验,他们使自己的产品更具吸引力。他们逐渐创造了数字产品销售的营销类型,并将其磨练成一种艺术形式。
什么是数码产品营销?
数字产品营销涵盖了零售商建立和推广在线销售产品的所有方式。
毫无疑问:在网上销售产品,没有销售助理站出来,没有触觉上的诱惑机会,没有熟悉的商店布局——不是一件容易的事。网购者有理由认为,如果他们看不到或摸不到一种产品,他们为什么要购买它?“在这一点上取得成功,就像是在人们能够浏览橱窗后,说服他们购买产品,但除此之外别无选择。
好消息是,可靠的数据可以向在线营销人员展示克服网购者沉默并最终实现大量销售的清晰路径。
产品营销:是如何开始的?
让我们回到几千年前,回到古希腊。户外公共市场(agoras)——相当于我们的农贸市场和杂货店——挤满了兜售不同类型商品的商人和商人。天气炎热,尘土飞扬,穿着凉鞋的希腊人从摊贩旁边走过。胖橄榄坐在碗里品尝,有人喊道:“把你的橄榄拿过来!”
是的,早在斯巴达,产品销售就是一件事。商人提供食品样品,顾客可以判断、闻和品尝商品。“尝尝这种奶酪,”商人会建议。“不是奶油吗?”体验就是一切,早期营销的好处显而易见。
今日店内商品陈列
快进大约 3000 年,有效的商品销售——无论是在实体店的销售层还是在电商商店的虚拟层——仍在强劲发展。当然,基于大量的数据和人类心理学,它现在变得更加复杂了。尽管如此,目标仍然是一样的:吸引潜在客户,说服他们购买(加上追加销售)。
作为参考,实体店采用的流行产品营销策略包括:
- 诱人的橱窗展示。顶级零售商将他们的橱窗视为人们经过商店门前的第一站,他们使用图像、醒目的颜色、时尚的产品系列、穿着得体的人体模型和有趣的商品排列来创作虚拟艺术作品。橱窗里一个好的零售展示可以创造奇迹,吸引路人来查看商品。
- 有用的标志。货架标志告诉购物者有关商品的信息,并为他们提供指导,通常还会推出有吸引力的促销活动,如买一送一(BOGO)、半价或闪购。精明的商店零售商使用标牌来推销分散的产品,并激励浏览者快速行动。
- 迷人的香味。 你会相信在实体店中使用合适的香水可以增加销售额11%和顾客满意度 20%吗?连同其他环境因素,如温度、照明、背景音乐和员工着装,气味有助于创造一种身临其境的愉快氛围,这可以很容易地转化为有益的购物体验(金钱可以买到的最佳“零售疗法”)。
- 免费样品。和古代一样,对于某些商品,实体店使用“先试后买”的销售方法。人们发现这能激发互惠,购物者觉得必须购买一件商品,作为收到免费(样品)“礼物”的回报。
- 迷人的店内演示。人们发现,面对面的产品演示——教育性的,通常是互动的——在现场向顾客销售时非常有效。
达到数字等效
那么,成熟的现场零售营销实践如何转化为数字销售的成功呢?在线零售商仍然需要吸引购物者,让他们参与内容,并让他们忠实地购买产品。只是他们用的方法肯定是完全不同的。
实体销售场所和数字市场之间有一些相似之处,比如主页类似于零售店的入口。例如,在网上,你可以提供与店内产品演示相媲美的点播视频。但总的来说,这是一门独立的科学。
尽管存在明显的差异,但良好的数字产品营销的价值怎么强调都不为过,原因有二。首先,正如亚马逊所展示的,你可以在网上销售大量的产品。借助数字产品销售和高级搜索和个性化等功能,人们可以立即找到他们需要的产品和服务。第二,你可以接触到更多的目标购物受众,而实体店只是当地附近的人的一个选择(甚至 他们 可能更喜欢在网上购物)。
考虑到商品销售的各种好处,考虑以下方法来最大限度地提高您在数字世界中的商品销售能力。
微调你的主页
你的电子商务商店主页是大多数人首先登陆的地方,所以从一开始就让它对购物者具有极大的吸引力是首要任务。
- 保持你的“商店入口”整洁。你的主页(以及所有的登陆页面)应该看起来干净、吸引人,就像商店橱窗里华丽的商品陈列一样。访问者应该能够立即知道你卖的是什么,而不是被过多的细节淹没或被广告轰炸。
- 指向搜索和导航。人们应该能够很容易地在页面顶部找到你的放大镜图标或搜索栏,这样他们就可以快速输入搜索词。你的产品类别过滤应该简单明了,也很有帮助。
模仿传统做法
- 突出畅销产品。 就像实体店的店内商品展示可能会展示畅销书一样,你也可以在你的分类页面和产品页面上展示你最好的商品。
- 使用高质量图像。 丰富多彩、生动专业的产品照片是有效视觉营销的关键。理想情况下,照片可以让购物者放大商品细节。提供近距离接触产品的能力——尽可能在网上——是打动潜在买家和推动你的底线的好方法。
拉出停止点
当你在网上销售商品时,可能需要一个虚拟的村庄来销售你的产品。引人入胜的数字营销文案、详尽的产品描述、用户生成的内容,如热情洋溢的客户评论和 社交媒体 客户评价(“社交证明”)、操作指南视频、社论、相关项目 推荐 ,以及无缝的 全渠道 协调,可能是将购物者转化为忠诚客户并产生更好的平均订单价值和更高销售额的成功组合的一部分
包含强烈的号召行动
如何让客户转化?在你的网站上放置醒目的行动号召(CTA)是启动成功的在线销售战略的好方法。你知道,像“浏览选择”或“查看销售项目”这样的按钮为了获得最佳效果,请确保每个 CTA 都靠近页面顶部,以便于查看。
为移动购物者优化
你知道吗,现在大部分网站流量都来自使用移动设备的人?再加上移动端产生的零售额占比,从 2018 年的 3.5%增长到 2022 年的6.9%。这意味着,将手机优先观看考虑在内的数字产品营销可能会获得回报。为了激起移动用户的兴趣并推动销售,你的设计和功能应该在移动屏幕上完美无缺。
利用 AI 个性化体验
购物者期望一流的搜索体验,包括【高级过滤和排序】 语义搜索 【理解】他们的意图。平均而言,当用户享受到个性化的网上购物体验时,他们会多花 40%的钱。
这意味着传统的搜索功能 仅仅基于关键词 可能不适合你的电子商务网站。相反,为了给你的顾客创造更好的体验,你可以从以下几个方面着手:
- 收集用户数据。借助谷歌分析、用户调查和用户反馈等工具,你可以收集关于潜在客户的宝贵信息。你从这些数据中对他们了解得越多——他们的偏好、兴趣、浏览和购买行为——你就能更有效地向他们推销你的在线商品。
- 做出直观的建议。你从网站上挖掘的客户数据?当你用它来做产品推荐时,它就变成了金子。你可以通过向客户展示基于他们的搜索历史、过去的购买和特殊兴趣的相关产品来引起他们的注意。
- 提供优秀的 客户服务 。无法回避的事实是,如果你想和一个人交谈,电子商务网站不是你该去的地方。没有销售人员在一旁等着,准备走近并指出很酷的新产品。然而,有一种 24×7 技术可以通过你的数字频道模仿人类的帮助:聊天机器人。撇开与机器人交谈的抱怨不谈,你的顾客可能会带着他们问题的答案离开,他们可能最终会购买,而你可以降低你的成本。在线客户忠诚度得一分。
一个全新的数字世界
当网络刚刚建立并运行时,电子商务还处于初级阶段。在线商店有难看的店面,超级笨重的界面,而且大部分是基于文本的内容。零售商感兴趣的主要是说服人们 去 网上购物;真正 有效的 网上销售在零售商眼里只是一个闪光点。
从那以后,在大量案例研究的帮助下,事情发生了相当彻底的变化。现在:
- 都是关于购物者 的体验。由于电子商务已经成为主流,人们关注的焦点是享受平稳“旅程”的购物者或顾客,当他们导航到他们需要的东西,购买它,如果一切顺利,成为一个忠诚的顾客。正确的客户之旅转化为电子商务销售和更高的收入,再加上加强品牌形象,因此企业当然会优先考虑出色的 客户体验 ,以此作为启动其指标的一种方式。
- 增强现实(AR)是真实存在的。 通过 AR,视觉和其他感官数据覆盖在现实世界的场景上,以更好地判断商品是否对购物者有用。他们可能能够虚拟地试穿衣服或者在房间里放置一件家具。让购物者评估不同的产品,做出决定,并购买最终证明是正确的产品,而无需踏足实体店,这是一项不容忽视的数字营销壮举。
- 搜索更“聪明” 过去十年,零售企业的搜索质量有了巨大的提高。除了个性化,搜索引擎转型的关键要素还包括 语音搜索 和 自然语言处理 。零售商也可以利用 搜索商品 来增加网上销售。
- 聊天机器人更“有亲和力” 与人工智能的其他应用一样,etail 聊天机器人拥有更多“类人”角色,并且能够 更好地模拟销售助理,耐心地回答问题并推荐产品,以提高产品的销售。
你的 数字营销怎么样?
**你有没有不太奏效的电子商务营销策略?想彻底改变你的网上零售策略吗?
我们在阿尔戈利亚听到你。我们相信,借助最新的数字产品销售技术,您可以提高客户参与度和转化率。
询问我们 关于 网站搜索体验 和个性化 建议 帮助您的在线业务在数字市场中赢得并保持竞争力。我们打赌你会很高兴你这么做了。**
什么是文档索引?
原文:https://www.algolia.com/blog/ux/what-is-document-indexing/
为了完成工作,你能轻松找到你需要的信息吗?您能快速访问正确的数字文件,而不浪费太多时间进入鼠洞吗?
随着企业继续数字化,无纸办公成为历史,掌握知识和文档管理的艺术变得越来越重要。文档索引使这一切成为可能:在数字世界中为信息搜索和文档检索提供动力的齿轮。
什么是文档索引?
文档索引是将标签和标记应用于文档的简单过程,以便在搜索大容量数据库和索引时可以轻松找到它们。索引相当于在你的行李上系上一条彩色丝带,让你在着陆时更容易发现你的包和其他人的包一样。通过用相关标记来标记文档,您可以更容易地快速找到它们。
本帖的点
你知道食指为什么会有这个名字吗?
单词 索引 来源于拉丁语单词indico,意为指出、表明或显示。人们用食指指着东西。
9-12 个月大的孩子能够理解并做手势。从那时起,一语双关,“索引”是一种简单而有效的搜索和检索手段。比如:
“我的墨镜呢?”
“他们在 那里。 在你头上。”
文献索引简史
据说在 15 世纪,随着印刷机的出现,人们开始为文件编制索引,作为一种挖掘埋藏在厚书里的信息的机制。
如今,在数字时代,企业用户依赖 SharePoint、Google Drive 和 Adobe Document Cloud 等文档管理系统进行文档存储。不幸的是,我们的食指无法帮助我们定位存储在云中的业务知识。但是文档索引仍然是帮助业务用户定位或愉快地发现正确信息的框架和机制。这一点至关重要:在竞争激烈的商业环境中,及时、准确地检索索引信息至关重要。
【正确地】索引文档为什么很重要?
对于公司来说,能够快速找到文档尤其重要。快速搜索功能不仅让日常工作变得不那么单调乏味,也是业务流程的一大优势。它提高了工作效率,实现了更好的协作,并有助于降低成本。它也是许多领域的核心,如治理、安全性和法规遵从性。
更重要的是,对于任何类型的文档,优秀的搜索已经成为一种需要。随着企业开始从基于纸张的流程(如文档扫描)转向自动化,现代搜索机制变得必不可少。在新冠肺炎疫情期间,这种意识变得非常明显,当时许多企业不得不匆忙将各种基于纸张的流程和系统放到网上,以便保持运营。
因此,不管是哪种文档类型,这种新的数字标准都将继续存在。当你在家工作的时候,你当然不能接触到文件柜后面马尼拉文件夹里的实体文件。此外,即使您在办公室,当索引工作做得很马虎或根本没有做时,访问本地数字文件存储也是一项耗时的挑战。
好事多磨指数
文档索引确保在数字世界中,无论你坐在(或站在)哪里,你都可以毫不费力地找到你需要的信息。这样,你和你的公司将从这些业务转型的额外津贴中获益
- 节省时间。有索引的文件查找速度更快,这样你就节省了为了找到正确的项目而花在冗长的文件搜索上的时间。
- 存钱。 使用简化的文档索引系统可以减少您的存储开支,并帮助您获得更好的员工时间投资回报。
- 改善协作。容易找到的文件也更容易分享。轻松共享让员工可以轻松完成他们需要做的工作。
- 更好的安全性和合规性。
文档索引如何工作
无论是你的墨镜还是必要的文件,要想快速找到某样东西,你首先需要知道去哪里找。戴上眼镜,你会从“明显的地方”开始寻找他们在车里吗?和你的钥匙一起放在柜台上?在你上次放的冰箱里?文档索引是这个解决问题过程的数字等价物。
索引的一个简单定义是搜索引擎存储数据的地方。
回想一下你高中的数学课本。在后面可能有一个索引,在那里你可以浏览主题、方程式、名字,以及讨论这些项目的页码。
文档索引有点类似。
当文档被数字化、保存或存储时,它会被分配标签,这些标签随后可以在搜索 中找到 。要索引文档,您需要标记它们以突出关键属性。出于工作目的,我们讨论的标签包括日期、员工姓名、客户姓名、供应商名称、客户参考号、项目名称、客户、条形码、帐户名、帐号。
这样一来,搜索引擎就不会因为必须梳理每个可用文档中的每个单词而变得超负荷工作,这对于医疗记录、人力资源文件或庞大的数字图像集合来说会变得乏味 、 你只会被指向与你的标签相匹配的文件和文件夹。
从本质上讲,文档索引缩小了搜索范围,确保了关键术语的优先级。因此,搜索引擎不会没完没了地在数十亿字节的文件和文件夹中挖掘,而是根据它们与搜索条件的相关性,向您呈现两三个文档。
三种文档标引方法
您知道有三种略有不同的索引类型吗?详情如下:
全文索引
顾名思义,全文索引过程包括扫描文档中的每个单词,从文件名一直到脚注。全文索引需要搜索非结构化数据流。然后,如果您的全文搜索词逐字准确地出现在一个文档中,您的搜索结果将会把您指向该文档。
这种综合方法的问题是双重的。首先,如果您的公司是一家大型企业,可能需要尽职尽责地搜索成千上万的文档。第二,除非你输入的搜索词非常具体,否则你会看到不太相关的搜索结果。
元数据索引
幸运的是,并非所有搜索都需要全文。一些文档通过元数据进行索引:元数据信息 关于 文档,相对于 术语 在 中找到它们。
与全文索引不同,在元数据索引中,只记录分配给文档的标签。因此,不是搜索文档、文件夹和系统的每个单词,而是只搜索元数据。这种级别的搜索通常用于缩短搜索时间和改进商业领域的工作流程。
字段-数据索引
与元数据方法一样,基于字段的数据索引缩小了搜索范围,从而提高了效率。例如,这种类型的搜索覆盖预定义的字段,如“订单号”、“发票号”和“客户号”,而不是将元数据标签应用于扫描的文档字段比元数据标签更加严格,因此任何搜索都会更加精确。
阿哥可以帮忙
在数字世界中,您如何处理文档索引(当然也包括纸质文档的索引)可能意味着平庸的业务结果和巨大的成功之间的差异。索引听起来可能相对无关紧要,但是优化用户在文件系统存储空间中查找数字文档和其他数据资产的方式可以显著提高效率和员工生产力。简而言之,良好的文档索引会直接影响您的业务运营的平稳性和可靠性。
如果您准备好开始从为您的员工和客户构建世界级的搜索体验中受益,请查看 Algolia 的 企业搜索 ,它可以让您索引您的文档以便于检索。要了解有关我们的 文档索引解决方案 以及如何利用高质量索引数据和搜索进行优化的更多信息,请立即联系。
什么是动态定价?
什么是动态定价?
动态定价(也称为需求定价、激增定价和基于时间的定价)基本上就像它听起来的那样:灵活的竞争定价。根据复杂的定价算法,产品价格随着当前市场需求和其他外部指标上下波动,目标是以不同的价格向不同的消费者群体销售相同的产品。
价格变化的速度有多快?动态定价基于对实时数据的机器学习分析,因此这可能只是几分钟的事情。然而,“在零售业,动态定价让你在几周或几个月的时间里达到最优价格,而不是几分钟或几小时,”动态定价专家 Seth Moore 说。
动态定价可以采取多种形式,调整为:
- 供需变化。 库存过多?降低价格是合理的。这显然不是一个新的想法,它只是被新技术增强了。
- 高峰期、天数(如黑色星期五)和时间。销售额随着一年中的季节和假期,以及一个月或一天中的不同时间而上下波动。一个很好的例子:人造圣诞树。六月,它们是便宜货;10 月份,它们开始变得更加昂贵。
- 人口统计学。你的种族或其他人口统计因素是否被用来设定你的价格?倒是挺有 可能的 。
- 地理因素。例如,在某些地区生活或工作的人有更多的可支配收入,公司很容易发现这一点。
一些行业广泛应用定价规则。你可能已经意识到了机票、拼车服务(也许你已经被优步飙升的价格打击了)、酒店业、零售购物和娱乐业的这种情况。这些调整中有许多是实时进行的,例如高峰时间的优步乘坐,而其他调整则反映了由季节变化和其他因素决定的不断变化的市场趋势。
可变定价的范围可能很大。例如,亚马逊每天平均改变其产品价格 250 万次,根据一项研究,可能会大幅改变价格——高达 20%——以反映竞争对手当时的价格。
根据不同的使用案例,动态定价的实现略有不同。例如,当在一些实体商店(如美国柯尔百货公司)实施它时,它采取计算机化货架标志的形式,显示可以根据供求关系即时变化的价格。此外,还有在线零售商店定价工具:经理可能会根据历史购买、购物车废弃或其他理由决定调整商品价格。
动态定价是如何起源的?
尽管是现代的化身,动态定价策略起源于 20 世纪 80 年代。当航空业中预算选择的出现开始侵蚀美国航空公司舒适的利润时,该公司建立了一种新的机票定价方式。通过降低低需求航班的机票价格,提高高需求航班的机票价格,美国航空公司能够在不太友好的天空中超越具有挑战性的市场条件,并与其他航空公司的低价竞争。
从那以后,所有的航空公司都采用了动态定价模式,决定价格的算法也变得更加复杂。为了优化航班价格,现代动态定价模型考虑了航空旅客订票的确切时间和日期。2020 年,Skyscanner报道称,只需在周四而不是周一预订航班,就能获得最低价格。
什么是动态定价策略?
灵活定价策略就是公司在各种类型的动态定价中选择的定价方法。
例如,一家公司可以对畅销商品或服务收取更高的价格,同时降低不太受欢迎或积压商品的价格。除了需求之外,实施动态提价或降价的公司通常会考虑竞争对手对相同商品的要价以及季节是否合适。为了在任何给定的时间周期内确定一个项目的定价策略,这些类型的变量被考虑在内,然后通过基于规则的算法应用于价格。
动态定价的伦理观
公司以不同的方式实施他们的动态定价策略,但不管他们使用的变量是什么,也不管他们是否采用实时定价作为及时的变化,数据科学驱动的价格优化是一种商业实践,可以激发消费者强烈的道德关注。
对于一些人(例如,正在关注预算的人),像那些在定价高峰期被 Ticketmaster 收取高达 5000 美元 的 2023 年布鲁斯·斯普林斯汀演唱会门票的人,似乎动态定价波动专注于使用机器学习来实现利润最大化,而完全损害了公司的声誉。
你可能会说,个性化定价的商业道德一直是一个灰色地带。一个公司划清界限,而另一个公司愿意以利润的名义做出不同的定价决策。现在,基于科学数据的算法世界让公司能够自信地快速改变价格,增加了新的决策扭曲。如果能在不损失客户的情况下获得更高的利润率,哪家公司不想要呢?
关注动态定价算法
有没有一个用例可以在不冒犯客户的情况下,将动态定价的效果最大化?随着消费者越来越适应道德原因,他们可能会更密切地关注你的企业的销售行为,包括你是否以及如何部署动态定价。
记住,使用动态定价策略的目标是 利润最大化, 不是创造忠诚顾客。在动态定价模型中,对单个客户体验或集体负面影响的考虑几乎不存在。
科技行业尤其容易受到道德问题的影响。随着数据量的增加和人工智能的使用,包括数据挖掘、智能算法和神经网络等组件,科技公司充斥着赚钱的创新,这些创新可能在道德上有问题,最好保密。
潜在棘手的伦理问题
关于动态定价的一些道德问题包括:
- 负担能力。没有费用推出动态定价软件的小企业可能会被能迅速确定最佳价格的大公司淘汰。这是否损害了当地社区并阻碍了新业务的发展?
- 电子“跟踪” 数据驱动的动态定价策略需要使用大量人工智能生成的客户行为数据,这需要后台活动跟踪。是否应该允许这种跟踪,并以某种方式收集和使用这些历史数据来“对抗”消费者?
- 公平。你必须为商品支付的金额是否应该根据你的年龄、职业、位置、房屋价值或其他客户细分人口统计数据而变化,更不用说当前的客户需求水平或是否是假期了?是否应该允许针对不同客户的价格歧视方法,以便公司可以提高其 KPI?是不是应该强迫一部分人出高价,另一部分人享受低价?这些类型的不公平,如果被消费者知道,会严重损害你的声誉。
对于一些公司来说,潮流可能开始转向更符合道德的方向。一项研究发现,2021 年, 32%的美国和欧盟企业 表示他们将 而不是 引入动态定价。然而,陪审团还没有出来:另外 27%的人还在评估。
德勤 表示:“挑战在于以一种建立客户信任并符合消费者公平认知的方式使用动态定价。“成功取决于动态定价机制,该机制能够为消费者提供可见的好处,并以一致和可预测的方式将价格与交付的价值相匹配。”
结局
有没有一种方法可以使用技术来评估正确的市场价格,实现利润最大化,并且还可以认识到消费者的重要性,不是作为可以实现利润最大化的数据点,而是当受到良好对待时可能成为忠诚和有价值的客户的人类?
换句话说,你能实施一个 道德上健全的 动态定价策略吗?
可以肯定地说 也许吧。
有利于动态定价:购物者已经习惯了不时支付不同的价格,因为在线零售商经常根据其供应链的状况提供促销价格和折扣。所以你可能会说,从概念上讲,动态定价并不遥远。
与此同时,让我们看看在线零售商以增加收入的名义保持活力的另一种方式:道德导向的动态 发现。
一个可行的替代方案:动态发现
“动态发现”——嗯,那是什么鬼东西?这听起来很像动态定价,也是着眼于利润最大化。但是没有;这是根本不同的。
dynamic discovery 不是使用客户数据来不断调整价格,而是使用消费者数据来呈现目标在线购物者的 最相关的产品、交易和折扣 ,同时为所有人保持相同的商品定价。
在这个关于大数据道德的新消费者意识时代,从采用动态定价的业务模式向以动态发现为导向的方法转变有助于保护您的业务。“动态”定价还可以帮助你与客户建立更牢固的关系,成为更值得信赖的品牌。
发现新的定价动态
如果你正在寻找一个更具道德性的替代方案,以取代可能疏远消费者的动态定价做法,并且你的企业需要提高转化率并确保经济效率,那么考虑一下 Algolia 的发现功能。
在 Algolia,我们专注于引导用户到正确的地方,无论他们是通过我们直观的搜索 API 还是我们整体的动态发现功能。
对于电子商务行业,我们的发现软件使用 50 多个数据点,为相关客户确定合适的交易、折扣和特别优惠。没有不真实的价格变化——没有频繁的 SKU 价格上涨和下跌——只是更有效地提供您最具竞争力的固定价格。
所以是的!你可以用静态定价创造一个令人敬畏的有机购物体验,永远不会让你的购物者质疑你的道德。询问我们的帐户 团队 关于动态发现或开始 建设出 一个新的站点-搜索解决方案免费。
如果你对动态定价期权的更多信息感兴趣,请查看我们的后续主题: 动态定价软件如何帮助你的电子商务业务蓬勃发展 。
企业搜索对消费者和员工的好处
随着谷歌、亚马逊和 YouTube 等主要搜索引擎不断挑战搜索引擎的极限,对用户和他们对搜索体验的期望产生了巨大的连锁效应。
随着最常用的搜索引擎的发展和变得更加先进,用户自然会期待更多:更快的搜索、智能推荐、复杂的个性化等等,无论他们在哪里输入查询。
因此,如果你的应用或网站的搜索体验很差,你就有可能损害品牌信任,降低客户满意度,甚至可能最终失去潜在客户。
同样,客户服务变得越来越先进,导致对销售和支持等面向客户的流程的期望越来越高。这促使组织改善满足客户需求的方式,以及内部团队的生产力和效率。
什么是企业搜索?
企业搜索是指组织从公司内的任何数据源中检索数据,并向用户呈现最相关信息的能力。搜索结果中包括数据库、本地内部网和活动目录,并且可以找到来自多个来源的数据和信息。
这通常需要复杂的定制编码和搜索专业知识,或者使用现成的搜索即服务 API 平台。您还需要确保您的数据卫生和治理得到适当的优化并保持最新,以便您的搜索爬虫可以有效地扫描元数据,并找到与每个搜索查询最相关的内容。
企业寻找内部团队的好处
企业搜索可以彻底改变你的内部团队的工作方式。更快的数据呈现、更高效的员工和更容易访问旧数据只是其中的一些好处。让我们仔细看看是什么让企业搜索对组织如此强大。
省时
与其花时间在迷宫般的文件夹结构中搜寻,在你的企业搜索软件上进行快速搜索应该能在几毫秒内显示出你或你的团队正在寻找的内容。大多数软件还提供“键入即搜索”功能,这意味着搜索结果会随着每次按键而刷新,变得更加相关。
提升员工生产力
内部知识管理是非常强大的,它增强了你的团队获取必要信息的能力,使他们在工作中做到最好。因为信息的获取变得更加容易和高效,它使得整个组织的团队和个人更加自主。
以你的客户服务团队为例。如果他们在打服务电话,客户问了一个问题,传统上,他们可能需要依靠这样的短语,“让我再回答你这个问题”。通过快速而全面的搜索,可以在几秒钟内提取信息,从而创建更顺畅且更少的客户服务电话。
见多识广的决策
企业搜索还可以让部门主管和领导团队更容易根据有用的信息做出更好的决策。随着对数据的访问越来越多,领导者可以快速行动并以更少的噪音做出决策:只看到他们需要的数据来指导他们的行动。简化关键组织信息有助于提高业务敏捷性。
更顺畅的档案存取
无论是已有一段时间未使用的旧内容还是客户数据(可能是回头客),重新呈现历史信息都很困难。随着时间的推移,企业会改变他们的文件结构、格式和命名约定,而那些曾经知道所有东西都存储在哪里的员工也会离开。企业搜索使查找旧信息的过程变得更容易、更高效,因此您的客户服务团队可以立即恢复工作。
企业为客户寻找的好处
企业搜索不仅仅服务于你的内部团队。您还需要利用您的数据、内容和产品信息来帮助您的客户创造现代数字体验。这可能包括个性化建议、智能产品推荐和更多智能功能,这些功能利用机器学习算法来确保客户根据其独特的偏好获得最具吸引力和定制的体验。
创造更吸引人的用户体验
企业搜索为您的客户提供了一个快如闪电、精确的搜索平台,使他们能够在需要时找到所需的准确内容。由于人工智能提供的功能,如推荐产品和个性化,您可以在每个阶段实时改善客户旅程。
个性化您的客户旅程
分析对网站用户体验的个性化有很大的影响。从面向客户的搜索应用程序中收集的用户行为数据可用于不断改进和个性化用户体验。这有助于进一步优化,推动您的业务成果。
像这样利用你的数据有多重优势:它将确保你的网站或应用程序在搜索中显示最相关的信息,它还将你的网站或应用程序转变为转化、吸引和留住客户的工具。
由于普通客户在做出购买决定之前会消耗大约 13 段内容 ,因此快速方便地访问您组织的可用内容至关重要。
在智能搜索引擎的时代,你的网站或应用程序可以与谷歌、亚马逊和网飞等最大的技术领导者相媲美。
为您的组织寻找强大的企业
你如何驾驭这个强大的搜索工具?正如我们已经讨论过的,有多种方法可以做到这一点,这确实取决于您的具体用例。您可以构建自己的 API,也可以选择预构建的搜索 API。但是哪个更好呢?
从零开始构建企业搜索功能
虽然这是一个获得适合你的定制企业搜索引擎的可靠方法,但它非常耗时且昂贵。你需要内部搜索专家和专门的工程团队。此外还有重要的预算问题,例如确保正常运行时间和扩展功能所需的 IT 和工程资源的持续成本。
它也可能不太可靠,更难保护。完全定制的搜索 API 需要自己的安全补丁和更新,这反过来需要更多的 IT 资源、时间和资金。
使用基于企业搜索 API 的模型
使用由专家开发的托管搜索 API 可能是在您的组织中实施改进的企业搜索的更经济、更可靠的方式。随着内容或产品目录的增长和变化,以及消费者和员工的期望变得更加复杂,它也会随着时间的推移而扩展。
拥有第三方搜索 API 减少了对大量内部 IT 和工程的需求。这也意味着安全性和可靠性由全职专家处理,因此您的数据始终处于良好的掌控之中。您可能还会发现,从长远来看,使用搜索即服务技术专家会降低总成本。
更智能的企业搜索与阿洛利亚
Algolia 为您的组织带来了最好的企业搜索技术,因此您可以与您的消费者和员工一起改进您的搜索,并继续提供卓越的全方位服务。
了解更多关于 Algolia 的 企业搜索解决方案 ,或 有任何问题联系我们的团队 。
可解释性在人工智能决策中的重要性
人工智能技术在商业和政府中的应用一直在悄然发展。机器学习模型已经成为在海量数据中识别模式的专家。人工智能正与人类决策一起使用,目标是创造更好的结果,部分是通过让人们管理它如何运作,并使他们相信它是一个可行的合作伙伴。
到目前为止,一切顺利。除了可能有一个关键的权衡:人工智能工具做出的决定缺乏透明度。
想象一下…
- 根据学校工作人员使用的算法,你被第一志愿大学拒绝录取。
- 你在生产线上工作, 而新“优化”的人工智能为一个流程生成的指令似乎并不安全。
- 你医生的 AI 软件 根据你对自己身体的了解,得出了一个看似错误的结论。
- 在黑色星期五, 你的电子商务客户没有做人工智能软件 预测的 他们会成群结队地做的事情。你的销售额在下降,时间也不多了。
需要(明确)的解释
在所有这些由人工智能模型输出创建的理论案例研究中,你可能会感到慌乱。你会想知道为什么你没能打动招生委员会的机器人,你的新工作流程是否会引发事故,你是否需要第二种意见,你如何修复你的网站。
你会想知道,模型预测究竟是如何由机器学习系统做出的,而这些机器学习系统无疑是如此的智能。在某些方面很聪明——毕竟,它是人工智能——但就你而言,并不完全是聪明的计算机科学。你会觉得你应该——甚至有权利——知道系统的精确学习方法和决策流程。
你还希望能够完全信任模型的性能。为了对结论满意,你会觉得有必要知道非人类数据科学家是如何应用他们的训练数据的。如果你怀疑解释的准确性有问题或者数据集有问题,你会希望有人干预。然而,你无法证明机器人拿错了工具箱里的东西。
超越个体
不仅仅是你担心人工智能技术。与工作的重要特征相关的透明度对于参与该过程的每个人都是必不可少的。如果你是公司内部的一员,比如首席招生官或医疗保健团队主管,你会希望决策过程完全透明。你会感受到这一决定的影响力,如果不只是因为你害怕诉讼,而是因为你的公司优先考虑公平和道德标准。如果你是监管者,你可能需要一个完整、清晰的解释。
所以你可以看到为什么详细描述人工智能可解释方法的能力是至关重要的。能够解释机器学习模型可以增加对模型的信任,这在影响许多金融、医疗保健和生死决策的场景中至关重要。
什么是可交代的 AI?
可解释的人工智能——或可解释的人工智能(XAI)——基本上意味着它听起来的样子:解释通常围绕人工智能内部工作的“黑匣子”中正在发生的事情。可解释的机器学习是负责任的,可以“展示它的工作”
“可解释性是表达人工智能系统为什么会做出特定决定、建议或预测的能力,”2022 年 麦肯锡&公司 报告称。
IBM 将可解释的 AI 定义为“一组允许人类用户理解和信任机器学习算法创建的结果和输出的过程和方法。”
卡内基-梅隆大学 软件工程学院 的 Violet Turri 指出,截至 2022 年,确切的定义仍未被真正采用:“可解释性旨在回答利益相关者关于人工智能系统决策过程的问题。”
很难想象算法能够展示他们决策背后的理由,并指出他们选择的优缺点。但这正是它的本质:智能技术提供了人们可以轻松理解的信息,并带有“面包屑”,可以追溯到决策制定的时间。
AI 不能去流氓(可以吗?)
所以你看到了问题所在:在一个不透明的系统中,人工智能有可能为所欲为,而人们没有办法遵循它的逻辑或理解它的结论。
当一个 ML 模型得出一个可能有深远影响的结论时,人类需要理解它是如何运作的。受决策影响的人——更不用说政府机构(例如,【DARPA】)——通常想知道结论是如何得出的。对于内部利益相关者来说也是如此,例如保险公司的销售人员,他们依赖人工智能模型的建议来确定保险金额,他们既需要获得客户的认可,又需要维护自己的公司声誉。
因此,企业和政府,更不用说个人消费者,都同意人工智能决策必须清楚地传达它是如何做出决定的。不幸的是,由于人工智能过程的复杂性,这不一定总是可以实现的,随后的决策是在最初决策的基础上做出的。
他们能解释吗?
也许如果机器人有发言权,它们会告诉我们,我们不够聪明,无法完成它们完成的复杂动作,然后问我们为什么需要知道。但是他们不负责,至少现在还不负责。(嗯;也许我们比我们意识到的更接近他们开始秘密决定事情的那一天,无视我们对透明度的请求。)
所以一定有 AI-process 的解释。人们的舒适程度、公司的声誉、甚至人类的最终生存都很可能取决于此。简而言之,商人、他们的客户和合作伙伴以及监督机构都必须能够审计和理解人工智能决策过程的每个方面。
此外,这些解释必须用我们的语言表述。它们必须在逻辑上有意义,并且(我们希望)让我们人类觉得我们理解——并且我们可以接受——即使我们对此感到失望——决定了什么。
为什么透明度对机器学习解决方案至关重要
如果人工智能电子纸轨迹对人类来说不可理解怎么办?
简而言之,混乱会在各个层面接踵而至。2017 年,斯蒂芬·霍金警告说,“除非我们学会如何准备和避免潜在的风险,否则人工智能可能是我们文明史上最糟糕的事件。”按照这些思路,无法识别或记录人工智能程序的“思维过程”可能会对消费者、公司以及世界是一个公正和公平的地方的总体感觉造成的毁灭性打击。
因此,所有受影响的群体都有足够的动力来确保透明度。
迄今进展
目前人工智能的透明度没有一个统一的全球标准,但人们普遍认为人工智能的运作必须得到解释。随着法律和其他问题的增加,XAI 世界将会适应任何变化的要求。
一些行业中正在利用人工智能的公司已经受到监管要求有一段时间了。欧洲已经实施了 通用数据保护法规 (GDPR,2016),该法规要求公司向消费者解释人工智能如何做出影响他们的决定。
虽然美国尚未效仿欧洲,通过这种类型的全面法律,但《加州消费者隐私法 (CCPA,2020 年)表达了同样的观点:用户有权知道人工智能系统对他们做出的推断,以及这些推断使用了哪些数据。
2021 年,国会 将可解释性 确定为促进人工智能系统中的信任和透明度不可或缺的一部分。
下级倡议
也有机构和公司提到这个目标,以及开发各种版本的可解释的人工智能原理。美国国防部一直致力于创建一个“稳健负责的人工智能生态系统”,包括创建 原则 (2020)。以及 健康与人类服务 旨在“促进道德、值得信赖的人工智能使用和发展。”
包括 谷歌 在内的各种组织也承担起了开发负责任的人工智能(RAI)原则的责任。虽然不是所有的公司都优先考虑这些标准,但它们是成长的良好基础。
有交代就有回报
除了能提供一个清晰的解释让你安心之外,让人工智能决策透明化还有经济上的好处。
麦肯锡 发现,更好的可解释性导致了更好地采用人工智能,最佳实践和工具也随着技术一起发展。它还了解到,当公司将数字信任作为客户的优先事项时,例如通过在算法模型中纳入可解释性,这些公司更有可能将其年收入增长 10%或更多。
IBM 也有同样令人印象深刻的证据:其 XAI 平台的用户实现了 15 %- 30%的模型准确性提升和 410 万-1560 万美元的利润。
挑战 XAI
复杂模型可以云透明
随着人工智能能力的进步,它们已经被用于解决越来越困难的问题。
随着这一切的发生,关于它是如何发生的问题也越来越多:为什么人工智能软件模型会做出这样的决定?人类队友是否理解模型如何运行,并对用于训练它的数据输入有坚实的理解?如何解释AI 做出的每一个决定 ,而不仅仅是最初的模型行为?
“一个人工智能系统变得越复杂,就越难精确定位它是如何获得特定洞察力的,”麦肯锡说。…“解开一阶洞见并解释人工智能如何从 A 到 B 可能相对容易。但随着人工智能引擎对数据进行插值和重新插值,insight 审计跟踪变得更加难以追踪。”
问题是很多 AI 模型都是 不透明 :很难或者不可能看到幕后发生的事情。一位 研究员 说,它们是在没有透明度的情况下创建的,要么是有意的(例如,为了保护企业隐私),要么是无意的,但使用了非技术人员难以理解的技术数据,要么是无意的“来自机器学习算法的特征和有效应用它们所需的规模”。
此外,AI 还有多种途径,包括卷积 神经网络 、递归神经网络、迁移学习、深度学习等。因为有如此多的操作方式,找到人工智能可解释性问题的根源会更加棘手。
不透明是一回事;人们仍然不理解的口头上的透明可能是另一个原因。解释太专业怎么办?如果您的最终用户不能理解他们需要理解的概念,如 深度神经网络 ,您如何确保对系统的信任?如果您不能以一致的方式向他们传达数据发生了什么,该怎么办?
对人工智能可解释性定义缺乏共识
人工智能领域仍在兴起,所以还没有很多关于选择、实现和测试人工智能解释的实用知识。专家们甚至无法就如何定义基本术语达成一致。例如, 可解释 AI 与 可解释 AI 是同一个概念吗?
一些研究人员和专家说是的,并交替使用这些术语。其他人强烈反对。有些人认为创建具有 内置 透明度的模型是必要的,这样决策在制定后就可以被人们轻松地解释(事后解释)。可解释的机器学习是一种不同的方法,不同于前述的正式问责制,也不同于试图解释人工智能黑盒模型中的内容,然后再解释 。
这种对概念缺乏共识的情况导致了在不同行业使用人工智能的各种学者和商界人士之间的尴尬话语,也抑制了集体进步。
学术界的泡沫
人工智能社区的问题在很大程度上仍在学术界争论,而不是在平民世界成为主流。事实上,对人工智能的理解和信任还没有站稳脚跟的一个结果是,人们可能天生不信任它做出影响他们的决定。
缺乏社会责任感
一些人工智能倡导者正在强调围绕人工智能决策的人类经验;这就是所谓的“社会透明度”他们驳斥了传统的假设,即如果人类能够进入黑匣子并理解所发现的东西,一切都会好的。但是计算机科学家 乌波尔·厄桑 指出,“并非所有重要的东西都在人工智能的黑匣子里”。“关键的答案可以在它之外。因为人类就在那里。”
偏向于 AI 模式
目前在人工智能领域工作的人并不是一个特别多样化的群体(该领域由白人男性主导)。因此,多样性支持者认为,可解释模型的创建和运行方式存在一些固有的偏见。这听起来很准确,但如果没有使用机器学习模型的多样化员工群体,你如何解决这个问题?给定模型的决策中是否存在偏见——如果存在,如何解决——是人们一直关注的问题。
可能出现的错误
可解释的模型如此有价值的一个原因是,人工智能模型有时会犯与算法相关的错误,这可能导致从小的误解到股市崩盘和其他灾难。作家 迈克·托马斯 指出:“当谈到正确时,我们认为计算机是最重要的,但人工智能实际上仍然和为它编程的人类一样聪明。”。
人的反应和商业影响
如果一个基于数据科学的决策普遍不受欢迎——也不被受其影响的人理解,你可能会遇到很大的阻力。如果一个心怀不满的人倾向于抱怨感知的不公平,比如在金融服务业,会损害公司的声誉吗?这种情况是公司高管的噩梦。
公众可能不理解人工智能模型可解释性方法是如何工作的,但如果模型是负责任地创建和监督的,并可靠地提供准确的结果,那就是朝着确保接受这一不断发展的技术迈出的一步。随着对人工智能算法的依赖不断增加,以不同的用例做出重大的商业、医疗和其他类型的选择,能够解释和审计人工智能应用程序做出的决定将有助于建立对人工智能工作的信任和接受。
交代搜索数据的好处
在搜索数据领域,强大的人工智能透明度是成功的关键。复杂的 排名 公式(例如,通过混合属性权重和单词之间的接近度而产生)本质上构成了不透明的模型。如果你的目标是网站优化,你可能想知道为什么你的搜索结果以特定的顺序出现,它们可以被测试、提炼和调整以获得你想要的相关性吗?
有了 Algolia,你不必相信算法的可解释性技术,也不必担心系统如何工作或模型的可解释性。对于如何计算搜索相关性,我们提供搜索的客户享受一个白盒模型 透明度 。例如,您可以看到搜索结果是如何基于个性化和相关性因素进行排名的,然后根据实际需要进行手动调整。
想要利用人工智能 的力量 为您的用户创建出色的搜索,并为您的团队带来真正的透明度?查看我们的 搜索和发现 API 和 立即联系我们的专家。
什么是假无头?点假无头,选真微服务
无头的定义是清晰的——或者至少应该是。在实践中,有模糊的边缘,慷慨的解释,和变化的定义。
无头架构 “解耦”一个网站的前端和后端。Nuts.com 的 Alex Shiferman 将前端描述为“表示层”它是内容、用户界面和用户体验。他称后端为“业务引擎”这些服务包括支付处理、订单跟踪、履行等。
同样的还有 可组合——它也有一个相当直白的定义。在一个可组合的应用程序中,每个元素彼此独立地工作,并且可以被替换,而不会对系统的其余部分造成任何影响。第三方专家构建元素来解决一个非常具体的问题,很容易插入、实现,并通过 API 层连接到系统中的其他部分。
希弗曼说,把可组合的企业想象成乐高。不是购买一个完整的工具——电子商务平台、财务系统、项目管理工具等等——而是购买 积木 。每当你需要一个新的工具时,你就把积木组合起来,为你的组织定制一些东西。
“如果我给我的女儿买了一个玩具屋,它已经完全建成了,”他继续说道。“但如果我买一个 乐高 玩偶屋,她就可以把东西搬来搬去,让它真正成为她自己的。”
什么假无头&假可组合的样子?
虽然这些常用术语的定义相当简单,但执行起来却大相径庭。随着 这个词的流行,无头、 出现在广告文案、营销材料和产品文档中的数量远远超过了它应该出现的数量。当假冒的无头服务进入技术堆栈时,可能会造成巨大的破坏。
然而,如果尽职尽责,软件购买者可以将小麦从谷壳中分离出来。尽管许多服务声称是无头的,但这些假货很少经得起仔细检查。这里有三个问题,你可以问,以测试供应商的无头索赔。
#1 他们的 API 代表平台功能的子集吗?
Shiferman 说:“当你深入其中时,你可能会发现 API 是整个平台功能的一个子集。“您只能从管理控制台执行此。你只能从命令行做 那个
这往往表现为两种方式中的一种。要么是 API 不提供某些功能,要么是 API 的操作方式与管理控制台不同。两者都产生了相似的复杂性:意外的编码、不必要的复杂性和异常的操作。
他们的服务是从内部产品发展而来的吗?
可组合企业和无头企业是相对较新的概念。他们只是在最近 5 到 10 年才开始获得真正的关注。记住这一点,你不太可能找到一个无头的本地服务。这根本说不通。对于最近将服务从本地转移的供应商,值得调查他们的技术。
“我看到一些传统的本地电子商务供应商试图向云产品过渡,”Shiferman 说。“我见过他们挣扎。他们不是这样构建工具和平台的。通常有一个潜在的基本限制。你不能简单地将产品移植到云上。”
#3 他们在前端有任何限制吗,无论多小?
厂商开发产品然后过渡到无头架构时,往往会得到 接近 但不完全是这样。比如真无头,可以支持任何前端。假无头,同时,可能有限制或要求。
真无头&真可组合使工程师能够说“是的,我们能做到”
一体化平台就像煮熟的意大利面条,各种服务相互纠缠在一起。当多个工程师在同一个平台上工作时,情况会变得很混乱。假设有人改变了订购系统。这对结账、履行、库存管理和其他十几项服务产生了连锁反应。另一方面,可组合企业就像是 未煮熟的 意大利面。每个微服务都是独立的。“每一项功能都是不同的,”Shiferman 解释道。“你有明确定义的合同。你真的可以在非常精细的层面上管理一切。”因为每个功能都是不同的,你可以让 50 个人都在同一个平台 上工作,而不会让一切变得混乱。
“你必须想出如何以不同的方式支持商业用户,”Shiferman 说。“最终,你的目标是实现客户体验或企业用户体验。如果你开始说,‘在这里做这件事,在那里做这件事’,事情就变得难以管理了。”
虚假服务束缚了组织的扩展能力。使用真正的无头服务,工程团队知道他们在一个地方有他们所有的工具。正如 Shiferman 所说,他们有“全面的功能覆盖”。但是假设一个微服务被证明是一个假的无头产品。当工程师开始建造时,他们会发现不一致的地方。这些不一致将需要一个新的架构。突然,你的团队支持不止一个,而是两个架构,这不是一件容易的事。
发现真无头搜索
“‘无头’这个词已经是问题的一部分了,”API-first CMS Contentstack 的首席执行官 Neha Sampat 在接受Diginomica采访时说。这意味着这个概念仅仅是去掉前端,增加一个 API。
但是无头远不止这些。
Headless 意味着通过 API 提供一切,而不是功能的选择性子集。这意味着支持任何前端,而不仅仅是选定的几个。这意味着从头开始构建 API-first,而不是采用过时的架构来迎合最新的趋势。这意味着自动成为全渠道和垂直不可知的。
我们从 API 优先的基础开始,把 Algolia 建成真正的无头。从 2012 年开始,我们的客户已经能够通过 API 访问功能的每一个细节——索引、搜索、过滤、分析、销售、A/B 测试,一切。“对于无头服务,API 是你的起点,”Shiferman 说。“API 是你的基础层。最小公分母永远是 API。”
因为我们明确区分了前端和后端,Algolia 支持任何类型的前端——JS、React、Angular、Vue、Android、iOS、Kotlin 等等。我们构建了一个 不可知的 产品。 Algolia 不仅仅是一个媒体或市场搜索功能,你可以将其融入不同的用例。它可以处理任何设备、任何使用情形和任何垂直市场,因为我们将其打造得非常灵活且适应性强。
不明不白
那么,时间紧迫的工程师、设计师和技术领导者该怎么办呢?如何从假货中分拣正品无头微服务?
为了释放无头产品的优势,工程师、设计师和领导者必须无情地评估微服务,剔除假货和欺诈,展示真正的无头产品。那件事我们可以帮忙。当您这样做时,您可以为您的组织开创一个强大的个性化软件的新时代。
你还在等什么?今天发现真正的无头搜索。
什么是联合搜索?
原文:https://www.algolia.com/blog/ux/what-is-federated-search/
如果你经营一家网站或企业,你知道新数据库、存储位置和产品目录的建立速度有多快。有了这种不断的积累,你如何确保你的客户总能在你的网站上找到他们想要的东西?您如何确保该解决方案对您的企业来说简单易行?
联合搜索是解决这两种需求的一种方式。通过允许用户同时搜索许多数据源和多种类型的内容,联合搜索改善了用户体验和参与度。同时,它可以让您的企业更轻松地管理数据和搜索工具。
什么是联邦搜索?
联合搜索是一种用于一次搜索多个数据源的技术。使用联合搜索,您可以通过一个查询和一个搜索界面从许多不同的内容位置检索信息。
你可能在没有意识到的情况下遇到过联邦搜索。当您在 MacOS Spotlight 或 Windows Search 中键入搜索查询时,搜索引擎会返回各种结果,如来自不同来源的应用程序、网页、联系人和文档。搜索引擎使用不同的布局来最好地呈现返回的每种类型的内容..这是联合搜索的实际应用。
联合搜索可用于多种环境。例如,如果您的公司除了您的产品目录之外,还为不同的产品维护单独的 文档数据库 ,那么联合搜索工具将允许您的客户从单一位置进行搜索,并同时从所有文档和产品目录中获得结果。这种类型的增强对改善网站上的客户体验大有帮助。
联邦搜索的重要性
尽管用户可能无法单独通过搜索来访问您的内容,但在您的网站或应用程序上实施联合搜索有几个主要好处:
提升客户体验
对于中低漏斗用户来说,联合搜索是一个高效的选择,他们确切地知道自己需要什么。他们可以通过一个查询从一个位置搜索大量数据,从而以较少的点击次数达到他们的目标。即使是对该主题还不熟悉的用户也能从联合搜索中受益——通过搜索一个关键字或短语,他们可以从您的产品页面、文档、多媒体资产等获得广泛的内容。
找到产品或服务所需的点击量或浏览量越少,你转化用户的可能性就越大。当用户通过联合搜索更快地找到关键信息时,你会看到提高的和 转化率 。
使网站扩展变得易于管理
无论何时添加新的内容或数据位置,您都可以轻松地将它们集成到现有的联合搜索工具中,而不必为每种新类型的内容设置一个独立的搜索工具。
支持浏览性
借助集中式联合搜索解决方案,您可以轻松修改、添加或重组数据,同时保持数据的可搜索性。
您可以调整您的联合搜索用户界面的每个部分,以完美地展示它返回的内容,帮助用户更轻松地解释和导航不同类别的信息。这改善了你网站的浏览体验,提升了可发现性,增加了 用户参与度 。
提高可靠性和安全性
联合搜索只需要您管理一个搜索引擎,这简化了可靠性和安全性。监控、维护和保护单个搜索引擎比针对每个数据集的不同搜索工具更容易管理和排除故障。
增加搜索结果的相关性
联合搜索允许您优化呈现给用户的每种内容类型的相关性。你可以考虑不同的参数来对不同类型的内容进行排名,而不是采用一刀切的排名方法。
由于可以提取的信息量更大,搜索结果往往更准确、更相关。当用户与这些改进的结果进行交互时,他们会生成有价值的用户意图数据。一旦你理解了用户在搜索什么(以及如何搜索),你就可以引导用户找到更有帮助的内容,并改善搜索者的体验。
接近于联邦搜索
所有联合搜索解决方案都依赖于两个基本组件:
- 索引:你想要搜索的数据的汇编,以一种有助于有效搜索的方式组织。
- 搜索功能:解析索引以在其中找到相关信息来响应给定查询的部分。
索引和搜索组件可以以不同的方式进行交互,以实现联合搜索。 主要方法 包括搜索时合并、索引时合并和使用联邦搜索接口。
搜索-时间合并
通过这种方法,您的联合搜索解决方案使用多个索引对您希望包含在搜索结果中的每个数据位置运行单独的搜索。然后,它将每个搜索的结果汇总成一个最终列表,呈现给用户。
在搜索时合并不同数据源的结果通常是最简单的联邦搜索,因为它不需要将所有数据聚集到一个索引中。但是,它确实要求您为要包含在搜索中的每个数据源运行和维护特定的搜索工具,或者使用一个工具来处理所有类型的内容,但在不同的索引中接收每个数据源。搜索结果到达的速度也可能较慢,因为中央搜索引擎必须等到所有本地搜索引擎都做出响应后才能交付最终结果。最后,微调聚合结果列表的相关性可能非常具有挑战性,因为搜索引擎可能很难对高度不同形式的数据进行排序。
指数-时间合并
索引-时间合并包括为您希望包含在搜索结果中的所有数据构建一个中央索引,然后搜索该索引以执行联合搜索。
这种方法只需要一个搜索引擎和一个索引,并且与没有本地搜索工具支持的数据源兼容。它通常也能更快地生成结果,因为不需要等待本地搜索工具来响应查询。
另一方面,索引时间合并的设置和维护更加复杂。您必须找到一种方法将来自多个位置的数据聚合到一个索引中,如果不是所有的数据源都以相同的格式存在(例如,一些可能是 PDF 文件,而另一些是 HTML 页面),这将非常困难。一旦数据被输入到一个索引中,索引时间合并仍然需要您为所有不同类型的内容决定一个独特的相关性策略,这是一个非常复杂的问题,如果不是不可能解决的话。
联邦搜索界面
这种联合搜索的方法是搜索时间合并方法的扩展。然而,它不是将结果聚集在一个组合的结果列表中,而是在一个统一的界面中为每种类型的内容呈现一个结果列表。
这种方法需要强大的搜索解决方案,能够在不同的索引中索引不同类型的内容,并创建统一的联合搜索界面。它还要求网站所有者预先考虑他们希望用户获得的最终体验,这样内容就可以以最友好的方式进行索引和交付。
联合搜索界面允许您单独微调每种内容的相关性,从而为您的用户提供卓越的体验。
联合搜索示例
通过改善用户体验、增加用户参与度和提高转换率,很好地实施联合搜索可以为各行各业的企业带来实实在在的结果。
零售
一个成功的电子商务网站依靠 先进的网站搜索设计 将访问者导向他们需要的东西。一个典型的网站可能会列出数以千计的产品,每种产品都被分类到不同的类别,并附有指南和评论。如果访问者不知道某种产品属于哪个类别,他们可能会不知所措,离开网站。
举一个顾客寻找浴室防滑垫的简单例子。他们应该从哪里开始?顾客应该去浴室区、布草区,还是去找教材,为自己买最好的?分类很容易因地点而异。
有了联合搜索,找到执行搜索的正确位置并不重要。在搜索栏中简单地查询“bath mat ”,将搜索所有产品类别,引导客户快速找到产品及其相关内容,从而最大限度地提高成功销售的可能性。
企业
大型企业通常拥有众多服务于不同目的和利益相关者的网站。可以为投资者关系、招聘、品牌意识和企业社会责任等维护单独的网站。
如果没有联合搜索,访问者可能会登陆公司的主要网站,并在相关网站上很难找到目标资源或信息。它可以代表公司失去的大量机会。
然而,有了联合搜索,访问者只需输入一个关键词,就可以立刻搜索所有内容。这种方法可能会让访问者更快地找到他们需要的东西,提供更积极的体验,增加访问者与公司保持互动的机会。
软件厂商
当客户购买软件时,他们已经有 许多至关重要的因素需要考虑。 客户期待优雅、快捷的解决方案,笨拙的搜索体验可能会让他们望而却步。这就是为什么将无缝的联合搜索体验整合到网站中对软件供应商来说至关重要。
考虑 这个联邦搜索特性 。该工具不仅允许用户通过一个简单的查询来搜索整个网站,从产品到博客到文档,而且搜索结果还会在用户键入时实时显示。结果被分成不同的组,以便于解释。在适用的情况下,添加说明不同类型内容的图片和简短描述,以使用户更容易发现和导航内容。所有这些功能都有助于实现积极的最终用户体验。
T22【联邦搜索入门】
从技术角度来看,如果您试图自己构建一个搜索引擎,实现联合搜索可能会很复杂——尤其是如果您想通过使用索引时间合并架构来最大化性能。
使用 Algolia,将联合搜索集成到您的网站或移动应用程序中既快速又无缝。无论您使用多少数据源,Algolia 都能以闪电般的速度提供搜索结果,以前所未有的速度满足您的客户需求。
观看我们的 演示 ,了解 Algolia 的联邦搜索解决方案如何帮助世界各地的企业满足用户需求。
什么是无头商务|无头商务
原文:https://www.algolia.com/blog/product/what-is-headless-commerce/
无头商务是网站前端(构成客户体验的内容和用户界面)与后端(处理订购、支付、跟踪和履行的业务引擎)的分离。Headless decoupling 实现了一个同类最佳的 API 体系结构,能够在不影响后端的情况下对站点内容和用户界面元素进行流畅的更改。
对于传统的电子商务平台,用户界面的每次改变都需要更新前端和后端。即使是对前端的小改动也可能需要对后端进行大修,将小的更新变成复杂而耗时的整个站点的改造。对于设计人员和开发人员来说,无头商务意味着强大的灵活性和敏捷性,可以在不中断后端基础设施的情况下展示体验和测试新策略,同时保持现代的 API 优先方法。
五大重要无头商业利益
采用 headless commerce 的站点享有该架构固有的显著优势,包括:
部署和扩展全渠道体验的能力
台式电脑、智能手机和平板电脑仍然是主要的数字体验和交付渠道,但精明的开发人员正在考虑智能手表、Alexa 类型的设备、数字标牌、信息亭、VR/AR 应用程序、社交媒体应用程序,甚至下一代家用电器的屏幕。全渠道意味着向现有的或在可预见的未来将会存在的任何渠道提供信息、内容和产品。有了无头商务,你就可以走全渠道了。
增加敏捷和灵活性
无头商务系统支持新技术的出现,这使其成为希望跨平台快速创建和部署新客户体验的产品、销售和营销团队的理想选择。您可以以无与伦比的速度和灵活性在各种品牌和产品组合中推出多种数字体验。您还可以灵活地添加或修改营销活动,以准确应对节假日等季节性事件和特殊情况(如 2020 年疫情)。工程师和开发人员也可以从无头商务提供的敏捷性和灵活性中受益,因为他们不必花费时间来重组功能后端。
更快的上市速度
借助无头商务架构,您可以在不干扰后端的情况下快速更改您的用户体验前端界面,反之亦然。由于该架构的开放性和灵活性,与传统架构相比,您可以在更短的时间内部署新的功能和集成。面向客户的内容更新可以快速安装,而无需重建整个系统。
定制化和更加个性化的客户体验
借助无头平台,开发人员可以从头开始创建独特的用户体验,让客户和管理员能够更好地控制平台的外观。这种定制化的体验不仅让公司从竞争中脱颖而出,还创造了一个吸引客户、促进销售的友好而迷人的环境。
增加转化率
当顾客体验是定制的、有针对性的、支持性的、无摩擦的,购物者自然会更倾向于购买。因此,无头商务有助于提高转化率。
阿洛利亚无头商业实例
杜奈姆
英国领先的家居用品零售商 Dunelm Ltd .希望重建实体店的在线浏览体验,同时构建可扩展的高性能堆栈并保持业务团队的可控性。他们以前的解决方案缺乏灵活性、可管理性和敏捷性,并且不能提供业务性能。
当决定采用 headless commerce 架构时,Dunelm 选择了 Algolia 作为关键技术提供商。Algolia 的核心品质(速度、相关性和业务控制),结合 API 优先的无头方法、易于实施和维护,以及易于集成到现有的 AWS 无头平台中,使 Algolia 成为 Dunelm 开发团队的合理和令人信服的选择。在 Algolia 的支持下,Dunelm 网站的搜索转化率提高了 30%,有效地将用户数量增加了一倍,从而增加了收入。
历史背景
全球奢侈品手表市场 Chronext 从一个难以更改、扩展和运营的单一电子商务平台转变为一个由 Commercetools、Frontastic、Contentful 和 Algolia 工具构建的无头平台。
无头堆栈在短短 5 个月内推出,为 Chronext 带来了巨大的好处。该品牌能够在没有 IT 专家的情况下控制其网站(包括内容和产品),并且可以更快地提供新功能。在更好的 UX、Algolia 搜索和 SEM/SEO 改进的推动下,买家转化率增长了 10%以上,超出了预期。
其他使用无头架构的知名品牌包括:
- 亚马逊
- 百思买
- 易贝
- Etsy
- 可口可乐
- J.Crew
- 网飞
- Spotify
- 优步
无头商业搬迁方案
随着越来越多的公司部署无头商务架构,它很可能很快取代传统架构成为主导方法。如果你的公司还没有迁移到 headless commerce,现在是计划你的迁移和转换的理想时间。
有许多采用无头商务的解决方案可供选择,而且还有更多的方案即将推出。应用最广泛的包括:
sales force 商务云
Salesforce Commerce Cloud 是一个一体化软件即服务(SaaS)电子商务平台,使用户能够相对轻松地创建强大的在线业务。Headless commerce 是该平台功能不可或缺的一部分,通过 API、体验管理器以及 Heroku、MuleSoft、Algolia 和其他合作伙伴的第三方工具的应用,使品牌能够丰富客户体验。
商业工具
Commercetools 提供多功能电子商务平台即服务(PaaS ),允许商家在网络、智能手机、平板电脑或销售点上构建和连接世界级的购物体验。
网络不育
Netlify CMS 基于客户端 JavaScript、可重用 API 和预建标记。与 WordPress 等服务器端 cmse 相比,Netlify CMS 提供了更好的性能、更高的安全性、更低的扩展成本和更好的开发者体验。
弹性路径
Elastic Path 是一个无头电子商务系统,支持无模板电子商务作为中间件与企业资源规划(ERP)系统集成。该系统基于 API,专门面向企业级组织。
内容丰富
Contentful 提供了一个灵活的、未来友好的内容平台,帮助编辑管理内容,帮助开发人员将内容提供给移动和网络应用程序。Contentful 的 API 优先平台使开发人员能够大规模创建数字体验,并比竞争对手的平台更快地启动网站和应用程序。
正面的
“无代码、无障碍地创建和交付非凡的数字客户体验”是 Frontasic 的价值主张。其前端管理平台使用户能够连接、构建页面,并利用他们在无头商务中的投资。
移动化
sales force 公司 Mobify 是一家面向 headless commerce 的现代化网络店面,允许品牌快速、频繁地定制其商务体验,通过任何渠道提供增强的购物体验,并增加转化率和收入,以推动在数字优先的经济中取得成功。
GraphCMS
GraphCMS 是第一个原生的 GraphQL API-first headless 内容管理系统。它使世界各地的团队能够快速构建和交付大规模的多渠道数字体验。GraphCMS 可与任何前端技术集成,包括 React、Angular 和 Vue。
棱镜
Prismic 是一个用于编辑在线内容的无头 CMS。使用 Prismic,开发人员可以选择他们的技术、框架和语言,然后轻松管理他们的内容,而无需构建定制的仪表板。
阿洛利亚
Algolia 是一个搜索即服务平台,帮助各行各业的企业在每个渠道上构建领先的个性化搜索和发现体验,推动更大的参与度和转化率,并增加数字投资回报。
凭借其搜索即服务 API 和高级前端库,Algolia 使组织能够过渡到无头架构,并依靠独特的解决方案来支持所有前端产品和基于内容的体验。Algolia 可以让您的无头架构充分利用所有索引数据,并将其大规模智能地推送到任何 CMS、设备或端点,从而帮助您实现目标。
要了解 Salesforce Commerce Cloud 的 Algolia 无头商务集成,请参见 “宣布 Salesforce Commerce 的 Algolia 无头商务集成” 。
Algolia 提供了两场关于无头商务的信息网络研讨会:
什么是无头电子商务?
原文:https://www.algolia.com/blog/product/what-is-headless-ecommerce-and-how-does-it-work/
当你听到“无头商业”时,你可能会情不自禁地想到无头骑士,这个来自 《断头谷传奇》、 的心怀不满的家伙骑着他的黑色种马离开了。别担心,没人在谈论砍掉网上购物者的头。在在线购物领域,“headless”指的是许多品牌用来简化其电子商务平台的酷新技术,以便跟上购物者的需求并增加收入。
为什么网购者的需求如此迫切?自从新冠肺炎疫情开始以来,人们已经成群结队地转向零售商的网站。最初,随着实体店关门,没有其他选择。然而,尽管实体店重新开业,网上购物的趋势仍在继续,因为消费者发现了在家购物的优势。因此,对更加互动和个性化的购物体验的需求推动企业适应、改造和优化其在线实践。
无头电子商务:一个定义
那么到底是什么, 无头电子商务 功能呢?要想出一个无头电子商务的定义,首先确定电子商务应用程序的前端和后端之间的差异是有帮助的。电子商务网站的前端体验是购物者使用和互动的店面。后端系统用于处理数据输入、产品图像、定价、促销和订单细节。
在传统的电子商务应用程序(如 Shopify)中,前端和后端是在一起的。然而,这种模式的问题是,在后端添加应用程序(例如,创建站点弹出窗口的小部件)可能会影响前端,可能会降低页面速度或导致 404 错误。
当我们谈论无头商务时,“无头”部分指的是切断电子商务商店应用程序的前端(头部)。切断前端和后端之间的联系会减少开发依赖性:这意味着开发人员可以在不损害前端完整性的情况下对后端进行更改。对于希望扩展其在线产品并满足客户对更复杂购物体验的需求的企业来说,无头解决方案是理想的选择。
一个无头的电子商务平台是如何运作的?
把一个网店的前后段分开的想法似乎很奇怪,不是吗?这就像把仓库从商店里拿出来,搬到几英里以外的地方。然而,网站前端和后端的区别不仅仅是“面向客户”和“幕后”
对于传统的电子商务平台,所有对前端的定制都发生在后端。例如,对网站设计的任何更新都是在后台实现的。前部依赖于后部,后部做了双倍的工作(结果是更慢)。
有了无头电子商务,做出这些改变的能力就转移到了前端。后端是为纯粹的功能保留的:像计费、定价、报告和分析这样的过程。应用程序编程接口(API),一个让双方“对话”的软件中介,被放置在这两个部分之间。
换句话说,在无头架构中,前端承担了更多的工作。它更加独立和自包含,并且,通过 API,它只在必要时才与后端通信。
无头商业与传统商业
我们已经讨论了无头商业架构和传统模式之间的区别。但是这两者在功能上有什么不同呢?让我们来看看。
刚性与柔性架构
传统的电子商务开发者经常抱怨在设计方面有太多的限制。像 Shopify 这样的电子商务内容管理系统(CMSes)有一定数量的设计模板,更复杂的设计更改通常需要一个插件,这可能会降低网站的页面加载速度或导致网站崩溃。
无头电子商务解决方案开发团队拥有更大的灵活性。前端开发人员对网站设计和模板有更多的控制权,因此他们可以创建更好的用户体验。中介 API 使开发人员能够进行动态创新——在不影响整个平台的情况下进行快速更改。因此,对于希望快速扩展网站并适应不断变化的客户需求的在线企业来说,无头电子商务是一个很好的选择。
快与慢店面
我们已经讨论了 API 如何提高网站的页面加载速度,以及与传统 CMS 相比,这是无头 CMS 的一个重要优势。在传统模式下,对后端进行更改会影响页面加载速度、下载时间和结账时间。所有这些都会影响销售。移动缓慢或笨拙的电子商务界面会让购物者想离开网站。因此,为了避免高客户跳出率,传统开发商已经尝试性地做出了改变。
有了无头 CMS,消费者会注意到页面加载更快,他们享受到更好的用户体验,这对公司来说,等同于更高的客户忠诚度和转化率。
随着向网上购物的持久转变,以及消费者对更复杂的用户界面的期待,许多企业不得不迎头赶上。在尽可能短的时间内提供无缝、便捷的购物体验可以大大提高销售额。一些公司能够做到这一点的唯一方法是实施无头电子商务模式。
个性化与一般化体验
无头电子商务的一个标志是个性化。自从疫情站稳脚跟后,传统的商业网站就不再受顾客欢迎了。谁希望必须导航回一个产品页面(并向下滚动),在注销然后重新登录后发现他们的购物篮是空的,或者得到客观的搜索建议?
糟糕的客户体验是不被允许的。开发传统商务应用程序的开发人员已经能够使用插件来创建个性化,但是正如我们所讨论的,这些插件降低了网站的速度。
借助 headless commerce,开发人员可以跨不同的接触点自由创建更加个性化的功能,从而改善客户体验。来自后端的产品数据和客户信息仍然可以用于通知前端的个性化功能和电子商务体验。
头(肩)高于传统商业
既然你已经牢牢掌握了 无头电子商务 是如何运作的,你无疑就能理解为什么这么多企业会走向无头。在电子商务中,客户需求总是推动变革,无头化运动解决了各种问题。无头应用程序促进了商业网站上的高级开发,允许企业更快地进行更改和扩展。适应性强的框架使得实现个性化变得容易,这有助于电子商务网站更好地满足购物者的标准。
希望利用无头架构的优势,打造经得起未来考验的电子商务网站,并通过个性化的产品信息取悦客户?联系 我们的团队 以了解更多关于我们的 API-first 平台或请求一个 免费演示 。
什么是智能搜索,它是如何工作的?
原文:https://www.algolia.com/blog/ux/what-is-intelligent-search-and-how-does-it-work/
一台电脑曾经在象棋上赢过我,但在拳击上却不是我的对手。 —Emo 飞利浦
有没有想过(更确切地说是什么时候)计算机会想出好主意,赶走它们的人类霸主,取而代之?
你并不孤单。人工智能正在为人类的更多技术提供动力,计算机和软件每天都在“学习”并变得越来越聪明。
搜索领域无疑是智能技术正在接管的一个领域。人工智能搜索工具现在正被用于从企业数据管理到电子商务购物体验的各种应用中。
例如,你可能已经注意到最近谷歌在从网络上给你提供相关信息方面变得多么聪明。这是因为它是一个智能搜索引擎,事实上是这个星球上最聪明的一个。但为企业知识库和其他用例定制的小规模企业搜索引擎版本在采用这种扩展功能方面并没有落后太多。
什么是智能搜索?
智能搜索能力是你从一个搜索引擎那里得到的,这个搜索引擎能够根据用户在搜索框中输入的内容“理解”用户意图。也被称为认知搜索和 AI 搜索 ,它利用一系列技术,如自然语言处理(NLP)和机器学习,来更好地理解每个用户想要的东西。一旦确定了这一点,就可以提供正确的搜索查询结果。
当你意识到就在不久前,唯一可用的搜索是“哑”(因为没有更好的词)搜索,现在被称为“传统搜索”时,这是非常令人惊讶的
传统搜索有什么例子?
几年前,你可能会在一个使用传统搜索引擎的网站上进行文本搜索;也许你输入了类似“纯素食冰淇淋”的东西你会看到这个词排名最高的页面,基本上是一个出售纯素食品牌的各种杂货店网站上的产品链接列表。
如果你正在寻找在哪里可以买到一加仑纯素食冰淇淋的基本信息,这种搜索方法可能会很有效。但你可能一直在寻找与纯素食冰淇淋更相关的东西。
这就是现代智能搜索解决方案派上用场的地方。
智能搜索有什么例子?
如果你在谷歌的搜索框中输入“纯素食冰淇淋”,你的体验会更加令人印象深刻。人工智能驱动的智能引擎仍然使用网络爬虫和网页排名,但该软件也分析用户意图。
当你像这样搜索一个宽泛的术语时,一个智能搜索应用程序会将结果分组为基于意图的类别,比如购物选项、食谱和常见问题的答案。然后,你可以快速锁定你心目中的类别,并在搜索结果中深入搜索。
“纯素冰淇淋”涵盖面很广。与其知道在哪里可以买到,你可能只是想知道是什么决定了真正的纯素食冰淇淋,或者里面有什么成分。
智能人工智能支持的搜索引擎技术考虑了所有这些变量,所以你不太可能因为第一个搜索查询失败而不得不重复搜索查询。搜索结果通常更准确,自然符合你的具体需求,无论你是想吃纯素食冰淇淋,还是只想知道它与素食冰淇淋有何不同(有这样的东西吗?).万一你还没有清楚地说出你正在寻找的确切的纯素食冰淇淋数据,你会看到“人们也会问”的问题,比如“纯素食冰淇淋比普通冰淇淋健康吗?”
智能搜索是如何工作的?
现在我们知道,智能搜索是基于识别搜索者的特定意图,以便快速提供正确的信息。但是智能搜索信息解密过程实际上是如何工作的呢?
智能搜索结合了包括自然语言处理和机器学习在内的 技术 。例如,它可以在语义术语之间建立联系,这是传统搜索引擎(只查看关键字的搜索引擎)无法识别的。它还可以做“思考”类的事情,比如理解文档的结构。
让我们详细了解一下这些功能。
过滤内容
网络爬虫搜索大量的结构化和非结构化数据,以识别最准确的搜索结果。由于这项繁琐的工作,智能搜索引擎采用先进的过滤器,缩小搜索范围,以便找到最相关的内容。
分析文档结构
智能搜索还有助于内容管理活动,如查找 pdf、模板和可视单页内容。这是因为它使用文档扫描技术,可以识别文档的类型和结构,例如,它是信息图、合同还是发票;它是否包含表格、目录、页眉或页脚。该软件可能对搜索者正在寻找的文档格式进行“有根据的猜测”,并在此基础上,为搜索者优先考虑最相关的项目。
应用自然语言处理
自然语言处理 是计算机程序理解人类口头和书面语言的能力。NLP 使搜索引擎能够理解从多个数据源提取的数字内容,并解释抽象的语言结构,如包含同义词、细微差别或单词之间复杂关系的语言结构。能够学习人们语言背后含义的搜索应用程序可以更有效地预测搜索意图。
应用机器学习
机器学习是人工智能的一个分支,利用数据和算法来复制人类的学习方式。这种学习是对检测到的东西的反应。
例如,如果某人一直在搜索特定主题,然后开始对看似相关的东西进行不同的搜索,机器学习功能可以假设这两个搜索确实相关,并主动建议包含这两个主题的材料。随着时间的推移,随着每个额外的查询,搜索引擎在预测最准确的搜索结果方面变得更好(更聪明)。
机器学习的另一个应用是当智能搜索引擎检测到信息模式时,这可以帮助它识别垃圾邮件和重复内容。这意味着搜索者不必受制于大量不想要的数字信息。
为你的网站做出明智的选择
你的公司还在为你的网站或应用程序使用传统的搜索技术吗?既然你已经读了这篇文章,你可能想知道你是否应该通过添加智能搜索来优化。
如果这个想法有道理,那就去查查阿哥利亚完全主持的 SaaS 搜索解决方案 。我们提供人工智能支持的智能搜索,让用户轻松找到他们想要的东西,沿途发现感兴趣的新项目,并对他们刚刚享受的出色客户体验感到完全满意。
从开发的角度来看,无论您的网站是专注于电子商务、医疗保健、媒体还是其他领域,我们强大的 API 都可以让您创建和简化搜索体验,以满足您的用户和团队的需求。 联系我们 获取详情,或者现在就开始免费构建伟大的企业内容 搜索功能 。
什么是意图数据?
如果你有一家实体商店,详尽地采访每一个走进来的不知情的人,以获得他们想要的东西的详细了解,会怎么样?包括他们在哪里寻找背景信息(如果适用的话),他们从与朋友和邻居的交谈以及在亚马逊上查看推荐中了解到的信息,他们对你的产品在价格方面的预期,他们对你商店的整体用户体验的感受,以及其他看似相关的趣闻。
你肯定会让他们怀疑你在干什么,因为那太过分了。但是你可能也能够自信地辨别 确切地说 他们想要什么——他们真正的 意图——以及这些基准数据是否与你的公司碰巧提供的产品或服务的好处或功能重叠。
继续……想象你很满意你花了最后一个小时来收集他们的想法,并且你已经让他们浏览你的店内商品(如果他们在经历了这个小小的磨难后还有兴趣这么做的话)。
你建立了一个基线级别的电子表格,开始摆弄你的临时意图预测模型,并试图建立关联,希望能找到一些自然的方法来预测用户意图:找到他们想要的东西。
最后,基于这种认识,你对你的网站做一些优化,以尽可能最吸引人的方式向他们推销,你努力提升你的客户体验,以满足他们的期望。
不管你的购物者是消费者还是企业买家,这种笨重的预测形式相当于现代的信息检索和购买意图验证。
意向数据可以通过计算机科学的进步来收集,如 自然语言处理 和 语义搜索 ,这要归功于 97%的消费者在做出购买决定之前会研究产品和服务。有了人工智能和先进算法增强的软件,研究人员可以准确找到用户在寻找什么,就电子商务而言,他们是否可能很快点击购买。
什么是意向数据?
买家意向 是一回事;买家意向 来自独特买家旅程的数据——记录该意向的重要证据——是另一个例子。
意向数据是关于潜在买家在线行为的信息,表明他们接下来可能会做什么或购买什么:他们的界面阐明了他们的购买意向。它利用 IP 地址和浏览器 cookies 等标识符,以及关键词和内容的点击量来收集信息。例如,某人的内容消费可能包括阅读在线评论、细读博客文章和点击其他内容的链接、观看视频、获取门控材料以及比较产品。
意向数据通常也围绕特定的主题、产品和服务。它专注于与主题相关的(积极或消极)情绪,提供了比传统的分析或行为数据更全面的视图。
预测分析和意图数据有什么区别?
预测分析 (也称为预测意图)大多与过去发生的事情联系在一起。它使用大数据来预测谁将在何时购买什么。信息来自各种数据源,如客户资料和销售,这种方法融入了数据挖掘、数据建模、机器学习模型、历史信息和人工智能等元素。
意向数据 可以说是卓越的,因为它专注于跟踪和记录购物者的实际在线探索。因此,它可以更好地帮助营销人员和销售代表识别潜在的潜在客户,并确定他们准备购买的时间,例如他们在搜索栏中输入相关关键词、观看网络研讨会或下载相关内容的时间。
值得注意的是,一家公司当然可以同时使用这两种方法来获得完整的数据。然而,收集买家意向数据并不复杂(需要更少的集成),而且与预测意向不同,它可以立即提供具体的实时洞察。
B2B 意向数据生成主要销售线索
当涉及到收集和分析意向数据时,B2B 买家特别感兴趣。事实上,汇总的商业买家意向数据非常有价值,以至于 Gartner 将其称为“B2B 销售线索生成的未来”并且Gartner预测,到 2022 年底,超过 70%的 B2B 营销人员将利用第三方意向用户数据在购买过程中锁定 B2B 销售前景,或在选定的客户中吸引买家群体。
两种意向数据
意图数据分为两种类型:主题和上下文。
一个 题目 类似于一般意义上的:一个主题。在这种情况下,它是在线内容的主题。主题是通过自然语言处理(NLP)和深度学习模型的应用正式确定的。主题可以是概念、地点、人物、产品、公司或其他实体。
当你搜索某样东西时,你表明了你对这个话题所包含的任何东西的兴趣。
然而,通过编辑意图数据,理解人员角色的背景和他们的搜索会有很大帮助,从而使数据真正相关。要获得准确的购买信号,真实世界的背景是关键。例如,搜索者可能是一名正在做研究的学生,或者是一名正在寻找要在国际会议上展示的数据的人,而不是有权为一家大公司进行采购的企业采购员。
当你有一个清晰的主题和清晰的背景时,你就对真实意图有了一个很好的了解,你的营销人员就可以充满信心地前进了。
三类意向数据
数据根据第一方、第二方和第三方提供的信息进行分组。
第一方意向数据
这是从你自己的站点收集的访问者意图信号。企业通过使用分析工具或营销自动化平台来收集目标市场的第一方数据。
第一方数据可能是匿名的,或者你可以使用 IP 身份或该人填写的表格来挖掘他们的具体细节。
数据可以来自人们在你的网站上填写的表格,他们完成的下载,他们输入的搜索词,他们登陆和查看的页面,他们放入购物车的物品(无论他们是否购买),任何基于活动的东西。
更广泛地说,第一方意向涵盖了您在与网站访问者、潜在买家和现有客户的互动中收集的任何信息,包括您从任何电子邮件营销活动和社交媒体投放中收集的信息。
第二方意向数据
第二方数据本质上可以被认为是另一个组织从第一方收集的数据。对于第三方信息,数据是由第二家公司收集的,例如评论网站(想想 Yelp)或发布网络或链接您的产品或服务的网站集合。当用户在这些类型的网站上注册时,他们授予网站所有者分享和出售他们的联系方式和他们留下的任何意向数据的权利。
与第一方数据一样,这些收集的材料可能包括来自网站、应用程序和社交媒体活动的客户参与度数据、店内购买历史、调查反馈等。
搜索引擎是第二方客户意图数据收集器的一种类型。比如你用 Google 做广告,你的关键词数据技术上是第二方数据,而不是第一方。人们搜索提供关键字给谷歌,而不是直接在你的网站上给你。你以非正式的伙伴关系与谷歌签约,以获得对这些关键词的访问权。
第三方意向数据
最后一种意向数据包括从另一个站点收集的信息。与第一方数据一样,它可能是从填写的表格和 IP 地址、与聊天机器人的交互以及其他活动中收集的。
第三方数据通常由从事收集意向数据业务的公司收集。这些意向数据提供商通常可以提供一系列的研究和购物接触点,由用户在访问您的网站之前着手进行。
哪种类型的意向数据最适合你的企业?
第一、第二或第三:你应该选择哪一个?
这取决于诸如营销活动的规模等因素。如果您收集意向数据的预算有限,可以考虑以下几点:
第一方意向数据的优点
- 数据是 完全属于您的: 一个独特的数据集,阐明了您的买家的兴趣和痛点(相比之下,如果您选择购买第三方意向数据,您的竞争对手也可以访问这些数据)
- 你 控制并能以任何最符合你需求的方式分割 你的数据
- 你的营销团队可以 利用你收集的数据 来强化你的销售流程和营销策略
第一方意向数据的缺点
- 第一方数据仅构成 购物旅程的一个片段
- 你可能会错过那些没有访问你自己网站的潜在客户的数据,例如,那些只在第三方网站上研究竞争对手的人
第三方数据的优点
- 你可以看到一个潜在客户的活动、他们所走的整个路线以及他们所走的每一步。
- 第三方数据是 可用的最早 的任何类型。这意味着它可以帮助公司计划如何解决问题,主动击败竞争对手,并在购物者虚拟踏上自己的网站时提供更个性化的体验。
鉴于这些优势和局限性,公司通常会结合第一方和第三方数据,以获得其潜在客户旅程的最完整图片。
如何利用意图数据?
现在你明白了为什么意图数据对预测用户行为和增加收入如此重要。本质上,如果你能确定潜在客户在销售周期中的位置,你就可以适当地向他们提供他们想要的相关内容,以促使他们更接近购买,从而有可能大幅增加收入。
这一切都归结于使用你的意向数据来识别准备购买的潜在客户,然后相应地调整你的营销活动。
大多数企业开始利用意向数据来帮助销售人员确定要接洽的目标客户的优先顺序。然后,销售团队可以在他们可能感兴趣的时候,直观地联系基于客户的营销(ABM)潜在客户,从而提高转化率。
意向数据也可用于未来潜在客户的相关工作,因为人们揭示了他们正在进行的购物和购买模式。
想让您的意向数据利用率更上一层楼吗?您可以使用这些数据来创建基于特定活动的独特群体和目标列表,然后让市场营销以更加个性化的方式进行受众拓展。
用例:利用搜索意图数据
如果你有一个零售网站,你无疑会关心你的搜索意图数据的质量。
您可以立即开始从您网站访问者的行为中收集 搜索意图 数据,以便提供 最先进的结果 。Algolia API 平台 将让你 预测 你的用户的意图,并在你的网站和应用中提供正确的搜索结果。
此外,您的决策者可以使用我们现成的搜索分析来筛选数据并调整他们的内容营销工作。您可以通过将用户的搜索分解为流行搜索、没有结果的搜索数量和过滤器使用等指标来模拟用户的行为。
包括 Lacoste、Slack 和 Medium 在内的公司依靠我们来满足其潜在客户在独特购买流程中的搜索需求。
想加入这些成功的网站并享受可能的留存率或转换率的提升吗? 联系我们 了解如何利用意向数据来提高 您的 客户对搜索的满意度,以及我们认为肯定会带来的所有回报。
什么是以知识为中心的服务?
原文:https://www.algolia.com/blog/ux/what-is-knowledge-centered-service/
您知道您的 IT 服务台很可能面临越来越大的压力吗?由于数字化转型项目的增加而涌入的需求意味着许多支持组织正在努力为其员工提供足够的 IT 支持。
为了帮助简化支持流程并提高利益相关方的服务水平,许多服务台经理正在转向以知识为中心的服务(KCS)方法。KCS 包括持续分享和提炼知识。拥有客户支持的 KCS 有很多好处。服务台代理通过搜索访问历史公司内容并不断优化该内容,所有这些都是为了帮助快速跟踪解决过程。
KCS:最佳实践方法论
以知识为中心的服务(也称为以知识为中心的支持)是一种描述组织如何更好地利用其拥有的信息来改善其服务交付的方法。KCS 方法让 IT 服务台工作人员不仅解决系统、员工和利益相关方的问题,还记录解决方案流程,以便在未来实现有效的知识共享和客户成功。在 KCS 进程中,知识库的不断更新改善了服务的提供。
什么是知识库?
知识库是一个在线图书馆,包含关于产品、服务、问题和主题的知识文章。它可能包括产品常见问题解答、故障排除指南、用户手册和其他文档。为了支持知识的收集、检索和共享,今天最好的知识库往往是人工智能驱动的和可搜索的。对于处理许多服务请求的支持团队来说,知识库中的集体知识对于加快新代理和老代理的响应时间至关重要,因为他们会定期参考公司的历史内容。
知识型服务的好处
像所有好的 知识管理 一样,KCS 的实践可以帮助您组织的服务台捕捉知识,以多种方式提高客户满意度。这对你的团队有帮助:
破案更快
支持团队随手可得的可搜索数据库意味着不再需要第二次猜测服务请求。过去的问题解决事件都有详细记录,让代理有所参考。常见问题可以快速解答。
打造专业文化
专业文化是指以知识和技能为特征的服务组织文化。丰富的资源库有助于团队成员培养专业知识文化,使代理能够处理案例。KCS 处理服务请求的方法可以产生消息更灵通的服务代理和更熟练的查询解决方案。
优化利用资源
拥有一个 可搜索的知识库 意味着内容可以进行优化搜索。特别是对于大型知识库,使用关键字标记内容可以让搜索正确信息的代理更快地访问特定内容,从而减少搜索正确信息的困难,并有助于确保运营效率。
启用自助成功策略
自助式数据库为支持代理提供了对其工作的自主权和所有权,并加快了新代理的培训过程(他们可以使用该数据库查看案例是否已被记录)。
增加首次接触分辨率
优化的资源数据库不仅加快了解决流程,还增加了案例首次得到解决的可能性,有助于持续改进。如果第一次接触的解决率很高,这应该表明客户以高效的方式获得了良好的服务。
创建以 KCS 为中心的知识库
创建有效的知识库需要时间,并且是一个持续的过程。然而,使用 KCS 方法可以帮助你更快地创建一个知识库,并有效地维护它,使它总是最新的。
以下是如何创建一个反馈知识库:
第一步:创建好文档
当 IT 服务台的询问得到解决时,创建适当的文档(如果它们不存在)是很重要的。为每个案例中的客户问题创建支持文档的过程——无论是以常见问题解答、文章、一页纸、案例研究、故障排除指南,甚至是完整的手册的形式——都将快速构建一个全面的有用资源库。
第二步:使用一致的文档结构
创建标准化的文档结构能够实现整个库的一致性,并简化创建额外文档的过程。代理人可以在整理文档时从内容模板开始。
第三步:运用你组织的知识
一个伟大的知识库仅仅存在是不够的。支持团队必须接受如何使用该平台、如何创建文档并将其添加到库中,以及如何有效地使用搜索在他们需要时找到正确的信息方面的培训。
搜索第一流知识库的重要性
您的知识库应该以直观的方式组织,并且易于搜索。为了优化可访问性,您可以按主题或内容类型排列内容。搜索栏确保用户可以在他们需要的时候立即调出正确的内容。
通过可搜索的知识库,您可以使用关键词按产品、主题或任何其他相关类别对信息进行细分。
关键词最佳实践
关键词是一个单词、短语或一组单词,最能描述内容所涵盖的内容。有了知识库,工程师可以使用关键字来查找与其问题相关的文档。例如,对于丢失密码的困境,代理可以通过在搜索栏中输入关键字(如“密码”或“忘记密码”)来查找相关信息。
支持团队可以定义他们自己的记录和查找文档的规则。这里有一些正确做这件事的技巧
- 选择代理可能搜索的关键词: 了解代理的想法。他们可能会使用什么搜索词?他们如何表达他们的搜索查询?
- 将关键词与内容联系起来: 每个关键词都应该描述内容的内容。
- 使用长尾关键词: 长尾关键词通常是三到五个单词的短语。长尾关键词更长,因此更具体,有助于缩小内容范围。
- 在内容中使用链接: 让服务管理内容创建者添加超链接,将搜索者导向其他相关内容。
- 建立关键字目录: 作为参考文档,创建与代理可能需要的信息相关的关键字列表。比如这里有一个 关键词列表 帮助人们查询微软知识库。
拥有可搜索知识库的好处
由人工智能软件支撑的搜索栏是一个成功知识库的重要特征。当您的代理拥有这些信息时,他们可以:
- 快速检索内容 并快速满足客户需求
- 轻松找到自己需要的 享受愉悦的用户体验
- 建立文档管理流程: 定期用关键词组织文档,直观地组织内容
添加最佳搜索来升级您的知识库
总而言之,您可以集中您的 IT 历史支持信息,并确保持续优化您的内容,以便在您的服务团队最需要时为他们提供支持。你可以让所有相关的文章都容易找到(而不是从孤立的文件夹中一篇一篇地挖掘)。
Algolia 的高级搜索 API 随时准备在这两方面提供帮助。我们的搜索功能是著名和可靠的,具有成熟的算法、集成和用户界面库。无论您是否正在实施 KCS 方法,帮助您的服务台代理毫不费力地挖掘他们需要的信息并能够重复使用知识都是至关重要的。
免费发现搜索如何帮助您大幅提高服务台的效率(更不用说用户体验了)。如果你喜欢你所看到的,没有大量的前期投资,你可以选择灵活的支付方式。 让我们知道 聊天的好时机,我们再联系!
搜索意图是什么意思?
原文:https://www.algolia.com/blog/ux/what-is-meant-by-search-intent-and-what-are-the-different-types/
你现在想要什么?
也许是午睡,吃点蘑菇披萨,一天中更多的时间;差不多吧。
比方说,你想吃一个新鲜的薄脆皮蘑菇比萨饼,里面有奶酪。
听起来很完美。但是冰箱里的剩菜可能足够了。或者车库里有冷冻烤焦的微波意大利香肠。如果你有食谱,用农贸市场的蘑菇从头开始做就很棒了。但是现在,你最好的选择是去当地的比萨饼店吃一个热的奶酪馅饼,上面覆盖着新鲜的香菇,橄榄油和少许蒜末。(这对于内容营销来说怎么样?)
什么是搜索意图?
所有这些都是说,当你在网上或特定网站上进行搜索时,你有一种特定类型的意图,或者你可以在几种相关类型的意图之间切换。营销人员想知道那是什么,或者那些是什么,这样他们的搜索引擎就能给你正确的搜索结果。
当人们在网上搜索时,他们可以在他们的搜索查询中有任何数量类型的搜索意图。因此,考虑到这些关于蘑菇的想法,你在搜索栏中指出的在搜索引擎结果页面(SERP)上调出结果以便导航到正确的网页的意图可能是这样的:
蘑菇披萨靠近我
交付数量披萨我的心
食谱蘑菇披萨
当地最好的蘑菇披萨
披萨为什么会上瘾?
香菇和牛肝菌的区别
所以搜索查询可以包含多种类型的搜索意图。那些类型的意图是什么?
理解用户意图
你在搜索框中键入的单词或短语——你输入的关键词——通常能很好地表明你的意图。例如,搜索引擎可以判断你是否:
- 正在寻找名牌产品
- 正在浏览,以便在做出购买决定之前比较信息
- 你已经做好了购买的准备,只需要找到合适的产品页面
- 你很好奇,并且有一个你想要回答的特定问题
- 想找菜谱
- 正在旅行,想找一个受欢迎的地方吃饭
为什么搜索意图很重要?
当人们的意图明确时,营销部门可以正确地设置他们的搜索引擎优化(SEO)来包含正确的关键词,以吸引你访问他们的网站登陆页面。
用户搜索意图——搜索者进行搜索背后的动机——已经成为管理 SEO 的商业人士的首要考虑因素。意图现在被认为是一个比以前更有效的指标,以前是根据输入的关键字进行推断。
营销人员热衷于找出整个搜索意图,他们已经确定了四种类型的意图。前三个由专家一致命名,而第四个命名略有不同,但涵盖了基本相同的概念。
类型 1:信息意图
信息搜索的意图非常简单:使用这种类型的查询,搜索者感兴趣的是挖掘一些内容,想知道他们看到的一些东西或他们想到的一些想法;他们很好奇。
在他们的搜索查询中,他们会问一个“谁”、“什么”、“何时”、“何地”、“为什么”或“如何”的问题(并且不一定会把它表述为一个问题)。
示例信息查询:
Spotify 上排名第一的艺人是谁?
什么是 virga
2023 年劳动节
阿姆斯特丹的火车站在哪?
蝙蝠为什么倒挂
没有经验如何找到工作
一个信息搜索查询 不能 的一件事就是与购买某样东西有关——这被认为是交易意图。
例如,判断谷歌搜索是否是信息性的一种方法是通过搜索引擎回应的细节。第一个结果通常是高质量的内容元素,如定义、地图、图表或图形等视觉效果、食谱、特色片段(简短的广告)或“人们也问”内容。
类型二:导航意图
这种类型的内容查询听起来像是表明搜索者想要知道如何去一个物理位置,不是吗?然而,导航查询实际上是想找到一个特定网站的快捷方式,比如一个特定品牌的网站(想想苹果或脸书)。搜索者不知道 URL 或名称的确切拼写,或者他们懒得键入。所以他们只需输入公司名称。有了导航式搜索查询,人们不再需要寻找特定的产品来购买(至少现在还没有)。导航搜索的目的是以最快的方式到达搜索者选择的网站的主页。
类型三:交易意图
你猜对了:这种类型的查询可能表明某人想要并准备购买某样东西——某种特定的产品或服务。如果你有一个电子商务网站,以产品名称作为目标关键字的交易查询将是预期的。搜索词可能是(但不总是)品牌名称,因为用户准备放弃公司网站或在线市场上的旋转产品传送带和其他元素,并支付他们的现金。这些搜索者使用听起来像交易的词,比如“购买”、“花费”或“注册”。(【成本】也可能是 而不是 表明事务性搜索意图;它可能只是面向研究的查询中的一个单词,如下所述。)交易搜索者也可以寻求捐赠。
下面是一些事务性搜索的例子:
克托在乔氏购物
买最好的洗发水治疗脱发
亚马逊折扣券
去哪里捐旧 iPhone
指向目标
第四类:商业意图(又称商业调查、考虑、优惠)
通过“商业”或另一个名称的搜索,某人正在做他们的研究(尤其适用于 B2B 交易),可能在他们决定访问产品页面买东西、注册服务或与某个组织做生意之前比较产品和选项。例如:
点评登山鞋男
技术风格 vs 缝合修复
最好的狗
比较名人邮轮价格
以上总结了搜索意图的类型。听起来很简单,对吧?
不完全是。虽然许多搜索很容易被归类为体现了这些类型的用户意图之一,但其他搜索仍然不会准确地揭示搜索者的意图。这是因为搜索者可能不知道他们当时想要什么,或者他们可能以一种模糊的方式表达他们的查询,这种方式可能被搜索引擎以多种方式解释。
这意味着公司能够准确识别用户的意图是至关重要的
如何高手破译关键词意图
由于用户进行模糊搜索的可能性,考虑如何设置搜索意图(例如,根据搜索排名因素)以及它在搜索引擎软件中的工作效率是值得的。
Algolia 使用 机器学习 来检测意图,并采用平局决胜算法来确定适用于任何给定查询的所有规则的优先级。如果需要澄清, 图形 被创建。
当您确定了特定查询术语和短语的预期效果后,您可以在用户的搜索与这些术语匹配时动态更改用户的特定搜索结果。
你用 规则 配置这个。这里有一个 的例子,说明意图匹配规则如何为零售商 工作。
意图也很重要 搜索 vs 浏览 。通过提供更丰富的用户界面来超越标准的搜索功能,可以提高搜索框的使用率,并确保满足搜索者的需求。为什么?人们并不总是有足够的技术知识来知道如何有效地搜索,或者如果他们最初的搜索不起作用,如何调整搜索。一个更好的搜索界面可以帮助人们不放弃地搜索——如果空手而归,还可以继续搜索。
你是想提高网站点击率的开发者吗?你可以开始 构建 一个有前途的新搜索解决方案(而且是免费的)。该视频进入 意图检测,规则 。
你是一个想要改善你的数字营销策略以获得更高转化率和降低跳出率的商业领袖或营销人员吗?
不管怎样,我们都愿意提供帮助。要了解如何增强对网站或应用中搜索意图的检测,以改善用户体验, 与 Algolia 团队联系 。
什么是自然语言处理(NLP)
语言是我们最基本的交流方式之一,但它也是丰富的信息来源,我们无时无刻不在使用它,包括在网上。如果我们能以自动化的方式使用这种语言,包括书面和口头语言,会怎么样?这就是自然语言处理要做的事情。
自然语言处理,简称 NLP,将语言处理成软件可以使用的信息。有了这些信息,软件就可以执行无数其他任务,我们也将对此进行研究。
自然语言处理为什么有必要?
但是首先,为什么自然语言处理是必要的?首先,每天都有大量的信息通过自然语言被创造和分享。每天都有数十亿的社交媒体帖子出现。数万亿次搜索发生在大大小小的搜索引擎上。通话记录。电子邮件。分类广告。新闻文章。其中一些,如搜索查询,直接受益于 NLP。其他的,比如新闻文章,可以通过 NLP 处理来创造价值。
让我们更详细地看几个例子。我们将从看新闻文章开始。
琼斯将出任 Acme 公司总裁
马库斯·l·琼斯今天宣布他将成为 Acme 公司历史上的第四任总裁。他将带领这家小部件制造商进入下一个篇章,研究向欧洲、墨西哥和加拿大等新市场的扩张。
现在想想我们可能想对这篇文章做的所有事情。例如,我们可能想知道哪些公司、主题、国家和其他关键的 实体 被提及,以便我们可以对类似的文章进行标记和分类。我们可以这样做的一个方法是首先决定只有名词和形容词有资格被考虑作为标签。为此,我们将使用一个 词性标签 ,它将指定文本中每个单词是什么词性。
NLP 规范化和标记化
但是,即使我们识别了这些单词,事情也很棘手,因为“widget”和“widgets”有什么不同吗?当然不是!所以我们需要使用一些 规范化 ,将单词折叠到它们的核心,以便不同的变体可以被认为是等价的。规范化可能很复杂,例如“欧洲”和“欧盟”,或者“马库斯·l·琼斯”和“马库斯·琼斯”。
这种方法甚至忽略了与标记和分类相关的项目可能不是单个单词,甚至可能是一个短语,例如“Acme Corp”。识别这些项目是 标记化 的工作。标记化将一个较大的文本分解成较小的部分。它可以将文档分解成段落,段落分解成句子,句子分解成“记号”(这里我们就不说 字了 ,因为 Acme Corp .可以是一个 token 但不是一个字,而“不是”是一个字,但往往会分解成两个 token:是 和n ' t。)标记化可能非常困难。例如,即使像识别段落中的句子这样“简单”的事情也是棘手的,因为当你有一个像文章中第一个这样的句子时会发生什么?“马库斯·l .”是因为以段落结尾,后面跟着一个大写字母的单词而成为句子吗?)
使用 NLP 进行命名实体识别
总而言之,识别关键概念就是所谓的 命名实体识别 。命名实体识别不仅仅是识别名词或形容词,而是识别文本中的重要项目。在这篇新闻文章中,我们可以确定 Marcus L. Jones、Acme Corp .、欧洲、墨西哥和加拿大都是指定的实体。
最后,我们可能要了解单词之间的联系。这将有助于我们的程序理解第二句话中“他”是谁,或者“小部件制造商”描述的是 Acme Corp. 背后的语义
自然语言处理搜索
自然语言处理对于搜索 查询同样重要,但是有其自身的挑战和需求。说明这一点的一个好方法是讨论自然语言处理的一个重要因素:世界上有成千上万种自然语言。不同的语言会有不同的需求,虽然英语是许多 NLP 软件开始使用的语言,但它并不代表所有的语言。
举个例子,英语中很少有 复合词在一起 不用一些分隔符,不管是空格还是标点。事实上,它是如此罕见,以至于我们有了 这个词来形容它。其他语言不遵循这种惯例,单词会相互碰撞,完全形成一个新单词。德语中“hundehütte”一词的意思是狗屋。不是两个词,而是一个,只是把这两个概念合起来指。
一个幼稚的搜索引擎会将hundehütte匹配到hundehütte足够好,但它不会将该查询词匹配到短语“hütte für gro e Hunde”,这意味着 大狗之家 。自然语言处理将查询词分解成单个的部分,这样搜索者就可以看到正确的产品。这说明了 NLP 的深度学习元素是有用的另一个领域,以及 NLP 如何经常需要特定于语言。
自然语言处理为程序构造数据
通过自然语言处理的所有这些步骤(统称为自然语言处理 流水线 )返回以软件可以理解的方式构建的信息。到目前为止,你已经看到语言中隐藏了大量的信息。一个 40 字的段落可以涉及一个公司,一个人,三个地区,以及关于这些项目的许多信息。人类非常擅长识别语言的重要部分,并理解它是如何组合在一起的,但不擅长从数百、数千或数百万的文本中寻找趋势或将它们组合在一起。大多数软件程序正相反:它们可以发现趋势或对文本进行分类,但它们不擅长文本本身。这就是为什么我们使用定制的软件,自然语言处理,将文本组织成那些程序可以使用的方式。(顺便问一下,为什么不把所有步骤合并成一个程序呢?拥有小而集中的程序可以使每一步都做得更好,并允许我们为不同的目的组合不同的工具。)
结论
上面,我们看了一篇新闻文章和一个搜索查询的例子,以及我们如何使用自然语言处理来更好地转换文本。现在想想我们讨论过的文本内容的其他例子,比如通话记录、分类广告或电子邮件。这些文本可能需要什么样的处理? 有关 Algolia 的搜索和发现 API 如何利用 NLP 的更多信息,或者了解我们如何帮助您在您的网站或应用中实现这一强大技术以获得更具吸引力的用户体验的更多信息, 请联系我们的专家团队 。
什么是自然语言搜索?
原文:https://www.algolia.com/blog/product/what-is-natural-language-search/
自从互联网诞生以来,搜索已经发生了很大的变化。用户现在在浏览网站或搜索引擎时期望快速和个性化的结果,他们不太可能为了找到他们想要的东西而尝试许多不同的关键词。随着新计算技术的兴起,网站开始提供更自然的搜索体验,提供创新的方式来探索内容——主要是通过自然语言搜索。搜索正迅速成为一种双向对话。
什么是自然语言搜索?
自然语言搜索允许用户使用他们的日常语言而不是关键字在设备中说话或打字。用户可以用他们的母语使用完整的句子,就像他们在和另一个人说话一样,让计算机将查询转换成它可以理解的东西。
自然语言搜索与关键词搜索
多亏了谷歌和其他搜索引擎,用户已经习惯了使用关键词搜索。但是关键词搜索并不是用户提问的直观方式,用户实际上很不擅长使用它们来找到他们需要的东西。它们迫使用户去掉疑问词和其他连接语言,形成搜索引擎可以用来查询数据的文字字符串。还可能需要业务部门努力从关键字搜索中挖掘意图。
虽然关键词搜索系统通常允许某种形式的复合问题,但它们经常迫使用户手动构建复杂的 搜索结构 。例如,不要问一个简单的问题,如“有西红柿和奶酪的素食食谱是什么?”,你应该搜索更像“素食食谱” 番茄奶酪 的东西。
然而,随着 Siri 和 Alexa 等数字语音助手的兴起,人们越来越习惯于用完整且语法复杂的句子与他们的设备 进行对话。其结果是,许多用户现在在不同的设备和平台上形成类似问题的查询。用户正变得习惯于使用自然语言来获取信息,并期望快速得到结果。因此,所有类型的搜索系统都能够开始接受自然语言搜索是至关重要的。
历史自然语言搜索
虽然计算机科学和计算速度的进步使得自然语言搜索取得了突破,但实现这些系统的尝试实际上可以追溯到互联网和 web 的早期。
1993 年,MIT 人工智能实验室开发了 START 自然语言问答系统 。虽然从技术上讲,它不是一个互联网搜索引擎,但 START 系统允许用户使用完整的自然语言句子搜索在线信息百科全书。
几年后的 1996 年, 问吉维斯 推出了。这是第一个允许用户通过自然语言探索网络的搜索引擎。然而,事实证明,吉夫斯有点超前于他的时代。此后不久,谷歌推出了一个关键词搜索引擎,并迅速建立了一个强大的系统,具有令人印象深刻的相关性评分,轻松击败了竞争对手的结果。
近二十年后,谷歌和其他搜索引擎开始意识到自然语言搜索的价值,并进一步发展 Ask Jeeves 试图提供的体验。
自然语言搜索如何工作
自然语言搜索使用一种叫做自然语言处理(NLP)的高级计算机科学技术。这个过程使用大量数据来运行统计和机器学习模型,以推断复杂语法句子的意义。随着互联网公司收集越来越多的数据,这在过去十年变得更加可行。计算能力正以指数速度增长,以便处理这些数据。
自然语言的力量不仅来自解析问题的能力,还来自分解复合句和基于上下文的句子的意义的能力。例如,如果一位顾客问一家电子商务商店“你们为我的孩子准备了什么尺寸的 t 恤?”,搜索系统可以确定客户正在寻找儿童类别中的 t 恤衫,并且想要知道有什么尺寸的存货。如果商店有这位顾客过去的购买和搜索历史,它甚至能够确定衣服的最佳尺寸和首选款式。
自然语言搜索不再仅仅是从个人助理那里获取天气等基本信息的工具。越来越多的消费者开始直接通过语音助手或手机语音搜索开始他们的购物和品牌探索之旅。因此,至关重要的是,公司要确保优化他们的技术和销售渠道,以确保这些消费者能够用对话语言与他们交流。
设计自然语言搜索友好网站的四个技巧
在为自然语言搜索优化网站时,许多网站过度关注 SEO,而没有优先考虑用户体验。然而,最终,自然语言搜索的目标是为客户提供一个有帮助的、直观的、吸引人的界面来浏览网站。以下是一些牢记用户体验的设计技巧:
1。设计一个减少大海捞针的语音搜索引擎
搜索系统应该利用所有可用的信息和上下文。例如,用户档案和过去的搜索可以帮助提供关于用户可能想要什么的有价值的信息。如果语音查询有点模糊,这一点特别有用,因为搜索引擎可以根据上下文来推断含义。此外,通过设置过滤器,按照预定义的类别对索引数据进行分类,有助于优化搜索,为用户提供更相关的结果。
2。研究并理解用户如何进行对话式搜索
虽然自然语言处理工具在理解一般含义方面非常强大,但大多数企业会发现他们的行业或领域中存在需要微调的细微差别。查看和定期分析用户搜索可以帮助揭示搜索中的这些趋势,以便可以相应地优化模型。
3。使用自然搜索查询测试网站内容的排名
除了审查搜索准确性之外,重要的是实际网站内容的构建方式要确保自然语言搜索引擎能够正确匹配查询。尝试运行常见的搜索查询来查看内容的排名,并逐渐调整内容来查看它对结果的影响。
4。在网站内容中使用日常语言,回答客户需求
在网站内容中使用对话式语言将有助于确保用户的问题和需求得到回答。对于可能无法在内容中直接找到答案的常见问题,在 FAQ 部分或专用页面中添加这些问题的答案会很有用,这样用户仍然可以找到答案。
总之,设计一个自然语言搜索友好的网站包括使用数据为搜索提供上下文,微调搜索算法和过滤器以适应特定的业务领域,以及构建网站内容以适应对话式搜索模式。这些过程将有助于客户习惯于过渡到与您的网站更具对话性的体验。
你的站点自然语言搜索准备好了吗?
随着消费者越来越多地将搜索转向对话和自然语言,企业必须跟上步伐来回答这些问题。 观看我们的网络研讨会“ 打造卓越语音体验的最佳实践 ”,了解您的网站如何为自然语言和语音搜索革命做准备
NLU 和 NLP 有什么区别
自然语言理解,也称为 NLU,是一个术语,指的是计算机如何理解人说的和写的语言。是的,这几乎是重复的,但它值得一提,因为虽然 NLU 的建筑是复杂的,结果可能是不可思议的,但 NLU 的潜在目标是非常清楚的。
为例,据估计每天有 3200 亿封电子邮件发送。这是大量自然语言的创造和消费,如果计算机能够更好地理解它,它可以帮助那些与电子邮件互动的人。NLU 可以确定电子邮件是否是垃圾邮件,电子邮件是否具有高优先级,或者是否有其他相关的电子邮件要与收件人共享。所有这些努力都有助于人们充分利用电子邮件。
NLU 和 NLP 的区别
当然,自然语言理解和自然语言处理或 NLP 之间的区别也是一个一直存在的问题。答案还是在名字里。自然语言处理是关于 处理 自然语言,或者取文本,转换成更容易让计算机使用的片段。一些常见的 NLP 任务有 去除停用词、分词或者拆分复合词 。NLP 还可以识别词类或文本中的重要实体。
回到自然语言理解的用途,我们可以想到其他的例子,比如:
- 总结新闻文章和博客文章
- 检测网页的语言以提供翻译
- 确定销售拜访记录中的关键主题
- 对推文中表达的情绪进行分类
- 服务客户服务请求的机器人
- 为搜索请求提供正确的产品
- 智能语音助手
这些例子只是自然语言理解的一小部分。你能想到的任何可以从理解自然语言交流中受益的领域都可能是 NLU 的领域。
为什么自然语言理解很重要
自然语言的理解是复杂的,而且看起来像魔术一样,因为自然语言是复杂的。语言在很小的空间里包含了大量的信息。一个明显的例子是句子“ 奖杯放不进棕色的手提箱,因为它太大了。 “你可能马上就明白什么是太大了,但这对一台计算机来说真的很难。
我们不能简单地编写一个程序来检查短语“was too big”并理解该短语指的是第一项。首先,因为这个短语可能改为“太大了”或“太重了”或“太大了”第二,因为有公式表明这种“规则”是不成立的,比如“棕色手提箱因为太大而不适合奖杯。”甚至有一些措辞可能会让人们感到困惑,比如“我没有把奖杯放在棕色的行李箱里,因为它太大了。”是奖杯太大放不下行李箱,还是行李箱太大带不动?
自然语言理解是建立在机器学习之上的
正是因为这个原因,NLU 非常依赖机器学习。机器学习(ML)可以获取大量文本,并随着时间的推移学习模式。这可以用所谓的 分布假说 来解释,该假说认为“通过一个词所结交的朋友”,你可以了解这个词的很多信息以“帽子”这个词为例。一个 ML 模型可能会看到这样的短语,“那个人头上戴着一顶帽子”或者“我戴上帽子是为了遮挡阳光。”如果模型看到了足够多这样的短语,它就开始发现一些模式。然后,抛出这句话,“我戴了一顶棒球帽来遮挡阳光”,它可以感觉到“帽子”和“棒球帽”之间可能有相似之处。加上短语“这个男人头上戴着一顶棒球帽”,相似性会更强。
可以想象,这些 ML 模型需要大量的数据。OpenAI 在 上训练了他们的 GPT-2 模型 15 亿个参数 ,紧接着又在 上训练了 GPT-3 175 亿个参数 。这些数据通常是从网上公开可用的数据中抓取的,但随后会在特定的数据集上进行微调。这种微调允许模型更好地理解给定的数据集。例如,微调可以帮助模型更好地理解医疗数据。
过去十年,计算和机器学习的进步增强了 NLU 的力量和能力。我们可以预期,在未来几年内,NLU 将变得更加强大,并更多地集成到软件中。
有关自然语言理解 应用的更多信息 ,以及了解如何在您的网站或应用中利用 Algolia 的搜索和发现 API, 请联系我们的专家团队 。
什么是自然语言理解| NLU 定义
原文:https://www.algolia.com/blog/product/what-is-natural-language-understanding/
人和机器通常通过语音或文本界面交换信息。但是,机器能够理解——并对——人的情绪状态、微妙的语气或低调的意图做出适当的反应吗?越来越多的人认为答案是肯定的。支持这种突破性能力的科学被称为自然语言理解(NLU)。
NLU 是被称为自然语言处理(NLP)的更广泛领域的子集,它已经在改变我们与技术的互动方式。
NLP vs NLU
NLP 涉及通过将自然口语或文本语言数据分解成可以分析的更小元素来处理自然口语或文本语言数据。常见的 NLP 任务包括标记化、词性标注、词汇化和词干化。NLP 主要致力于将文本转换成结构化数据。
NLU 是自然语言处理的一个子集,它教会计算机一段文本或口头语言意味着什么。NLU 利用人工智能来识别语言属性,如情感、语义、上下文和意图。它使计算机能够理解语言中的微妙之处和变化。使用 NLU,计算机可以识别人们说同样事情的许多方式。
一键区别
本质上,自然语言处理的是所说或输入的内容,而 NLU 则努力理解其含义。人们写或说的意图会因为拼写错误、断句和发音错误而被扭曲。NLU 通过这些错误来判断用户的意图,即使他们的书面或口头语言有缺陷。
因此,NLU 允许计算机软件和应用程序在响应书面和口头命令时更加准确和有用。对于开发者来说,在设计对话式搜索功能时,考虑 NLP 和 NLU 之间的区别是很重要的,因为它会影响对用户所说和所指的解释的质量。
【NLU】实例及应用
常用的自然语言处理和 NLU 的例子包括:
通过智能个人助理提供客户支持和服务
由 NLU 驱动的聊天机器人实时工作,根据用户意图和基本对话元素立即回答查询。无论是指导用户使用产品、回答支持问题,还是将用户分配给人工客户支持操作员,NLU 聊天机器人都提供了一种有效、高效且经济实惠的方式来实时支持客户。
基于语音的智能个人助理,如 Siri、Cortana 和 Alexa,也受益于 NLU 的进步,能够更好地理解用户请求并提供更个性化的响应。
机器语言翻译
语言翻译——其诱人的前景是让用户用一种语言说话或输入文本,并立即获得另一种语言的准确翻译——一直是应用程序开发者的圣杯。但是实现这个目标的问题就像任何自然语言本身一样复杂和微妙。虽然这一领域远非完美,但 NLU 的应用在最近几年已经促进了巨大的进步。虽然翻译仍然很少是完美的,但它们往往足够准确,以合理的准确度传达复杂的意思。
数据收集与分析
越来越多的公司发现,NLU 解决方案为分析元数据(如客户反馈和产品评论)提供了强大的优势。在这种情况下,NLU 被证明比传统的方法,如手工编码,更加有效和准确。
NLP 和 NLU 通常用于使用 5 种技术从文本中提取信息:命名实体识别、情感分析、文本摘要、方面挖掘和主题建模。一旦使用这些方法从非结构化文本中提取了信息,它就可以立即被机器学习模型使用,以提高它们的准确性和性能。
NLU 商业用例
电子商务
传统的搜索引擎很适合基于关键词的搜索,但对于更复杂的查询,NLU 搜索引擎可以使这个过程更有针对性和回报。假设一个购物者询问“给我看看 500 美元以下的黑色礼服。”该查询定义了产品(连衣裙)、产品类型(黑色)、价格点(低于 500 美元)以及个人品味和偏好(经典)。
使用 Algolia Understand 等工具的 NLU 驱动搜索将此类请求的重要部分分解开来,以准确把握客户想要什么。通过理解更复杂、更细致的搜索请求,NLU 更快地将顾客从浏览转向购买。对于那些确切知道自己想要什么的人来说,NLU 可以节省大量时间。
聊天机器人
聊天机器人可能是 NLU 和自然语言处理技术中最著名和最广泛使用的应用,许多部署它的公司已经获得了丰厚的回报。例如,服装零售商 Asos 使用 Facebook Messenger Chatbox 将订单增加了 300%,并获得了 250%的投资回报率,同时达到了几乎 4 倍多的用户目标。同样,化妆品巨头丝芙兰通过使用 Facebook Messenger Chatbox 将其化妆预约增加了 11%。
电视、流媒体、视频
支持 NLU 的流媒体和点播服务可以帮助观众找到内容,从而显著提高客户满意度和忠诚度,即使他们不确定自己到底在找什么。如果一个观众说:“给我看一些由《阿波罗 13 号》的主要演员主演的有趣的电影,”尽管很模糊,NLU 还是能推断出并生成一个符合所有这些标准的电影列表。可能是一种令人厌倦和沮丧的猜谜搜索体验,反而是一种短暂而富有成效的体验,往往会导致购买或租赁销售。
记者和出版商
通过使用自然语言与内容档案进行交互,NLU 可以极大地帮助记者和出版商从内容深处提取复杂问题的答案。
Algolia Answers 等工具支持自然语言交互,可快速找到现有内容,减少记者撰写报道所需的时间。读者还可以受益于 NLU 驱动的内容访问,这有助于他们在一系列来源之间建立联系,并在几秒钟内找到非常具体的问题的答案。
客户服务与支持
像 Alexa 和 Siri 这样的语言交互平台已经广泛使用 NLU 技术来处理大量的用户请求,从产品搜索到诸如“我该如何退货?”以及“我的保修期有多长?”客户服务和支持应用程序非常适合让 NLU 在制造商和经销商最少参与的情况下提供准确的答案。
NLU 是问答系统的核心,问答系统增强了企业中的语义搜索,并将员工与业务数据、图表、信息和资源联系起来。它也是客户支持应用程序的核心,这些应用程序回答大量、低复杂性的问题,重新路由请求,将用户引向手册或产品,并降低全面的客户服务成本。
博彩
在线游戏已经变得极其复杂,以至于玩家不断地参考规则书和游戏指南来寻找特定问题的答案。此外,游戏通常以极快的速度进行,玩家希望立即得到诸如“我如何在这个游戏中击败 3 级?”这样的竞争焦点问题的答案以及“这个游戏里的魔法药水在哪里可以找到?”
在战斗过程中,玩家可以求助于 NLU 驱动的聊天机器人来获得他们需要的信息,而不是翻阅厚厚的纸质手册,不会错过怪物攻击或射线枪爆发。
阿洛利亚对 NLU 的态度
NLU 和 NLP 已经在 Algolia 的下一代搜索工具的开发和推出中发挥了核心作用。例如:
- Agolia Understand是一款强大的多功能 NLU 驱动应用,将 NLU 和人工智能引入电子商务搜索,以提高客户参与度,并将访客转化为买家。
- Algolia Answers旨在理解最具挑战性的自然语言搜索,以更好地对文章进行排序,并从内容深处提取答案,使其成为出版商和记者的一个特别有价值的工具。
有关 NLU 和 NLP 的 Algolia 方法的更多信息,请参见:
神经搜索 101
原文:https://www.algolia.com/blog/ai/what-is-neural-search-and-how-does-it-work/
想到搜索,你首先想到的是什么?
你可能会想象有人在一个网站上,在搜索框中输入一个查询,他们的搜索结果会根据搜索引擎在其网络架构中将关键词与正确的内容进行匹配而出现。毕竟, 否则 搜索引擎如何识别信息,而不是通过即时匹配关键词?
基于关键词的搜索永远是现状。但现在,新技术开始改变搜索应用程序的幕后运作。关键字作为在网上追踪信息的唯一途径的日子正在消逝。现代新的搜索方式正被用于关键字搜索,以创建更准确的搜索结果,并为用户提供更好的搜索体验。
以下是全球公司目前使用的最新发展的搜索方法概要:
传统关键词搜索
用老派的 关键词搜索——你已经认识并喜爱的那种——你肯定会得到大量的搜索结果。诚然,必须提前为搜索引擎创建规则,以便它能够有效地理解数据,并在所有可用的存储库中为您提供最佳信息。根据你的关键词匹配的方式,你的搜索结果可能并不总是超级准确或者按照你的目的排名最优,尽管它们会在眨眼之间为你展示出来,所以你可以方便地点击看起来很好的选择。
【人工智能搜索】
随着人工智能(AI)领域的重大进步,传统的关键词搜索方法和功能一直在稳步发展。大多数搜索引擎用例仍然依赖于关键字匹配方法;其他人则更积极地为新来者让路。为了提高搜索结果的质量,AI-powered search加入了基线关键词搜索。有了人工智能,通过收集和考虑用户活动的数据,搜索结果的相关性得到了提高。AI 搜索利用了一系列现代技术,包括 机器学习 和 自然语言处理 (NLP),以更好地了解每个用户需要定位什么信息。
矢量搜索
许多较新的基于人工智能的搜索引擎整合了 矢量搜索 ,它使用机器学习模型来检测 语义关系 。
搜索向量是文本的数学表示(这适用于搜索查询和索引信息,如产品信息和网页)。向量让搜索引擎理解输入文本的 上下文 。在将单词转换成向量的过程中,意义被编码。
例如,一个基于关键词的搜索引擎不一定知道“温暖”、“热浪”和“夏天”是相关的。相比之下,基于向量的搜索引擎确实理解这些类型的单词关系,这使它们能够胜过单独的关键字搜索。
由于增加了这个维度,向量成为同义词自动化、documents聚类、检测查询中的含义和意图以及搜索结果排名等任务的首选。
与关键词搜索引擎的输出相比,矢量搜索可能速度较慢,扩展性较差,而且价格昂贵。
神经搜索
然后是神经搜索,最热门的新兴搜索方法,准备在搜索界掀起风暴。这听起来像是“有头脑”的东西,事实上,它包含了基于算法组件的奇特、互连节点的“思维”,这些组件被称为 神经网络 (也称为人工神经网络;ANNs)。神经搜索结合了向量的力量,以快速的性能和自学习能力准确地表示数据。
神经搜索的出现是大数据推出的一个成果,没有大数据,搜索引擎就没有足够的信息来进行准确的分析。我们社会积累的可用现代数据集允许神经网络筛选大量信息(其中大部分是非结构化数据),并将其吸收用于广泛的用例。
理解语义
神经搜索有助于提高 语义 理解人们在搜索时想要什么。它利用人工智能来检测人、内容和数据之间的关系,以及用户兴趣与当前和过去的搜索查询之间的联系。
它还可以从数据中学习任意复杂的表示,并利用数据点之间的关系。在理解搜索查询的语义时,这给了它一个优势。
由于能够利用语义和关键词检索方法,对搜索者意图的更好理解转化为提供更相关的结果。
灵活、独立、时刻学习
神经搜索也具有适应性:它可以用于任何类型的数据,包括图像、视频、音频和 3D 信息。例如,表示图像的向量可以包含关于其形状、颜色和内容的信息,这些信息对于将图像与其他图像进行匹配都是非常有用的数据。
神经搜索促进了相关搜索结果的交付,同时降低了对持续管理的需求。例如,它消除了大多数同义词和语言规则的必要性。这意味着网站搜索经理不需要照看和微调他们的搜索功能,添加同义词,制定复杂的搜索规则,提出关键字填充标题,或插入额外的语言包。
你可以从一个训练有素的神经网络开始,而不是依赖于为机器学习模型制定和更新规则,然后模型可以逐渐得到更好的“教育”由于神经搜索基于学习算法,它可以随着时间的推移适应不断变化的现实世界条件(通过微调)。
简而言之,神经搜索就是:
- 擅长理解搜索查询
- 强大的
- 灵活
- 非常适合在系统训练数据和输入不断变化的情况下使用,例如在 电子商务 中
神经网络和机器学习
神经网络也被认为是机器学习的一种形式——人工智能(AI)的一个分支,它使用数据和算法来复制人类的学习方式。
有了机器学习,数据会随着时间的推移变得更加精确。例如,如果某人搜索一个主题,然后开始另一个看似相关的搜索,面向机器学习的系统可以假设这两个搜索是相关的,并建议搜索者检查包含这两个主题的材料。随着处理的附加查询的集成,搜索引擎学习并更好地在下一次提供准确的搜索结果。
子集:深度学习
深度学习是机器学习的一个子集(显然,如果你想知道的话,还有一种叫做“浅层学习”的东西)。
深度学习的概念是基于人类对神经网络如何运作的理解而诞生和发展起来的。1943 年,科学家根据人脑中神经网络的运作方式创建了一个计算机模型。他们的目标是利用算法和数学来复制人类的思维过程。
今天,深度学习的计算算法为各种编程方法提供了一个强大的框架。
深度学习和神经网络有什么关系?而它对搜索质量的影响呢?
神经搜索引擎依靠深度学习算法为用户提供准确的搜索结果以及出色的搜索体验。
搜索引擎由索引器、查询处理器、检索算法和排序算法组成。与神经搜索引擎的最大区别是检索部分,它使用机器学习来确定查询和搜索结果之间的相似性度量。这样,神经搜索引擎实际上可以理解概念 ,这可以带来更好的性能,特别是对于关键词/结果对不完全匹配的长尾查询。
深度神经网络
深度学习、神经网络……不可避免地,我们会进入词汤变异的下一个变异: 深度神经网络。
深度神经网络就像它们听起来的那样:注入了更多深度的人工神经网络:在输入和输出层之间插入了额外的层。
深度学习的重点是机器如何利用深度神经网络计算模型进行学习。
由于在基准问题和应用中的优异表现,多层深度神经网络的概念最近已经成为机器学习中非常成功和热门的研究课题。
神经搜索简单来说就是深度神经网络驱动的信息检索。神经搜索利用深度神经网络(DNN)的能力来构建搜索系统的每个组件。
有什么最新的思维?
这总结了各种在线搜索技术的最新进展。
那么,相关搜索下一步将走向何方?回顾一下大约十年前,当全文关键词和向量搜索技术的合并使优化成为可能时,将会蓬勃发展,确保比传统搜索平台或向量搜索目前单独提供的搜索结果更准确。
与此同时,如果你想在下一个十年的某个时候更快地改进你的网站搜索,你仍然可以做一些事情,就像现在的 。T13
检出神经搜索
那是什么东西?看看 Algolia 新收购的技术neural search,它利用矢量搜索与 神经散列 相结合,为您的用户提供快速、准确的搜索结果。它允许我们在一个 单一 API 中结合传统关键字搜索的速度和神经搜索的准确性。
通过这一改变游戏规则的收购,我们现在可以为您的网站或应用程序提供真正的混合搜索,结合全文人工智能关键词搜索和基于向量的语义搜索来处理每个用户查询。是的,你可以在毫秒内为你的用户或客户获得 最先进的搜索 结果,无论规模还是查询吞吐量。
了解如何利用我们先进的搜索算法来提高贵公司的搜索和底线指标,现在就开始吧。联系我们的 团队 ,成功结束您对正确搜索解决方案的搜索!
电子商务营销:科学与艺术
原文:https://www.algolia.com/blog/ecommerce/what-is-online-retail-merchandising-an-introduction/
最近在电子商务网站上购物过吗?如果是这样,你知道一个顺畅的网上购物体验不是可有可无的。如果你打算逗留一会儿,也许会买一件东西,那么对你来说,做任何事情都一定非常容易。
同样,作为一名电子商务商人,你希望你的目标客户享受在你的电子商务商店度过的平稳体验。当他们登陆你的主页或产品详细信息页面时,你希望他们能够专注于你的产品,并开始热情地看伟大的产品图片、阅读产品描述和浏览产品评论。他们的购买之旅不应该是一项复杂的任务,否则你可能会失去他们的兴趣和你可能获得的利润丰厚的零售销售。
在线零售商品展示是打造顺畅购物之旅的关键。他们让购物者探索你的产品,发现他们想要的东西,购买它们,然后也许以后会购买更多,因为第一次的体验是如此愉快( 和 他们喜欢你的产品)。
一门科学一门艺术
在线零售营销(也称为电子商务营销)与零售网站上的产品战略布局有关。有效的营销既是一门科学也是一门艺术:数据驱动的布局是科学,产品布局是艺术。它显然与传统的实体店现场营销有很大不同——其元素包括橱窗展示和商店设计、彩色标牌、穿着考究的人体模特、奢华的产品展示和试衣间——然而,它仍然符合一些店内原则:漂亮的店面、展示不同类型产品的直观商店布局、强大的品牌以及智能分类。
然而,网上销售更多的是关于而不是你在网站上放产品的地方和你的各种分类页面的外观。它需要对你的潜在客户的购物需求和行为有深入的了解。
作为一门学科,在线零售营销已经受到技术进步、消费者行为变化和电子商务平台功能现代化的影响。随着网上购物变得越来越流行,网上零售商的竞争也越来越激烈,他们需要想出新的方法脱颖而出,吸引顾客,并保持领先地位,包括店内销售 和 网上销售。
如果利用得好,在线零售营销还可以融合虚拟和实体购物体验,可以通过多种渠道为消费者创造一致、无缝的品牌体验(见证亚马逊的品牌)。在零售商的电子商务业务工具包中,简化 全渠道 是构建引人入胜、个性化的在线零售体验的重要流程,可促进商店销售并激发客户忠诚度。
电子商务营销策略的好处
作为更大的零售营销计划的一部分,在线零售营销是推动品牌成功不可或缺的。当你做对了,你可以收获这两大好处:
更顺畅的客户互动
推动高质量的用户参与和购物体验可以为你的购物者和你的 电子商务网站 带来显著的成功。当你能吸引顾客的欲望,让他们购买他们需要的东西(此外,你可能会向他们推销与他们购物车里的东西相关的商品,或者在结账时向他们交叉销售补充产品),让他们想回来,并把他们变成快乐的长期顾客时,你通常可以预期一些相当丰厚的回报。
通过应用在线零售营销的原则来提供更好的用户体验——从登录页面到产品页面,以及沿途的奖励体验——您还可以提高品牌的声誉。然后,当你的顾客想到你的公司时,他们会记得找到和购买他们想要的东西是多么容易;他们很高兴购买并能够使用该产品。但如果做错了,代价可能会很大: 86%的消费者在两次糟糕的网站体验后很可能会离开一家公司。
收入大增
归结起来,愉快、轻松的网上购物和顾客体验必然会带来更高的转化率。如果顾客问:“我能找到我要找的东西吗?”并且可以肯定地说,收入即将到来。此外,您满意的客户可能会再次进行网上购物,因为根据 Salesforce 的调查,89%的人在获得积极体验后更有可能再次购买。
如何钉钉线上零售商品销售
准备好开始构建或改造你的在线零售营销战略了吗?首先,问自己这些问题:
你的品牌塑造如何?
你的网站品牌告诉你的顾客什么?网上销售空间显然与零售商店完全不同,但理想情况下,它应该与购物者在实体店销售区的体验相似。随着时间的推移,强大的品牌会建立回头客,因为他们知道他们在你的网站上会有什么样的体验,所以他们会毫不犹豫地首先访问你。
你的网站好看吗?
在零售网站上,颜色、标识和风格都是创造吸引顾客的体验的一部分,让顾客感到舒适熟悉。引人入胜的视觉营销技术吸引用户,并促进成功的导航。基于你的团队的编码和设计能力,你可能会遇到一些挑战,但你仍然可以优先提供专业的产品销售体验,让你的顾客满意。
你的搜索栏状态好吗?
你的搜索栏在客户体验中扮演着重要角色。目的是帮助你的客户快速找到他们想要的东西,所以你的搜索栏需要容易定位,并连接到一个强大的搜索引擎,可以几乎实时地提供快速、可预测的网站搜索结果。
你的产品分组好了吗?
就像你在店内展示一样,通过在你的在线商店中为多种商品创建建议的“套件”,你可以为顾客的购物之旅增添便利。例如,如果你是一个极限运动品牌,你可能会把登山夹克、登山靴和攀岩装备归为一类。即使购物者只寻找组合中的一部分,他们也会知道在准备好的时候去哪里买其他的商品(可能是在某些 SKU 降价之后)。做得好的话,直观的产品分组促进了销售,一些在线零售商的平均订单价值(AOV)增长了 20%。
个人说明
此外,个性化的互动通过向人们展示他们可能特别喜欢的商品来增强购物之旅。个性化产品推荐和其他以客户为中心的路标由一种 算法 生成,该算法考虑了客户的数据点,如浏览和购买历史。可以肯定地说, 个性化营销 有助于赢得客户体验。个性化有助于确保购物者的快乐,从而获得更高的收入。研究压倒性地证实了这一点。例如,Salesforce 发现,76%的顾客说他们会从提供个性化体验的品牌那里购买,其中 78%的人可能会重复购买。
现在需要结果 ?T37
想要尽快为您的在线购物者提供无缝的用户旅程吗?在 Algolia,我们提供了 工具 ,可以帮助你简化用户体验以增加销售,潜在的大幅增加。
不要只相信我们的话。我们已经让 零售巨头 提供最佳搜索和发现,这带来了一些非常惊人的结果。从改善塞曼的搜索体验到将 Lacoste 的销量提高 150%以上,我们有着辉煌的业绩。这意味着你可以自信地运用我们的销售技巧,将你的电子商务销售提升一个档次。
什么是搜索即服务?
原文:https://www.algolia.com/blog/ux/what-is-search-as-a-service/
“搜索即服务”是一种使用软件即服务(SaaS)模式的网站搜索。
通常在 SaaS,许多不同的服务通过云按需提供,现收现付。有了搜索即服务,公司可以更快地创新,因为他们不必担心托管、运营和维护。相反,他们可以专注于完善最终用户体验和优化相关性。搜索即服务提供了一系列好处,包括搜索分析功能、直观的搜索 UI 以及用户可以定期即时获得的创新,因为该服务托管在云上,所以其效率超过了典型的网站搜索。
搜索即服务模式对于帮助企业持续改进网站搜索功能和满足客户需求至关重要,而无需大量的 IT 投资。
搜索即服务的好处
当 43%的网站访问者立即进入搜索框时,出色的现场搜索体验意味着更好的参与度和更多的转化。
网站搜索不仅能快速将用户与他们的需求联系起来,还能通过提高转化率和客户保持率来帮助业务增长。但是最好的搜索即服务解决方案提供的 远不止是一个搜索栏 。它们让探索成为可能,将访问者与他们甚至不知道自己需要的东西联系起来。
搜索与在线体验如此紧密地结合在一起,如果没有它,一个网站很难与之竞争。然而,专有搜索解决方案的构建成本很高,难以维护,并且需要大量的 IT 投资来测试和实施改进。凭借 云架构 的效率,将开发、部署和创新外包给搜索专家通常更容易,而企业则专注于补充营销和产品开发工作。
搜索即服务模式为企业提供了多种优势:
敏捷
搜索即服务解决方案创建了一个更加简化的运营环境。搜索提供商负责保持运行的细节,因此一旦实现,内部团队就不必花费大量时间进行故障排除、测试、解决后勤问题或创建新功能。事实上,搜索即服务为企业提供了自助服务能力,因此 it 可以将更多的时间用于实现组织目标,而将更少的时间用于调整搜索。
拥有/运营成本
有了搜索即服务,企业承担的基础设施和运营成本就会减少。他们不必为搜索工具雇佣专门的运营团队,这简化了技术堆栈,加快了工作完成的速度。这些因素从根本上为开发人员创造了更好的体验。
性能和速度
快速是伟大搜索体验的基础。搜索即服务依赖于可靠的基础设施,如 分布式搜索网络 ,即使在业务增长和客户需求变化的情况下,也能大规模提供闪电般的结果。搜索即服务允许网站以最少的开发投资处理更复杂的搜索需求,如替代语言搜索、允许输入错误、个性化等等。
可靠性和可扩展性
随着业务的增长,搜索功能也必须随之增长和发展。内部搜索解决方案要求开发人员管理系统备份,并解决 网络延迟 、服务器停机和/或搜索无响应的问题。另一方面,搜索即服务允许企业将支持可靠性和可扩展性的基础设施外包给第三方专家。
多通道用途
搜索即服务还允许组织用一个搜索解决方案支持多个渠道,而不是为每个渠道构建新的解决方案。因此,无论用户使用哪种搜索渠道,包括桌面 web、移动 web、移动应用程序和语音,都可以快速获得相关信息。
范围
大多数公司在自己的网站上都有多个部门、资产和数据仓库。一个好的搜索服务工具可以很容易地跨越所有这些,在一个直观、易于理解的界面上给用户一个关于你的所有内容、产品和服务的统一视图。
分析
竞争性搜索即服务解决方案的主要优势之一是能够收集用户行为,并使网站所有者能够根据这些数据采取行动。 网站搜索分析 提供了对各种页面和内容性能的可见性,揭示了哪些资源是最有影响力的,以及为什么。Analytics 还能洞察转化率、关键词、查询、CTR 的有效性等等。这些信息由“搜索即服务提供商”以直观的仪表板形式提供,有助于做出有关产品和营销策略的更大决策。通常,公司可以发现一些未满足的需求,这些需求代表着巨大的商机。
定制&灵活性
有了强大的搜索服务提供商,公司可以让业务目标和业务特定需求驱动搜索配置和搜索 UI 设计。定制确保搜索与业务案例和挑战最匹配。公司可以调整排名因素、优先级和其他元素,以不断改进搜索工具来满足客户的需求。
个性化
个性化是 未来的搜索 。搜索即服务提供商拥有数据、分析和基础设施来支持大规模个性化,这是内部解决方案和通用搜索插件通常无法做到的。
用户越觉得搜索结果迎合他们的需求,就越有机会交叉销售和追加销售相关内容和产品。组织可以同时针对多种语言进行优化,而不是一次构建一种语言,然后再逐步构建另一种语言。每次,他们还可以针对变化、复数和单数情况以及其他相关因素进行优化,以提供相关的结果。
视觉设计
当你 构建自己的搜索功能 时,你还得投资工具的 UX 和视觉设计。通过搜索即服务,搜索提供商提供了与您的网站无缝协作的视觉设计和模板。在该工具中,您可以调整这些视觉效果并测试不同的图形元素,以获得最吸引人的视觉布局。您可以从与您的搜索相互影响的不同设计元素中进行选择,如分页、过滤器和方面,以确保客户拥有直观、顺畅的体验。
功能
效率是有效功能的结果。作为服务提供商的搜索在后端功能上投入了大量资金——从及时的 索引 到对查询的快速响应,再到 联合搜索——因此您可以专注于调整和优化自己的搜索结果。虽然默认的 CMS 或电子商务平台搜索结果是通用的,通常是无优先级的列表,但优化的搜索即服务解决方案为每个网站访问者提供了高度相关的定制结果。
搜索即服务如何运作
一旦一家公司选择了 他们首选的网站搜索解决方案 ,就该让服务在网站上运行了。要实现搜索即服务解决方案,客户首先需要让云提供商能够访问格式正确的数据。
供应商通过其搜索引擎处理这些数据,因此客户可以通过 API 提供的软件访问搜索结果。该处理包括创建索引,或者指示内容包含什么的标记,其可被搜索引擎访问。当用户查询或在搜索栏中输入单词开始搜索时,该引擎会筛选索引以快速向用户提供结果。那些搜索结果根据与查询的相关性 被分类为 。
搜索供应商维护所需的硬件、计算、内存和处理能力。对于其他解决方案,客户负责购买和维护基础架构,如服务器、操作系统和补丁程序。将搜索作为服务的 API 方法不需要这些投资。
谁需要搜索即服务?
任何拥有可搜索内容或产品的网站都可以从“搜索即服务”中受益。
搜索即服务在许多不同的行业中尤其有用。在媒体或新闻业,每天或每周都会产生大量的新内容,因此访问者很难找到最相关的信息。在零售和电子商务中,不断变化和/或扩展的产品目录可能很难让用户浏览。在许多情况下,组织依赖多个搜索引擎来搜索不同的内容类型,这增加了开支,给内部开发团队带来压力,并导致用户体验不佳。
搜索即服务有助于缓解这些问题。通过一个工具,公司可以帮助用户找到广泛的内容,从存档的文章到新的视频,再到最新的调查报告。由于频繁的网站索引,结果会不断刷新,媒体网站可以运行分析来查看哪些内容是最重要的,哪些内容缺口需要填补。
和搜索即服务
搜索即服务是一种云产品,让用户、开发者和企业的搜索变得更加容易。
Algolia 是尖端的搜索即服务,旨在规模化运作。我们在高可用性架构、持续创新和个性化体验方面的投资有助于您随时为每位用户提供出色的搜索体验。
了解更多关于 购买与构建您的搜索工具 或 观看演示 了解 Algolia 的实际应用!
在浏览、发现和推荐的时代,搜索相关性是什么?
良好的搜索相关性是指找到正确的信息,以及 将客户和在线业务置于平等的地位。搜索相关性不仅试图满足顾客在他们的搜索查询中表达的 意图 ,它还使在线商家能够最有利地呈现他们的产品和服务,而不打破他们的顾客的相关性期望。
在本文中,我们将看到这种更广义的搜索相关性如何扩展到包括 浏览 和 发现 ,这些活动不一定需要从搜索框开始。
有什么关联?或者更好地说,相关性试图完成什么?
相关性算法试图(1)将查询文本与一些潜在内容进行匹配,同时(2)预测并满足客户和企业的需求。这个定义是一个相当好的总结,在某些方面很简单,但承载着大量未言明的潜力和力量——或复杂性,这取决于你看到的是半满还是半空。
推/拉的关联性
如果我们把 搜索 关联简化为关于 寻找信息 ,那么更一般意义上的 关联 可以指除此之外的东西。我们的文章对 搜索和浏览 讨论了 拉动 和 推送 内容的优点,即搜索和浏览。用户 在主动搜索并期望找到合适信息的时候拉 内容。一个业务 在用户搜索(或浏览)公司的各种数字界面时,当它主动建议或浮出信息时,就会推送 内容。
我们来对比一下两者:
| 拉取/搜索内容 | 推送/浏览内容 |
|
- 将字母、单词和短语与内容进行匹配,并过滤以向下钻取
- 权衡某场比赛的强弱(下面讨论)
- 结果排名:根据相关性对结果进行排序(首先显示最强的匹配)
- 添加自定义排名,根据受欢迎程度、利润或其他此类业务指标以及业务需求进行排序
|
- 通过营销活动推广您的产品和服务
- 管理内容和媒体
- 使用用户资料个性化搜索结果
- 根据快速变化的市场趋势和用户行为动态调整结果
- 推荐相关和“经常一起购买”的商品
- 还有更多
|
拉和推是一个整体的两个部分。你不能真的把它们分开。 适时推送合适的信息 (浏览)与一个用户 在搜索 (搜索)时拉取合适的内容没有太大区别。换句话说,它们都是为了满足用户意图而设计的——尽管方式不同。虽然本文更侧重于拉而不是推(搜索而不是浏览和发现),但在实践中,它们从未分开;他们总是作为一个完整的整体行动。我们称这个完整的画面为 关联循环 。
本文的第一部分着重于基本的搜索算法。有一篇配套文章深入探讨了搜索引擎如何实现最佳搜索相关性。在文章的最后,我们提供了关于循环的第二部分,浏览/推送功能的进一步阅读的链接。
关联循环解释
技术相关性循环——搜索引擎如何管理相关性:
功能关联循环——用户对关联的期望:
从两幅图中可以看出, 关联沿着一个循环 行进,这个循环包括拉和推信息。完整的搜索体验始于搜索查询,其中搜索引擎应用查找和排序算法来返回一组相关的搜索结果。然后,搜索引擎通过商品销售、内容管理、人工智能驱动的个性化和推荐来增强搜索结果——所有这些都取决于您如何在系统中配置这些功能。
好的搜索相关性——看到就知道
一个 衡量 好的相关性就是最佳匹配出现在你搜索结果的第一页。但那真的没有什么关联 就是 。
搜索相关性更恰当的定义是:无论什么 最佳 匹配一个搜索查询。但是“最佳匹配”是什么意思呢?是某种抽象的相关性分数吗?还是随便什么 感觉 对?如:如果它 感觉 像是匹配查询的结果,或者 看起来就是我要找的 ,那么它的相关 ?
可惜,这有点太主观了。如果我输入甲虫,看到很多看起来很吓人的虫子,引擎会显示相关的搜索结果吗?是的——即使我在寻找著名的长发音乐家,披头士。
其实,什么 看似 相关和什么 实际上 相关是有区别的。好的相关性本身没有意图。只有查询中的单词才重要。
然而,最好的搜索引擎也能读懂字里行间的意思。如果你在卖音乐,查询“甲壳虫”应该可以找到甲壳虫乐队的音乐——这可以通过打字错误容忍和同义词等技术来实现。
再假设你既卖甲壳虫又卖甲壳虫。在这种情况下,两个其他方面的相关性可能会派上用场:
- 过滤 ,可以按类别过滤(虫子 vs .音乐)
- 用户界面 ,可以显示一组 查询建议 ,比如“甲壳虫 bugs”和“甲壳虫音乐”,或者多个结果——一边是音乐,另一边是 bugs
搜索结果页面还有许多其他的用户界面,例如分类页面和重定向。这些技术有很多,目标是满足搜索者的意图和客户体验的所有可能性。
但仍然,有什么关联?相关性既有主观的也有客观的
考虑到以上所有情况,有一件事(很不幸)是真的:你认为相关的可能 没有 显示在第 1 页上。这可能是一种令人沮丧的用户体验,应该尽可能避免。然而,在某些情况下,比如音乐,总会有强烈的主观因素。
例如:对于查询“著名摇滚团体”,我们是否应该在第 1 页显示滚石乐队?结果应该只显示英美摇滚歌手吗?其他国家也在 60 年代摇摆不定。再说了,一个搜索引擎是怎么知道哪些音乐团体“出名”的?
另一个常见的问题是如何解决平局?例如,“bea”同样可以培养出像 Beans on Toast 和 Joe“Bean”Esposito 这样的艺术家,他们拥有忠实的观众,但人数较少。对此有解决方案(将结果分成不同的类别,或者限制同一艺术家的结果数量)。但是对这个问题最重要的“修复”是 as-you-type,instant-results 界面,在这里搜索结果会立即出现在网页上作为人的类型。有了即时结果,乔“豆子”埃斯波西托的粉丝可以继续输入,直到他们的艺术家出现。这种额外的输入很好,因为今天的用户乐于更精确地找到不太知名的商品。
幸运的是,并不是每个话题都有如此强烈的主观因素。如果有人在寻找“合适”的鞋子,一个好的搜索引擎应该引导用户找到最佳答案。这是通过 构造 鞋子数据来实现的。
结构化与非结构化信息
获得恰当的相关性并非易事。谷歌搜索或任何网络搜索引擎都必须让数十亿人正确筛选数万亿条(主要是)无组织的信息。
在小范围内,比如说像亚马逊这样的在线市场,搜索引擎可以更加稳定。亚马逊 知道 它的内容,知道它的客户经常使用的查询。它因此可以 构造 其内容围绕这一知识展开。
这就是像 Algolia 这样的搜索引擎的用武之地,它允许你根据你对内容的了解来定制你的搜索。Algolia 的搜索引擎不知道它搜索什么。它的 algorothms 可以搜索电影、电子商务网站上的产品、博客、医院和客户记录、Salesforce 数据集、报纸文章和其他用例。你需要以最能代表主题的方式来组织你的内容。
我们将在本文的姊妹篇中讨论这个问题。但是有必要快速了解一下构建数据集意味着什么。
创建结构化, 可搜索 内容
这里有一个很好的例子来说明我们所说的结构。一只鞋有:
- 名称
- 描述
- 品牌
- 流派
- 颜色
- 价格
- 图片
- 人气
Algolia 的相关性算法完全依赖于你如何让搜索引擎知道它在搜索什么信息。如上所述,它从创建有价值的数据集开始。但是,您还需要告诉引擎这些数据的含义。听起来很复杂,但其实很直观:
- 你告诉引擎“名字”、“颜色”和“品牌”对查找记录很重要,而不是“形象”或“受欢迎程度”。
- 您告诉它根据匹配的 质量 对结果进行排序,同时考虑输入错误、精确或部分匹配以及许多其他细节。例如,查询“Bee”应该在 Bee 之前显示 Bee,因为 Bee 是精确的单词匹配。同一查询还应该显示"Beetles " before "Beatles ",因为错别字匹配不如非错别字匹配好。
- 你可以 自定义 带有商业指标的订单,如人气、畅销书、最受听次数、点赞数和利润率。例如,显示首先匹配的所有热门项目。
- 您可以添加过滤器、同义词和其他此类基于逻辑和语言的方法。
- 最后,你可以添加关键功能,如销售、策展、人工智能、自然语言处理、机器学习、AB 测试和分析,以实现相关性优化(换句话说,浏览和发现技术可以启动 推送 相关内容)。
什么是“最佳搭配”?相关性如何衡量匹配的优势和劣势
我们经常使用“最佳匹配”、“高质量匹配”和“排名”这些术语。他们的意思是这样的。我们说“相关性”,往往是指“ 文本 相关性”,是指搜索引擎如何将用户查询的词与内容进行比较,返回匹配结果。但我们也指 排名 ,这是关于按最佳匹配对结果进行排序,通常被称为“按相关性排序”。
因此,如果一个项目与搜索框中的词匹配,搜索引擎会确定匹配是强还是弱。我们已经看到上面用查询“蜜蜂”,其中 蜜蜂 比 蜜蜂 tle 强。
最佳的比赛是最强的比赛。
为了说明这一点,想象一个使用最简单的相关性形式——逐字母比较——的搜索体验。
这里有四句名言
- “要 是, 还是不要: 那 就是这个问题”(作者威廉·莎士比亚)
- “那是 成为 的时代,那是最坏的时代”(作者狄更斯)
- “不要问你的国家能为你做什么——问问你能为你的国家做什么”(美国总统约翰·肯尼迪)
*** “很长一段时间我习惯于去 做 d 早”(作者马赛尔·普鲁斯特)**
**文本匹配可以是精确的,也可以是部分的。搜索“be”“匹配 3 条记录的文本:记录 1(“be”)、记录 2(“beST”)、记录 4(“bed”)。在本例中,记录 1 是最强的,因为它是完全匹配的,而记录 2 和 4 较弱,因为它们只是部分匹配。
继续这个例子,如果我们允许 1 个单词的错别字,那么搜索“ that ”将找到记录 1 和 3,其中记录 1(“that”)比记录 3(“what”)强,这与查询相差 1 个字母。
超越搜索——浏览和发现
既然搜索引擎已经找到了最好的记录,并根据最匹配的记录进行排序,那么是时候继续前进了。此时,企业可以考虑根据当前的促销活动或行业趋势添加或重新排序记录。它还可以将用户重定向到为他们感兴趣的项目或类别设计的页面。它还可以个性化结果,支持用户喜欢的项目(通过分析、人工智能、自然语言处理和机器学习学习)。最后,它还可以在搜索结果旁边开始推荐相关项目。我们在博客的其他地方讨论了这些。比如:
结论——各种关联
我们将以一个新的搜索示例结束。取一个相当合理的查询:“跳舞用的深色尖头鞋”。
如前所述,相关性不仅始于查询,也始于你如何组织内容。因此,“尖头舞鞋”查询的结果来自于您的数据结构如何回答这些问题:
- 我卖什么样的鞋(颜色、形状、品牌等。)?
- 普通用户输入什么搜索词?
- 我的顾客想要和寻找什么样的鞋子?
- 什么鞋最流行或最畅销?
- 我的目标群体是什么(儿童、成人、青少年)?
- 我应该添加同义词吗(例如,“尖尖的”=“尖锐的”,“跳舞的”=“舞蹈俱乐部”)
- 我应该为颜色和流派添加滤镜吗?
然后坐下来放松,知道那些尖头舞鞋会升到顶端。**
什么是搜索相关性?
原文:https://www.algolia.com/blog/product/what-is-search-relevance/
搜索相关性是对搜索查询和搜索结果之间的关系的准确性的度量。
网络用户期望很高。由于像谷歌、亚马逊和网飞这样的网站设置了高标准,他们期望准确、相关和快速的结果。然而,现实是,许多网站没有优化的结果页面,这些页面能够理解用户的意图并轻松地满足他们的需求。
如果你曾经搜索过一个网站,却只能看到一堆无用的、不相关的结果,那么你应该知道你的用户可能会有什么感受:沮丧并倾向于去竞争对手的网站寻找结果。搜索相关性是用户体验不可或缺的一部分。
网站所有者可以微调他们的搜索相关性,以对用户最有帮助的方式排列搜索结果。这可以基于多个因素,例如搜索意图、业务优先级、文本相关性、拼写准确性、用户的地理位置或搜索内容中关键词的接近度。
微调搜索相关性以获得准确性
相关性可能很难确定,因为它高度依赖于上下文和许多不断变化的变量。例如,网站的类型很重要:电子商务网站和学术网站的排序方式是不同的。搜索者的类型也很重要。收藏家和新手会有不同的意图和搜索技巧。最后,不同的人会用不同的词来表达他们在寻找什么,即使是完全相同的查询。结果排名公式必须满足这些不同的需求。
当用户在电子商务网站上输入类似“折扣”的查询时,他们希望返回符合查询条件的特定记录子集。
When a user enters a query like “discount” on an ecommerce site they want a specific subset of records that match the query criteria to be returned.
为什么搜索相关性很重要?
优化 搜索相关性 是用户体验设计中一个极其重要却又经常被忽视的方面。研究显示,43%的网站访问者会立即进入搜索栏,而这些搜索者转化的可能性是普通人的 2-3 倍。当用户得到符合他们的查询和兴趣的结果时,他们会更满意,更投入,甚至更有可能转化。因此,一个好的 UX 设计应该鼓励用户从搜索栏开始,浏览搜索结果。
此外,现代在线用户对网站的可用性有很高的期望,因此速度、易用性和设计的简单性是客户如何看待一个品牌的重要因素。
搜索相关性简史
搜索相关性的历史可以追溯到互联网的早期,当时研究人员试图找到信息检索的方法来管理每天快速增长的内容。这很快导致了搜索引擎的发明。
搜索引擎
早期的搜索引擎和协议,如 1990 年由麦吉尔大学的一名研究生创建的 Archie 和 1991 年由明尼苏达大学的研究人员创建的 Gopher,是现代搜索相关性系统发展的重要里程碑。他们使学者能够使用搜索词搜索他们通过互联网连接的其他机构的文件系统。
然而,这些早期的搜索引擎仍然非常技术性,要求用户具有先进的计算机知识和低级的互联网概念。与此同时,就在几年后的 1993 年,随着数百个网站开始上线,万维网开始蓬勃发展,引发了全新的搜索系统浪潮。
早期网络搜索引擎
很快就出现了网络爬虫,它能自动加载和更新搜索引擎索引中的网页,允许搜索更多的内容。
网络搜索引擎,如 1993 年的 Excite 和 1994 年的 Yahoo,因其易用性而迅速流行起来。它们甚至包括一些基本的统计模型,旨在理解用户查询以及它们与内容的关系。
这些新颖的早期系统采用了一种可行但有限的方法来排列与用户最相关的搜索结果。他们根据关键词在网页中出现的次数进行相关性排名,但是他们没有考虑任何其他标准来评估网页的质量。
然后改变游戏规则的谷歌搜索框出现了。谷歌于 1998 年 9 月 4 日在加利福尼亚州门洛帕克成立,通过建立其尖端的搜索引擎技术,极大地提高了搜索的相关性。2000 年代,谷歌使用更新、更强大的机器学习模型改进了搜索算法,提供了更好的相关性和预测性搜索功能,如自动完成和即时搜索。
测量相关文档搜索
随着网站数量的增加,在特定网站和数据库中搜索相关文档的需求也在增长。文档搜索是我们今天网站搜索方式的重要先驱。
传统的排名系统通常会查看文档中关键词的频率来预测它们的相关性。例如,一种称为 TF-IDF 的经典算法会查看关键词在相应文档中出现的次数(术语频率)以及关键词在存储库中所有其他文档中出现的次数(逆文档频率)。后一种分析有助于过滤掉通常是噪音的常见单词,如介词。
虽然 TF-IDF 和其他此类早期相关性方法擅长通用文档搜索,但它们未能利用大多数网站包含的附加结构和元数据。现代内容包含标题、描述、类别、标签和更多基于关键字的信息,可用于解释网站内容和提高搜索相关性。
随着时间的推移,搜索引擎公司已经开发出 TF-IDF 的替代方案,例如,通过更多地依赖关键字算法而不是统计。对于我们自己的搜索引擎,我们开发了一个平局决胜和自定义排名系统,使企业更容易看到引擎盖下发生的事情,这使他们能够根据自己的需求定制相关性。
随着更新的语义搜索功能的出现,也有更复杂的排名质量模型来对搜索相关性进行评分,包括 nDCG,归一化的折扣累积增益,它可以确定一组查询结果对于特定查询的排序情况之间的相似性。分数越高,相关度越高。我们增加了神经技术和向量搜索的评分,以扩展我们的关键字搜索对更多用例的相关性。还有其他方法,如 MRR(平均倒数排名)和 MAP(平均平均精度),每种方法都有自己的优缺点。
为了获得更好的相关性,搜索索引中记录的质量很重要。关键字和语义搜索的好坏取决于数据的质量,这就是为什么数据清理可以处理缺失值或有噪声的数据,构建来自不同来源的数据集以便更好地进行分析,以及改进标题、描述、标签、标题和元数据等内容可以极大地影响搜索质量分数。
实现搜索结果提升和优化
如今,随着网站内容和产品供应的增长,优化搜索相关性是单个网站搜索引擎的主要考虑因素。企业生产自己的相关性需要考虑到他们的具体业务需求,使他们的搜索有用。
例如,一个电子商务品牌可能拥有数千种不同的产品和不同人口统计的客户。因此,当客户搜索产品时,内部搜索引擎必须能够提供不仅与查询相关,而且与特定用户上下文相关的结果。
今天的搜索引擎还必须知道如何处理同义词、错别字、多词查询,甚至是问题。搜索引擎使用自然语言处理(NLP)来帮助阅读、理解和理解人类语言。
此外,营销人员可能希望推销与其店内商品类似的季节性商品 商品 商品,或者企业经营者可能希望推销利润更高的商品。因此,相关的搜索系统还必须能够将这些因素考虑在内,并提供可以随着时间的推移进行调整以满足这些需求的自定义排名。
然而,这些算法中的许多仍然很笨拙。为了改善这一点,一些算法 考虑了 匹配属性的重要性和关键词的接近度。通过这样做,搜索结果比通用搜索算法更有可能与用户相关。
最近,为了提高相关性,搜索设计者一直致力于构建更多的个性化和情境化。这包括像机器学习和自然语言处理这样的技术,以实现更多的对话式搜索,跟踪用户搜索和浏览历史以允许对查询进行自定义解释,以及对网页进行自动标记和分类,以便在比简单的文本关键字更高的层次上理解内容。
用 Algolia 微调你的搜索相关性
优化网站的搜索相关性是一个复杂且持续的过程。它不仅需要提供与用户查询相匹配的结果,还需要为用户提供个性化的结果,同时满足您自己特定的业务需求。此外,随着用户越来越多地转向支持语音的设备和数字助理,企业将不得不找出如何提供一种新型的界面,能够与用户自然交谈。
为了向您的客户提供所有这些功能,您需要一个搜索即服务合作伙伴,提供所有行业最佳实践和现成的最先进功能。更好的相关性对于一个网站或内联网上的客户是获得好的搜索体验还是坏的搜索体验有着巨大的影响。
什么是 searchandising?
在实体零售销售中,店主和经理可以安排商店的库存和布局,以促销某些商品和满足顾客需求。这个过程在电子商务商店中同样重要,在电子商务商店中,产品的组织极大地影响了客户的体验和与品牌的互动。
通过 searchandising,企业可以将实体商品销售的好处带到电子商务商店,引导客户在网站上进行一次引人入胜的旅程。
Searchandising,也称为 searchandizing 或 search merchandising,是以推动电子商务商店销售、转化和 KPI 的方式管理搜索结果的过程。
Searchandising 允许产品所有者、营销人员、商家和网站所有者推广产品,以符合业务目标的方式组织搜索结果,甚至跟踪人们如何与产品互动。搜索是一个迭代和持续的过程,可以不断改进,最终推动更多的销售。
为什么 searchandising 很重要?
在电子商务网站上,近 30%的用户直接进入搜索框。这些搜索者已知转换 比正常被动浏览器高 5-6 倍 。搜索代表着如此巨大的机会,为什么没有更多的电子商务网站投资搜索和设计呢?
老实说,对许多公司来说,搜索是一个黑匣子。企业主和网站经营者通常对搜索没有什么所有权,这意味着他们:
- 不知道为什么产品在给定搜索中排名靠前
- 靠开发者做排名变化
- 努力获取关于 搜索特定结果的良好数据 做出决策并迭代
借助强大的 搜索即服务 解决方案,然而,企业主和营销人员可以接管搜索的所有权。他们可以微调自己的相关性规则,在试运行环境中测试变更,对生产中的变更运行 A/B 测试 ,并监控一段时间后的结果,以确定成功与否并确定未来开发的优先级。
通过加强对网站搜索的控制,企业也可以在比实体店更大的范围内进行网上销售。(想想 10,000 件产品,而不仅仅是 10 条过道。)通过帮助客户准确找到他们想要的东西并快速购买,这提供了更好的用户体验。
searchandising 如何工作
Searchandising 允许您快速调整搜索引擎的相关性,以适应您的业务需求、营销活动、关键绩效指标和其他特定需求。Searchandising 的工作原理是在网站内部搜索引擎的基本相关性规则上覆盖特定业务的规则。这使得公司能够通过针对给定的搜索项推广、增加和/或隐藏产品来动态地适应业务目标。
这还可以更进一步。高级搜索和设计利用搜索分析数据进一步细化搜索结果。您可以检测用户意图和趋势,例如表现不佳的查询和趋势主题。然后你可以推销你的搜索查询和关键词,以确保你引导你的用户找到他们关心的东西。
网站搜索功能,如自动完成、最近搜索、搜索建议和相关查询,都可以用来推销和推广产品。
搜索策略
你可以采取一些行动来利用搜索和设计:
- 个性化 。通过向用户证明上下文相关和 个人相关的 内容,可以增加用户点击通过和转化的几率。
- 使用搜索规则 。手动提升、隐藏和排序搜索结果可以让您根据一年中的时间、业务目标和其他 KPI 向用户推广某些类型的产品。
- 推荐产品 。向用户展示相关产品并不一定要在产品或收藏页面上。在搜索中直接这样做可以提供直观的用户体验,并为交叉销售和追加销售提供机会
- 开展搜索活动。通过在搜索结果页面上添加展示广告和推广横幅,您可以轻松推广产品、内容和其他重要资源。
- 轨道数据。销售和搜索是反复和持续的过程。监控用户互动以决定如何调整搜索相关性和产品供应。
为你的电子商务网站搜索和定位
有效、持续的搜索和设计要求非技术用户能够快速、轻松地测试网站搜索的变化。要做到这一点,您需要一个搜索即服务解决方案,它对于个性化的高级搜索来说足够强大,但对于任何人来说都足够容易监控结果和测试增强功能。
看看超越框框的搜索 ”看看搜索如何改善客户体验,推动电子商务网站的转化。
什么是站点搜索?
原文:https://www.algolia.com/blog/product/what-is-site-search/
站点搜索是一项功能,它使用户能够快速、有针对性地搜索给定网站的内容或产品目录。一个伟大的网站搜索功能是为特定的网站量身定做的。一个优秀的网站搜索不仅会不断地对网站进行索引,以确保最新的内容易于访问,它还会引导用户浏览网站内容,帮助他们发现他们可能甚至不知道自己感兴趣的内容。最好的网站搜索产品让用户高兴,因为它允许他们快速连接到他们需要的内容,同时获取关于访问者最感兴趣的内容和产品的有价值的数据。
为什么站点搜索很重要?
像谷歌这样的搜索网站以及像亚马逊和 YouTube 这样以搜索为中心的网站是我们互联网体验不可或缺的一部分。因此,毫不奇怪,当搜索单个网站的产品、内容或信息时,访问者希望获得与这些网站相同的便捷性和速度。
搜索栏是网站功能和设计的重要组成部分,对于我们大多数人来说,使用没有搜索栏的网站会显得——嗯,很奇怪。在设计网站时,搜索栏是显而易见的,但是真正有用的网站搜索不仅仅是有一个搜索栏。
研究表明,使用搜索的访问者找到他们正在寻找的东西并转化为客户或潜在客户的可能性是仅仅浏览的用户的 3 倍。搜索也是访问者告诉你他们在找什么的最好方式,并给你机会根据访问者的具体需求来定制网站。
强大的网站搜索可以对你的网站产生强大的影响:
提升用户体验
一个网站可以有令人敬畏的内容或非凡的产品,但如果用户找不到,他们很可能会感到沮丧。出色的网站搜索体验将快速相关的搜索结果与出色的搜索后发现体验结合在一起,允许用户过滤结果、浏览不同类别的内容,甚至推荐相关的热门搜索。易发现性导致访问者和你的内容之间积极和持续的互动。因此,你应该考虑网站搜索对用户体验(UX)的重要性,就像美学和功能性一样。
降低跳出率
来自 KISSmetrics 的研究表明,12%的网站访问者在不满意的搜索后会离开并选择竞争对手的网站。不要赶走你的客人!如果你提供一种奇妙的搜索体验,你的网站可以成为访问者空手离开竞争对手网站后转向的网站。
升压转换
当你帮助访问者第一次找到他们想要的东西时,这对销售和参与度有着巨大的影响。事实上,根据 Forrester research 的研究,多达 43%的访问者在访问一个网站时会立即将 导航到搜索栏。
以客户为中心的网站搜索对企业绩效有着有益的下游影响。一个专用的网站搜索解决方案允许企业保持对网站上可搜索和推广内容的控制,并为用户提供有用的建议。网站搜索对于一个网站的日常健康和运营是如此重要,以至于它不应该被当作一个事后的想法。
站点搜索对你的企业的好处
那么,这种以用户为中心的方法是如何帮助提振业务的呢?你可以使用强大的搜索功能,以几种方式实现更健康的底线:
让用户更好地了解你的产品、服务或内容
你的访问者发现你网站上提供的东西越多,他们获得的知识就越多。这种知识可以很容易地转化为行动,尤其是如果这是游客所需要的。一个好的网站搜索有助于一个简单的发现过程。而自然发现用来抓住并保持用户的注意力。
分析并利用有价值的数据
用户每次搜索你的网站,都会产生有价值的 用户意图数据。 用户在用自己的话告诉你他们的欲望 。 借助网站搜索分析功能,你可以做出如下战略性举措:
- 优化你的结果: 区分相关性的优先级有助于减少用户筛选结果的时间。一旦你评估了趋势和你自己的商业目标,一个强大的网站搜索将允许你根据诸如受欢迎程度或 Twitter 喜欢或转发等属性来微调相关性,以确保 最相关的结果 对网站用户排名最高。
- 填补内容空白: 访问者可能正在搜索你甚至还没有考虑过要写的内容主题。
- 更了解你的用户: 谁在搜索你的产品?他们住在哪里?哪些产品在哪些月份最受欢迎? 网站搜索分析有助于市场细分。
提升你的 SEO 力度
有效的网站搜索提高了 你的网站的整体 UX,这是谷歌在对网站进行排名时看重的东西。网站搜索还需要对内容进行逻辑的、层次化的组织,这有助于像谷歌这样的搜索引擎理解你的核心主题和产品(以及它们是如何组合在一起的)。
另外,如果你的访问者经常在你的网站上搜索一个单词或短语,他们可能也在谷歌上搜索这个关键词。因此,当你在你的网站上发现搜索率很高的词时,你可以制定策略来解决这些关键词 背后的 用户意图。
缓解成长的烦恼
网站的扩张,包括增加日常内容和/或新的产品线,实际上会损害 UX。 当一个网站显著增长时,定位一个确切的项目就像在不断增长的干草堆中寻找一根针。但是有了正确的网站搜索,对于访问者来说,大海捞针并不是一个负担。他们可以很容易地找到他们需要的东西,并获得其他相关内容的建议,以继续他们的旅程。
哪些类型的网站应该具备网站搜索功能?
内部站点搜索可以让任何网站或技术平台更容易使用。积极的网站搜索体验会带来更多的回头客、更多的订阅、更强的品牌形象和更少的用户投诉。
然而,这里有一些类型的网站可能会从有效的网站搜索中受益最多:
电子商务网站
当购物者知道他们在寻找什么时,他们不会想在众多产品类别中寻找。你也不希望他们这样做,因为浪费时间就等于失去客户。因此,在任何时候,尤其是在 最繁忙的购物季节, 给你的访客最好的网上购物体验是至关重要的。帮助他们轻松搜索、查找和购买,并看到投资回报的增加。
媒体网站
媒体网站上的内容不断扩大和变化。读者和视频观看者很容易在这样一个内容丰富的环境中迷失方向。网站搜索可以帮助他们找到它,引导他们到感兴趣的新的相关主题,并延长他们在网站上停留的时间。
SaaS 公司
软件即服务(SaaS)平台允许客户搜索他们创建的数据,可以极大地增强用户体验。而且随着每一家 SaaS 公司现在平均面临几乎 10 个竞争对手 ,提供一个比竞争对手更好的 UX 比以往任何时候都重要。
受益于内部网站搜索的其他类型的高搜索网站包括网络论坛、维基和知识库。 医疗保健和金融行业 的企业也能从顺畅的网站搜索中受益匪浅。
如何选择合适的内部站点搜索
不是所有的网站搜索平台都是平等的,价格只是众多因素中的一个。寻找一个平台,提供您需要的所有功能,以提供高级搜索体验——无论是现在还是未来,随着您的站点的增长。这里有几个要寻找的特征。T34
- 分析: 没有具备分析能力的站点搜索,很多站点搜索的好处都无法实现。确保你选择的平台能够让你了解你的访问者,并不断完善你的网站。
- 定制: 最好的网站搜索平台可以让你将访问者的个人资料纳入排名策略。然后,该平台可以 根据访问者之前的搜索和网站行为,对他们看到的结果 进行个性化处理。
- 功能: 网站搜索功能应该能够可靠、快速、轻松地执行,并具有打字错误容忍、建议、过滤器、同义词和多语言选项等功能。
- 方便开发者: 选择一个平台,这个平台是为了与你的开发者合作而设计的,而不是与他们作对。它的实现和维护应该是直观的(很可能甚至可以被很少或没有编码技能的团队访问),与许多集成一起工作,提供 24/7 支持,并有一个活跃的开发人员社区。实现一个网站搜索平台应该是一个令人兴奋的里程碑,而不是一个痛苦。
- 安全性: 您的内部搜索平台应该提供 SOC 2 和 SOC 3 合规性、API 密钥、集群隔离和多租户架构等安全特性。
- 可靠性: 有了网站搜索这样一个客户体验不可或缺的组成部分,你就无法承受停机或不可靠的解决方案。寻找建立在 可靠基础设施上的可信解决方案 ,在问题影响到你之前,让团队专门处理问题。
看看 Algolia 如何改善你的站点搜索
像 Lacoste、Stripe、Twitch 和 Birchbox 这样的世界知名品牌都把 Algolia 作为他们网站搜索引擎的首选。其强大的搜索功能、分析、安全性和易用性值得信赖,它是一个开箱即用的解决方案,深受 web 访问者和开发人员的喜爱。
看看 Algolia 能为你做什么, 开始免费搭建。
什么是矢量搜索?
向量搜索是一种使用机器学习模型来查找具有相似特征的相关对象的方法,该机器学习模型检测索引中对象之间的语义关系。
矢量搜索和推荐的解决方案越来越普遍。如果你想在你的网站上添加一个自然语言文本搜索,创建图片搜索,或者建立一个强大的推荐系统,你将会希望使用向量。
这背后的研究已经进行了几十年,但到目前为止,只有谷歌、亚马逊和网飞等最大的公司才能建立和扩展矢量搜索。这些公司雇佣了数千名工程师和数据科学家,一些公司甚至开发了自己的计算机芯片,以提供更快的机器学习。
今天,几乎任何一家公司都可以用很少的时间和价格部署矢量搜索和推荐。Vector 技术为开发人员开启了一个全新的时代,让他们能够构建更好的搜索、推荐和预测解决方案。
本博客介绍了矢量搜索及其背后的一些技术,如矢量嵌入和神经网络。此外,我将简要介绍神经散列法,这是一种能够更快、更有效地传递向量的新技术。
语言问题
语言往往模棱两可,模糊不清。两个词可以表示同一个意思(同义词),或者同一个词可以有多个意思(多义词)。例如,在英语中,“神奇的”和“棒极了”有时是同义词,但“棒极了”也可以表示许多不同的意思——鼓舞人心的、令人畏惧的、神圣的,甚至是丰富的。
向量嵌入(也称为单词嵌入,或简称为向量)以及不同的机器学习技术,如拼写纠正、语言处理、类别匹配等,可用于构建和理解语言。
什么是矢量嵌入?
矢量化是将单词转换为向量(数字)的过程,这使得它们的含义能够以数学方式进行编码和处理。你可以把向量想象成代表某种东西的一组数字。在实践中,向量用于自动化同义词、聚类 documents、检测查询中的特定含义和意图以及对结果进行排序。嵌入是非常通用的,其他对象——像整个文档、图像、视频、音频等等——也可以嵌入。
我们可以用一个简单的三维图来可视化矢量:
Image via Medium showing vector space dimensions. Similarity is often measured using Euclidean distance or cosine similarity.
你和我都能理解诸如“国王”、“女王”、“统治者”、“君主”和“皇室”等术语的含义和关系有了向量,计算机就可以通过在 n 维空间中把这些术语聚集在一起来理解它们。在上面的三维例子中,每个术语可以用坐标(x,y,z)来定位,并且可以使用距离和角度来计算相似性。
在实际中,可以有几十亿个点,几千个维度。然后,可以应用机器学习模型来理解向量空间中距离较近的单词(如“国王”和“王后”)是相关的,距离更近的单词(如“王后”和“统治者”)可能是同义词。
向量也可以通过加减乘除来寻找意义和建立关系。最通俗的一个例子就是 国王——男人+女人=王后 。机器可能使用这种关系来确定性别或理解性别关系。搜索引擎可以利用这种能力来确定一个地区最大的山脉,找到“最佳”的度假路线,或者确定健怡可乐的替代品。这些只是三个例子,但还有成千上万个!
如何创建矢量嵌入
一些最早的将单词表示为向量的模型和尝试 可以追溯到 20 世纪 50 年代 根源于计算语言学。在 20 世纪 60 年代,关于语义差异的研究试图测量单词的语义或意义。【NLP】,一种分析文本以推断意义和结构的方法,开始于复杂的手写规则集,但在 20 世纪 80 年代转向了新的机器学习模型。NLP 今天仍然在搜索引擎中使用,以帮助构建查询。
在 20 世纪 80 年代后期,一种新的统计模型,潜在语义分析(LSA),也称为潜在语义索引(LSI),被开发用于创建向量和执行信息检索。LSA 非常擅长通过分析哪些术语经常一起使用来理解文档相关度,以建立语义相关度模型 (例如,“皇室”和“女王”)。
这是处理某些问题的好方法——例如同义词和多义词,以及测量对象之间的距离(或相似性)——但是,它很难扩展。LSA 的计算开销很大,尤其是当矢量数量增加或基础数据发生变化时,例如,每次更新目录时。
2013 年,word 2 vec作为利用神经网络理解词语相似度的新模型被推出。像 LSA 一样,Word2Vec 可以用来创建单词嵌入,然后经过训练找到语义相似的文本。
Image via IBM
顾名思义,神经网络是类似大脑中神经元的机器学习网络。神经网络的基础是一种称为深度学习的机器学习。神经网络中的每个“神经元”本质上只是一个数学函数。计算每个神经元输入的加权总和;输入的权重越重要,它对神经元输出的影响就越大。
你可以在语音助手、面部识别、自动驾驶汽车和许多其他应用中找到深度学习。深度学习可以在庞大的数据集上训练,能够识别大量复杂的模式。
矢量搜索结果的例子
如今,有各种各样的矢量嵌入模型来处理不同的数据,如图像、视频和音频。还有许多免费提供的矢量数据库,带有矢量嵌入和距离度量,表示矢量之间的接近度或相似度。
也有各种算法可用于搜索矢量数据库以找到相似性。其中包括:
- ANN(近似最近邻):一种使用距离算法定位附近矢量的算法。
- kNN:一种使用邻近度来预测分组的算法。
- (SPTAG)空间划分树和图:大规模近似最近邻库。
- Faiss:脸书的相似性搜索算法。
- HNSW(分层可导航小世界):一种用于确定相似性的多层图方法。
在这些不同的技术之间存在权衡,你经常会看到多种技术被用来更快、更准确地交付结果。这些不同的技术将提供更好的结果,甚至对于难以处理的查询。我们将在未来的博客中讨论这些不同的技术和权衡。
例如,当搜索电子产品目录时,人们有时会键入“usbc”、“usb-c”或“usb c”。这些是一个意思,还是三个不同的项目?关键字引擎可能很难处理这种格式,通常您可能需要创建 if/then 规则来指导搜索引擎如何管理这个查询。然而,对于矢量搜索,这不是问题。向量搜索引擎将知道提供类似的结果。
这里有一个更有趣的例子:
在我们拥有 20,000 多种产品的测试数据库中——其中仅包含产品名称和品牌名称——我们搜索了“咖啡礼品卡”(如上)。“咖啡”一词不在星巴克礼品卡的描述中,但是,向量引擎可以将“咖啡”和“星巴克”联系起来,以返回良好的结果!
矢量搜索挑战
向量嵌入帮助我们找到文档之间的相似性。就相关性而言,对于许多类型的查询,向量搜索优于关键字搜索。如果它们真的很棒,为什么我们不使用矢量搜索来搜索一切呢?事实上,对于许多查询类型,关键字搜索仍然提供了更好的相关性。此外,矢量搜索不是非常有效,并且在历史上,如果不在计算机处理方面进行大量投资,就无法扩展。随着新的,最近推出的神经哈希功能,矢量搜索终于能够规模。以下是更多相关信息。
准确率 vs 关键词搜索
矢量搜索非常适合模糊或宽泛的搜索,但关键字搜索仍然是精确查询的主宰。顾名思义,关键字搜索试图匹配精确的关键字。其他功能,如自动完成、即时搜索和过滤器也使关键字搜索流行起来。
例如,当你在关键词引擎上查询“阿迪达斯”时,默认情况下你只会看到阿迪达斯品牌。矢量引擎的默认行为是返回 相似的 结果——耐克、彪马、阿迪达斯等..都在同一个概念空间里。关键字搜索仍然为具有特定意图的短查询提供更好的结果。
速度和比例
向量搜索更有可能出现瓶颈,因为查询必须进行复杂的向量计算来预测关系,而不是仅仅读取基于列的索引。机器在不同的入站进程之间分配 CPU 时间。事实上,大部分嵌入也需要 GPU 推理,包括查询,所以这在某些方面甚至更复杂。
为了应对这种情况,搜索引擎要么需要更强的计算能力,要么必须更快地处理同样的查询。向量搜索公司多年来一直在推广向量人工智能的好处,但成本和性能问题阻碍了它的进展,并引发了对其可行性的担忧。
一些提供矢量搜索模块插件的公司试图通过只运行矢量搜索来回避问题,如果关键词搜索结果很差的话。这意味着你可以选择其中一个——关键词或向量,速度或质量——但不能两者同时进行。
有些人认为缓存是解决这个问题的好方法。有观点认为,通过缓存结果,您几乎可以消除成本并立即提供结果。在实践中,搜索查询变化很大,缓存的成本效益往往是可疑的。搜索的缓存率可能会非常低,尤其是对于拥有大量长尾内容的网站(使用我们自己看到的客户数据,o n 平均来说,50%的流量是长尾查询,这些长尾查询不够频繁,无法被缓存 )。
解决所有这些问题——准确性、速度、可伸缩性和成本——的一种方法叫做神经散列法。我们将简要解释它是如何工作的。
二元向量
矢量可以工作,但如上所述,其速度和规模有限,会影响性能和成本。我们采取了一种不同的方法,称为 神经哈希 ,这种方法不需要权衡就能利用向量。
Vector search engines use neural networks and deep learning models to deliver semantic search capabilities.
神经哈希使得基于向量的搜索与关键字搜索一样快,并且这是在不需要 GPU 或专用硬件的情况下完成的。神经散列使用神经网络来散列向量——将向量压缩成二进制散列(或二进制向量)。你可能听说过哈希;加密哈希是一种常用的安全技术,用于为受保护的密码比较生成微小、唯一的输出。
在性能方面,这些散列向量可以在商用硬件上运行,保留 96%(或更多!)的矢量信息,并且可以比单独计算矢量快上百倍的 。
现在,如果有某种方法可以将关键字搜索和神经散列结合到同一个查询中…
混合搜索
混合搜索是一种将全文关键词搜索引擎和矢量搜索引擎结合到一个 API 中的新方法,可以两全其美。
对于同一个查询,同时运行关键词和矢量引擎是非常复杂的。一些公司选择通过顺序运行这些过程来绕过复杂性——他们运行关键字搜索,然后,如果没有达到某个相关性阈值,则运行向量搜索。这方面有很多不好的权衡,比如速度、准确性、过滤和堆排序。这些所谓的双系统受到影响,因为向量数据库通常没有相同的(或任何)过滤能力,所以它们会返回大量不必要的信息。
真正的混合搜索是不同的。通过将全文关键词搜索和向量搜索结合到单个查询中,客户可以快速获得更准确的结果。对于 Algolia,我们已经将神经散列与我们世界一流的快速关键字搜索技术结合到一个单独的 API 调用中。它可以扩展以满足任何规模的数据集的需求,即使是对于频繁更新和删除的大量更改的索引,也不会产生任何额外的开销。
希望这已经为你提供了一个很好的矢量搜索概述,以及它如何从根本上改善你的网站的搜索结果!
敬请关注。全新的 Algolia 搜索体验即将推出!S 登录通知可用:
什么是语音搜索优化?
想象一下,你第一次去商场,突然很想吃披萨,而且必须是纯素食的。你是怎么处理的?随便问个人美食街在哪?去每个食品摊贩那里看看他们有没有展示素食披萨?
大概不会。你拿出手机,对吧?
当然。但有趣的是 你接下来可能会做什么。
越来越多的人不再在搜索栏中输入搜索词,而是使用智能手机(或其他设备)作为虚拟助手进行快速语音搜索(尤其是当你饿了的时候?).你会听到智能手机用户用自然语言说语音命令,比如(对苹果的 Siri)“我在哪里可以买到素食披萨?”或者“好的谷歌,我附近最好的素食披萨在哪里?”无论他们是在旅途中使用手机应用程序语音搜索功能,还是在客厅使用亚马逊 Echo 智能扬声器进行查询,这一趋势都将成为主流。
因此,对于渴望成功的企业来说,针对 SEO(搜索引擎优化)的语音搜索优化是必不可少的。SEO 专业人士、营销经理和内容创作者都必须重新思考如何优化他们的电子商务网站、营销活动和内容,以反映对语音搜索技术的日益重视。
为了帮助您改善企业的语音搜索结果,让我们来探索一下您需要如何、由谁、何时、何地以及为何开始整合词语,例如 如何谁何时**何处 以及因为使用那些疑问词是实现成功语音搜索优化的方法之一。
语音搜索趋势
更多的人开始习惯于在对 其他人 对 他们的手机讲话。这种 趋势 波及范围远不止语音搜索一项,尤其在年轻一代中。单向类型的说话,如视频日志、语音笔记、抖音和 Instagram 卷轴,现在很流行。对着电话说话而不期望有人回应是很常见的。但最关键的是,不仅仅是 而是 年轻一代正在拥抱虚拟助手和语音搜索,这是每个人。
说明这一现象的几个统计数据:
- Statista 称美国有超过1.1 亿的语音搜索用户
- 根据凯捷的调查,70%的消费者使用语音功能购物,而不是去商店
- 2024 年,在设备中使用的 数字语音助手 将超过使用它们的人
来自 Gartner 的研究表明,新冠肺炎·疫情可能也在推高语音搜索量方面发挥了作用。首先,被困在室内的人可能已经把亚马逊 Alexa 作为他们唯一的(或首选?)公司。此外,在公共场合,如果人们可以直接对着耳机麦克风说话,从 Siri、Alexa 或 Cortana 获得答案,他们就不太愿意拿出手机来触摸屏幕。
如何优化语音搜索进行 SEO
因此,无论是使用手机还是通过数字助理,语音搜索正在改变人们寻找所需的方式。公司正在转向语音搜索优化,以满足日益增长的需求,并确保他们的客户能够成功完成搜索。
你需要做些什么来优化你的语音搜索应用?如何能让你的语音搜索在线完美?你如何锁定本地语音搜索搜索引擎优化目标?
在确定语音搜索优化的 SEO 策略时,有三个主要方面:关键词和语气、网站内容以及完善本地搜索的机会。
关键词和语气
如果你想一想人们如何使用语音搜索——特别是,他们可能如何构建他们的搜索查询——你会注意到与传统的在线搜索相比有一些不同。
让我们想象一位女士下午 3 点要去林肯纪念堂,她想知道天气会怎么样。使用键入的谷歌搜索,她可能将她的查询框定为“华盛顿州 DC 的天气”,并迅速得到下午的天气预报。
如果她用谷歌语音搜索同样的信息,她很可能会表达为“今天下午华盛顿特区的天气预报如何?”或者“今天华盛顿特区会下雨吗?”或者可能是“Siri,我需要一把伞吗?”
典型的语音搜索:
- 几乎总是作为一个问题出现
- 是会话式的
- 比文本字符串长
同样值得注意的是,在语音搜索中,说话者可能会假设一些上下文理解。例如,如果他们想研究产品以及在哪里可以买到它们,他们可能会假设他们的位置是已知的,而不会在他们的语音查询中包含这些细节。
这些参数为语音搜索优化提供了一些提示。你应该用问题形式的长尾关键词。这意味着在字符串的开头使用那些疑问词——如何、谁、何时、何地以及为什么*——*。此外,在所有内容中使用对话语气,包括关键字,并包括填充词,如 the、of、to 和 for。
网站和内容
如何组织网站内容对人们的语音搜索成功至关重要。这里有几个因素需要考虑。
目标“丰富”答案
丰富答案(或“丰富结果”)是出现在搜索结果正上方的信息的 片段 。这些结果是从排名靠前的网站内容中提取出来的。他们以谷歌认为全面的方式回答问题。
因为语音搜索用户期望快速响应,所以出现的是丰富的答案——包括特色片段、知识图表、知识面板和知识框。对于语音搜索优化,您需要创建 web 内容,这些内容可能是优秀的丰富答案的候选材料。
这可能是一个挑战,但你通常可以通过使用包含长尾关键词的问题作为博客帖子或网页的标题来实现。接下来的文字应该简短、简洁、直接地回答你提出的问题。
包括常见问题(FAQ)
另一个有效的做法是添加一个 FAQ 页面,或者在页面底部添加一些适用的 FAQ。这很有效,因为 FAQ 结构是一个常见问题,后面跟着一个快速回答。
为移动用户优化你的网站
因为语音搜索大多发生在 移动 设备上,所以你的网页必须针对移动设备进行优化。
提高你的站点页面速度
因为需要以闪电般的速度回答语音搜索查询,所以需要快速的网站页面加载来吸引算法。
完善本地搜索的机会
大多数移动语音搜索查询都围绕着当地的地理位置和环境信息(比如在哪里可以找到素食披萨)。与本地区域相关的语音搜索并不适用于所有类型的企业,但对于酒店和零售本地企业,它应被视为您营销策略的一个关键部分。
语音搜索优化的最佳工具
我们对语音搜索优化策略的讨论到此结束;希望这些建议对你有用。
借助 Algolia 强大的搜索 API,您可以预测语音搜索者想要什么,准备好您的本地化内容,以便搜索引擎可以轻松地将这些内容提供给使用手机的人,总体而言,为您的用户提供愉悦的体验。
在 Algolia,我们帮助公司应用 语音搜索最佳实践 到 优化 网站和应用程序内部语音搜索的方方面面。例如,下面是我们如何帮助weight watchers实现语音搜索以改进其健康应用。
我们已经准备好帮助您构建个性化的移动搜索体验,以提升您的品牌。您可以使用原生浏览器 语音到文本支持 将语音搜索添加到您的移动搜索体验中。
查看我们关于 的网络研讨会,了解如何打造 卓越的语音搜索体验,并在 零售 中使用语音搜索,然后 联系我们 以便我们帮助您入门!
什么是语音搜索?
让搜索变得前所未有的简单
语音搜索,也称为语音搜索,让人们通过说话而不是在搜索框中输入文本来请求信息。简化和精简搜索过程以改善用户体验的趋势推动了语音搜索技术的发展。这种受欢迎的用户界面可以取代键盘输入的查询,从而节省时间并减少工作量。
一种澎湃技术
语音将永远是人类最好的交流工具,仅仅这个原因就使语音搜索成为一个引人注目的选择。 这里有一些统计数据 说明了使用语音技术和语音设备进行搜索的重要性日益增长:
- 到 2024 年,智能音箱市场(用计算机生成的声音响应口头命令的独立设备)将超过 300 亿美元
- 没有语音助手的人中有 34%有兴趣购买一个
- Gartner 的一项研究预测,到 2020 年,30%的浏览会话将包含语音搜索
- Juniper Research 的分析师预测,到 2023 年,基于语音搜索的电子商务将增长到每年 800 多亿美元
随着与疫情相关的在线购物的激增以及大量新产品涌入在线市场,专家预测对以语音为中心的用户体验的需求将会更大。
语音搜索给用户和电子商务购物者带来的好处
通过语音搜索节省了时间,因为无需调出搜索引擎网页并在搜索框中输入问题。从当地餐馆的评论到最新的体育比分,语音搜索使信息访问变得自发、方便和容易。当搜索引擎使用先进的自然语言理解来生成想要的答案时,这项技术可以成为一个值得信赖的“顾问”。
语音搜索电子商务简化了寻找产品和探索购买选项的过程。语音驱动的购物明显比在网上搜索框中输入文本要快,它为个性化、无障碍搜索和追加销售提供了新的机会。
例如,假设您正在网上购物,就在完成订单之前,一位支持语音的购物助理告诉您,您的订单上有一个诱人的附加产品,需要多付一美元。很有可能你会注意到这一点,你很可能会把它加到你的购买中。
根据WhatIs.com,语音搜索的热门应用有:
- 搜索引擎查询
- 请求特定信息,如股票报价或体育比分
- 启动程序和应用
- 选择搜索选项
- 在音频或视频文件中搜索内容
- 免提声控拨号
语音搜索的准确性需要有效使用人工智能(AI)和机器学习。人工智能使语音功能足够智能,可以捕捉购物行为和习惯。
基于人工智能的自然语言理解(NLU),让用户可以轻松地找到他们正在寻找的东西,即使他们不确定他们到底需要什么。用户可以简单地用简单的语言问一个问题,而不是输入导致“没有找到结果”的关键字,例如,“来自 1990 年代的高度评价的浪漫喜剧电影”
通过利用人工智能和 NLU 的能力来检测重要的细节,加上说话者的意图,Algolia 将口头请求的重要部分分解开来,并准确推断出用户想要什么。从电子商务的角度来看,这可以让客户更快地找到他们想要的产品,从而带来更多的转化率和更多的销售收入。
此外,通过分析之前的购买行为,语音助手可以提醒在线购物者他们已经购买的产品以及可能再次购买的产品。这种自发的引导不仅为购物者增加了便利, 它还可以作为营销人员和品牌的业务助推器 。
语音搜索是新的移动
十多年前,移动设备和智能手机革命席卷全球,令许多开发者和营销人员措手不及。现在,语音搜索正在创造同样的剧变,由几个流行的 iOS 和 Android 应用程序和设备实现。以下是一些几乎已经家喻户晓的产品和服务:
谷歌助手
“嘿,谷歌”是推出这款基于数字语音的应用程序所需要的一切。Google Assistant 使用 Google 搜索索引来查找查询的答案,并根据收到的信息给出口头回应。本质上,谷歌助手为用户进行谷歌搜索。Google Assistant 的功能也可以通过 Google Actions 或品牌可以创建的第三方应用程序进行扩展,用户可以调用这些应用程序与品牌进行交互,或者为他们的助手添加新功能。
谷歌智能助理设备
谷歌的独立智能助理设备使用谷歌助理。谷歌主页是一个小型扬声器设备,而谷歌主页中枢增加了一个屏幕。对于那些通过看而不是听学习得更好的人来说,屏幕尤其有用。谷歌家庭中枢可以显示图形和视频来清楚地说明某件事是如何完成的。
Amazon Alexa
与谷歌助手(Google Assistant)的功能相似,Alexa 可以找到特定查询的答案,也可以回答关于天气和运动等事情的一般性问题。开发者和品牌可以构建技能,或者在 Alexa 平台上运行独立的语音应用。
苹果西里
自 2011 年以来,基于语音的数字助理 Siri 已经嵌入每一部 iPhone 中。为了让这个迷人的声音听你的指挥,你只需要说“嘿,Siri。”
微软 Cortana
Cortana 是微软开发的虚拟助手,它也使用 Bing 来执行任务和回答用户提出的问题。Cortana 提供英语和其他七种语言的帮助。
利用语音搜索提高客户参与度
许多公司正在使用语音搜索和语音应答技术在网上定义和推广他们的品牌。这里有四个突出的例子:
约翰尼·沃克
约翰尼·沃克利用语音搜索向其网站上的购物者宣传其苏格兰威士忌的特色和质量,帮助建立品牌亲和力和客户忠诚度。游客被问及他们对威士忌的偏好。他们的反应导致推荐约翰尼·沃克产品或最适合他们的产品。
雀巢
2017 年,这个全球品牌为亚马逊 Alexa 推出了 GoodNes skill:为喜欢烹饪的顾客提供视觉和语音浏览体验。除了 Alexa,GoodNes 还提供了一个可视指南,可以在桌面电脑或移动设备上的 Safari 或 Chrome 上运行。
多米诺比萨
达美乐的语音助手“Dom”通过电话自动订购披萨,确保订购过程方便快捷。Dom 接受人们的订单并检查他们的订单状态。Dom 是该公司将声控数字技术融入其订购和客户服务渠道的战略的核心。
帕特龙龙舌兰
这个优质龙舌兰酒品牌与几个虚拟助手合作,包括亚马逊 Alexa 和谷歌助手。Patrón 网站上的 声控“调酒师” 与公司的目标受众分享 Patrón 鸡尾酒实验室配方、操作视频、技巧和建议。
阿果对语音搜索的承诺
Algolia 正在努力推广 语音搜索 作为一种丰富用户体验和改进客户网站功能的方式。通过使用查询理解、 人工智能 、个性化和搜索相关性——这些技术可以在 web、移动设备和语音优先应用程序中轻松实现——您可以将您的搜索能力提升到新的高度。
关于语音搜索的 Algolia 方法的更多信息,请参见:
知识管理系统由什么组成?
仅在 2021 年,据估计就产生了大约 79z 字节的数据。在这种情况下,人类历史上所有记录的口语单词可以只用大约 42 zettabytes 来存储。这种铺天盖地的数据洪流对地球来说是一个问题,更不用说个体企业了,它们需要能够有效地共享信息,并利用自己的公司知识来帮助推动员工和客户的成功。
进入 知识管理 (KM)及其有用的知识管理系统(KMSes)。知识管理系统为企业提供了团队成员跨部门共享重要组织知识的方式,促进了工作空间协作,同时减少了孤岛和瓶颈,从而提高了整体指标。
什么是知识管理系统?
一个成功的知识管理系统是一个软件平台,允许企业共享正确的知识——包括三种特定类型: 隐性知识、显性知识和隐性知识——与需要轻松访问名副其实的内容库的员工共享。知识管理工具控制信息资产的创建、获取、组织、访问和使用,以便在整个企业中共享知识。这意味着 KMS 可以帮助员工高效地输入和存储数据,发现真知灼见,然后在需要的时候随时随地自动传递发现的智慧。
不同的公司有不同的业务流程,这要求他们在知识管理系统中关注不同的功能。幸运的是,市场上的知识管理工具的类型也有很大的变化。
知识管理系统实例
一些 KMSes 充当高级笔记平台或 内部网】-可访问的文档管理系统,而另一些则具有集成的客户服务工具和客户支持票务自动化功能。KMS 可能需要整合知识库文档、项目管理电子表格、学习管理系统、可重复使用的模板、以不同格式存储的数据、不同级别用户的权限、CRM(客户关系管理)工具、Slack 等通信软件或这些元素的任意组合。不考虑特定的 KMS 特性,知识管理系统的用户体验质量也可能有很大的差异。
知识管理有什么好处?
好的知识管理不仅仅是通过友好的界面部署质量工具来提高员工生产力或客户满意度;它必须与一种文化转变相一致,这种文化转变是朝着专注于单一真理来源的协作工作和知识共享的方向转变;信息可以帮助每个人做好自己的工作,同时帮助公司实现收入和其他目标。
你知道吗,未能分享知识会导致员工不满和巨大的经济损失?IDC 报告称,发行成本财富 500 强企业每年 310 亿美元。不幸的是,没有专门的知识管理工具的影响,这是一个可悲的现实。
好消息是,一旦你把公司范围内的知识管理系统恰当地固定下来,好处会成倍增加。从更好的员工保留率,到更好地回答客户问题,再到更高的整体销售额,通过在公司的每个部门之间分享知识,您可以在每个资产负债表上产生积极的连锁反应。
以下是实施有效 KMS 的一些最常被提及的好处:
高等职员留用
让员工更好地获取重要信息是提高员工忠诚度的好方法,这样可以留住你最优秀的人才,而不是眼睁睁地看着他们跳槽。使用知识管理系统可以确保中央内容管理中心的可用性,员工可以访问该中心来帮助他们完成日常任务和项目。这种改进的信息访问可以防止沮丧,提高员工满意度。一个消息灵通的员工很可能是一个快乐的员工。
更快入职
盖洛普的一项民意调查发现,仅有 12%的员工非常认同他们的组织在新员工入职方面做得很好。
第一印象对新员工来说很重要。正如你不会期望一个新员工忘记他们迄今为止在职业生涯中学到的一切,一个组织也不应该期望员工从一张白纸开始工作。拥有一个集中的知识管理系统可以通过整理所有新员工的材料来加快入职速度,以便新员工可以轻松访问这些材料。根据您使用的知识管理系统的类型,您还可以管理此信息的交付方式(例如,作为需要认证的课程、教程或常见问题)。
销量更高
事实上,在从小型企业到大型企业的各种规模的组织中,当销售团队消息灵通时,客户体验就会改善。
出色的知识管理系统有助于销售代表更快地找到信息并简化他们的流程。销售代表可以帮助客户获得他们问题的即时答案,这样他们就更有可能更快地做出购买决定,而不是去别处寻找信息或等待回电。
一个出色的客户成功团队
与销售团队非常相似,有了好的知识管理解决方案,您的客户成功团队会发现管理客户数据更容易,以便让客户了解最新的功能、培训和帮助台创建的自助服务支持。一个好的知识管理工具可以将各个部门聚集在一起:如果产品团队在团队 wiki 上发布了一个重要的新更新,他们也可以将有关它的细节添加到 KMS 中,在那里可以很容易地检索到这些重要的细节。
营销人员可以将这些知识用于对外宣传,销售、客户成功和支持团队可以在未来与客户和销售线索的通信中使用这些知识。消息更灵通的客户成功团队总是有利的。
选择最佳知识管理软件
考虑 KMS 时,首先要记住的是,有效的知识管理不是一成不变的。这是一个持续的承诺,它的成功依赖于在你的组织中建立一个文化转变。如果你的利益相关者和员工能够致力于培养一种重视知识的文化,你可以期待你的 KMS 取得巨大的成果。
第一步:现场决策。思考 KMS 的哪些优先事项对您公司的独特用例最重要。
在寻找贵公司的完美 KMS 时,请记住以下三个关键特征。
整合
对相关信息的访问应该是无缝的、用户友好的,并且与员工的日常工作流程兼容。您可以通过将知识管理与您的员工正在使用的应用程序和程序相集成来实现这一点。检查任何潜在的新知识管理工具,看看它们是否与您现有的应用程序和协作工具兼容,这一点很重要。
知识流
所有员工在他们的工作日都创造和消耗不同类型的知识,但是某些角色的人,由于他们的工作描述,自然比其他人产生更多的知识用于你的内部知识库。这也意味着其他员工经常需要访问他们创建的信息。如果你能发现知识流——确定谁在知识管理过程中产生重要信息,谁在消费这些信息——那么你就能创建正确的知识管理系统来利用它。
可搜索性
所有好的知识管理系统在有智能、直观的搜索能力支持时都是最有效的,这种搜索能力能让用户在大量不断增长的数字信息中高效地找到他们需要的东西。您的搜索功能可以通过集成搜索工具或 预制高级搜索 API 提供。使用高级 API 的好处是,它可以从各种来源提取数据,并无缝地集中您组织的所有信息。无论哪种方式,随着您的日常数据的冲击,优秀的搜索是一个救命稻草。
获取正确的知识库软件
在建立一个有效的知识管理系统的背景下,搜索 API 是一个可以给你带来显著竞争优势的简单工具。它提供了一个完整的知识管理平台的优化、功能和覆盖范围,以及一个复杂的搜索引擎的易用性和便利性,该搜索引擎为您公司的数据搜索者提供近乎实时的结果。
有了 Algolia,您可以将孤立的数据集中起来,并通过一个方便的界面进行访问。我们的 SaaS 解决方案 还可以根据用户的活动和过去的搜索来修改他们的搜索结果,使他们更容易找到他们经常需要的信息。我们也提供随用随付的价格。 要获得一些关于搜索如何与知识管理系统一起工作的真实例子,ping 我们的团队;让我们来谈谈你的知识管理策略,以及你如何优化以取得成功!
期待 Algolia 在 NRF 2023 零售大展上的表现—
原文:https://www.algolia.com/blog/algolia/what-to-expect-from-algolia-at-nrf-2023-retails-big-show/
Algolia 是新在线零售机制的关键人物,这一机制正在改变消费者和企业购物、购买和采购商品和服务的方式——作为 NRF 2023 零售大展的金牌赞助商,Algolia 是今年最受关注的主要参展商之一。
Algolia 团队喜欢面对面交流。我们喜欢在内部团队之间、内部部门之间以及公司总部之间建立联系。但最重要的是,我们重视与用户、客户、合作伙伴和人们的面对面交流。
随着我们走出大流行后的延期和推迟期,现在开始考虑明年的行业活动和贸易会议既令人欣慰又令人兴奋。全国零售联合会(NRF)在纽约的集会因其规模而得名,当然被称为零售业的大展,Algolia 将会全力以赴。
Algolia 将于 2023 年 1 月 15 日至 17 日在纽约市 Jacob K. Javits 会展中心举办,届时我们将在展会上展示完整的展台,并在 14 日的开幕派对上提前与大家见面。
宝贵的参与机会
“参加 NRF 2023 零售展对我们所有人来说都是一次特殊的经历。来自近 100 个国家的近 40,000 名零售专家将亲临现场,成为全球领先的年度零售活动的一部分,这是一个交流、会面和合作创新的绝佳机会。Algolia 的首席执行官 Bernadette Nixon 说:“整个 Algolia 活动团队都很高兴能够在这个宝贵的参与机会中与志同道合的专业人士会面。
Algolia 是新的在线零售机制的关键人物,这一机制正在改变消费者和企业购物、购买和采购日常所需商品和服务的方式。该公司是 NRF 2023 零售大展的黄金赞助商,我们热衷于展示零售和更广泛应用用例的最新 产品搜索、导航、浏览、推荐、企业搜索和发现 。
我们革命性的混合方法将关键字和基于向量的语义搜索结合在一个 API 中,该 API 可以无缝地适应任何组织的可组合架构。Algolia 的 API 优先搜索和发现平台使零售商能够在网络范围内创建引人入胜的最终用户体验,就像互联网本身一样广泛。
参加 NRF 2023 零售展将是 Algolia 自【2022 年 9 月收购search . Io以来首次有机会在大型 IT 贸易展上展示其新扩展的能力。
零售商的数字行动号召
消费者导航和搜索的方法和方式正在发生变化,变得越来越复杂。从战略上来说,零售商下一步需要做的是发现摆在桌面上的销售机会,其中许多机会甚至从未出现在购物车上。从未实现的“长尾搜索查询”中获取收入是零售业的当务之急(也是挑战)。
总的来说,零售商有巨大的零售机会来捕捉更具体、更狭窄和更依赖客户的长尾搜索。
首席执行官 Nixon 表示:“我们敦促 NRF 2023 零售大展的与会者参观我们的展台,了解 Algolia 如何让零售商利用我们的混合搜索引擎捕捉和完成长尾搜索。“据估计,多达 55%的搜索查询代表对产品和搜索的长尾请求,这是一种构建用户查询的更复杂的方式,需要结合关键字和基于向量的语义搜索来实现。”
作为长尾搜索的一个典型例子,一个人可能会搜索“季风天气的防水套件”,或“新祖母的神话般的领带”,甚至可能是“结实的吉他盒”——这些查询背后都承载着更多负载的意图和语境化的意义,而不是一个不太复杂的搜索引擎可以立即看到的。
查询分类
该公司还将展示其查询分类功能,该功能已于 2022 年 9 月 27 日公开测试。高级计划下的 Algolia 客户可以直接从他们的 Algolia 仪表板访问查询分类,并亲自体验这一新的有效功能。
我们认为查询分类是 Algolia 搜索和发现平台的关键组成部分,这一新功能将使您的客户更容易搜索、发现和找到他们想要的东西,从而大大减少最终用户的工作量。
利用 Algolia 查询分类,开发商、销售商、媒体公司和内容提供商可以预测客户的意图。Algolia 客户可以将他们的买家与最相关的商品类别或精选商品联系起来,帮助他们设计最能满足最终用户旅程中每时每刻需求的内容或产品类别。产品经理和跟单员都可以利用 Algolia 打开目标相关性和提高网站转化率的大门。
请参加我们 2023 年 1 月在纽约举办的 NRF 零售大展!您可以提前与我们 预约会议,了解更多关于我们出席会议的 。
在此查看Algolia stand # 4046 信息 并在社交媒体@NRFBigShow 上关注该事件,并使用以下标签# retail# NRF 2023。
在搜索 API 中寻找什么
原文:https://www.algolia.com/blog/product/what-to-look-for-in-a-search-api/
几乎每个网站都可以从出色的搜索体验中受益,从而提高用户对内容和产品的可发现性。然而,大多数企业没有专业知识或开发资源来从零开始建立一个现场搜索引擎。搜索 API 使任何规模的公司都能在不过度使用资源的情况下打造强大的搜索体验。
在这篇文章中,我们将介绍在选择搜索 API 时需要考虑的一些主要品质。
什么是搜索 API?
搜索 API 是软件组件,允许开发人员将搜索功能无缝引入网站和应用程序。它们提供了用于索引文档、查询各种类型的数据、管理 集群配置 、查看搜索分析等的后端工具。
虽然不是所有的搜索 API 都提供这些,但是质量库、软件开发工具包(SDK)和文档可以指导开发者完成搜索实现,极大地改善开发者体验。
搜索 API 可用于多种用例。例如,想象一下,你正在 开发一个电子商务网站 ,它有一个包含不同品牌、尺寸、颜色、价格等产品的大型目录。您将需要一个专门的工具来构建、存储和管理您的数据,并帮助用户快速准确地找到他们需要的东西。这就是搜索 API 的用武之地。开发人员可以将整个目录输入到搜索 API 中,并通过几行代码从网站上调用它。
然而,好处还不止于此。利用现成网站或电子商务商店的公司通常可以在这些 API 中插入很少甚至不需要编码的插件。例如,Algolia 有带Shopify和Magento的插件,只需点击几下就可以设置,因此即使是非技术用户也可以设置一个强大的搜索应用程序。
为什么搜索 API 很重要?
搜索 API 是最大限度缩短上市时间、同时最大限度提高投资回报的最佳方式。这意味着你可以用最少的努力为你的用户提供最好的搜索体验。使用搜索 API 的一些额外好处包括:
- 降低开发的复杂度 。通过在现有功能的基础上进行构建,开发人员可以专注于适用于其用例的业务逻辑,而不是担心构建和管理搜索引擎的基础设施。
- 简化自动化 。由于搜索引擎的基础设施是通过一个简单的 API 抽象出来的,开发人员可以轻松地将搜索工具插入现有的数据管道和集成中,以快速获得系统之间的数据流动。
- 管理成本 。简单来说, 开发一个可扩展的搜索引擎是昂贵的 。这是一项非常技术性的工作,要求开发人员了解复杂的领域,如分布式系统和性能优化。将这些角色外包出去,并在构建真正的核心产品所需的开发人员类型上给予自己灵活性,这是非常有价值的。
有了清晰分离的搜索 API,您可以灵活地在任何地方运行软件——通过库在您的产品内部、在单独的微服务中或在单独的云中。 搜索即服务 像 Algolia 这样的公司提供托管解决方案,以便您可以让其专家团队运行和管理服务,并让您真正专注于您的业务,而不是维护基础架构。
在搜索 API 中要寻找的 7 个元素
开发人员、业务经理和最终用户都会从搜索 API 提供的强大功能和无缝实现中获益 。
以下是选择搜索 API 时需要考虑的 7 个关键因素,以最大化利益相关者的利益和体验。
- 性能、正常运行时间和可靠性
- 速度
- 易用性
- 安全与保护
- 分析学
- 文档
- 白盒方法
1。性能、正常运行时间和可靠性
对于大多数企业来说,服务停机会导致客户体验和收入的重大损失。您的服务需要在客户需要时可用。然而,扩展复杂的分布式系统(如搜索引擎)是一项艰巨的任务,经常会导致技术错误,从而导致请求失败。
因此,理解搜索 API 及其支持系统所能提供的可靠性水平是很重要的。需要注意的一些重要因素是 请求延迟统计——如平均值、中值和第 99 个百分点——以及服务正常运行时间。
例如,优质服务可以为 SLA 提供至少“99.999%”的正常运行时间(称为“五个九”)。这意味着系统丢失的请求不会超过 100,000 个中的一个。这将确保您的客户不太可能在与服务交互时遇到问题,如果遇到问题,应该会很快恢复。
2。速度
速度是奖励搜索体验的重要组成部分。搜索速度越快,响应性越强,你就越能吸引用户的注意力。 搜索 API 要尽可能减少搜索体验中的 延迟。
人类可以感知低至 20 毫秒的延迟,如果一个请求超过一秒,许多用户都会感到沮丧。理想情况下,用户应该在大约 100 毫秒或更短的时间内收到结果,包括服务器处理时间和网络传输时间。有许多因素会对此产生影响—数据传输大小、服务器优化、数据库索引等等。您应该评估您正在考虑的搜索 API 的请求延迟统计数据。这些可以帮助您了解服务的可靠性,衡量系统的响应能力,并预测对最终用户体验的影响。
3。易用性
由于亚马逊和谷歌这样的网站,用户对搜索的可用性有很高的期望。这些系统经过高度调整,能够以最小的努力为用户提供快速、简单的结果。正因为如此,所有企业都需要能够提供同等水平的服务,而不是强迫用户采取任何额外的步骤,这些步骤可能会让他们感到沮丧,并有可能让他们输给竞争对手。
网站需要提供符合用户习惯模式的用户体验。搜索 API 可以帮助您无缝地实现 UI 元素和功能,如自动完成、等,以提升搜索体验。进一步,用户数据可以用来 个性化 这些结果来进一步增加用户快速找到相关内容的机会。所有这些都会影响用户对服务水平的感受,并最终影响他们是否转换。
4。安全和保护
任何时候,当你把你公司的数据发送给第三方时,你都应该注意供应商是否有适当的安全措施来确保没有泄露或误用。这对于减少你的个人责任和保证你的客户和企业的安全是很重要的。
对于托管搜索服务,你可以查看他们的服务条款和隐私政策,以了解他们对你的数据做了什么,保留期限是多久,他们可以与谁分享这些数据,等等。如果你共享敏感信息,如客户数据或个人身份信息(PII),这些尤其重要。
从技术角度来看,您还可以查看他们的认证(如 SoC 2 或{\ lang 1033 ,}了解他们是否遵循了数据安全、加密和其他基础设施级保护的最佳实践。
5。分析
优化搜索是一个持续的迭代过程。确保的高度相关性是吸引和满足最终用户的关键。搜索 API 应该带有 搜索分析 功能,这对于理解和监控用户随时间的行为以及提炼相关性非常有用。
通过分析,你可以发现用户可能会使用你意想不到的语言和表达方式。或者,您可能会发现对某些类型的产品或内容有需求,而您目前没有提供这些产品或内容,您可以对其进行调整以满足客户的需求。除了分析特定的关键字和查询之外,还可以监控总的指标,如点击率或出现的 【无结果】页面 。这允许您调整您的搜索参数和配置,以最好地满足用例,并确保它们随着时间的推移工作良好。
6。文件
搜索 API 显著降低了构建搜索应用的复杂性,但开发人员仍然需要适当的文档来指导他们使用。例如,单个端点可能有几十个必需和可选的参数,可用于修改结果。API 提供者必须列出这些字段是什么,它们的前提条件和要求是什么,以及预期的结果是什么。文档使开发人员能够自行排除故障并进行指导,而无需连接到产品支持。
除了 API 文档 之外,有教程和实现指南可能会有用。这些有助于开发人员和非技术用户快速开始使用 API,并指导他们如何处理各种常见用例,以确保一致性和质量。对于大多数网站来说,实现遵循共同的工作流程,因此一组强大的示例可以确保开发人员以最好的方式实现。
7。白盒方法
许多 API 提供了不可见的简单性。开发者可以使用 API,但是看不到指导搜索排名的逻辑和设计。这实际上使搜索 API 成为一个黑箱,开发者失去了控制。也就是说,如果结果不理想,开发人员就不知道应该如何使用系统或对系统进行不同的配置来解决问题。
白盒方法向用户揭示了 API 的逻辑,而没有增加开发的额外复杂性。对于搜索 API 来说,这意味着开发人员和业务分析师可以很容易地查看和修改排名和相关性规则,从而可以很容易地根据业务规范对它们进行修改。这提供了一个环境,您可以在其中 A/B 测试 各种搜索配置的更改,并使用分析来确定是否成功。
无缝集成搜索和 Algolia 的搜索 API
搜索 API 是为数不多的面向开发者、决策者和最终用户的软件服务之一。开发人员从无缝的开发人员体验中受益,允许他们以最适合其现有平台的方式利用搜索 API。决策者可以信赖他们数据的安全性和隐私性以及服务的总体可靠性。最终用户受益于快速、自然和透明的搜索体验。
然而,搜索是一个复杂的过程,需要不断发展和完善。具有强大的开发人员库和 SDK 的可靠 API 有助于大大简化这个过程。借助 Algolia 托管的 搜索 API ,增强您的开发人员的能力并缩短上市时间。它拥有用于构建 10 种编程语言的生产就绪用户界面的库、完整的文档和实时支持。
在我们的电子书中学习更高级的搜索功能,以改善用户体验并提高转化率。从 Algolia 搜索中获得更多益处的 7 种方法 。”
卷积神经网络解释
社交媒体用户 被展示了基于人脸识别技术他可能认识的人的快照,并被询问是否想在应用程序中将他们添加为好友。
一辆行驶在城市街道上的自动驾驶汽车 使用视觉识别技术进行物体检测,“看到”一名行人即将走下路边并在它面前乱穿马路,并决定通过减速做出反应。
一名医生 能够使用技术比较数千张 x 光韧带的可比医疗图像,从而自信地诊断她的病人的状况,并排除恶性癌细胞的存在。
一个警察部门 生成一张嫌疑犯的清晰照片,警察可以把它放在手边。但这还不是全部:通过生成对抗网络(GANs),图像可以用来训练面部识别的深度学习模型。
一家在线零售商 建议人们用其他人选择搭配的上衣、夹克和配饰来“完善”他们正在考虑的牛仔裤,社交媒体图像数据证明了这一点。
多功能视觉图像识别
这些是图像识别系统的一些最新应用,更广泛地称为计算机视觉:机器表面上像人一样“看”,以同样的视觉方式感知人类环境。
所有这些图像识别和分类应用程序有什么共同点?它们由称为卷积神经网络(CNN,简称 ConvNet)的机器学习子集专业处理。
卷积神经网络的定义
在 类神经网络 中脱颖而出,卷积神经网络是一种深度学习的网络架构,它从接收到的数据中进行学习。在各种类型的神经网络中,CNN 最擅长识别图像(和视频;另外,它们擅长语音和音频信号)。事实上,对于 CNN,数据输入被认为是与图像相关的。
在其图像处理周期中,卷积网络可以评估图像,为图像的各个方面分配重要性级别,并区分其视觉元素。
CNN 操作结构的创建受到了大脑中神经元连接方式的启发,特别是动物视觉皮层的组织方式。神经元只在特定的区域——感受野——对刺激做出反应。各种感受野重叠覆盖视觉区。
导盲犬?
一个没有眼睛的机器是如何熟练掌握模式识别,在卷积运算中解释图像的?你猜对了:借助人工智能。
卷积神经网络架构包括一个模型,一系列统计函数,计算和重新计算数字的像素化向量,直到图像被识别和分类。由于利用了数字(权重)、统计和通过节点(神经元或输入)对数据的处理,它可以“看见”,这些节点具有与之相关联的权重和阈值。
这种图像识别技术的第一步:将图像的像素值转换成称为矢量的数值,从而可以解释图像和提取图案。完成后,就可以输入数据了。
深度学习的 CNN 有几种类型的节点层,每一层都学习检测图像的不同特征。在每一层中,应用过滤器(一个 内核 或特征检测器),移动穿过图像的感受野,检查某些特征是否存在并激活某些特征。
一层中的所有节点连接到下一层中的每个激活单元或节点。如果一个节点的输出高于指定的阈值,则该节点被激活,其数据被传递到连接节点。
节点知道
在初始处理层中,重点是解读图像中的直观特征,如颜色和元素边缘。随着每一次连续的层迭代,过滤器活动深入到更复杂的地方,识别代表输入的元素。
在每一层中创建的部分识别的图像作为下一层的输入被推进。对于每一层,CNN 识别出图像的更大部分。
每次扫描后,计算一个 点积 。这一系列点的输出被称为特征图。
通过多次扫描,整个图像被处理,算法识别图像中的内容。
这种细化过程可以重复几十层、几百层甚至几千层,使图像逐渐变得更好、更详细。
这一壮举本身就令人印象深刻。但是还有更多。
由于 CNN 可能会处理数百万张图像,该模型会记录、校准并重新调整其权重。最终,它对自己看到的东西变得非常自信,几乎可以识别任何图像。在整个 CNN 世界,深度学习处理技能的完善意味着 计算机视觉领域一直在突飞猛进。
多层
CNN 识别图像的关键是从一层到下一层增加复杂程度。不同的 CNN 专家引用了不同数量的 CNN 层(其中一些是隐藏层)。不管这些不一致,结果是一样的:图像的准确解释。
除了基线输入层和输出层,构造块层还包括:
卷积层
这第一层是进行大部分计算的地方。可以包括在初始层之后用于附加分类的第二卷积层,以便于从图像中提取高级特征。
共用层
这一层降低了视觉表示的复杂性/维度——输入中的参数数量——因此丢失了一些信息。这个 下采样 层提高了效率,限制了 过拟合 的风险。
有两种类型的池操作:
Max pooling: 当过滤器扫描输入图像时,它选择具有最大值的像素传递给输出数组。
平均池: 当过滤器扫描时,它计算接收域内的平均值,并传递给输出数组。此方法的使用频率低于最大池。
【全连通层】
这是根据提取的特征对图像进行分类的层。这最后一层是“完全连接的”(FC),因为它的节点与另一层中的节点或激活单元连接。
CNN 是上级
谈到视觉感知,为什么 CNN 比常规神经网络(NNs)更好?
常规神经网络(NNs)无法伸缩。它们没有 CNN 那样的计算能力和资源。神经网络可能试图学习训练数据中过多的细节(称为过度拟合)。如果你将数百万张照片输入计算机,并要求它考虑图像识别工作中的每一个重要细节,包括视觉“噪音”,这可能会扭曲图像分类。
CNN 架构对图像更好,因为它利用了一种称为参数共享的方法,与 NN 相比,这降低了计算强度。在它的每一层中,每个节点都连接到另一个节点。随着过滤器在给定层中穿过图像,相关联的权重保持固定。
CNN 如何在搜索中提高图像识别能力
得益于 CNN 对视觉信息的精准处理,对图像的分类,以及计算机视觉的提升, 视觉搜索 的领域得到了爆发。这种视觉处理现象在电子商务中尤为明显,网站现在可以为用户提供 视觉购物 的优势和乐趣。
在 Algolia,我们帮助公司让现实生活中的人们更容易使用图片搜索来准确找到他们想要的商品,并通过“完成外观”等功能鼓励追加销售。
想用我们 CNN 辅助的 图片搜索 技术提升你的网站搜索结果? 联系我们 我们会帮你发现并追求所有的可能性。
Algolia 的新功能推荐:春季发布回顾网络研讨会
赶上我们的春季发布展示会
每天顾客都会收到大量的推荐。你如何引导他们,让你的在线体验脱颖而出?
Algolia 的客户生命周期营销负责人雷切尔·沃德和中小企业、业务战略和优化总监 Ben Pusey 主持了我们最新的春季发布展示网上研讨会,他们在会上公布了 Algolia 推荐的新产品更新。
我们从下面的谈话中收集了一些要点,他们探讨了企业如何通过提供可靠和相关的建议来增加收入、建立忠诚度以及为客户创造最佳的数字体验。也可以 点播观看完整的网上研讨会 。
为什么我们在乎推荐**—**搜索本身已经不够用了。推荐已经成为当今在线发现体验不可或缺的一部分。无论您的客户是购买新产品、消费您发布的内容、查找特定信息,还是寻求解决客户问题,您都需要能够更好地吸引客户、增加收入并为您带来竞争优势的正确建议。更多阅读我们最近的文章 为什么推荐推荐做推荐 。
Algolia 在 2021 年推出了“推荐”,以帮助我们的客户面对这一挑战,正如任何新产品一样,总有进一步发展的空间。我们在这里分享的 2022 年春季更新是基于客户的直接反馈而构建的。请继续阅读,了解我们的新核心功能和 Algolia 推荐的其他令人兴奋的更新。
**我们的客户面临的挑战—**人们一直期望企业在正确的时间提供正确的内容和正确的环境。曾经被认为是尖端的特征很快就变成了桌面赌注。像亚马逊和网飞这样的公司在推荐方面设立了很高的标准——这种水平的指导是人们所期望的,即使他们正在查看较小企业的网站。
我们致力于为客户提供最佳建议,以便他们能够提供最强、最相关的结果。自从推荐推出以来,我们已经在客户中取得了许多成功。随着我们最近的更新,我们期待更多。
我们为解决这些挑战而开发的产品**–**C超负荷工作会导致不满、浪费时间,有时甚至会导致瘫痪。产品和内容推荐占了发现过程的很大一部分。
Algolia 搜索 已经帮助我们的客户通过独特和差异化的搜索体验增加了 70%的收入。现在有了推荐,我们的客户能够通过产品和内容推荐来推动剩下的 30%。Algolia Recommend 帮助您的开发团队建立差异化,在任何渠道上提供推荐,增加在线收入,推动客户参与,并最终改善您的整体客户体验。
**谁能用推荐?****–**我们的 电商 客户喜欢 Algolia 的推荐,但我们也对其进行了调整,使其更适用于非电商业务。无论您的内容在哪里,我们现在都可以帮助您基于它做出有用的推荐。我们的相关内容模型使用混合引擎,以及协作过滤和用户信号来提供高质量的推荐。
由于这些更新,我们预计内容相关业务的参与度、在线时间和品牌忠诚度将会增加,客户流失也会减少。我们还发现,相关产品模型对平均订单价值(AOV)、转换率、每单商品数量有积极影响,之后我们在推荐中构建了相关内容模型。
**有什么新功能推荐?****–**作为我们 2022 年春季更新的一部分, 我们有四个关于 Algolia 推荐的新内容要分享,包括两个新的核心功能。其中之一是我们的混合推荐引擎,我们构建该引擎是为了处理稀疏数据和冷启动问题。我们的趋势模型允许您基于真实的客户交互(即真实数据)生成动态内容块。相关内容模型更适合非电子商务应用程序。你可以在我们关于 Algolia 推荐更新的博客文章中了解更多关于这些更新的信息。
我们还拥有自己的规则引擎,它位于我们的推荐产品之上,让我们的客户可以使用他们拥有的任何业务逻辑或市场知识来增强和完善推荐。 新的规则功能允许我们的客户继续为他们的客户创造独特的定制体验。这些规则的工作方式与它们在 Algolia 搜索中的工作方式非常相似。总的来说,你可以根据你的商业模式和交易策略对这些建议进行微调。
错过了我们的更新? 观看完整的网上研讨会 了解 Algolia 推荐的新内容,然后 请求演示 亲自体验 Algolia 搜索和推荐。
让合适的人掌握组织知识
你公司的组织知识怎么样了?换句话说,如果一名员工要离开,他们会给你 留下一个原本有关键信息的大洞吗?
组织知识——随着时间的推移积累起来的知识创造的宝库——是大多数现代商业运作的核心。从循序渐进的文档到宽泛的概念材料,各种类型的知识都是必须重视、收集、保护和共享的资源。这些信息可以影响高层决策,帮助员工避免代价高昂的错误,并确保公司保持在实现目标的轨道上。
咱们聚一聚?
在典型的工作场所,这种知识库是一种被忽视和低估的商品,因为人们有一种误解,认为简单地 将有知识的个人聚集在一起 就足够了。在现实中,员工聚在一起与同事或经理分享个人知识和见解是不够的,例如在一对一的会议上。封装新知识的过程必须更加深入。
为什么企业信息化深度和员工共享能力如此重要?因为虽然公司可能存在了几十年,但对员工和其他贡献者来说却不是这样。随着时间的推移,员工对公司流程、规格和客户信息有了深入的了解。当一个高级别的玩家离开时,如果没有足够的组织知识共享方法,知识产权可能会随着他们一起从公司的秘方中蒸发。这些突然丢失的数据成分会对组织知识的平衡产生负面影响,并严重阻碍进展。
因此,为了让现在和未来的员工继续利用有价值的组织知识,企业必须保存和分享这些知识。
“组织知识”是指什么
短语“组织知识”听起来像是与变得有条理有关的东西,但它不是关于某人在书架上安排书籍或规划产品开发周期方面有多好。
这个概念是由企业管理大师彼得·德鲁克在 20 世纪 80 年代提出的,即“协调和利用组织的知识资源,以创造效益和竞争优势。”或者更简单地说,组织内可记录的集体知识的总和,可用于释放机会。
三种认识方式
管理专家说,组织知识的类型分为三类
显性知识
这是具体的、有据可查的知识:已经写下来或者正式记录下来的公司信息。它通常存储在公司文件中(数字文件或现场文件),任何可能需要它的人都可以轻松访问。
隐性知识
这是应用的显性知识,比如在某个特定的公司职位上工作一段时间后学到的技能。这些信息可以教给新员工或任何需要的人。
隐性知识
隐性知识指的是从某个过程中学到的信息,但不一定记录在任何地方。这种类型的信息通常更难记录和传递给其他人,因为它可能包含直观的方面。
关注原因
尽管有效地输入、保护和分享组织知识被认为是必要的,德勤的一项调查发现缺乏组织知识是“影响公司成功的三大问题之一”
德勤(Deloitte)发现:“如果搜索(信息)很困难,搜索结果没有得到高度重视,员工就会对知识体系失去信任。”。“这反过来使他们不太愿意在这些系统中分享个人知识,从而降低了内容的质量。”
让组织知识无障碍
如果组织知识早就在德鲁克的雷达上,那么在我们这个数据泛滥的世界里,它无疑更加重要。
对数据进行组织和分类是唯一的选择。理想情况下,公司需要集中化的组织 知识管理 来跟上。据记载:根据技术服务行业协会的数据,有效的知识管理将近四分之三的公司的生产率提高了约 20%。
那么如何才能让 你的 组织知识更容易获取呢?
以下是专家的推荐:
凿沉筒仓
没有知识管理系统,知识很容易变得孤立:隐藏在某个团队的技术堆栈中,而不是常规地提供给更广泛的公司。这意味着一旦外部员工意识到数据的存在,访问数据可能会很困难,并且其他团队无法从大量信息中受益。
当然,你可以通过要求知识在团队中随时可用来打破知识的孤岛。为了使这种类型的知识保留成为现实,团队间的共享和集中的知识管理存储是关键。
集中起来便于查找
这也许是知识管理最重要的元素。好消息是,你不需要开发一个完整的平台来上传和存放不同类型的知识;您可以通过一个 企业搜索工具 实现跨平台快速查找信息的目的。通过单次搜索 创建对全公司数据 的访问,您可以有效地将过去、现在和未来的信息集中在一个公司内部。
打造知识共享文化
宣传知识共享的好处是一个良好的开端。然而,要推出真正的交易,企业领导人必须更进一步,创造一种完整的组织文化,在这种文化中,知识共享是员工日常训练的一部分,是一个自动发生的内在过程。
当然,这种解决问题的方案不会一蹴而就;它需要持续致力于员工和高管之间的知识共享,以及培养所有团队之间的信任。这也需要一个专门的平台来进行的知识管理。您可以激励这种知识共享(例如,通过奖励发布有益网络研讨会的团队成员),以 鼓励员工 在您组织的知识管理流程中发挥积极作用。
组织知识用例
管理组织知识不仅仅是把有价值的知识从隐藏的地方拿出来。而是利用它来推动创新和帮助业务部门运营。这里有两个虚构的案例研究:一个是电子商务网站,另一个是出版平台。
专柜
Shoppit 在网上销售定制家具。产品团队与销售和营销组织之间的日益脱节导致了质量管理系统的崩溃:产品规格和定价方面的错误正在损害公司的声誉。
管理层对此的回应是引入一个集中的组织知识管理系统,以帮助简化订单管理和销售流程。新系统允许销售团队在与潜在客户进行销售通话时快速检查库存和产品细节,确保他们发布的规格始终是最新和准确的。
这让团队在执行他们的任务时更加自如。一项管理审查得出的结论是,其结果是员工体验的显著改善,这种影响会波及到客户,并可能与帮助实现利润最大化直接相关。
牛逼文章
这家文章分享平台的管理层希望在其网站和应用程序中推广新的自助发布功能,但营销团队仍然依赖开发团队偶尔提供的书面更新。
特别是,管理层希望营销人员能够更轻松地访问新功能和更新的详细信息。通过实现中央 企业搜索 功能,开发者可以继续以同样的方式提交他们的更新。但是这一改变使得营销团队 以及 也可以访问这些信息,这样他们就可以在制作宣传材料和广告方面领先一步。
搜索:知识访问的答案
合适的企业搜索平台可以通过 向任何需要的人提供内部知识 来有效解决知识管理困境。这解决了一个紧迫的问题,但它通常也会产生连锁反应,远远超出快乐的员工和成功的客户体验。
了解合适的 企业搜索 解决方案如何增强内部知识共享,以便您能够改善员工的生活,赢得他们的信任,并使他们能够帮助您发展壮大。从今天开始免费试用!
当分配器囤积你宝贵的记忆时
原文:https://www.algolia.com/blog/engineering/when-allocators-are-hoarding-your-precious-memory/
虽然切换到最新的流行框架或语言已经成为工程界的老生常谈,但有时升级是有保证和必要的。对于我们致力于维护核心引擎功能的搜索工程团队来说,这包括升级操作系统版本以获得最新的内核或库功能,以便快速适应我们最新的代码发布。我们总是急切地等待着操作系统的升级,并且已经推动了很长一段时间。
当您处理遍布全球 70 个数据中心的数百台服务器时,在生产环境中升级操作系统可能是一件大事。对于我们的生产服务器,我们目前使用的是 Ubuntu 16.04(四年多前发布的),我们的基础团队(管理所有生产服务器,并确保我们始终有一个超过我们的 SLA 的运行服务)在过去几个月里一直在准备升级到最近的 20.04 长期版本。
但是升级是艰难的
当你改变许多组件的版本时,你需要准备好不愉快的惊喜:内核及其相关驱动程序、操作系统的 C 库、各种库,但也可能是操作系统附带的许多策略、政策、默认配置设置。
升级时我们遇到的一个令人不快的意外是整体内存消耗。一张图表(承蒙波前度量)比其他任何东西都好,下面我让你猜猜“绿色”服务器是什么时候升级到更高的操作系统版本的:
如果您设法发现了内存消耗的轻微增加,是的,我们从 10 到 30 GB 的内存消耗(平均 12)转移到 30 到 120 GB 的内存消耗(平均 100 以上)。公平地说,消耗甚至会更高,但我们在这台特定的机器上只有 128GB(绰绰有余,通常用作大页面缓存),内存消耗的下降是当消耗我们宝贵内存的进程要么被我们强制重新加载,要么被愤怒的内核强制屠杀(这有点麻烦,因为它在这里和那里触发了许多警报)时发生的事件。
总而言之,我们有一个问题。作为一家创业公司,我们被期望满足 10x 工程师的刻板印象,但这可能不是我们谈论的 10x。
调查过度的记忆囤积
讽刺的是,我们没有忘记:我们推动系统升级,现在我们要为服务器占用这么多内存负责。嗯,只有一件事要做:我们需要了解为什么升级会有如此巨大的影响。
泄密
我想到的第一个想法是怀疑某种内存泄漏。但是有一个问题:只有最近的 Linux 版本才有。会不会是以前系统上没有满足的条件触发的内存泄漏?
为了验证这一假设,我们通常利用来自 Brendan Gregg 的极其强大的 Linux 性能分析器。每个对性能感兴趣的开发者都应该知道这个工具,我们强烈推荐观看大师亲自做的一些演示。
一种典型的方法是连接正在运行的守护进程,并不时地寻找未释放的内存(10 分钟后):
sudo memleak-bpfcc -a --older 600000 --top 10 -p 2095371 120
不幸的是,我们没有看到任何泄漏——即使在此期间该进程吃掉了我们宝贵的 RAM。
所以这不是泄露,而是我们失去了记忆。下一个逻辑疑点是底层内存分配器。
贪婪的分配器
好吧,你可能会感到困惑,因为我们这里有几个分配器。作为一名开发人员,您可能听说过 malloc
,它通常位于 C 库(glibc)中。我们的进程使用的是默认的 glibc 分配器,它可以被看作是任何大小的内存分配的零售商。但是 glibc 本身不能分配内存,只有内核可以。内核是批发商,只卖大批量。所以分配器通常会从内核中获得大块的内存,并按需分配。当释放内存时,它会合并空闲区域,并且通常会通过调用内核来释放大块内存。
但是配置者可以改变他们的策略。您可能有几个零售商,以适应在一个流程中运行的多个线程。并且每个零售商可以决定保留一些释放的大内存块供以后重用。零售商可能会变得贪婪,可能会拒绝释放他们的库存。
为了验证这个新的假设,我们决定直接使用 glibc 分配器,调用它非常特殊的“垃圾收集器”:
MALLOC_TRIM(3) Linux Programmer's Manual MALLOC_TRIM(3)
NAME
malloc_trim - release free memory from the top of the heap
SYNOPSIS
#include <malloc.h>
int malloc_trim(size_t pad);
DESCRIPTION
The malloc_trim() function attempts to release free memory at the top
of the heap (by calling sbrk(2) with a suitable argument).
The pad argument specifies the amount of free space to leave untrimmed
at the top of the heap. If this argument is 0, only the minimum amount
of memory is maintained at the top of the heap (i.e., one page or
less). A nonzero argument can be used to maintain some trailing space
at the top of the heap in order to allow future allocations to be made
without having to extend the heap with sbrk(2).
RETURN VALUE
The malloc_trim() function returns 1 if memory was actually released
一个简单而笨拙的解决方案是用调试器(gdb -p pid)连接到进程,并手动调用 malloc_trim(0)。结果不言自明:
橙色是升级后的服务器内存消耗,另外两条曲线是以前的操作系统版本。09:06 左右的突然下跌是对 malloc_trim function
的叫牌。
为了解决这个问题,我们还使用了另一个非常有用的特定于 glibc 的函数,转储分配器的一些状态:
MALLOC_INFO(3) Linux Programmer's Manual MALLOC_INFO(3)
NAME
malloc_info - export malloc state to a stream
SYNOPSIS
#include
int malloc_info(int options, FILE *stream);
DESCRIPTION
The malloc_info() function exports an XML string that describes the
current state of the memory-allocation implementation in the caller.
The string is printed on the file stream stream. The exported string
includes information about all arenas (see malloc(3)).
As currently implemented, options must be zero.
RETURN VALUE
On success, malloc_info() returns 0; on error, it returns -1, with
errno set to indicate the cause.
是的,这里再次附上并直接使用 gdb:
(gdb) p fopen("/tmp/debug.xml", "wb")
$1 = (_IO_FILE *) 0x55ad8b5544c0
(gdb) p malloc_info(0, $1)
$2 = 0
(gdb) p fclose($1)
$3 = 0
(gdb)
XML 转储确实提供了有趣的信息。有将近一百个堆(“经销商”),其中一些显示了令人烦恼的统计数据:
<heap nr="87">
<sizes>
... ( skipped not so interesting part )
<size from="542081" to="67108801" total="15462549676" count="444"/>
<unsorted from="113" to="113" total="113" count="1"/>
</sizes>
<total type="fast" count="0" size="0"/>
<total type="rest" count="901" size="15518065028"/>
<system type="current" size="15828295680"/>
<system type="max" size="16474275840"/>
<aspace type="total" size="15828295680"/>
<aspace type="mprotect" size="15828295680"/>
<aspace type="subheaps" size="241"/>
</heap>
在浏览了 glibc 的源代码之后,“rest”部分似乎是自由块:
fprintf (fp,
"<total type=\"fast\" count=\"%zu\" size=\"%zu\"/>\n"
"<total type=\"rest\" count=\"%zu\" size=\"%zu\"/>\n"
"<total type=\"mmap\" count=\"%d\" size=\"%zu\"/>\n"
"<system type=\"current\" size=\"%zu\"/>\n"
"<system type=\"max\" size=\"%zu\"/>\n"
"<aspace type=\"total\" size=\"%zu\"/>\n"
"<aspace type=\"mprotect\" size=\"%zu\"/>\n"
"</malloc>\n",
total_nfastblocks, total_fastavail, total_nblocks, total_avail,
mp_.n_mmaps, mp_.mmapped_mem,
total_system, total_max_system,
total_aspace, total_aspace_mprotect);
并且占用了 901 个块,超过 15GB 的内存。总体统计数据与我们看到的一致:
<total type="fast" count="551" size="35024"/>
<total type="rest" count="511290" size="137157559274"/>
<total type="mmap" count="12" size="963153920"/>
<system type="current" size="139098812416"/>
<system type="max" size="197709660160"/>
<aspace type="total" size="139098812416"/>
<aspace type="mprotect" size="140098441216"/>
是的,这是 137GB 未被系统回收的空闲内存。说说贪心吧!
用 glibc 调优内部
在这个阶段,我们联系了glibc 邮件列表来提出这个问题,如果这被证实是 glibc 分配器的问题,我们将很乐意提供任何信息(在撰写本文时,我们还没有了解到任何新的情况)。
与此同时,我们尝试使用 GLIBC_TUNABLES
特性(通常是glibc.malloc.trim_threshold
和 glibc.malloc.mmap_threshold
)来调整内部组件,但没有成功。我们还试图禁用最新的特性,比如线程缓存(glibc.malloc.tcache_count=0
),但显然每线程分配缓存是针对小块(最多几百字节)的。
从这里,我们设想了几个前进的选择。
【临时】修复-垃圾收集器
定期调用 malloc_trim
是一种相当肮脏的临时手段,但看起来相当有效,每次运行有时需要几秒到 5 分钟:
{
"periodMs": 300000,
"elapsedMs": 1973,
"message": "Purged memory successfully",
"rss.before": 57545375744,
"rss.after": 20190265344,
"rss.diff": -37355110400
}
值得注意的是,GC 时间似乎与累积的空闲空间成线性关系。将时间段除以 10 还会将回收的内存和花费在 GC 中的时间除以相同的因子:
{
"periodMs": 30000,
"elapsedMs": 193,
"message": "Purged memory successfully",
"rss.before": 19379798016,
"rss.after": 15618609152,
"rss.diff": -3761188864,
}
绿色表示新的 glibc,蓝色表示以前的版本。橙色曲线是带有常规 GC 的 forcer glibc。
嵌入新 glibc 的服务器缓慢漂移,占用越来越多的空间(这里几乎是 60GB)。
下午 4:00,GC 在新的(绿色)glibc 代码中启动,您会看到内存消耗统计数据很低。
下面的绿色曲线展示了将 GC 周期从 5 分钟更改为 30 秒的影响:
最后,我们还成功测试了 free 的一个覆盖,它在释放一定量的内存时触发 trim 操作:
#include
#include
#if (!__has_feature(address_sanitizer))
static std::atomic freeSize = 0;
static std::size_t freeSizeThreshold = 1_Gi;
extern "C"
{
// Glibc "free" function
extern void __libc_free(void* ptr);
void free(void* ptr)
{
// If feature is enabled
if (freeSizeThreshold != 0) {
// Free block size
const size_t size = malloc_usable_size(ptr);
// Increment freeSize and get the result
const size_t totalSize = freeSize += size;
// Trigger compact
if (totalSize >= freeSizeThreshold) {
// Reset now before trim.
freeSize = 0;
// Trim
malloc_trim(0);
}
}
// Free pointer
__libc_free(ptr);
}
};
#endif
所有这些测试都是在几个集群上执行的,以确认不同的工作负载。
GC 的成本是多少?我们在 CPU 使用率方面没有看到任何负面影响(特别是系统 CPU 使用率),而且,看一下 malloc_trim implementation
,似乎每个区域都被单独锁定并逐一清理,而不是有一个“大锁”模型:
int
__malloc_trim (size_t s)
{
int result = 0;
if (__malloc_initialized < 0) ptmalloc_init (); mstate ar_ptr = &main_arena; do { __libc_lock_lock (ar_ptr->mutex);
result |= mtrim (ar_ptr, s);
__libc_lock_unlock (ar_ptr->mutex);
ar_ptr = ar_ptr->next;
}
while (ar_ptr != &main_arena);
return result;
}
专用分配器
使用不同的分配器(可能包括 jemalloc 或 tcmalloc )是另一种有趣的可能性。但是转移到一个完全不同的分配器代码有一些缺点。首先,它需要长时间的验证,在半生产和生产阶段。差异可能与我们通常拥有的非常具体的分配模式有关(我可以保证,我们有时真的会有奇怪的分配模式)。因为我们使用的是不太常见的 C++库(来自 llvm 的libc++
),将这种不太常见的情况与更不常见的分配器混合在一起可能会在生产中产生全新的模式。而所谓的新,意味着可能存在其他人之前没有发现的 bug。
调查 bug
潜在的缺陷一点也不明显。
竞技场泄漏
2013 年填补的一个错误, malloc/free 无法在 main_arena 不连续时将内存归还给内核,看起来有点像我们正在经历的问题,但这在我们的系统中并不是什么新问题,尽管在 glibc 2.23 中有 malloc_trim
回收内存,但我们当前问题的数量级完全是前所未有的。然而,这个错误仍然悬而未决,可能只影响到角落的情况。
竞技场数量
竞技场的增加可能是另一种可能性。在相同的硬件和环境下,我们从 2.23 中的 57 个竞技场增长到 2.31 中的 96 个竞技场。虽然这是一个显著的增长,但这一数量级太大,不足以成为触发因素。Alex Reece 在他的博客上建议 glibc 中的竞技场“泄漏”,通过 glibc.malloc.arena_max
可调参数将竞技场的数量减少到内核的数量。当您的进程没有比内核更多的线程时(在我们的例子中是这样),这完全有意义,并且在理论上可以减轻浪费内存的问题。不幸的是,实际情况并非如此:将竞技场的数量从 96 个减少到 12 个仍然存在同样的问题:
甚至还原到 1(也就是主 sbrk()
竞技场),其实:
竞技场门槛
有趣的是,每个增长的竞技场过一会儿就停止增长,达到进程历史中分配的最大内存。自由但未发布的块可能很大(高达千兆字节),这相当令人惊讶,因为这些块应该由 mmap 提供服务。
待续
我们将继续尝试不同的场景,最好有一天能重现一个平凡的案例,帮助修复根本原因。与此同时,我们有一个变通方法(一种 GC 线程),它远非完美,但将允许我们继续前进。
外卖
升级操作系统和库具有潜在的影响,但这些影响常常被忽视。限制风险可以包括在一段时间内一个接一个地升级不同的组件(例如将内核或链接库升级到最新的组件),每次升级的时间足够长,以检测回归(内存或 CPU 使用、行为变化、不稳定性……)。更有规律地升级也是有帮助的另一点(一次升级两个系统版本可能不是最安全的选择)。最后,执行滚动升级并仔细查看收集的指标集应该是健康的生产部署过程的一部分。我们当然已经学到了这些经验,并将在今后的流程中加以应用。
数字市场中的白色标签和配对
当公司互相介绍技术时,就会出现白标和配对。称之为技术口碑。这些交易在市场上尤其普遍。考虑一下在线市场的标准组成部分:搜索、发现、订购、支付和交付。任何由这些功能组成的网站都创建了一个软件生态系统,它可以——也就是说,被其他公司复制来推出自己的市场。例如,用于运营亚马逊和 Etsy 等市场的软件可以激发专门从事硬币或稀有书籍的较小市场。电子商务市场可以催生流媒体平台。
一般来说,一个标准的市场生态系统可以被复制并单独运行,以驱动 任何 市场,该市场提供某种形式的搜索、发现、订购、支付和交付,以及评级和推荐等其他功能。一个可共享的生态系统向其他企业介绍了一种做生意的方式。它可以发生在前端或后端——一个公司可以分享其网站的用户界面技术或其后端基础设施。在阿尔戈利亚,我们看到了两者的变化。
一个市场生态系统
市场是出售各种商品的任何物理空间或数字平台。亚马逊、Ebay 和 Etsy 是市场——销售书籍、服装、家具、汽车等等的单一平台。
在引擎盖下,一个市场可以由一个单一的“”架构和许多移动的组件组成。对任何稳定的生态系统来说,重要的是它如何选择和管理它的活动部分。考虑管理网站的 搜索 和 支付 功能的软件组件。对于搜索,两家公司可能使用相同的组件,但配置不同。对于支付,人们可以使用 Stripe 来管理支付,另一个 PayPal。无头架构通过使用即插即用的软件组件系统(称为 API)来实现这一点,该系统使不同的组件能够相互交互。最好的 API 是第三方专家精心雕琢的珠宝。市场工程师的工作是将这些 API 集成到他们现有的软件架构中,并对它们进行配置以满足他们公司特定的业务需求。
市场生态系统中的白标和牵线搭桥
一旦架构构建完成,组件集成和配置完成,你就有了一个可运营的市场。这就是 白色标签 和配对的用武之地:一个市场网站通过分享它的组成部分来“激励”不同的企业。这种分享是通过合作或白标完成的。
在这篇文章中,我们将看到一个成功的市场是如何为多个衍生市场铺平道路的。一些衍生产品将使用相同的服务器,但更换组件;其他人会将生态系统复制到他们自己的服务器上,并建立独特的网站。本系列的下一篇文章将深入探讨这一切是如何实现的技术细节。
第一步:构建市场生态系统
你可以用 一张桌子 、两把或者 三把 椅子和一些打开的笔记本电脑来搭建一个集市。在我们的场景中,有两个企业家有销售他人产品的天赋。他们建立了一个轰动一时的砖臼市场,供小镇工匠和古董商出售他们的商品。他们在全国范围内销售,人们不远万里来到他们的商店发现隐藏的宝藏。这就是成功的实体市场的定义。
业主是动态的。一个是当地艺术家和经销商的精明推动者,她用自己迷人的个性和商业智慧开创了这项事业。她的合作伙伴是一位工程奇才,他来了,为他们铺好了砖和砂浆,还建立了后端业务流程,这有助于使他们的市场成为当地艺术家和经销商的圣地。
联合创始人创建在线数字市场
很长一段时间,工程师都有上线的想法。像亚马逊和 Etsy 这样的在线市场让她相信自己的方向是正确的。Covid 19让她别无选择。她开发了一个强大的软件生态系统,拥有漂亮的网页设计,为渴望发现难以找到的艺术品和古董的锁定公众创造了理想的用户体验。
随着他们在线业务的增长,他们的技术和业务合并了。 商品销售内容发现 结合简化的软件流程进行订购和交付。该平台为消费者(需求)和供应商(供应)的高需求提供了理想的搜索和发现体验。凭借天赋和不断的迭代,这些女性发展了她们的数字市场,成为当地艺术和古董的一站式商店。
所有这些都配有一张桌子和两把椅子,现在是乌木制成的。
下一步:拓展业务,共享生态系统
人才孕育人才。一个企业家的突破影响下一代。在这种情况下,一个由强大的生态系统和在线销售敏锐度构建的在线市场带来了衍生产品和合作伙伴关系。
他们的第一次分拆:收藏家市场
在一个场景中,一个硬币收藏家上升到了搜索结果的顶部。每次搜索总是包括他的项目。女性在线市场把他放在一个更大的地图上。但他觉得这并没有影响到他的最佳观众——一群需要更多细节、日期和历史的收藏家。他们需要一种适合钱币收藏的在线搜索和发现体验。他的客户喜欢看到每一个瑕疵和完美,尽可能地接近硬币。
将业务与软件脱钩
这打破了更一般化的市场模式。他需要的是不同的用户界面——但事实证明,不是不同的生态系统/基础设施。因此,他联系了工程师,他们提出了一个计划:她的生态系统,在她的服务器上,仍将管理他的后端数据和业务流程(如搜索和订购),但她会 将其与前端 分离,从而使他能够构建自己的用户界面,在同一引擎上运行:两个非常不同的前端界面集成到一个后端基础架构中。
因此,主要的区别在于搜索和发现体验。他想要一种直接面向所有收藏者的用户体验,而不仅仅是钱币收藏者。因为这将是一个收藏各种收藏品的——邮票、漫画书、挂毯、黑胶唱片。
能看出做媒吗?
收集者认识到原来的 marketplace 的软件组件可以运行任何 marketplace,他只需要根据自己的业务进行定制。这是一个公司 A 向公司 b 介绍独立 API 组件的例子
他们的下一个副产品:与一个流媒体平台合作
一名旧黑胶唱片经销商同时也是当地音乐圈的狂热爱好者。像收藏家一样,他为音乐家和表演艺术家设想了一个不同的市场。他的灵感来自 Spotify 和 YouTube,但他认识到女性市场电子商务生态系统可以帮助他销售和播放其他人的音乐。因此,他联系了这位工程师,并了解到,只需进行一些修改,她的生态系统就可以驱动他的流媒体平台。她解释了可组合 API 驱动的架构如何使他能够插入更适合流媒体的组件——如存储和流媒体或管理艺术家版税的软件。否则,其余的都一样。她向他展示了搜索、订购、支付和交付的四部分模式是如何保持核心地位的(其中“交付”被改为“流媒体和/或交付”)。但要做到这一点,他需要购买一些自己的组件。
他们的第三个副产品:白色标签(生态系统成为产品)
此时,女人们看到了一个机会:为什么不 推广 她们的软件架构并出售它 无品牌 ? 白标 涉及一家企业向其他企业出售其软件的通用版本,这些企业随后在自己的平台上运行该软件,并完全控制其组件和配置。
他们的第一个客户是一群已经在女装市场上出售艺术品的当代艺术品经销商。他们想拓展业务,因为他们的艺术鉴赏家观众需要完全不同的用户体验。他们遵循收集器的相同伙伴关系模型,使用相同的基础设施,但是改变了接口。然后,由于一些最大的艺术家的巨大价格和销量,他们的业务利润激增。他们需要独占性以及对其商业模式和基础设施的更多控制。因此,他们购买了一个白标版本的生态系统,并将其变成自己的,将自己的组件与原始市场的组件进行混合和匹配。天作之合。
下一步
还有许多其他的衍生可能性。例如, 企业撮合 ,A 公司与其他公司共享其 后台系统 的组件,如执行内部会计、库存控制和客户关系的 API。生态系统匹配的逻辑也是如此——一家公司创建了一个包含多个组件的系统,将其公开给其他公司(通常是合作伙伴和供应商),然后其他公司复制流程和组件,替换一些组件,配置其他组件。
我确信在这一点上,更注重技术的读者会问——这一切听起来非常浪漫,但细节中的魔鬼不是吗?事实上,设计、编码和配置中有一些细节需要仔细考虑——但它们并不一定非常复杂。这是任何 API 驱动的无头架构的要点:大多数细节已经由构建第三方 API 的专家处理了。
请继续关注本系列文章的第 2 部分,它将更深入地探讨生态系统,重点关注搜索和发现组件。我们描述了使上述场景成为可能的内容管理(即,可搜索的索引)和前端库。
—
Algolia 搜索和发现与无头生态系统紧密结合。要了解它如何转变您的数字策略, 免费注册 并亲自查看。或者今天从我们的搜索专家那里获得一个定制的 演示 。
ChatGPT 与谷歌和其他搜索引擎的对决——赢家是..
原文:https://www.algolia.com/blog/ai/why-chatgpt-wont-replace-search-engines-any-time-soon/
自从 OpenAI 宣布 ChatGPT 并且人们开始尝试它以来,已经有很多关于它将如何颠覆一切的令人屏息的宣告。其中一个颠覆就是搜索。上 Twitter 或 LinkedIn(或 彭博! ),并且你可以读到 ChatGPT 和类似的 LLM是如何取代 Google 和其他搜索引擎的。
但是,真的吗?
不,谷歌没什么可担心的,至少在中短期内。搜索引擎已经存在了几十年,并将继续存在几十年。对他们来说,缺乏真正的危险与搜索相关性和基于聊天的环境中的用户体验有关。
我曾在Algolia从事搜索工作七年,最近四年专门研究自然语言、语音和会话搜索。我已经了解了什么可行,什么不可行,虽然我对 LLM(大型语言模型)很感兴趣,但我很快就会取代现有的搜索范式。原因如下。
查询公式
具有讽刺意味的是,第一个原因与查询公式有关。我在这里讽刺地说,因为搜索中围绕 人工智能(AI)和 机器学习【ML】的许多工作都是为了减少查询公式的障碍。过去,最基本的搜索引擎将文本与结果中完全相同的文本进行匹配。这意味着,如果您搜索 JavaScript 片段 ,那么 JavaScript 片段 必须正好在您想要查找的文档中。问题是它迫使搜索者尝试并预测哪个文本将出现在文档中。
这里有一个例子:假设你正在清洁煤气灶,你意识到它是热的,尽管你已经有一段时间没用它了。有了一个怂的搜索引擎,你需要在搜索之前问自己:“我应该用 暖 还是 热 这个词?这对我得到的结果有影响吗?”
智能的、ML 驱动的搜索通过扩展匹配并包括“概念上”相似的匹配,如 热 和 热 ,来消除这种负担。搜索者在确定正确的搜索词上花费更少的精力,他们更有可能找到他们最初想要的信息。
然而,ChatGPT 响应严重依赖于提示(即查询)公式。 OpenAI “将此列为限制”:
ChatGPT 对输入短语的调整或多次尝试相同的提示很敏感。例如,给定一个问题的一种措辞,模型可以声称不知道答案,但给定一个轻微的措辞,可以正确地回答。
有时这在搜索搜索者已经知道很多的东西时表现出来,但当搜索者对细节模糊不清时,问题就大了。如果有人搜索后缀-gate的意思,很有可能正确的结果是关于政治丑闻的。Google 和 Kagi 反映了这一点,ChatGPT 没有:
(chat GPT 回应的最后是说后缀-gate 的使用很少。去跟华盛顿说吧!)
当涉及到错别字时,这就更加明显了。我们都会犯错别字,不是吗?有时我们拼写错误,因为我们不知道任何更好的。例如,短语 优等生 在日常生活中是一个不常见的短语,因此会有人想了解更多关于它的信息,但不知道正确的拼写。ChatGPT 如何处理come lad相对于 Kagi 的拼写?
这不是 ChatGPT 没有答案的情况。当你使用正确的拼法时,它会
即使有拼写错误,Search 也必须理解搜索者,否则体验会倒退一步。理解和匹配不同的拼写是困难的。在 Algolia,我们采取两种方法:一种是 直截了当的编辑文本之间的距离;另一种是通过我们即将推出的人工智能搜索,它可以匹配概念,并考虑上下文线索,以便更好地匹配正确的拼写,即使编辑距离很大。
ChatGPT 还有一个问题,那就是它如何显示不正确的结果。或者,实际上,它是如何显示结果的。
用户体验
几十年来,搜索布局通常都是一样的。具体来说:从最相关到最不相关(无论如何衡量)的一组结果。近年来,这种情况有所改变。搜索引擎引入了答案框、边框、建议搜索、多媒体搜索等等。看看阿炳搜索页面:
当然,冰是个异数。这一个搜索结果页面包括大约 20 个不同的组件:流选项、视频结果、图像结果和网页结果。也许那太多了。谷歌、Kagi 和其他公司的份额更少。但重点是,搜索者 总是得到选项 。
搜索者获得选项很重要,因为第一个结果并不总是最好的。它可能是“客观上”最好的整体,但搜索是查询、索引、用户和上下文的组合。所有这些结合在一起,可能会导致第一名以外的结果成为当时最相关的结果。这篇博客文章声称,谷歌搜索的第一结果是 被点击了 28%的时间 。不管这个数字是否准确,它通常是正确的:大多数点击往往不是第一个结果。
什么是基于聊天的搜索?只有第一个结果。
更重要的是,这是在一个基于聊天的环境中。在对话式界面中,用户总是希望得到一个相关的响应,最少的“我不知道”响应。
在 Algolia,我看到一些客户使用我们的搜索作为聊天机器人的后备。聊天机器人自然语言理解(NLU)有时会有很高的失败率(我们已经看到客户接近 50%的失败率),搜索似乎是一个自然的退路。不过,我们不得不修改聊天机器人 UX,不将第一个结果作为响应显示,而是显示几个结果,让用户清楚地看到一个回退。这是用户所期望的。
聊天也会抢夺语境的信息。登陆一个页面并看到相关信息是有好处的:它有助于构建你所找到的信息,甚至可能向你展示原始片段哪里是不正确的或误导的。
找一个想了解棒球本垒打记录的人。这个人听说记录上曾经有一个星号。但是为什么呢?记录是什么?这是指罗杰·马里斯在 1961 年的 61 全垒打赛季,但搜索者不知道,所以搜索 为什么全垒打记录带星号? 对比 ChatGPT、Google、Kagi 的答案:
ChatGPT 提供了一个答案,关于 98 年与马克·麦格威尔的全垒打记录,多年后一直有争议,但 不是带星号的 全垒打记录吗?谷歌在一个回答框中给出正确的答案,并附有链接,Kagi 提供结果。其中,卡吉甚至可能是最好的,因为当人们提到“阿斯特里斯克”时,脑海中浮现的是马里斯,而麦格威尔和邦德也有争议。
平心而论,OpenAI 意识到了这一点。这里有一条来自首席执行官山姆·奥特曼的推文:
但我确实认为,在纯聊天语境中,缺乏语境和多种选择是不可避免的。这就是为什么聊天对于寻找工作时间非常有用;对于了解新兵训练营是什么样子或者为什么人们喜欢浪漫喜剧来说就不那么好了。
这还没有触及产品搜索。这年头花在搜索上的大笔钱不是花在 Google 的 SEO 上,而是 建设搜索一个站点自己的产品目录 。在这些情况下, 非常重要,因此 对于搜索者来说,能够看到选项,点击过滤,通常会进入“发现阶段”这不适合聊天。
还有其他的障碍:法律( )澳洲有法律要求谷歌和脸书为新闻 付费;新闻没有来源自动汇总,他们会怎么想?),成本,和速度立刻浮现在脑海里。这些也许有一天会被克服。过于自信的错误结果也可能如此。
但是用户体验:这一点不会消失。好吧,是的,你可能会说这很容易解决。基于聊天的系统可以一次显示多个结果,让用户决定哪个是最好的。甚至可以根据可信度对他们进行排名。然后,它甚至可以链接,这样搜索者就可以看到信息,并决定它是否准确。更好的是,为什么不包括后续问题的建议或可能有趣的多媒体呢?
祝贺你,你刚刚重建了一个搜索界面。
所以,简而言之:法律硕士很棒。理解用户意图是非常棒的。自动总结功能强大。搜索毫无进展。
知识管理系统:一个重要的内部工具
拥有最佳客户支持的数字服务组织总是依靠其团队成员的快速反应和广博的知识来帮助客户。但随着数字搜索变得越来越先进,这些类型的员工学习和保留更多信息以跟上时代的压力也越来越大。
说到知识管理工具,客户支持团队需要的是一种第二大脑。一个蜂群思维,如果你愿意的话,员工可以从其中快速提取并利用每一点有用的数据,就像他们可以从记忆中提取关键事实一样。
蜂群思维——容易获取所有可用数据——类似于知识管理系统(KMS)。
什么是知识管理系统?
在其最基本的形式中,知识管理系统存储并允许有效检索对员工有用的信息。这种类型的信息可能包括入职指导、培训手册、可用于帮助客户的技术材料(如技术支持论坛中的错误描述)、协作细节和流程改进指南。KMS 的目的是将相关信息快速实时呈现给需要的个人。
“知识管理系统”是一个宽泛的术语,涵盖了许多类型的知识,以及其所有的形式:显性知识、隐性知识和隐性知识。任何能够识别、存储、组织和检索正确知识的知识管理软件都可以被认为是 KMS。您组织的客户关系管理系统(CRM)、文档管理系统和内部知识库,甚至您的销售和营销内容管理系统(CMS),都可以被视为知识管理系统的类型。
作为顾客满意工具的知识管理
有效知识管理的例子有哪些?
Abaan 是一家高科技公司的客户支持代理。他正在与一位客户 Lynn 交谈,该客户对一种较为陌生的产品表示了兴趣。他相对来说是个新手,对产品了解不多。所以他很快转向公司的知识管理系统,他可以很容易地搜索产品的规格,然后能够给客户准确,及时的细节和建议,以帮助她的决策。
有效的知识管理需要大量的搜索
不幸的是,对于许多组织来说,最佳 知识管理 所需的搜索能力根本就不存在。设计不良或过时的搜索功能意味着互不相连的数据孤岛,员工无法获得他们需要的信息,从而浪费了团队的辛勤工作。
具有集中、一流搜索功能的知识管理系统将公司所有数据仓库的内容汇集在一起。您的支持团队可以利用它来有效地帮助客户,这可以带来:
更大的生产力
您的员工是否从太多的孤岛中提取数据?
通过一个中心位置来访问您组织的各种知识,员工可以检索他们成功完成工作所需的一切。一个好的集中式知识管理系统将网络中所有信息源的数据汇集在一起,包括云存储、CMSes、CRM、数据库等等。
无论是达成交易、解决客户问题还是追加销售,员工都可以在一个地方访问所有有用的内容,节省了他们回答客户问题的大量时间和精力。这还可以减少可能发生的延迟,例如,当员工必须从“知识看门人”那里获得信息时,这些人专门知道或有权访问特定的材料。
更高的员工工作满意度
减少追踪重要信息和执行手工任务的时间,让员工有更多时间从事更有回报、高价值的工作,例如提供优质的客户服务。此外,更有成就感的工作经历会带来更高的保留率,更快乐、更投入的员工更有可能主动利用他们组织的知识管理系统。
更加灵活地进行远程工作
借助单一来源的真实 KMS,您的团队可以安全地访问他们需要的数据,无论他们是在办公室、在家里、在旅途中,甚至是暂时居住在其他国家。毫无疑问,为员工提供对知识共享资源的全球访问可以为远程(和混合)员工提供公平的竞争环境。
整体组织绩效更好
组织的每一部分都可能从知识管理系统的投资中受益。您可以使用它来简化一般流程,从而减少瓶颈,例如,有限数量的具有特定技能的员工或缺乏经验的员工无法执行任务。
您还可以减少人们无法在云蔓延中找到重要数据以及不得不在管理不善的文件海洋中导航的头痛问题。知识管理系统将数据逻辑地存储在一个精简、安全的环境中,在需要时可以轻松地将数据呈现出来,并确保 企业工作场所搜索效率 。
如何实施一个致胜的知识管理系统
为了以最佳方式为您的组织知识实施一个中央 KMS,您需要考虑您的各种数据驻留在哪里,以及您的员工通常如何访问这些数据。当你理解了你的员工如何获得你的数据的工作流程,你就需要决定如何建立你的知识管理系统。
创建知识管理解决方案有两种方法:
- 在开发人员或开发团队的帮助下建立一个定制的内部搜索引擎
- 使用由行业专家创建的预制的、可定制的搜索 API
在过去的十年中,让开发团队构建您的 KMS 搜索引擎可能是唯一可行的方法,但随着低代码或无代码技术的进步,高级企业搜索知识管理系统变得更加可行,也更加经济实惠。
此外,构建定制搜索引擎的过程既耗时又昂贵。虽然它确实保证了你完全定制的搜索功能和高度的控制,但你的设置和运行成本会很高。你需要为网站托管和开发者支持做预算,以保持知识库软件的安全和最新,或者潜在地处理问题。此外,优化您的搜索算法可能需要大量的时间和资源。
预先制作的搜索 API 设置和运行成本更低,并且可以帮助您创建高质量的知识管理流程。高端搜索 API 不仅充当高级中央知识管理系统,它们还可以使用您组织的数据来改善在线客户体验。
用阿果企业打造更好的 KMS 搜索
Algolia 的企业搜索技术可以专业地将您的知识管理系统的松散部分结合在一起,创建一个单一的接触点,提供对您的员工所需的所有数据的访问,并为您的公司带来竞争优势。可以:
- 集中搜索体验。 不再需要挖掘多个单独的筒仓。您为网络文件、数据库、CRM、CMSes、知识库、笔记程序等提供了一个单一搜索栏
- 借助成熟的搜索算法、集成和用户界面库,让您的解决方案快速启动并运行
- 按需付费 采用灵活的成本计划,满足您组织的预算需求
了解 更多 关于我们的企业搜索以及它如何让您的知识管理系统更好地为您的员工服务。
想看看 Algolia 的演示吗? 让我们知道 ,我们会尽快安排。
为什么网站搜索在今天的数字经济中至关重要
原文:https://www.algolia.com/blog/product/why-is-site-search-so-essential-in-todays-digital-economy/
如果你正在实施一个新的网站搜索项目,或者刚刚开始这方面的研究,这篇博文就是为你准备的。我们将简要介绍站点搜索能为您的业务做些什么,以及一些如何实现站点搜索的例子。
什么是站点搜索,它能为你的在线业务做些什么?
站点搜索 是一种使用户能够以 速度和 相关性搜索在线公司内容或产品目录的技术。伟大的网站搜索是为你的业务量身定做的。
一个优秀的网站搜索不仅会不断地对网站进行索引,以确保最新的内容易于访问,它还会引导用户探索和发现网站的内容,帮助他们连接到他们可能甚至不知道自己感兴趣的内容。
最佳网站搜索 通过捕捉访问者最感兴趣的内容和产品的有价值数据,个性化购物体验 。
更好的网站搜索案例:增加转化率,降低支持成本,增加客户忠诚度
站点搜索在发展业务、降低支持成本和创造更好的客户体验方面有着巨大的潜力。
当一家公司让他们的搜索栏 更加可见 时,他们看到了:
- 网站搜索量攀升了 439%
- 当访问者使用搜索时,他们在网站上停留的时间增加了 110%
- 页面浏览量增长 45%
- 目标完成量增加了 242%
搜索还可以 增加点击量和 转化率 对于电商之类的商家:
- 在黑色星期五,新用户的订单率增加了 150%,而“加入购物车”率增加了 32%
- 回头客的订单率和“加入购物车”率分别提高了 13%和 10%
- 每用户 1.4 次点击,而之前的解决方案为 1.1 次
显示搜索栏前端和中心
谷歌、亚马逊和 YouTube 是我们互联网体验不可或缺的一部分,它们都是从搜索开始的。因此,毫不奇怪,当搜索单个网站的产品、内容或信息时,访问者希望获得与这些网站相同的便捷性和速度。
平均来说,你有 15 秒的时间来吸引顾客,直到他们离开你的电子商务网站。 大约 30% 的访问者会使用你的搜索栏找到他们想要的东西,其余的会浏览你的网站。
研究表明,使用搜索的访问者找到他们正在寻找的东西并转化为客户或潜在客户的可能性是仅仅浏览的用户的 3 倍。
商家受益于网站搜索
有几种类型的网站从有效的网站搜索中获益最多:
电子商务网站
当购物者知道他们在寻找什么时,他们不会想在众多产品类别中寻找。你也不希望他们这样做,因为浪费时间就等于失去客户。因此,在任何时候,尤其是在 最繁忙的购物季节, 给你的访客最好的网上购物体验是至关重要的。帮助他们轻松搜索、查找和购买,并看到投资回报的增加。
媒体网站
媒体网站上的内容不断扩展和变化。读者和视频观看者很容易在这样一个内容丰富的环境中迷失方向。网站搜索可以帮助他们找到它,引导他们到感兴趣的新的相关主题,并延长他们在网站上停留的时间。
【SaaS 公司】
软件即服务(SaaS)平台允许客户搜索他们创建的数据,可以极大地增强用户体验。而且随着每一家 SaaS 公司现在平均面临几乎10 个竞争对手,提供一个更好的 UX 比竞争对手更重要。
其他业务
受益于内部网站搜索的其他类型的高搜索网站包括网络论坛、维基和知识库。 医疗保健和金融行业 的企业也能从顺畅的网站搜索中受益匪浅。
数据驱动的分析——分析并利用有价值的数据
用户每次搜索你的网站,都会产生有价值的用户意向数据。 用户在用自己的话告诉你他们的欲望。借助网站搜索分析功能,您可以实施战略变革,例如:
- 优化结果 :一旦你评估了趋势和自己的业务目标,一个强大的网站搜索将允许你根据人气等属性微调相关性,以确保 最相关的结果 在网站用户中排名最高。
- 填补内容空白 :访问者可能会搜索你甚至还没有考虑过要写的内容。
- 更好地理解您的用户 :谁在搜索您的产品?他们住在哪里?哪些产品在哪个月最受欢迎?网站搜索分析有助于市场细分。
定制网站搜索示例及最佳做法
有许多 标准 和高级站点搜索功能,包括 AI 站点搜索。但我们会保持简短,并专注于关键的网站搜索功能。
搜索叠加
搜索覆盖是一个弹出窗口,让您在不影响底层屏幕的情况下搜索。
联邦搜索
您可以添加 联合搜索 来返回来自多个域的结果,包括您的网站、支持和社区页面。在这张图片中,您可以看到描述性搜索结果和每个页面的预览。
这是一个全面的联合体验,为您的用户显示信息和许多选项。
搜索结果高亮显示
在搜索结果中突出显示查询短语是搜索的基本 UI/UX 部分。
过滤器和刻面搜索
《洛杉矶时报》(下图)有一个庞大的文章数据库。为了帮助用户导航,他们在搜索结果页面中加入了 过滤器 。
公司可以在搜索中应用过滤器和方面。 面 类似于过滤器,它们缩小了 结果的范围,但是它们是动态的,可以根据结果的上下文而改变。动态分面搜索如下例所示:
即时搜索与可视化结果
即时搜索 和 搜索建议——将结果显示为用户类型——是站点搜索的最佳实践。可视化结果为用户提供结果预览,帮助他们缩小搜索范围。“当然,”你可能会想,“这对于电子商务商店来说是有意义的,但是其他网站呢?”
B2B 网站也可以更直观地显示网站搜索结果,如下图所示——Zapier 在自动完成建议中使用徽标,帮助访问者更直观地发现结果。
处理搜索错别字和拼写错误
对于网站搜索来说,一个不可见且经常被忽视的 UI 元素是如何处理打字错误和拼写错误。介于 之间的某处 10-25%的搜索 可能包含一个拼写错误!包括 错别字容忍度 的一些味道是站点搜索的最佳实践。
《洛杉矶时报》不能很好地处理拼写错误,所以一个不经意的搜索者可能会返回到谷歌。
下面是《洛杉矶时报》和《卫报》如何处理拼错的“营养”搜索的两个例子。通过显示修正后的结果,《卫报》提供了比《洛杉矶时报》更好的用户体验。这是一个明显的拼写错误,但不太明显的拼写错误会导致用户认为该网站没有他们搜索的答案。
底线
搜索栏是网站功能和设计的重要组成部分,对我们大多数人来说,使用没有搜索栏的网站会显得——嗯,很奇怪。设计网站时,搜索栏是显而易见的,但是真正有用的网站搜索不仅仅是有一个搜索栏。
世界知名品牌如 Lacoste、Stripe、Twitch 和 Birchbox 都将网站搜索 Algolia 作为他们首选的网站搜索引擎。其强大的搜索功能、分析、安全性和易用性值得信赖,它是一个开箱即用的解决方案,深受 web 访问者和开发人员的喜爱。
要了解 Algolia 能为您做什么, 开始免费建造。
为什么零售业的未来是混合购物体验——在 eTail East 了解
原文:https://www.algolia.com/blog/ecommerce/why-the-future-of-retail-is-the-hybrid-shopping-experience/
**Algolia 首席执行官 Bernadette Nixon 将出席eTail East Conference**会议,讨论零售商如何更好地适应进一步改善客户的在线和店内购物体验。
您可以在此处 阅读 会议摘要,并在 2022 年 8 月 9 日(星期二)参加我们的专题讨论会。您还可以参观 504 号展位的 Algolia,并与我们的搜索专家探讨如何为您的企业打造最佳混合零售体验。
零售业的顶尖人物将齐聚 etail,探讨行业中最紧迫的问题,包括组织现在和不久的将来需要适应哪些中断。Algolia 将与 Party City、Abercrombie & Fitch 和 Lowe's 公司一起领导一个小组,讨论实体和数字之间的界限如何变得模糊,以及企业正在采取哪些措施来确保他们能够在这个不断变化的环境中取得成功。
定义品牌混合零售
虽然疫情迫使零售商加快数字创新,但它也改变了消费者的购物方式。实体和数字之间的界限现在变得不那么明确,更多的消费者通过手机 和台式机搜索和购买 ,同时也通过在线搜索寻找他们附近的零售商。共性:通过搜索做决定。
一旦消费者找到了他们想要的商品或他们想在网上购物的零售商,搜索就是他们决策过程中成败的关键。找到一个产品有多快多容易?这是正在展示的产品品种吗?这家零售商的库存中是否有消费者正在寻找的商品?一旦消费者找到了他们想要的东西,产品在网上看起来会像在现实中一样吸引人吗?
混合零售必须解决这些类型的问题,以数字化方式引导顾客,同时让他们参与到实体购物体验中。搜索营销,或 搜索营销, 通过电子商务零售商的精选搜索结果推动销售。使用搜索和分类方法组织产品需要一个 搜索即服务 解决方案,让营销人员和企业主能够控制搜索结果。
在 网上购买、店内提货 (BOPIS)场景中,在线搜索体验也会影响到物理位置的流量。合适的移动搜索体验能让品牌更好地脱颖而出,提高转化率。虽然最终结果是买家参观实体场所,但推动销售的机制是数字化的。
创造未来的零售体验
零售商现在正努力建立一个能够提供现代体验、准确库存和引人入胜的发现体验的在线业务。品牌还面临着平衡实体零售和在线参与增长利润的挑战,同时面临劳动力和商品成本上升,导致商品销售成本(COGS)上升。
面对来自成熟的在线平台和新的利基在线零售商的竞争,竞争格局正在推动实体供应商进行发展和调整,以保持和扩大市场份额。零售商现在需要围绕搜索关注点制定策略,包括:
- 提供现代用户体验 —首先向用户显示最相关的结果
- 为错别字留出空间——不要让用户重新打字,重新考虑他们的决定。相反,让搜索功能在用户输入搜索查询时纠正或解释错误和拼写错误
- 预测你的用户想要什么 —提供随你输入的搜索结果和搜索查询建议,帮助用户更快地找到他们想要的东西
Algolia 将与 eTail East 的领先零售创新者一起讨论他们如何利用尖端技术塑造行业的未来,并研究商店在这一新环境中的角色,从电子商务履行选项到高科技增强。我们在 504 号展位的专家可以帮助您找到简单可行的方法来实现未来的混合零售体验,无论您是首席技术官、CMO 还是跟单员:
- 了解 Algolia 搜索&发现平台,该平台能提供极快的搜索结果,以及如何通过 Algolia 推荐添加个性化内容
- 探索混合零售体验和 Algolia 推荐的提高购物车价值的方法
- 讨论成功的混合零售解决方案的策略——包括网上购物和店内提货
Algolia 通过丰富店内或网上的顾客参与体验,创造更深层次的个性化。通过混合方法,Algolia 正在为全渠道零售开辟一个新的领域,扩展客户对话以及数字和实体之间的联系。
参加我们的小组讨论并参观我们的展位,了解我们的 API 优先方法和高级开发人员工具如何将强大的搜索实施简化到任何技术堆栈中,支持任何地方的任何体验,根据零售商的特定需求塑造体验,并在必要时轻松进行调整。
考虑到可扩展性和可靠性,我们的客户信任 Algolia 搜索和发现:
不是要来东波士顿吗?
使用 个性化演示 体验 Algolia 解决方案,并通过我们的搜索专家之一获得 对您网站的搜索进行免费审核。
为什么我们推荐推荐做推荐
原文:https://www.algolia.com/blog/product/why-we-recommend-recommend-to-make-recommendations/
毫不奇怪,Algolia 相信伟大的搜索发现体验的力量。事实上,我们围绕它建立了整个公司。我们的目标一直是提高用户的速度和相关性,以便他们可以找到他们正在寻找的东西,并继续他们的一天。
我们已经意识到搜索并不是寻找或发现的唯一途径。搜索需要与其他发现手段相结合,以提供更深远、更令人满意的体验。
想想你的用户的日常在线体验。他们不是在搜索栏中输入查询后才消费内容和进行购买。他们还会点击朋友和家人发给他们的链接。他们在网飞“推荐给你”的一个标题上按了“播放”。他们将另一件商品添加到您的亚马逊购物车中,因为它被建议作为“人们经常购买”他们最初感兴趣的产品。
换句话说, 他们是按照建议 行事。他们这样做是因为推荐让他们的在线体验更容易、更愉快。相关的推荐改变了在线的典型动态:推荐为你找到内容 ,而不是需要搜索。这很重要,因为产品质量是大多数顾客坚持使用品牌的主要原因。在一个比以往任何时候都更难留住顾客的世界里,这意味着很多: “产品质量是 74%的忠实消费者拒绝更换品牌的主要原因。”
这就是为什么我们建立了 Algolia 的 推荐产品 的原因,也是为什么我们现在告诉你我们推荐使用推荐来做推荐(我们知道— meta)。有策略地使用,结合出色的搜索体验,推荐可以为最终用户创造令人满意和吸引人的在线体验。让我们花些时间来探索一下为什么它能如此好地补充搜索,如何使用它来增加与客户的相关性,以及它在哪里最有用。
我们为什么建推荐
现在网上的信息和内容比以往任何时候都多。在一天的时间里,我们大多数人都会花时间筛选 【娱乐】 (网飞有 7000 多种图书可供选择) 产品 (亚马逊的目录由 1200 万种产品组成,并且还在不断增加),以及 媒体 (一些新闻网站贴出了 成千上万种
虽然有这么多信息唾手可得是件美妙的事情,但信息量的庞大意味着我们大多数人花更多的时间去寻找我们想要的东西,而不是真正享受它。在 Algolia,我们几年前就解决了这个问题的搜索方面,通过使用数据和各种搜索算法的力量,使搜索体验更快、更直观、更相关。我们希望将这种专业知识引入推荐领域。
为了改变用户体验,我们首先必须关注开发者体验。我们知道,我们需要让推荐的工具套件易于实现并且超级快速,就像搜索一样。这就是为什么我们采用了一种构建模块的方法,开发人员可以将其集成到自己的体验中以增强它。
我们还想构建一个可以在多种环境下工作的解决方案:主页、类别页面、产品详情页面和文章页面。根据不同的场景(我们将很快进入一些用例),推荐可以在用户旅程的不同部分得到有效利用;我们希望适应每一种潜在的使用情况。
推荐零售
推荐的一个最明显的使用案例是在线零售环境。无论你是选择将它整合到你的主页、产品详情页面,还是结账体验(或者全部三者),它都可以作为一个工具来激励用户,引导他们找到他们需要的产品。例如,将“推荐”整合到主页中,就可以将它转变成一个激发灵感的工具。马上,客户就会看到,他们通过一系列周到的建议获得了定制的、量身定制的体验,而不必自己开始搜索。
然而,推荐之旅可以在主页之外继续。用在产品页面上,可以帮助用户细化需求。也许用户登陆的产品并不完全是他们想要的。使用“推荐”来展示不同颜色和功能的类似产品,可以让人们继续找到相关信息,最终做出最佳选择,而不必返回主页重新搜索。有了 Algolia,放入购物车的产品增加了 32%。
推荐甚至可以集成到结账体验中,通过经常与用户购物车中的商品一起购买的产品推荐来增加平均订单价值(AOV)。战略性地使用“推荐”可以让客户在每个接触点都参与进来,给人以支持和帮助的感觉。它还会导致整个网站的订单率增加 150%,转化率增加 13%。我们还测量了 增加+20%的加入篮子 和降低-24%的 反弹 比率。
为媒体推荐
推荐在媒体环境中有着不同的功能。首先,用户并不想购买。此外,人们通常从谷歌搜索页面或通过朋友或家人发送给他们的链接登陆内容和文章页面。在这种情况下,文章页面是用户对你的网站的第一个——也可能是唯一的——接触点。
由于这个原因,推荐是在文章页面上使用的一个很好的工具。你可以把推荐看作是一个迷你主页,在你网站的其他地方突出大的热门文章。你也可以用它来链接类似主题的文章。无论哪种方式,推荐都可以极大地吸引用户,并为他们提供他们原本会自己去搜索的内容。与其他提供商相比,Algolia 的推荐点击率提高了 60%。
搜索旅程内推荐
最后,推荐可以整合到任何网站的搜索过程中,使搜索结果更有帮助和相关性。通常,这看起来就像在前五个左右的搜索结果后添加一个推荐产品或结果的转盘。
同样,你可以选择多种方式之一。在零售环境中,您可以使用“推荐”来提供一组“经常一起购买”的结果,或者您可以显示许多相似的 SKU 来增加用户可能想要购买或浏览的替代产品。在媒体环境中,你可以展示其他带有相似关键词的文章来吸引用户。
在这个场景中,我们可以真正看到推荐如何补充搜索体验。当企业拥有合适的工具时,他们可以找到自己的秘方,为用户打造最吸引人、最有帮助的体验。当这些工具易于配置、试验和调整时,可能性是无穷的。
对于一个影响如此之大的改变来说,实施起来非常容易。只需三个步骤和六行代码,您就可以开始推荐了。
为什么每个企业都应该从第一天就捕捉点击+转化事件
你知道我们在生意上走得越远,我们用商业语言交谈得就越多吗?我们将开始参考整体概述和一些驱动的方法,我们将不时地接触关于大规模转移前沿范例的基础。
好吧…我确实用了“大规模”这个词。我向那些被我的商业术语困扰的人道歉。
在商业中你会经常听到的一个词是分析。因为它经常被用作行话,所以很容易认为它只是“杠杆”或“稳健”等毫无价值的陈词滥调。尽管这个词——分析——是一颗未经雕琢的钻石,一朵荆棘中的玫瑰(好吧,我不说了)。说真的,什么是分析?它们如何明显地影响我构建应用程序的方式?我什么时候应该关心他们?让我们一起来探究答案吧。
分析磨练商业的每一个领域
当你想到这个词时,分析只是指将被分析的数据。你可能会问,我们在这个分析中寻找什么?嗯,完全看情况!精心制作的分析作为许多不同流程的输入数据,包括业务方面和技术方面。
让我们用一个电子商务的例子来探索一下这两个方面。想象一下,你一直在记录一个产品在你的网站上被点击的每一次,以及每一次交易发生的每一次。光是这些数据就足够通用,可以用于各种不同的事情,但它仍然足够适用,在所有这些情况下都有价值。
例如,在业务方面,您可以问自己这样的问题:
- *是不是有些产品没有任何点击,更别说转化了?*这表明该产品对你的受众没有吸引力,并且/或者无法被发现。
- *是否有些产品产生的点击量很大,但转化很少?*这可能暗示产品页面或产品当前的展示方式有问题;也可能只是产品本身的一个因素。
- *是否有些产品几乎总是转化中的唯一产品?*也许这表明该产品更多的是一种冲动购买,甚至在顾客往购物车里添加任何东西之前就购买了。
- 特定产品的大量转化是否可以归因于一个营销渠道?这里的明显效果是,如果是这样,我们应该做更多的营销!
- *我们网站上的哪些页面最擅长将点击转化为转化率?*好吧,那么让我们找出是什么让这些页面成为转换机器,并将这种逻辑应用到其他地方。
- *某些产品是否比你预期的更受季节性关注?*那么,或许你与该商品相关的营销应该比现在更适应季节变化。
- 用户在转换前点击了多少产品?如果这个数字很高,这可能表明你的产品页面转换得不够好,或者你的应用程序的结构使得很难找到潜在客户想要的产品。
- 回头客会一直搜索相同的商品吗?也许把这些物品放在最前面和最中心是个好主意,这样他们在重复购买时就不会有摩擦了!
- *潜在转化被放弃的频率有多高?*同样,如果这个数字很高,这表明您的应用程序流程降低了潜在客户的速度,打消了他们的兴趣。
看看这些问题是如何得到不仅仅是商业人士的答案的?当我们在像 Algolia 这样的灵活系统中从第一天开始跟踪点击和转换事件时,我们就可以“整体地”改善我们的业务——换句话说,跟踪分析使业务全面改善。
数据分析可以为新功能输入数据
人工智能是我们现在用来解决电子商务中复杂问题的最大工具之一。比如 Algolia 推荐可以(顾名思义)根据之前的一些数据,向用户推荐产品、内容或者类别。如果他们喜欢现在正在看的产品,我们可能会向他们推荐他们喜欢的产品,或者推荐那些经常与他们正在看的产品一起购买的产品。无论哪种方式,我们都需要输入数据来训练我们产品目录上的人工智能,我们这样做的方式是向 Algolia 发送点击和转换事件!
请注意,不同的功能需要不同数量的训练数据。例如,Algolia 让您 A/B 测试不同的索引设置,但只有当您有办法测量结果时才有意义。输入分析。当您从一开始就发送点击和转换事件时,A/B 测试可以定量地测量对您的搜索索引配置的轻微调整的影响。这意味着我们拥有的数据越多,我们对应用程序的影响就越大。个性化也是如此——如果我们没有任何关于用户行为的数据,那也没关系!我们不会以任何方式将结果个人化。但是我们掌握的用户行为数据越多,我们就能更好地调整搜索结果,使其更有可能反映用户偏好。
另一方面,如果没有至少一些数据,如何创建一个经常一起购买的部分呢?你不能只显示随机结果,因为很明显它们是随机的——例如,如果你经营一家技术经销商,你最终会说 iphone 通常是按照 Galaxy 手机的顺序购买的,而更合适的建议是充电器或手机壳。Algolia 可以为我们处理“经常一起购买”部分——通过在过去 30 天内与多种产品共享至少 1,000 次转换事件(在我们的示例中为结账),我们就可以开始了。
相关产品是电子商务网站通常应该有的部分。由于 Recommend 的混合动力引擎,您可以从第一天开始根据您记录中的信息进行相关产品推荐。但是,为了真实地反映用户的行为,你需要事件数据——过去 30 天的 10,000 次点击或转换足以让 Algolia 对产品之间的一般关联做出准确的结论。但是,如果您从第一天开始跟踪点击事件,那么当您选择实现这个相关产品部分时,您可能已经拥有了在 Algolia 中训练模型所需的数据,这样您就可以立即前进。
分析可以让你免除未来的头痛
实话实说吧。如果你是开发人员,你的经理会要求你在某个时候实现一些分析系统。如果你是经理,你知道你会提出要求。然而在许多代码库中发生的问题是,不同的分析以不同的方式被跟踪,因为它们在不同的时间被实现并且用于不同的目的。通常,相同的事件会在多个分析系统中重复出现,这种情况会被所有相关人员所鄙视。我们如何避免这个难题?
下面简单回答:从第一天开始尽可能多的跟踪。
这个简单的指南能帮上忙,要点如下:
- 分解用户交互中可能发生在页面上的每一件小事。
- 尽可能详细,最好在事件本身中包含足够的信息,甚至可以通过编程重现事件。
- 建立一个系统,这样你就可以从用户到达你的网站的那一刻起,到他们离开的那一刻,真实地跟踪他们的每一个选择。
- 不要忘记在你的主站点之外的交互点跟踪事件,比如电子邮件、广告、推送通知,或者跨不同的域/子域属性。
- 不嫌多有意义的事件!绝对不要为用户滚动的每一个像素发送一个事件,但是如果他们停留在网站的某一部分,那就有意义了!将它事件化!
在未来,您将最终实现更多需要分析的功能,但您已经拥有了这些数据。您可以随时过滤掉分析仪表板中您不关心的额外数据,但您可以放心地知道,无论何时您或其他人需要这些数据,它们仍然存在。你永远不必重新实现分析的概念,或者在不同的平台之间划分你的事件数据。在分析您的业务表现时,您将永远不必担心考虑重复事件,并且您将始终拥有足够的数据来准确地为您的客户流建模。
我们学到了什么?
- 虽然有些人谈论分析就像另一个陈词滥调的商业术语,但它实际上是一个非常有用的概念,应该立即在您的应用程序中实现。
- 您将来想要实现的功能可能取决于您是否已经拥有可用的分析数据。
- 对于不同的特性和使用不同的平台,你可能最终会实现一些度量跟踪工具很多次——所以通过提前计划和现在存储一切,你会为自己节省很多工作。
- Algolia 是存放所有物品的好地方!如果你更喜欢将你的分析数据存储在其他地方,但想要 Algolia 的仪表板和人工智能驱动的搜索的好处,也有针对 GTM 和细分市场的插件。
如果您已经做到了这一步,我敢打赌您已经准备好开始跟踪您的应用程序中的点击和转换。这里是注册 Algolia 的链接,这里是帮助你实现这个的详细指导指南。如果您还没有在现有的应用程序中走过这条路,请不要担心——现在是您走上正确道路的机会了(我们不会告诉任何人😉).
编写可测试、可维护、可用的代码
原文:https://www.algolia.com/blog/engineering/writing-usable-code/
写代码很难。写高质量的代码,更难。
对于一个依赖团队工作的软件公司来说,或者对于跨越多年的代码项目来说,一个经常相关的代码质量度量标准是它的可维护性(可修复、可修改)和可扩展性(可重用、可组合);换句话说,从开发人员的角度来看,代码是否可用。
让我们来看看设计可用代码的方法。我们将看到可测试性和松散耦合技术如何使我们的代码更易于维护。我们将介绍使我们的代码可组合和(可重用)的方法。
可测性
测试代码是指对其进行受控输入,以验证其产生预期的输出,并表现出预期的行为。
测试代码有很多方法;我们将关注集成测试和单元测试。
我们将会看到这些类型的测试在验证我们的代码在常规和 边缘情况 (即在可能发生的事情的边缘的情况)下的行为时是如何互补的
集成测试
集成测试是孤立地测试软件 的 部分,将它们暴露给真实的输入,并使用 真实的 I/O 系统 。
检查软件的 部分在暴露于真实 I/O 系统时是否如预期的那样运行 。集成测试用于常规用例(所谓的“快乐路径”), ,因为在真实的 I/O 系统中通常很难诱发边缘情况行为 (数据库连接出错、数据损坏、文件系统故障、网络超时等)。
单元测试
这是隔离测试软件 的 部分,控制它们的输入,以及 使用虚拟 I/O 系统和依赖关系 。当暴露于输入和依赖关系的常规情况 以及边缘情况 (慢依赖关系、损坏的依赖关系、出错的依赖关系、无效输入等)时,它验证它们的输出和行为。).
我们所说的“依赖”是指一段代码不拥有但使用 的所有东西(通常是同一软件的其他部分,如服务、模块等)。)
单元测试 一段常规以及边缘情况下的代码需要 对其使用的依赖关系(API 客户端、数据库连接、邮件程序、日志程序、授权层、路由器等)进行精细控制。).
简而言之, 单元测试 检测发生在边缘案例上的问题(即,在可能发生的事情的边缘),这是集成和端到端测试所不能做到的。
( )重新解读马丁·福勒的单位测试图 )
当然,有时候, 我们的软件在野外接触到的案例太多了 无法完全测试;但是即使这样,单元测试仍然是一个有效的工具,以确保被识别的边缘情况得到正确的处理。
检测所有的东西,以及如何到达那里
为了对我们的代码进行单元和集成测试,我们需要这样的能力:
- 独立运行部分软件
- 我们将通过将每个关注点隔离在其自己的范围内来做到这一点
- 归纳我们代码中的边缘情况
- 我们将通过控制依赖行为,使用依赖模仿来做到这一点
- 用虚拟依赖替换依赖的实现
- 我们将通过注入模拟依赖关系来实现这一点
单一责任原则:隔离软件的各个部分,让它们独立运行
通常,一个软件不止做一件事,甚至一个单独的特性也可能依赖于其他几个特性。
然而我们想要隔离软件的特性,因为一次测试一个单独的特性:
- 使测试的设置更容易
- 使我们需要测试所有情况变得更加明显,而
- 帮助查明测试失败的原因
为了达到期望的隔离级别,我们将 单一责任原则 (SRP)应用到我们的代码中,声明我们软件的每个部分都应该 处理一个单一关注点 。
关注的范围与软件相关;例如,在大多数发送电子邮件的软件中,邮件服务是一个单一的职责,将电子邮件发送到 SMTP。但是在电子邮件平台的代码中,邮件发送者可能跨越许多关注点(SMTP、模板、安全性、权限、速率限制等)
既然我们有了与清晰关注点的依赖关系,让我们看看如何在代码中自适应地选择和初始化它们。
一段代码获取其依赖项的传统方式是自己构建或获取它们;例如,负责在 JSON API 上查询用户的服务构建自己的 API 客户端,或者从全局单例中获取它。
将初始化的依赖关系传递给一段代码,而不是让它构建或获取它们 让我们能够控制依赖关系如何初始化。
代码失去了对其依赖项的控制,并期望接收完全初始化的依赖项。
这种模式被称为 【控制反转】(IoC),或者“依赖注入”(DI) 。
这本身是一个强有力的原则,但是当谈到可测试性时,它需要一个完全不同的维度,我们将在下一节中看到。
用虚拟依赖替换依赖的实现
我们看到注入依赖项是一种在使用它们的代码之外控制它们的初始化(进而控制它们的行为)的方法。
继续我们之前的例子,一个依赖于 JSON API 客户端的例子,我们如何在边缘情况下(响应缓慢、超时、JSON 中断、响应无效等等)使用这个 API 测试我们的代码?
我们可以操纵 API 客户端,人为地增加它的延迟,破坏服务器返回的 JSON。然而,这也会给实际的 API 客户端添加大量的“测试”代码,有可能成为产品使用中的一个问题。
为了解决这个问题,我们可以一起使用 API 客户端的另一个实现,能够 模拟常规和边缘情况:模拟实现 。
模仿依赖是一种完全控制它们暴露给被测试代码的行为的方法,用更少的努力模拟各种边缘情况。
一个 mock 在外表上看起来和真实的东西一模一样(公开了相同的方法),但实际上是中空的,并且只会产生测试用例所需的输出(正常输出、缓慢输出、错误等)。)
对于一段代码来说,接受一个模仿而不是真实的东西, 它不应该期望被注入一个具体的类型,而是用一个抽象来表示依赖 。
这种抽象将关注依赖能够做什么(它的方法的签名),而不是它是如何实现的。
为了在支持它们的语言中实现这一点,我们通常使用接口。
接口抽象了代码中的实现,因此一个实现可以被遵循相同接口的另一个实现所替代。
注意:我们使用术语 接口 作为它的广义理解,但是不支持 API 级接口或类型的语言仍然可以依靠 鸭类型 来应用这个原则。
可用性
在软件可以重用之前,它首先必须是可用的–拉尔夫·约翰逊 —编程智慧(@ code Wisdom)2020 年 2 月 17 日,推特上
好了,现在我们可以测试了。我们如何使我们的代码可用?
重申一下,我们所说的代码可用性是指:
- 可维护性 轻松修改或修复代码的能力
- 可组合性 (或可重用性),通过轻松组合代码的各个部分来扩展代码的能力
事实证明,我们用来编写可测试代码的那些步骤实际上同时也使它变得更加可用。
可维护性
可测试性对于可维护性来说是一个巨大的胜利,因为通过测试,我们可以验证所有被测试的案例在代码库更新后仍然工作。
单一责任原则 确保: –代码是:以精确映射我们的应用程序的关注点的方式进行分区;
- 每个关注点都是清晰可辨的,这增加了代码库的可发现性,在维护过程中也很有帮助
- SRP 让我们的代码 高内聚低耦合 。
依赖注入 确保代码每一部分的 API 都明确了它所需要的依赖。软件的依赖图通过代码的 API 变得可见,这也有助于维护。
依靠抽象类型 (接口)来模仿我们代码中的依赖关系会产生更干净、耦合度更低的 API。与 SRP 相结合,抽象依赖隐藏了实现细节,否则这些细节会通过具体类型泄露,这正是我们想要的,因为:
- 遵循 接口隔离原则 使我们的软件的耦合性变松
- 它遵循德米特 的 定律,说明 在没有关于其结构的先验知识的情况下提供可用的信息降低了相互作用部分的耦合
这些原则导致的松散耦合 限制了当需求变化时需要重构的代码数量,从而简化了可维护性。
可组合性、(再)可用性
可组合性: SRP 和 DI 结合使用产生了 一个软件,它的各个部分是可组合的 ,因为特性可以彼此独立地使用,这使得通过利用现有代码在软件中构建新特性变得更加容易。
可重用性: 我们软件各部分的松散耦合(见上文)使得我们的代码具有可重用性。
模仿“不可模仿”的依赖关系
有些依赖可能不容易被模仿。这有很多原因;以下是其中一些,以及可能的解决方案。
依赖关系暴露了一个“开放”的 API,太宽泛而无法抽象
你可能会处理期望无限变化的输入的方法,这可能导致无限不同的输出。例如,公开 GetTodos(additionalSqlFilter: string)
方法的依赖项。
现在想象测试 additionalSqlFilter
所有可能的值(剧透:不能,因为依赖关系暴露了一个开放的 API: SQL)。
为了解决这个问题,我们可以 将依赖 封装在一个抽象中,以 公开一个带有有限数量方法 的封闭 API。
继续我们的例子, 我们将只暴露必要的预定用例 用于数据获取;比如 GetAllTodos(done: boolean)
和 GetLateTodos(done: boolean)
。
这种模式被称为 数据访问层 ,这是一种以可测试的方式抽象数据库和其他可查询 API 交互的好方法。
依赖性暴露了许多不同的关注点,使得抽象变得困难
通常情况下,第三方依赖者会提供一个 API,为不同的用途提供不同的关注点。
在你的代码中使用它们作为具体类型会使测试变得复杂,因为它们比严格必要的更具欺骗性,因为被测试的代码片段很可能不会立刻使用依赖关系所暴露的所有问题。
SRP 告诉我们解决方案是让每个依赖集中在一个领域;但是,如何在第三方依赖上实现这一点,因为我们不拥有 API?
让我们以 Algolia API 客户端为例。如果您的软件使用的 API 客户端只是它的“搜索”功能,您可能希望将客户端抽象在一个接口之后,只暴露一个“搜索”方法;这样做会有一些好的副作用:
- 测试将保证被测代码永远不会使用 API 客户端上除“搜索”方法之外的其他方法(只要我们不愿意更新接口),从而减少所需的测试设置
- 很明显,我们使用 API 客户端只是为了搜索,如果只是在界面的命名上(像 SearchClient 这样的东西适合我们的用例)
如果反过来我们需要在同一个软件中添加索引操作,很可能应用程序的“搜索”和“索引”关注点会被用在不同的上下文中。我们可能希望他们将同一个 Algolia API 客户端包装在另一个只包含相关“索引”操作方法的接口 IndexerClient 下。
这个原理叫做 界面分离原理 。
这不是固若金汤吗?
是的!有些 实心 的原理与本文介绍的相同。
固然把这些原则的重点放在了 面向对象编程(OOP)——例如 开闭原则 。
我相信人们也可以接受 SRP、DI、抽象和嘲讽(或者它们的子集),不管这种语言是否是面向对象的。
同样,
是关于控制代码的
软件开发应该总是包括为可测试性设计代码,以迫使我们精细地控制它的行为。事实证明,这正是我们首先需要使我们的代码(可重用)可用的东西。
如果你对以上任何一个话题有任何疑问或观察,请随时 ping 我:我是 Twitter 上的 @jeromeschneider 。
Zendesk + Algolia:愉悦客户的发现体验
原文:https://www.algolia.com/blog/product/zendesk-guide-search/
Forrester Research 告诉我们,76%的消费者使用自助服务帮助中心来寻找问题的答案。你的支持团队花费数小时来创造这些答案——如果找不到这些答案,所有的工作又有什么用呢?在 Algolia,我们致力于加快发现和改善客户体验。
不到两年前,我们发布了 Zendesk 的扩展,这是我们第一次与帮助中心解决方案集成。今天,我们很荣幸成为 Zendesk 官方指南和 Zendesk 指南企业合作伙伴。
打造更好的客户体验
Zendesk 和 Algolia 有一个共同的目标,即让企业变得更加可靠、灵活和可扩展,最重要的是,让它们能够建立一流的客户体验。我们的伙伴关系使目标很容易实现。
在寻求支持时感到沮丧和浪费时间的概念正迅速变得过时。为了提供出色的客户体验,我们必须达到或超过谷歌和亚马逊等大公司之前设定的用户预期。搜索是网上发现的主要方式:让它变得强大对于减少用户寻找正确答案的摩擦至关重要。
以下是 Algolia 为您的 Zendesk 帮助中心带来的内容:
- **即时回答(即使是输入错误的问题)。**您可以将客户引向正确的内容,结果会随着每次击键而更新,而不考虑打字错误。高级搜索减少了支持票证的数量,同时提升了客户体验。
- **联合搜索。**这不仅仅是支持中心的问题。打破内容孤岛,让您的客户能够在您的所有内容中找到答案。
- **分析学&见解。**真正了解用户的意图是改进支持中心内容的关键。大多数公司基于客户的重复请求来构建他们的支持中心内容。这是区分哪些内容与用户最相关的好方法,但这里有一个更好的方法:一个强大的分析工具。查看您的搜索分析将有助于根据您的客户正在搜索的内容(包括没有返回结果的查询)对新的帮助中心内容进行优先排序。
【T2
- **完全可定制。**我们的代码是开源。让它成为你自己的,设计最适合你品牌的体验。
赢在客户支持的第一线
对于在 Handshake 的 Derek Daniels 来说,自助知识库是帮助他们的三个不同客户群快速、轻松地找到正确信息的必备工具。在寻找将客户与内容联系起来以解决他们的问题的解决方案时,Handshake 团队发现了用于 Zendesk Guide 集成的 Algolia。自从启用集成后,Derek 发现浏览类别页面的数量显著下降,“因为人们开始使用搜索来找到他们需要的文章来解决他们的问题,而不是漫无目的地在帮助中心闲逛。”
“Algolia 增强了 Handshake 的帮助中心搜索,为 Handshake 团队提供了更好的用户搜索分析,并通过展示更多相关文章来帮助客户。”
我们的客户看到的结果包括:基本支持问题减少了 27%,提交支持的票证数量减少了,票证解决时间减少了,联合多语言搜索得到了改进,所有查询的相关性增强了。
入门
对于 Algolia 和 Zendesk 客户,我们将其简化为一个简单的 3 步流程;详情此处。
如果您还没有试用过我们,请注册使用 Zendesk 和 Algolia 进行免费试用。我们承诺为您和您的客户改善您的帮助中心体验。