DevExpress WinForms中文教程 - 如何在Grid控件中集成语义相似性搜索?
许多用户都知道Microsoft的Daniel Roth和Steve Sanderson引入的.NET智能组件——AI驱动的UI控件,许多人都喜欢这个控件原因归结为以下几点:
- 由于它的简单性,开发人员可以在本地“驾驭AI”,而无需获得Azure或OpenAI PhD - 智能功能使用单个NuGet包即可使用。
- “智能搜索”是通过本地嵌入实现的,它的优点在于能够在本地运行,而不需要外部人工智能服务。
- 相关的使用场景很有意义——许多业务线(LOB)应用程序可以立即从这个实现中受益。以语义相似度搜索为例:终端用户可以在使用DevExpress Data Grid、Lookup或其他数据感知控件时搜索“furniture”这个词,并且实现足够智能,可以返回“chair”、“table”、“sofa”、"wardrobe"等记录。
P.S:DevExpress WinForms拥有180+组件和UI库,能为Windows Forms平台创建具有影响力的业务解决方案。DevExpress WinForms能完美构建流畅、美观且易于使用的应用程序,无论是Office风格的界面,还是分析处理大批量的业务数据,它都能轻松胜任!
获取DevExpress WinForms v24.1正式版下载
DevExpress技术交流群10:532598169 欢迎一起进群讨论
问题/使用场景
上面提到的例子采用ASP. NET Core Blazor和MVC/Razor集成,在本文中我们将演示如何使用DevExpress WinForms数据网格轻松引入“智能搜索”,其他数据感知DevExpress UI控件的集成也类似——您只需要使用适当的事件来实现期望的结果。
实现细节
1. Microsoft的 SmartComponents.LocalEmbeddings NuGet(作为一个实验性的GitHub仓库)是我们“智能搜索”实现的核心——只是把它和DevExpress.Win.Grid包一起添加到WinForms项目中。
让我们仔细看看Microsoft的GitHub repo本地嵌入:
嵌入用于语义相似度搜索,自然语言字符串被转换成称为嵌入的数字向量。两个字符串在概念上越相关,它们的向量就越接近。虽然您可以使用外部AI服务来计算嵌入,但在许多情况下,可以简单地再服务器上本地计算它们(不需要GPU - CPU就可以正常工作)。SmartComponents.LocalEmbeddings是一个简化此操作的包,使用它您可以在一毫秒内计算嵌入,并在一位数毫秒内对数十万个候选项执行语义搜索。
SmartComponents.LocalEmbeddings NuGet包实际上不包含任何ML模型,但它被配置为在您第一次构建应用程序时下载一个模型,您可以配置下载哪个模型。
有关这方面的更多信息,请查看了解Understand embeddings in Azure OpenAI Service在web上搜索类似的文章。ONNX嵌入模型(由Microsoft.ML.OnnxRuntime.dll提供支持)会自动从SmartComponents.LocalEmbeddings NuGet包中添加到Bin文件夹中 - 它的大小为16MB。
2. 被绑定到一个Item记录的集合(ID, Name, Description),测试数据是人工智能生成的(节省时间)。我们处理网格的ColumnView.CustomRowFilter 事件来确定搜索字符串行的可见性(基于条目文本相似度—在本例中为Name和Description,可选),当处理键盘输入或更改搜索选项(如相似性阈值)时,也会触发过滤例程。
void OnCustomRowFilter(object sender, RowFilterEventArgs e) { Item? item = ((ColumnView)sender).DataController.GetRowByListSourceIndex(e.ListSourceRow) as Item; if(item == null) return; string filter = teFilter.Text; if(string.IsNullOrEmpty(filter)) return; float threshold = (float)tbThreshold.Value / 100; e.Visible = SmartFilterProvider.IsSimilarTo(filter, item.Name, threshold); if(!e.Visible && cbIncludeDescription.Checked) e.Visible = SmartFilterProvider.IsSimilarTo(filter, item.Description, threshold); e.Handled = true; }
3. “智能搜索”是由SmartFilterProvider类实现的——它调用了SmartComponents. LocalEmbeddings API基于GitHub repo中发布的文档。
namespace SmartAIFilter.Provider { using SmartComponents.LocalEmbeddings; public static class SmartFilterProvider { readonly static LocalEmbedder Embedder = new LocalEmbedder(caseSensitive: false); readonly static ConcurrentDictionary<string, EmbeddingF32> cache = new ConcurrentDictionary<string, EmbeddingF32>(StringComparer.OrdinalIgnoreCase); public static bool IsSimilarTo(string filter, string text, float threshold = 0.75f) { EmbeddingF32 eText = cache.GetOrAdd(text, x => Embedder.Embed(x)); EmbeddingF32 eFilter = cache.GetOrAdd(filter, x => Embedder.Embed(x)); return eFilter.Similarity(eText) > threshold; } } }
上面的LocalEmbedder类使用ONNX运行时——它可以执行许多不同的CPU或GPU嵌入模型(通常,CPU对于这样小的模型工作得更快)。
SmartComponents.LocalEmbeddings NuGet包实际上不包含任何ML模型,但它被配置为在您第一次构建应用程序时下载一个模型。如前所述,您可以配置下载哪个模型。
作为一名开发人员,您可以根据特定用例场景/项目需求来调整这个示例。例如,您可以根据需要使用在线(OpenAI, Azure等)或离线模型(Ollama, ONNX)。