ES介绍《二》
信息输出:搜索和分析
虽然你可以将Elasticsearch作为一个文档存储,并检索文档及其元数据,但真正的力量来自于能够轻松访问建立在Apache Lucene搜索引擎库上的全套搜索功能。
Elasticsearch提供了一个简单、连贯的REST API,用于管理你的集群以及索引和搜索你的数据。出于测试目的,你可以很容易地直接从命令行或通过Kibana的开发者控制台提交请求。从你的应用程序中,你可以使用你所选择的语言的Elasticsearch客户端。Java, JavaScript, Go, .NET, PHP, Perl, Python或Ruby。
搜索你的数据
Elasticsearch REST APIs支持结构化查询、全文查询,以及结合两者的复杂查询。结构化查询类似于你可以在SQL中构建的查询类型。例如,你可以在你的雇员索引中搜索性别和年龄字段,并通过hire_date字段对匹配结果进行排序。全文查询找到所有与查询字符串相匹配的文档,并按相关性对它们进行排序,即它们与你的搜索词的匹配程度。
除了搜索单个术语外,你还可以进行短语搜索、相似性搜索和前缀搜索,并获得自动完成的建议。
你有想要搜索的地理空间或其他数字数据吗?Elasticsearch在优化的数据结构中对非文本数据进行索引,支持高性能的地理和数字查询。
你可以使用Elasticsearch全面的JSON式查询语言(Query DSL)访问所有这些搜索功能。你也可以在Elasticsearch内部构建SQL风格的查询来搜索和汇总数据,JDBC和ODBC驱动使得大量的第三方应用程序可以通过SQL与Elasticsearch进行交互。
分析你的数据
Elasticsearch的聚合使你能够建立复杂的数据摘要,并获得对关键指标、模式和趋势的洞察力。聚合使你能够回答以下问题,而不是仅仅找到传说中的 "干草堆里的针"。
干草堆里有多少根针?
这些针的平均长度是多少?
按制造商划分,针的中位长度是多少?
在过去6个月中,每年有多少根针被添加到干草堆中?
你也可以使用聚合来回答更微妙的问题,例如。
你最受欢迎的针头制造商是什么?
是否有任何不寻常或异常的针头集群?
因为聚合利用了用于搜索的相同数据结构,所以它们也非常快。这使你能够实时地分析和可视化你的数据。你的报告和仪表盘会随着你的数据变化而更新,这样你就可以根据最新的信息采取行动。
更重要的是,汇总与搜索请求同时进行。你可以在一次请求中同时对同一数据进行搜索文件、过滤结果和执行分析。而且,由于聚合是在特定搜索的背景下计算的,你不只是显示所有70号针的数量,你显示的是符合你的用户搜索标准的70号针的数量--例如,所有70号不粘的刺绣针。
但是,等等,还有更多的
想自动分析你的时间序列数据吗?你可以使用机器学习功能来创建数据中正常行为的精确基线,并识别异常模式。通过机器学习,你可以检测到。
与数值、计数或频率的时间偏差有关的异常现象
统计学上的稀有性
人口中某一成员的不寻常行为
最重要的是什么?你无需指定算法、模型或其他与数据科学相关的配置就可以做到这一点。 使用www.DeepL.com/Translator翻译(免费版)