摘要:
[TOC] ![](https://img2023.cnblogs.com/blog/1601821/202305/1601821-20230529224714391-1787716387.png) ## 一、概述 `MySQL` 是一种开源的关系型数据库管理系统(`RDBMS`),以其快速、可靠和 阅读全文
摘要:
[TOC] ![](https://img2023.cnblogs.com/blog/1601821/202305/1601821-20230523235208576-1289947568.png) ## 一、概述 Redis(全称:Remote Dictionary Server,即远程字典服务器 阅读全文
摘要:
[TOC] ![](https://img2023.cnblogs.com/blog/1601821/202305/1601821-20230521175431338-994462764.png) ## 一、概述 Kafka是由Apache基金会开发的分布式流处理平台,采用发布-订阅模式,支持高吞吐 阅读全文
摘要:
[TOC] ![](https://img2023.cnblogs.com/blog/1601821/202305/1601821-20230520172026914-1384604878.png) ## 一、概述 Zookeeper是一个开源的分布式协调服务中间件,它提供了一种分布式数据管理服务, 阅读全文
摘要:
[TOC] ![](https://img2023.cnblogs.com/blog/1601821/202305/1601821-20230519215611242-227854739.png) ## 一、概述 Presto(现在叫Trino)是一个分布式SQL查询引擎,它允许用户在多个数据源上执 阅读全文
摘要:
一、概述 Presto(Trino)是一个快速、分布式的SQL查询引擎,可以用于查询各种数据源,包括Hadoop、NoSQL、关系型数据库等。下面是Presto(Trino)SQL语法的概述: 它支持标准SQL语法,包括以下SQL命令: SELECT:用于从一个或多个表中检索数据,指定所需的列和过滤 阅读全文
摘要:
一、概述 Trino (前身为PrestoSQL)是一款高性能,分布式的SQL查询引擎,可以用于查询各种类型的数据存储,包括Hive、Mysql、Elasticsearch、Kafka、PostgreSQL等。在使用Trino时,可以通过一些参数来控制查询的行为,例如: coordinator节点和 阅读全文
摘要:
一、概述 Presto是一个快速的分布式查询引擎,最初由Facebook开发,目前归属于 Presto Software Foundation(由 Facebook、Teradata 和其他公司共同支持)。Presto的核心特点是支持远程数据访问,可以查询包括Hadoop、Cassandra、Rel 阅读全文
摘要:
一、Hive 小文件概述 在Hive中,所谓的小文件是指文件大小远小于HDFS块大小的文件,通常小于128 MB,甚至更少。这些小文件可能是Hive表的一部分,每个小文件都包含一个或几个表的记录,它们以文本格式存储。 Hive通常用于分析大量数据,但它在处理小文件方面表现不佳,Hive中存在大量小文 阅读全文
摘要:
一、YARN Proxy 概述 Web应用程序代理是YARN的一部分。默认情况下,它将作为资源管理器(RM)的一部分运行,但可以配置为以独立模式运行。代理的原因是为了减少通过YARN进行基于网络的攻击的可能性。 在YARN中,应用主机(AM)有责任提供web UI并将该链接发送到RM。这引发了许多潜 阅读全文