2020 年 7月 1 日随笔档案 - 是谁扭曲了时空

2020年7月1日

摘要： Kafka 的核心架构原理。 ##Kafka 分布式存储架构那么现在问题来了，如果每天产生几十 TB 的数据，难道都写一台机器的磁盘上吗？这明显是不靠谱的啊！所以说，这里就得考虑数据的分布式存储了，我们结合 Kafka 的具体情况来说说。在 Kafka 里面，有一个核心的概念叫做“Topic” 阅读全文

posted @ 2020-07-01 17:13 是谁扭曲了时空阅读(711) 评论(0) 推荐(0)

【Kafka】Kafka高性能原因

摘要： Kafka是高吞吐低延迟的高并发、高性能的消息中间件，在大数据领域有极为广泛的运用。配置良好的Kafka集群甚至可以做到每秒几十万、上百万的超高并发写入。那么Kafka到底是如何做到这么高的吞吐量和性能的呢？这篇文章我们来一点一点说一下。 1、页缓存技术 + 磁盘顺序写首先Kafka每次接收到数阅读全文

posted @ 2020-07-01 17:01 是谁扭曲了时空阅读(1019) 评论(0) 推荐(0)

jeval数学表达式解析工具

摘要： jeval是为为你的Java应用程序提供可增加的、高性能、数学、布尔和函数表达式的解析和运算的高级资源包。以下这个样例包括了JEval经常使用功能： package demo0; import net.sourceforge.jeval.EvaluationException; import n 阅读全文

posted @ 2020-07-01 16:07 是谁扭曲了时空阅读(636) 评论(0) 推荐(0)

【大数据】Hive与HBase

摘要：二者区别 Hive：Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能。 **Hive本身不存储和计算数据，它完全依赖于HDFS和MapReduce，Hive中的表纯逻辑。**hive需要用到hdfs存储文件，需要用到MapReduce 阅读全文

posted @ 2020-07-01 15:20 是谁扭曲了时空阅读(223) 评论(0) 推荐(0)

【大数据】Hadoop、Hive、Spark 之间是什么关系？

摘要：大数据本身是个很宽泛的概念，Hadoop生态圈（或者泛生态圈）基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。锅碗瓢盆，各有各的用处，互相之间又有重合。你可以用汤锅直接当碗吃饭喝汤，你可以用小刀或者刨子去皮。但是每个工具有自己的特性，虽然奇怪的组合也能工作阅读全文

posted @ 2020-07-01 15:06 是谁扭曲了时空阅读(293) 评论(0) 推荐(0)

【kafka】kafka部署硬件考虑

摘要：前言本文所写的，偏重于架构师的内容，所以阅读的小伙伴，要有综合的一些能力，否则，你可能会被其中的计算给弄晕，不过既然，阅读我的文章嘛，都是从基础开始写起，所以还是很好读的。本文要讨论的话题是，当我搭建一个kafka集群的时候，我们需要考虑的问题。不能张口就来，我需要什么什么配置的机器之类的，那阅读全文

posted @ 2020-07-01 14:11 是谁扭曲了时空阅读(2248) 评论(0) 推荐(0)

【kafka】kafka内核原理

摘要：基础概念 kafka基础构成 producer 消息生产者，发布消息到kafka集群的终端或服务。 broker kafaka集群中包含的服务器 topic 每条发布到kafka集群的消息属于的类别，即kafka是面向topic的。 partition partition是物理上的概念，每个topi 阅读全文

posted @ 2020-07-01 14:04 是谁扭曲了时空阅读(375) 评论(0) 推荐(0)

【MetaQ】高性能原因

摘要：简介 MetaQ是一款高性能的消息中间件，经过几年的发展，已经非常成熟稳定，历经多年双11的零点峰值压测，表现堪称完美。 MetaQ当前最新最稳定的稳本是3.x系统，MetaQ 3.x重新设计和实现，比之前的版本更优秀。虽然MetaQ借鉴了linkedin 的消息中间件kafak思想，但已经是青出于阅读全文

posted @ 2020-07-01 13:58 是谁扭曲了时空阅读(240) 评论(0) 推荐(0)

是谁扭曲了时空

公告