随笔档案「2021年1月」 - kris12

端到端的Exactly Once| Kafka的事务和幂等性| Flink的Exactly Once

摘要：1. Kafka的事务和 Exactly Once Kafka 中的事务，它解决的问题是，确保在一个事务中发送的多条消息，要么都成功，要么都失败。注意，这里面的多条消息不一定要在同一个主题和分区中，可以是发往多个主题和分区的消息。Kafka 的这种事务机制，单独来使用的场景不多。更多的情况下被用来阅读全文

posted @ 2021-01-26 21:11 kris12 阅读(2882) 评论(0) 推荐(0)

ElasticSearch| 文档的CRUD

摘要：文档(Document) Elasticsearch是面向文档的，文档是所有可搜索数据的最小单位日志文件中的日志项一本电影的具体信息/一张唱片的详细信息 MP3播放器里的一首歌/一篇PDF文档中的具体内容文档会被序列化成JSON格式，保存在Elasticsearch中 JSON对象由字段组成，阅读全文

posted @ 2021-01-25 23:46 kris12 阅读(136) 评论(0) 推荐(0)

CAP 定理

摘要：CAP 定理（CAP theorem）又被称作布鲁尔定理（Brewer's theorem），是加州大学伯克利分校的计算机科学家埃里克·布鲁尔（Eric Brewer）在 2000 年的 ACM PODC 上提出的一个猜想。2002 年，麻省理工学院的赛斯·吉尔伯特（Seth Gilbert）和南阅读全文

posted @ 2021-01-25 23:36 kris12 阅读(616) 评论(0) 推荐(0)

ElasticSearch| mapping

摘要：Type可以理解为关系型数据库的Table，那每个字段的数据类型是如何定义的呢？实际上每个Type中的字段是什么数据类型，由mapping定义，如果我们在创建Index的时候，没有设定mapping，系统会自动根据一条数据的格式来推断出该数据对应的字段类型， mapping除了自动定义，还可以手动阅读全文

posted @ 2021-01-24 16:47 kris12 阅读(199) 评论(0) 推荐(0)

Elasticsearch| 分词

摘要：如何通过分词生成倒排索引分词是指将文本转换成一系列单词（term or token）的过程，也可以叫做文本分析，在es里面称为Analysis. Analysis 和Analyzer Analysis - 文本分析是把全文本转换一系列单词（term / token）的过程，也叫分词； Analys 阅读全文

posted @ 2021-01-24 14:29 kris12 阅读(619) 评论(0) 推荐(0)

ClickHouse| 02 副本| 集群读写操作

摘要：1. 副本副本的目的主要是保障数据的高可用性，即使一台ClickHouse节点宕机，那么也可以从其他服务器获得相同的数据。 1.1 副本写入流程 client从clickhouse-a节点写数据，提交写入日志给zookeeper，clickhouse-b有一个监听器来监听zookeeper接收到日阅读全文

posted @ 2021-01-18 10:54 kris12 阅读(2823) 评论(1) 推荐(0)

Elasticsearch-Restful API

摘要：1. 基本概念 Elasticsearch有几个核心概念，先理解这些概念将有助于掌握Elasticsearch。近实时(Near Realtime / NRT) Elasticsearch是一个近实时的搜索平台，从生成文档索引到文档成为可搜索，有一个轻微的延迟(通常是一秒钟)。集群(Cluste 阅读全文

posted @ 2021-01-13 16:04 kris12 阅读(502) 评论(0) 推荐(1)

kris12

Self-discipline gives me freedom.

01 2021 档案

公告