摘要: 本文由云+社区发表 一、困难点 建立topic的时候,可以通过指定参数 replication factor 设置备份数量。但是,一旦完成建立topic,则无法通过kafka topic.sh 或者 命令修改replica数量。 二、解决办法 ​ 实际上,我们可以考虑一种 “另类” 的办法:可以利用 阅读全文
posted @ 2019-01-08 18:27 腾讯云开发者 阅读(2373) 评论(0) 推荐(0) 编辑
摘要: 本文由云+社区发表 做为大数据生态系统中最重要的底层存储文件系统HDFS,为了保证系统的可靠性,HDFS通过多副本的冗余来防止数据的丢失。通常,HDFS中每一份数据都设置两个副本,这也使得存储利用率仅为1/3,每TB数据都需要占用3TB的存储空间。随着数据量的增长,复制的代价也变得越来越明显:传统的 阅读全文
posted @ 2019-01-08 12:14 腾讯云开发者 阅读(770) 评论(0) 推荐(2) 编辑