zourui4271

博客园 首页 新随笔 联系 订阅 管理

2021年5月7日 #

摘要: 1、在大型集群中每日宕机发生的概率为千分之一左右;在实践中,一台宕机的机器恢复时间通常认为是 24 小时。 2、由于网络数据丢失的异常存在,直接决定了分布式系统的协议必须能处理网络数据丢失的情况。 3、如果某些节点的直接的网络通信正常或丢包率在合理范围内,而某些节点之间始终无法正常通信,则称这种特殊 阅读全文
posted @ 2021-05-07 13:46 zourui4271 阅读(47) 评论(0) 推荐(0) 编辑

摘要: 对于一个分布式计算引擎(尤其是7*24小时不断运行的流处理系统)来说,由于机器故障、数据异常等原因导致作业失败的情况是时常发生的,因此一般的分布式计算引擎如Hadoop、Spark都会设计状态容错机制确保作业失败后能够恢复起来继续运行,而新一代的流处理系统Flink在这一点上更有着优秀而简约的设计。 阅读全文
posted @ 2021-05-07 11:41 zourui4271 阅读(128) 评论(0) 推荐(0) 编辑

摘要: https://cloud.tencent.com/developer/information/%E5%88%86%E5%B8%83%E5%BC%8F%E8%AE%A1%E7%AE%97%E5%8E%9F%E7%90%86 阅读全文
posted @ 2021-05-07 11:30 zourui4271 阅读(155) 评论(0) 推荐(0) 编辑