Fork me on GitHub
摘要: 1. SimHash与传统hash函数的区别 传统的Hash算法只负责将原始内容尽量均匀随机地映射为一个签名值,原理上仅相当于伪随机数产生算法。传统的hash算法产生的两个签名,如果原始内容在一定概率下是相等的;如果不相等,除了说明原始内容不相等外,不再提供任何信息,因为即使原始内容只相差一个字节, 阅读全文
posted @ 2018-12-08 16:08 stardsd 阅读(15577) 评论(0) 推荐(0) 编辑
摘要: 1 介 绍 1.1 流式计算介绍 流式大数据计算主要有以下特征: 1)实时性。流式大数据不仅是实时产生的,也是要求实时给出反馈结果。系统要有快速响应能力,在短时间内体现出数据的价值,超过有效时间后数据的价值就会迅速降低。 2)突发性。数据的流入速率和顺序并不确定,甚至会有较大的差异。这要求系统要有较 阅读全文
posted @ 2018-12-08 15:56 stardsd 阅读(2160) 评论(0) 推荐(0) 编辑
摘要: 1 指数平滑法 移动平均模型在解决时间序列问题上简单有效,但它们的计算比较难,因为不能通过之前的计算结果推算出加权移动平均值。此外,移动平均法不能很好的处理数据集边缘的数据变化,也不能应用于现有数据集的范围之外。因此,移动平均法的预测效果相对较差。 指数平滑法(exponential smoothi 阅读全文
posted @ 2018-12-08 15:39 stardsd 阅读(3638) 评论(0) 推荐(0) 编辑
摘要: API 网关(API Gateway)提供高性能、高可用的 API 托管服务,帮助用户对外开放其部署在 ECS、容器服务等云产品上的应用,提供完整的 API 发布、管理、维护生命周期管理。用户只需进行简单的操作,即可快速、低成本、低风险地开放数据或服务。 背景 我们知道在微服务架构风格中,一个大应用 阅读全文
posted @ 2018-12-08 15:00 stardsd 阅读(8186) 评论(0) 推荐(2) 编辑