摘要: Apriori 算法 他通过分析购物篮中的商品集合,找出商品之间的关联关系 利用这种隐性关联关系,商家就可以强化这类购买行为,从而提升销售额 商业智能 BI、数据仓库 DW、数据挖掘 DM 三者之间的关系 数据仓库是个金矿,数据挖掘是炼金术,而商业报告则是黄金 数据仓库可以说是数据库的升级概念。不过 阅读全文
posted @ 2020-04-27 14:36 怡情养性长智 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 从自上而下的角度去理解 Kafka 竟然发现了很多之前学习过程中忽略掉的东西 更特别地是,我发现这种学习方法能够帮助我维持较长时间的学习兴趣,不会阶段性地产生厌烦情绪 Apache Kafka 是消息引擎系统,也是一个分布式流处理平台 LinkedIn 最开始有强烈的数据强实时处理方面的需求,其内部 阅读全文
posted @ 2020-04-27 11:49 怡情养性长智 阅读(185) 评论(0) 推荐(0) 编辑
摘要: Kafka 属于分布式的消息引擎系统 它的主要功能是提供一套完备的消息发布与订阅解决方案 在 Kafka 中,发布订阅的对象是主题(Topic),你可以为每个业务、每个应用甚至是每类数据都创建专属的主题 我们把生产者和消费者统称为客户端(Clients) 向主题发布消息的客户端应用程序称为生产者(P 阅读全文
posted @ 2020-04-27 11:48 怡情养性长智 阅读(210) 评论(0) 推荐(0) 编辑
摘要: Apache Kafka 是一款开源的消息引擎系统 “消息队列”“消息中间件”的提法想必你一定是有所耳闻的 这类系统引以为豪的消息传递属性,就像引擎一样,具备某种能量转换传输的能力 消息引擎系统的功能 消息引擎传输的对象是消息; 如何传输消息属于消息引擎设计机制的一部分 既然消息引擎是用于在不同系统 阅读全文
posted @ 2020-04-27 11:47 怡情养性长智 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 数据密集型 由于大数据业务系统都是为公司业务服务的,所以通常来说它们仅仅是执行一些常规的业务逻辑,因此它们不能算是计算密集型应用,相反更应该是数据密集型的 对于数据密集型应用来说,如何应对数据量激增、数据复杂度增加以及数据变化速率变快,是彰显大数据工程师、架构师功力的最有效表征。 就拿数据量激增来说 阅读全文
posted @ 2020-04-27 11:46 怡情养性长智 阅读(265) 评论(0) 推荐(0) 编辑