Fork me on GitHub

01 2022 档案

摘要:智能时代 科学研究发展的四个范式, 即描述自然现象的实验科学、 以牛顿定律和麦克斯韦方程等为代表的理论科学、 模拟复杂现象的计算科学 数据密集型科学 大数据是解决不确定性的良药 “用不确定的眼光看待世界,再用信息来消除这种不确定性”,是大数据 解决智能问题的本质。 吴军博士在书中提到 了世界的不确定 阅读全文
posted @ 2022-01-30 23:21 kris12 阅读(693) 评论(1) 推荐(0) 编辑
摘要:1. Explain查看执行计划 Spark 3.0 大版本发布,Spark SQL 的优化占比将近 50%。Spark SQL 取代 Spark Core,成为新一代的引擎内核,所有其他子框架如 Mllib、Streaming 和 Graph,都可以共享 Spark SQL 的性能优化,都能从 S 阅读全文
posted @ 2022-01-30 23:16 kris12 阅读(962) 评论(0) 推荐(0) 编辑
摘要:Kafka Streams Kafka Streams。Apache Kafka开源项目的一个组成部分。是一个功能强大,易于使用的库。用于在Kafka上构建高可分布式、拓展性,容错的应用程序。 Kafka Streams特点 1)功能强大 高扩展性,弹性,容错 2)轻量级 无需专门的集群 ;一个库, 阅读全文
posted @ 2022-01-28 17:19 kris12 阅读(100) 评论(0) 推荐(0) 编辑

levels of contents
点击右上角即可分享
微信分享提示