01 2022 档案
摘要:智能时代 科学研究发展的四个范式, 即描述自然现象的实验科学、 以牛顿定律和麦克斯韦方程等为代表的理论科学、 模拟复杂现象的计算科学 数据密集型科学 大数据是解决不确定性的良药 “用不确定的眼光看待世界,再用信息来消除这种不确定性”,是大数据 解决智能问题的本质。 吴军博士在书中提到 了世界的不确定
阅读全文
摘要:1. Explain查看执行计划 Spark 3.0 大版本发布,Spark SQL 的优化占比将近 50%。Spark SQL 取代 Spark Core,成为新一代的引擎内核,所有其他子框架如 Mllib、Streaming 和 Graph,都可以共享 Spark SQL 的性能优化,都能从 S
阅读全文
摘要:Kafka Streams Kafka Streams。Apache Kafka开源项目的一个组成部分。是一个功能强大,易于使用的库。用于在Kafka上构建高可分布式、拓展性,容错的应用程序。 Kafka Streams特点 1)功能强大 高扩展性,弹性,容错 2)轻量级 无需专门的集群 ;一个库,
阅读全文