08 2024 档案

摘要:本周重点研究了Kafka和Spark的结合使用,了解了如何通过Kafka进行数据的高效传输,并使用Spark Streaming进行实时处理。我在本地环境中搭建了一个完整的流处理管道,从Kafka获取数据,并通过Spark Streaming进行实时计算和结果输出。此外,Python方面,我继续学习 阅读全文
posted @ 2024-08-31 10:37 我也不想的 编辑
摘要:本周继续深入学习了Kafka的高级特性,特别是如何配置分区策略和管理副本以确保数据的高可用性和可靠性。我还研究了Kafka Streams,了解了如何使用它进行实时数据处理。与此同时,我继续学习了Spark Streaming的窗口操作和状态管理技术,尝试在本地环境中实现了一些复杂的流数据处理任务。 阅读全文
posted @ 2024-08-24 19:59 我也不想的 编辑
摘要:本周我学习了Kafka的基本原理和架构,了解了它在分布式消息系统中的应用场景。我尝试在本地搭建了一个简单的Kafka集群,并编写了一些Producer和Consumer的代码来测试消息的发送和接收过程。与此同时,我还开始了对Spark Streaming的学习,理解了流数据处理的基本概念,并在本地环 阅读全文
posted @ 2024-08-17 23:18 我也不想的 编辑
摘要:本周深入研究了ZooKeeper的应用场景,特别是在分布式系统中的协调和配置管理方面。我还学习了如何使用ZooKeeper实现分布式锁和领导选举。Python方面,继续深入学习机器学习,尝试了使用Scikit-learn进行分类和回归模型的训练,同时还学习了一些模型评估的技巧。 本周总共花费了大约2 阅读全文
posted @ 2024-08-10 18:15 我也不想的 编辑
摘要:本周主要研究了HBase的高级特性,包括协处理器、时间序列数据处理和HBase与Hive的集成。我还学习了ZooKeeper的基本概念和应用场景,理解了它在分布式系统中的关键作用。Python方面,我开始学习Scikit-learn,并使用它进行了一些简单的机器学习模型训练和评估。 本周总共花费了大 阅读全文
posted @ 2024-08-03 20:14 我也不想的 编辑

点击右上角即可分享
微信分享提示