01 2025 档案
摘要:使用 MLPipeline 进行数据处理和模型训练,测试 RandomForestClassifier
阅读全文
摘要:了解 MLlib,学习基本的 LabeledPoint,测试 LogisticRegression
阅读全文
摘要:练习窗口操作 (window, reduceByWindow),Kafka 集成初步测试
阅读全文
摘要:了解 Spark Streaming 架构,创建 StreamingContext,测试 socketTextStream
阅读全文
摘要:学习 SQL 风格查询 (select, groupBy, join),练习 JSON/CSV 解析
阅读全文
摘要:安装 Hive,配置 Spark SQL 访问 Hive 表,学习 DataFrame 的基本操作
阅读全文
摘要:练习 WordCount 任务,理解 groupByKey 和 reduceByKey 的区别
阅读全文
摘要:学习 RDD 行动操作(collect, reduce, count, take)
阅读全文
摘要:了解 RDD 的创建 (parallelize, textFile),基本转换 (map, flatMap, filter)
阅读全文
摘要:了解 Spark 运行架构(Driver、Executor、Worker),配置 YARN 集成
阅读全文
摘要:安装 Spark,配置 Standalone 模式,运行 spark-shell 测试
阅读全文
摘要:安装 Hadoop,配置 HDFS,测试 hdfs dfs -ls /
阅读全文
摘要:学习函数式编程概念(高阶函数、匿名函数、模式匹配) 还是练车的一天
阅读全文
摘要:学习基本数据类型(Int、Double、String、List、Map),集合操作 (map, filter, reduce) 去练车
阅读全文
摘要:安装 Scala (sdk install scala),编写第一个 Scala 程序 (object HelloWorld extends App)
阅读全文
摘要:学习用户管理 (useradd, passwd, sudo),进程管理 (ps, top, kill),网络 (ping, curl, scp) 练车
阅读全文
摘要:学习 Linux 目录结构,基本文件操作 (ls, cd, cp, mv, rm, cat, nano) 在家里休息
阅读全文
摘要:安装 Ubuntu 22.04,配置 SSH 远程访问,更新系统 (apt update && apt upgrade) 从西安回家
阅读全文
摘要:试着读了那个QTQuick 媒体播放器的demo的代码 坐飞机回西安
阅读全文
摘要:试着跑了dtk widget的demo 去了动漫星城
阅读全文
摘要:决定做播放器,准备开发环境,装deepin的虚拟机 去广州玩,坐了一个晚上的火车终于到达,屁股好痛 去了当地的历史街区,吃了东北菜
阅读全文
摘要:准备选题,看了一圈,下载了各种选题的文档 一起出门吃了饭
阅读全文