摘要: 引入 本文在两台2核2g的云服务器上搭建了Hadoop集群,两台云服务器分别是阿里云(hjm)和腾讯云(gyt),集群部署规划如下: hjm gyt HDFS NameNode\SecondaryNameNode\DataNode DataNode YARN ResourceManager\Node 阅读全文
posted @ 2023-09-20 01:10 ZeroZeroSeven 阅读(548) 评论(0) 推荐(0) 编辑
摘要: 概念漂移 ​ 概念漂移是数据流挖掘领域中一个重要的研究点。传统的机器学习算法在操作时通常假设数据是静态的,其数据分布不会随着时间发生变化。然而对于真实的数据流来说,由于数据流天生的时间性,到达的数据的分布可能会随着时间的推移不断改变。这使得传统的批处理模型不适合对数据流的进行挖掘分析,模型更是需要有 阅读全文
posted @ 2023-09-16 20:06 ZeroZeroSeven 阅读(488) 评论(2) 推荐(3) 编辑
摘要: 功能介绍 登录 首页 修改密码 提交申请 提交列表 数据可视化 审核列表 前端 components结构 搭建Vue项目 ​ Vue3快速上手: ​ https://cn.vuejs.org/guide/quick-start.html#creating-a-vue-application 页面布局 阅读全文
posted @ 2023-09-10 15:23 ZeroZeroSeven 阅读(214) 评论(0) 推荐(0) 编辑
摘要: SparkCore RDD基础 定义 ​ 在 Spark 的编程接口中,每一个数据集都被表示为一个对象,称为 RDD。RDD 是 Resillient Distributed Dataset(弹性分布式数据集)的简称,是一个只读的(不可变的)、分区的(分布式的)、容错的、延迟计算的、类型推断的和可缓 阅读全文
posted @ 2023-07-28 00:29 ZeroZeroSeven 阅读(50) 评论(0) 推荐(0) 编辑
摘要: Scala基础篇 数据类型 下表中列出的数据类型都是对象,可以直接对它们调用方法。 数据类型 描述 Byte 8位有符号补码整数。数值区间为 -128 到 127 Short 16位有符号补码整数。数值区间为 -32768 到 32767 Int 32位有符号补码整数。数值区间为 -21474836 阅读全文
posted @ 2023-07-14 18:50 ZeroZeroSeven 阅读(110) 评论(0) 推荐(0) 编辑
摘要: # 决策树相关概念及简单实现 ​ 决策树是一种机器学习的方法。决策树的生成算法有ID3(信息增益), C4.5(信息增益率)和CART(Gini系数)等。决策树是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果。 ​ 构造树的基本想法 阅读全文
posted @ 2023-05-31 21:28 ZeroZeroSeven 阅读(117) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示
🚀
回顶
收起