导航

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

统计

随笔 - 349
文章 - 0
评论 - 1
阅读 - 10643

公告

昵称：实名吓我一跳
园龄： 2年8个月
粉丝： 8
关注： 15
+加关注

随笔分类

学习笔记(1)

随笔档案

阅读排行榜

评论排行榜

1. 2023年11月19日每日随笔(1)

最新评论

1. Re:2023年11月19日每日随笔
大数据你是真的6
--实名吓我一跳

02 2024 档案

学习记录24
摘要：本次学习了spark的机器学习相关内容。机器学习可以看做是一门人工智能的科学，该领域的主要研究对象是人工智能。机器学习利用数据或以往的经验，以此优化计算机程序的性能标准。机器学习强调三个关键词：算法、经验、性能 Spark提供了一个基于海量数据的机器学习库，它提供了常用机器学习算法的分布式实现阅读全文

posted @ 2024-02-27 16:30 实名吓我一跳阅读(6) 评论(0) 推荐(0) 编辑
学习记录25
摘要：本次进行了大数据hdfs的相关操作，通过实验进行了hdfs的操作，在Linux系统的本地文件系统的“/home/hadoop”目录下新建一个文本文件test.txt，并在该文件中随便输入一些内容，然后上传到HDFS的“/user/hadoop”目录下；【参考答案】 $cd /home/hadoop 阅读全文

posted @ 2024-02-27 16:30 实名吓我一跳阅读(12) 评论(0) 推荐(0) 编辑
学习记录23
摘要：本次学习了DStream无状态转换操作 DStream:RDD的集合 map(func) ：对源DStream的每个元素，采用func函数进行转换，得到一个新的Dstream flatMap(func)：与map相似，但是每个输入项可用被映射为0个或者多个输出项 filter(func)：返回一阅读全文

posted @ 2024-02-04 20:09 实名吓我一跳阅读(45) 评论(0) 推荐(0) 编辑
学习记录22
摘要：本次学习了spark Streaming里进行读取高级数据源的一些操作进行安装kafka 网站：https://dblab.xmu.edu.cn/blog/1096/ 接下来在Ubuntu系统环境下测试简单的实例，按顺序执行如下命令： # 进入kafka所在的目录 cd /usr/local/ka 阅读全文

posted @ 2024-02-04 20:05 实名吓我一跳阅读(17) 评论(0) 推荐(0) 编辑
学习记录21
摘要：本次学习学习了Spark的Streaming的一些外来输入源进行操作的形式文件流创建一个文件 [atguigu@hadoop102 ~]$ cd /usr/local/spark/mycode/ [atguigu@hadoop102 mycode]$ mkdir streaming [atgui 阅读全文

posted @ 2024-02-04 20:01 实名吓我一跳阅读(5) 评论(0) 推荐(0) 编辑
学习记录20
摘要：本次学习学习了spark的流计算相干概念静态数据和流计算静态数据：很多企业为了支持决策分析而构建的数据仓库系统，其中存放的大量历史数据就是静态数据，技术人员可以利用数据挖掘和OLAP（On-Line Analytical Processing）分析工具从静态数据中找到对企业有价值的信息流数据阅读全文

posted @ 2024-02-04 19:55 实名吓我一跳阅读(7) 评论(0) 推荐(0) 编辑
学习记录19
摘要：今天，完成了实验五，做这次实验的时候，遇到一些问题吗，找了一些时间后，进行了解决，然后，感觉对于spark的学习仅仅学习了基本流程，目前只能停留在看懂别人的答案的层次上，还不能进行自己编写一些独立程序阅读全文

posted @ 2024-02-01 22:32 实名吓我一跳阅读(3) 评论(0) 推荐(0) 编辑