06 2023 档案
摘要:# HDFS伪分布式集群搭建 ```shell tar -zxvf hadoop-2.7.7.tar.gz echo $JAVA_HOME /root/software/jdk1.8.0_221 #查看loaclhost vim /root/software/hadoop-2.7.7/etc/had
阅读全文
摘要:# CHATGPT ``` https://talk.hyjack.top/ chat.hywwwlove.top/?code=9kCB https://chat.jubianxingqiu.com/#/chat/1002 https://shdily.com/#/chat/666 ```
阅读全文
摘要:# 爬虫 ```python import requests from bs4 import BeautifulSoup import re from lxml import etree # 获取网页内容 for i in range(1, 1277): # 爬取第2,50页的数据 url = 'h
阅读全文
摘要:# 网络采集与数据分析 ```shell #修改云主机host文件,添加内网IP,对应映射名为hadoop000,实现云主机自身使用root用户ssh访问hadoop000免密登陆 vi /etc/hosts 172.18.39.103 hadoop000 #配置免密################
阅读全文
摘要:# 大数据处理与应用hive ```shell #修改云主机host文件,添加内网IP,对应映射名为hadoop000,实现云主机自身使用root用户ssh访问hadoop000免密登陆 vi /etc/hosts 172.18.39.103 hadoop000 hostnamectl set-ho
阅读全文
摘要:# 12.WordCount示例编写(三) ## 任务目的 - 掌握 MapReduce 程序运行模式 - 理解 Combiner 的作用和使用方式 ## 任务清单 - 任务1:MapReduce 程序运行模式 - 任务2:MapReduce 三大组件(一):Combiner ## 详细任务步骤 #
阅读全文
摘要:# 11.WordCount示例编写 ## 任务目的 - 理解 WordCount 示例的业务逻辑 - 掌握 MapReduce Reduce 端编程规范 - 理解 WordCount 示例 Reduce 端的自定义业务逻辑的编写 - 熟记 MapReduce Driver 端编程规范 ## 任务清
阅读全文
摘要:# 10.WordCount示例编写(一) ## 任务目的 - 理解 WordCount 示例的业务逻辑 - 掌握 MapReduce Map 端编程规范 - 理解 WordCount 示例 Map 端的自定义业务逻辑的编写 ## 任务清单 - 任务1:WordCount 的业务逻辑 - 任务2:W
阅读全文
摘要:# 9.Java API 操作 HDFS 文件(三) ## 任务目的 - 学会使用 Java API 删除指定的 HDFS 文件或目录 - 学会使用 Java API 查看指定 HDFS 目录下所有文件信息和对应块信息 ## 任务清单 - 任务1:删除文件/目录 - 任务2:查看指定路径中文件和块信
阅读全文
摘要:# 8.Java API 操作 HDFS 文件(二) ## 任务目的 - 学会使用 Java API 将 HDFS 文件下载到本地指定位置 - 掌握对 HDFS 文件或目录重命名的使用方法 - 学会使用 Java API 查看指定 HDFS 中某个目录下所有的文件或文件夹 ## 任务清单 - 任务1
阅读全文
摘要:# 7.Java API 操作 HDFS 文件(一) ## 任务目的 - 了解 junit 的作用和常用注解 - 掌握使用 Java API 在 HDFS 上创建目录的方法 - 学会使用 Java API 将本地文件上传到 HDFS 指定位置 ## 任务清单 - 任务1:创建目录 - 任务2:上传文
阅读全文
摘要:# 6.Eclipse 连接 Hadoop ## 任务目的 - 掌握在 Linux 下 Eclipse 连接 Hadoop 的详细步骤 - 掌握获取 fs 对象的两种方式 ## 任务清单 - 任务1:Linux 下 Eclipse 连接 Hadoop - 任务2:FileSystem 实例获取 ##
阅读全文
摘要:# 5.HDFS 的 Shell 操作(二) ## 任务目的 - 掌握查看 HDFS 文本内容的相关命令 - 学会往 HDFS 文件中追加内容和合并下载 HDFS 的多个文件到本地文件系统 - 掌握修改 HDFS 文件权限和拥有者的相关命令 - 掌握统计指定目录和文件系统信息的方法 - 学会使用 H
阅读全文
摘要:# 4.HDFS 的 Shell 操作(一) ## 任务目的 - 掌握 Hadoop 集群管理脚本的使用方式 - 学会使用 `help` 命令查看指定命令的帮助信息 - 掌握操作 HDFS 文件或目录常用命令的使用方式 ## 任务清单 - 任务1:Hadoop 集群管理脚本 - 任务2:HDFS 管
阅读全文
摘要:# 3.HDFS 架构 ## 任务目的 - 理解 HDFS 存储架构 - 熟知 HDFS 4个组成部分的主要职责 ## 任务清单 - 任务1:HDFS 存储架构图 - 任务2:HDFS 组成结构 ## 详细任务步骤 ### 任务1:HDFS 存储架构图 HDFS采用主从架构(Master/Slave
阅读全文
摘要:# 2.YARN伪分布式集群搭建 ## 任务目的 - 重点掌握 YARN 集群的相关配置 - 学会启动和关闭 YARN 集群的两种方式 - 能够使用 jps 命令查看进程的启动情况 - 能够通过 UI 查看 YARN 集群的运行状态 ## 任务清单 - 任务1:YARN 集群主要配置文件讲解 - 任
阅读全文
摘要:# 1.HDFS伪分布式集群搭建 ## 任务目的 - 了解 Hadoop 集群的组成和规划 - 重点掌握 HDFS 集群的相关配置 - 掌握格式化文件系统的命令 - 学会启动和关闭 HDFS 集群的两种方式 - 能够使用 jps 命令查看进程的启动情况 - 能够通过 UI 查看 HDFS 集群的运行
阅读全文