大数据1test

1000000T的硬盘该怎么读写?

假如是1000台计算机承接,那么如果一台计算机的宕机,那么公司的数据就会有查询不到的情况,为了避免这种事情的发生,需要把每一台机器的数据备份成三份。所有的机器就可以组成一个分布式系统。

进程  

进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。

HDFS集群有两类节点,并以管理者-工作者模式运行,即一个NameNode(管理者)和多个DataNode(工作者)。一个HDFS cluster包含一个NameNode和若干的DataNode,NameNode(以下简称nn)是master,主要负责管理hdfs文件系统,具体地包括namespace管理(其实就是目录结构),block管理(其中包括 filename->block,block->datanode list的对应关系)。

rm -f 删除文件  (一个 - 是简写  两个 - - 要接全拼)

tail 打印最后10行

find 查找文件 在给定位置查找文件

tar 解压 

help 可以列出所有命令针对性的查找

echo (写入并创建文本)

虚拟机linux (192.168.230.xxx) -------- 主机window10(vmnet8) 192.168.230.149/24
如何验证你的网络是否正确(ping windows系统, ping外网)
cd /etc/sysconfig/network-scripts/ cat ifcfg-ens33
systenctl restart network 重启网络
ifconfig 需要yum install net-tools

hostname 立即生效,但是重启失效
vi /etc/hostname 重启生效,永久有效
vi /etc/hosts 格式 ip 主机名


ssh 远程登录终端 退出exit (Hadoop通过ssh远程登录,同时开启所有节点)
ssh-keygen(key密匙对generate生成) -t (type) rsa
ssh-copy-id 目标主机 (把主机的公匙发到这个机器,从而实现免密登录)

systemctl (system control) restart(子命令start stops status(状态) enable disable)
network (mysqld,firewalld,sshd ) daemon(守护者)
systemctl 后面什么都不接,显示所有服务
systemctl | grep 服务名 查找服务

secureCRT putty xshell


环境变量,path路径
pscp (-r发送文件夹)源路径 目标路径 (用户@IP:)

tar zxvf解压
环境配好以后,可以在任意路径下运行你的程序
/etc

pwd查看现在所在路径

tar -zxvf jdk-8u211-linux-x64.tar.gz  sw

yum install lzsrz -y  

 scp -r /root/sw/jdk ip82:/root/sw/

 vi .bashrc 

 . .bashrc 

java

posted @ 2019-09-10 11:10  R星校长  阅读(110)  评论(0编辑  收藏  举报