大数据1test
1000000T的硬盘该怎么读写?
假如是1000台计算机承接,那么如果一台计算机的宕机,那么公司的数据就会有查询不到的情况,为了避免这种事情的发生,需要把每一台机器的数据备份成三份。所有的机器就可以组成一个分布式系统。
进程
进程(Process)是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。
HDFS集群有两类节点,并以管理者-工作者模式运行,即一个NameNode(管理者)和多个DataNode(工作者)。一个HDFS cluster包含一个NameNode和若干的DataNode,NameNode(以下简称nn)是master,主要负责管理hdfs文件系统,具体地包括namespace管理(其实就是目录结构),block管理(其中包括 filename->block,block->datanode list的对应关系)。
rm -f 删除文件 (一个 - 是简写 两个 - - 要接全拼)
tail 打印最后10行
find 查找文件 在给定位置查找文件
tar 解压
help 可以列出所有命令针对性的查找
echo (写入并创建文本)
虚拟机linux (192.168.230.xxx) -------- 主机window10(vmnet8) 192.168.230.149/24
如何验证你的网络是否正确(ping windows系统, ping外网)
cd /etc/sysconfig/network-scripts/ cat ifcfg-ens33
systenctl restart network 重启网络
ifconfig 需要yum install net-tools
hostname 立即生效,但是重启失效
vi /etc/hostname 重启生效,永久有效
vi /etc/hosts 格式 ip 主机名
ssh 远程登录终端 退出exit (Hadoop通过ssh远程登录,同时开启所有节点)
ssh-keygen(key密匙对generate生成) -t (type) rsa
ssh-copy-id 目标主机 (把主机的公匙发到这个机器,从而实现免密登录)
systemctl (system control) restart(子命令start stops status(状态) enable disable)
network (mysqld,firewalld,sshd ) daemon(守护者)
systemctl 后面什么都不接,显示所有服务
systemctl | grep 服务名 查找服务
secureCRT putty xshell
环境变量,path路径
pscp (-r发送文件夹)源路径 目标路径 (用户@IP:)
tar zxvf解压
环境配好以后,可以在任意路径下运行你的程序
/etc
pwd查看现在所在路径
tar -zxvf jdk-8u211-linux-x64.tar.gz sw
yum install lzsrz -y
scp -r /root/sw/jdk ip82:/root/sw/
vi .bashrc
. .bashrc
java