成平艺君 - 博客园

2018年5月4日

摘要：一、ls 二、demsg 问题盘结果：三、iostat使用 1）、安装 2)、命令使用重要参数说明 -c 仅显示CPU统计信息 -d 仅显示磁盘统计信息 -k 以K为单位显示每秒的磁盘请求数,默认单位块. -p device | ALL 与-x选项互斥,用于显示块设备及系统分区的统计信息.也阅读全文

posted @ 2018-05-04 11:16 成平艺君阅读(976) 评论(0) 推荐(0)

2018年4月16日

Linux文件系统

摘要： Linux文件系统由三部分组成：文件名、inode、block(真正存数据) 查看inode所有信息 $>>df -i 查看文件发生变动的时间 Linux常见文件系统 ext4:ext3的升级版，大幅度改动 NFS：网络文件系统主要用于远程文件共享 ISO9660：大部分光盘所采用的文件系统 XFS 阅读全文

posted @ 2018-04-16 16:06 成平艺君阅读(194) 评论(0) 推荐(0)

2018年1月23日

spark性能调优

摘要： 1、spark汇聚失败出错原因，hive默认配置中parquet和动态分区设置太小 2.hive数据入hbase报错出现报错原因： executor_memory和dirver_memory太小，在增大内存后还会出现连接超时的报错解决连接超时：spark.network.timeout=140 阅读全文

posted @ 2018-01-23 15:16 成平艺君阅读(9957) 评论(2) 推荐(0)

2017年11月22日

Linux硬件资源管理与外设设备使用、系统运行机制及用户管理

摘要： Linux硬件资源管理 PCI设备 CPU信息通过/proc文件系统查看 $>> cat /proc/cpuinfo 内存信息 $>>free -m 或 cat /proc/meminfo 磁盘分区信息 $>>fdisk -l //分区情况 $>>df -h //大小情况 $>>du -h //使阅读全文

posted @ 2017-11-22 11:45 成平艺君阅读(1161) 评论(0) 推荐(0)

2017年11月20日

Linux系统维护管理命令及vim编辑器

摘要：系统维护管理命令date、clear who命令 w //登录到过该系统的用户信息 man uname //用于显操作系统相关的信息 uptime //用于输出系统任务队列信息。输出系统当前时间、系统开机到现在的运行时间、目前有多少用户在 //线和系统平均负载 last命令 //列出目前与过去登入系阅读全文

posted @ 2017-11-20 16:07 成平艺君阅读(204) 评论(0) 推荐(0)

2017年11月14日

ambari单节点集群塔建

摘要：配置2台机器，发别为ambari01、ambari03。ambari01上部署Ambari-server和Mirror server,另一台机器上部署agent。一、配置静态IP 运行命令，让配置生效完成后，测试能否ping通外网二、配置永久的hostname root用户下执行 $>> /e 阅读全文

posted @ 2017-11-14 16:10 成平艺君阅读(1239) 评论(0) 推荐(0)

2017年4月5日

hadoop FileSystem类和SequenceFile类实例

摘要： Hadoop的FileSystem类是与Hadoop的某一文件系统进行交互的API，虽然我们主要聚焦于HDFS实例，但还是应该集成FileSystem抽象类，并编写代码，使其在不同的文件系统中可移植，对于测试编写的程序非常重要。可以使用本地文件系统中的存储数据快速进行测试。一、从Hadoop Fi 阅读全文

posted @ 2017-04-05 15:58 成平艺君阅读(1174) 评论(0) 推荐(0)

2017年4月4日

搭建ubuntu版hadoop集群

摘要：用到的工具：VMware、hadoop-2.7.2.tar、jdk-8u65-linux-x64.tar、ubuntu-16.04-desktop-amd64.iso 1、在VMware上安装ubuntu-16.04-desktop-amd64.iso 单击“创建虚拟机”è选择“典型（推荐安装）” 阅读全文

posted @ 2017-04-04 00:05 成平艺君阅读(725) 评论(0) 推荐(2)

2017年3月23日

Spark处理日志文件常见操作

摘要： spark有自己的集群计算技术,扩展了hadoop mr模型用于高效计算，包括交互式查询和流计算。主要的特性就是内存的集群计算提升计算速度。在实际运用过程中也当然少不了对一些数据集的操作。下面将通过以下练习来深化对spark的理解，所有练习将使用python完成，java、scala版本将后续完成阅读全文

posted @ 2017-03-23 15:43 成平艺君阅读(2034) 评论(0) 推荐(0)

2017年3月21日

Hadoop/Spark开发环境配置

摘要：修改hostname bogon 为localhost 查看ip地址执行结果此时python 版本为2.7 将python版本升级至3.0及以上一、下载欲升级python版本 Python-3.4.5,将包放于本机与虚似机的共享目录下，上传至虚似机的opt目录下二、解压三、阅读READ 阅读全文

posted @ 2017-03-21 14:29 成平艺君阅读(2568) 评论(0) 推荐(1)

公告