Hadoop - 文章分类 - 牧天

Kibana restful

摘要：Kibana在ES中，增加了三个索引，.apm-agent-configuration、.kibana_1、.kibana_task_manager_1 一个Elasticsearch集群可以包含多个索引，相应的每个索引可以包含多个类型。这些不同的类型存储着多个文档，每个文档又有多个属性。索引（阅读全文

posted @ 2021-01-19 19:26 牧天阅读(113) 评论(0) 推荐(0)

ntp_new

摘要：服务器（10.143.86.113）端安装ntp $ sudo apt install ntp $ sudo apt install ntpstat $ sudo vi /etc/ntp.conf #注释掉默认的远程服务器，因为内网连不上这些服务器 #pool 0.ubuntu.pool.ntp.o 阅读全文

posted @ 2021-01-07 16:24 牧天阅读(106) 评论(0) 推荐(0)

nohup cmd &

摘要：nohup 的用途就是让提交的命令忽略 hangup 信号。& 用途：在后台运行nohup 的使用是十分方便的，只需在要处理的命令前加上 nohup 即可，标准输出和标准错误缺省会被重定向到 nohup.out 文件中。一般我们可在结尾加上"&"来将命令同时放入后台运行，也可用">filename 阅读全文

posted @ 2021-01-06 16:18 牧天阅读(769) 评论(0) 推荐(0)

Ubuntu 设置代理

摘要：cts@cts-pc:~$ vi ~/.bashrc export http_proxy="http://username:password@proxyhk.hxxxxi.com:8080/" export https_proxy="http://username:password@proxyhk. 阅读全文

posted @ 2021-01-05 19:49 牧天阅读(533) 评论(0) 推荐(0)

Hadoop疑难问题

摘要：Q1：Spark出现解决Retrying connect to server: 0.0.0.0/0.0.0.0:8031. Already tried 0 time(s);解决方案修改yarn-site.xml，添加下面内容 Q2：hadoop-2.7.7执行hadoop wordcount用例报错阅读全文

posted @ 2019-03-28 19:37 牧天阅读(133) 评论(0) 推荐(0)

Spark

摘要：先安装scala + hadoop 这里省略下载spark安装包http://apache.communilink.net/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz 修改spark-env.sh 修改~/.bashrc 修改slaves 拷贝配阅读全文

posted @ 2019-03-23 18:08 牧天阅读(112) 评论(0) 推荐(0)

Scala环境配置

摘要：下载https://www.scala-lang.org/download/scala-2.12.8.tgz并解压修改~/.bashrc 编写源代码文件HelloWorld.scala 阅读全文

posted @ 2019-03-23 17:02 牧天阅读(78) 评论(0) 推荐(0)

HBase Shell

摘要：get 获取行或者单元的值阅读全文

posted @ 2019-03-23 15:00 牧天阅读(208) 评论(0) 推荐(0)

hbase配置

摘要：Hbase特点HBase是一个构建在HDFS上的分布式列存储系统；HBase是基于Google BigTable模型开发的，典型的key/value系统；HBase是Apache Hadoop生态系统中的重要一员，主要用于海量结构化数据存储；从逻辑上讲，HBase将数据按照表、行和列进行存储。与ha 阅读全文

posted @ 2019-03-20 14:03 牧天阅读(245) 评论(0) 推荐(0)

Zookeeper eclipse plugin

摘要：eclipse 当做client连接zookeerper “help” =>"Install new software..." zookeeper-plugin - http://www.massedynamic.org/eclipse/updates/ 安装好后 “Window”=> "Show 阅读全文

posted @ 2019-03-14 16:34 牧天阅读(386) 评论(0) 推荐(0)

zookeeper

摘要：ZooKeeper 是一个开源的分布式协调服务，由雅虎创建，是 Google Chubby 的开源实现。分布式应用程序可以基于 ZooKeeper 实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master 选举、配置维护，名字服务、分布式同步、分布式锁和分布式队列等功能。阅读全文

posted @ 2019-03-05 19:58 牧天阅读(297) 评论(0) 推荐(0)

hadoop概述

摘要：1、hadoop：它是一个分布式计算+分布式文件系统，前者其实就是MapReduce，后者是HDFS。后者可以独立运行，前者可以选择性使用，也可以不使用 2、hive：通俗的说是一个数据仓库，仓库中的数据是被hdfs管理的数据文件，它支持类似sql语句的功能，你可以通过该语句完成分布式环境下的计算功阅读全文

posted @ 2019-03-05 19:03 牧天阅读(127) 评论(0) 推荐(0)

Hive QL

摘要：0: jdbc:hive2://10.121.63.240:10000> CREATE TABLE pokes (foo INT, bar STRING); No rows affected (1.93 seconds) 0: jdbc:hive2://10.121.63.240:10000> show tables; +-----------+ | tab_name | +-------... 阅读全文

posted @ 2019-03-05 16:37 牧天阅读(112) 评论(0) 推荐(0)

Hive

摘要：Hadoop + Hive + mysql hive是基于hadoop的一个数据仓库. 这里省略Hadoop环境的搭建。将元数据存储在 RDBMS 中，一般常用 MySQL 和 Derby。默认情况下，Hive 元数据保存在内嵌的 Derby 数据库中，只能允许一个会话连接，只适合简单的测试。实际阅读全文

posted @ 2019-03-01 19:03 牧天阅读(483) 评论(0) 推荐(0)

hadoop Eclipse环境

摘要：将相关库导入eclipse工程即可 commons-cli-1.2.jarhadoop-common-3.2.0.jarhadoop-mapreduce-client-core-3.2.0.jar 用eclipse Export.. 为Runnable JAR fIle: wc2.jar 阅读全文

posted @ 2019-02-28 11:44 牧天阅读(136) 评论(0) 推荐(0)

hadoop命令

摘要：hadoop fs -help rm #产看某个命令的参数 Usage: hadoop fs -count [-q] [-h] [-v] [-x] [-t [<storage type>]] [-u] [-e] <paths>Count the number of directories, file 阅读全文

posted @ 2019-02-26 11:46 牧天阅读(353) 评论(0) 推荐(0)

hadoop wordcount

摘要：搭建好环境后执行wordcount用例这里是统计hehe.txt中各个单词的个数配置编译环境用例源码解压hadoop-3.2.0/share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-3.2.0-sources.jar org\apa 阅读全文

posted @ 2019-02-22 20:54 牧天阅读(402) 评论(0) 推荐(0)

hadoop环境搭建

摘要：配置环境:ubuntu 16.04 主机信息: 机器名 IP地址作用muhe221 10.121.63.240 NameNode、JobTrackercaoming 10.121.63.215 DataNode、TaskTracker 1、在两台电脑上分别做以下操作：sudo useradd ha 阅读全文

posted @ 2019-02-20 20:59 牧天阅读(345) 评论(0) 推荐(0)

牧天

文章分类 - Hadoop

公告

牧 天

文章分类 - Hadoop

公告

牧天