摘要: 1.外部表 关键字:EXTERNAL 外部表创建时需要指定LOCATION 删除外部表时,数据不被删除 CREATE EXTERNAL TABLE page_view(viewTime INT, userid BIGINT, page_url ST... 阅读全文
posted @ 2018-09-14 15:37 莫逸风 阅读(399) 评论(0) 推荐(0) 编辑
摘要: 和sql十分类似简单计一下 1、 启动hive 因为需要借助于MySQL保存Hive的元数据,所以,请首先启动MySQL数据库 service mysql start # 可以在Linux的任何目录下执行该命令 由于Hive是基于Hadoop的数据仓库,使用H... 阅读全文
posted @ 2018-09-14 14:33 莫逸风 阅读(54) 评论(0) 推荐(0) 编辑
摘要: 1、目录操作 hdfs dfs [命令] [命令] 等价于 hadoop fs [] [] 1 ./bin/hdfs dfs -mkdir -p /user/hadoop 基本操作在hadoop目录bin中h... 阅读全文
posted @ 2018-09-14 11:08 莫逸风 阅读(74) 评论(0) 推荐(0) 编辑
摘要: Exception in thread "main" java.lang.NoClassDefFoundError: org/json/JSONObject hadoop@hadoop-virtual-machine:~/app/sqoop-1.4.6-cdh... 阅读全文
posted @ 2018-09-13 09:40 莫逸风 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 错误信息 FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:For direct MetaStor... 阅读全文
posted @ 2018-09-12 21:13 莫逸风 阅读(108) 评论(0) 推荐(0) 编辑
摘要: SET PASSWORD FOR 'root'@'localhost' = PASSWORD('输入新密码'); 阅读全文
posted @ 2018-09-11 13:38 莫逸风 阅读(47) 评论(0) 推荐(0) 编辑
摘要: 此文为个人学习笔记如需系统学习请访问http://dblab.xmu.edu.cn/blog/1709-2/ 基本概念 *  RDD:是弹性分布式数据集(Resilient Distributed Dataset)的简称,是分布式内存的一个抽象概念,提供了一... 阅读全文
posted @ 2018-09-10 20:48 莫逸风 阅读(86) 评论(0) 推荐(0) 编辑
摘要: 此文为个人学习笔记如需系统学习请访问http://dblab.xmu.edu.cn/blog/1709-2/ Spark具有如下几个主要特点:  运行速度快 Spark使用先进的DAG(Directed Acyclic Graph,有向无环图)执行引擎... 阅读全文
posted @ 2018-09-10 20:23 莫逸风 阅读(127) 评论(0) 推荐(0) 编辑
摘要: 蒙特·卡罗方法是一种通过概率来得到问题近似解的方法,在很多领域都有重要的应用, 其中就包括圆周率近似值的计算问题。假设有一块边长为 2 的正方形木板,上面画一个单位 圆,然后随意往木板上扔飞镖,落点坐标(x, y)必然在木板上(更多的时候是落在单位圆内), 如... 阅读全文
posted @ 2018-09-06 10:20 莫逸风 阅读(547) 评论(0) 推荐(0) 编辑
摘要: 1、编写程序,输入任意大的自然数,输出各位数字之和。 2、编写程序,输入两个集合 setA 和 setB,分别输出它们的交集、并集和差集 setA-setB。 3、编写程序,输入一个自然数,输出它的二进制、八进制、十六进制表示形式。 1、 num = inpu... 阅读全文
posted @ 2018-09-06 09:52 莫逸风 阅读(426) 评论(0) 推荐(0) 编辑