摘要: #1、按单个字段排序 #2、添加筛选条件再排序 #3、按表达式排序 #4、按别名排序 #5、按函数排序 #6、按多个字段排序 阅读全文
posted @ 2019-08-12 23:11 DiYong 阅读(272) 评论(0) 推荐(0) 编辑
摘要: 第8章 Spark SQL实战 8.1 数据说明 数据集是货品交易数据集。 每个订单可能包含多个货品,每个订单可以产生多次交易,不同的货品有不同的单价。 8.2 加载数据 tbStock: tbStockDetail: tbDate: 注册表: 8.3 计算所有订单中每年的销售单数、销售总额 统计所 阅读全文
posted @ 2019-08-12 22:31 DiYong 阅读(1045) 评论(0) 推荐(0) 编辑
摘要: 第7章 Spark SQL 的运行原理(了解) 7.1 Spark SQL运行架构 Spark SQL对SQL语句的处理和关系型数据库类似,即词法/语法解析、绑定、优化、执行。Spark SQL会先将SQL语句解析成一棵树,然后使用规则(Rule)对Tree进行绑定、优化等处理过程。Spark SQ 阅读全文
posted @ 2019-08-12 22:21 DiYong 阅读(928) 评论(0) 推荐(0) 编辑
摘要: 第6章 运行Spark SQL CLI Spark SQL CLI可以很方便的在本地运行Hive元数据服务以及从命令行执行查询任务。需要注意的是,Spark SQL CLI不能与Thrift JDBC服务交互。在Spark目录下执行如下命令启动Spark SQL CLI: ./bin/spark-s 阅读全文
posted @ 2019-08-12 22:18 DiYong 阅读(249) 评论(0) 推荐(0) 编辑
摘要: 第5章 JDBC/ODBC服务器 Spark SQL也提供JDBC连接支持,这对于让商业智能(BI)工具连接到Spark集群上以 及在多用户间共享一个集群的场景都非常有用。JDBC 服务器作为一个独立的 Spark 驱动 器程序运行,可以在多用户之间共享。任意一个客户端都可以在内存中缓存数据表,对表 阅读全文
posted @ 2019-08-12 22:17 DiYong 阅读(410) 评论(0) 推荐(0) 编辑
摘要: 第4章 SparkSQL数据源 4.1 通用加载/保存方法 4.1.1 手动指定选项 Spark SQL的DataFrame接口支持多种数据源的操作。一个DataFrame可以进行RDDs方式的操作,也可以被注册为临时表。把DataFrame注册为临时表之后,就可以对该DataFrame执行SQL查 阅读全文
posted @ 2019-08-12 22:09 DiYong 阅读(387) 评论(0) 推荐(0) 编辑
摘要: 第3章 SparkSQL解析 3.1 新的起始点SparkSession 在老的版本中,SparkSQL提供两种SQL查询起始点,一个叫SQLContext,用于Spark自己提供的SQL查询,一个叫HiveContext,用于连接Hive的查询,SparkSession是Spark最新的SQL查询 阅读全文
posted @ 2019-08-12 21:53 DiYong 阅读(342) 评论(0) 推荐(0) 编辑
摘要: 第2章 执行SparkSQL查询 2.1 命令行查询流程 打开Spark shell 例子:查询大于30岁的用户 创建如下JSON文件,注意JSON的格式: {"name":"Michael"}{"name":"Andy", "age":30}{"name":"Justin", "age":19} 阅读全文
posted @ 2019-08-12 20:37 DiYong 阅读(267) 评论(0) 推荐(0) 编辑
摘要: 第1章 Spark SQL概述 1.1 什么是Spark SQL Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作为分布式SQL查询引擎的作用。 Hive是将Hive SQL转换成MapReduce然后提交到集群上执行,大大简化了编写Map 阅读全文
posted @ 2019-08-12 20:23 DiYong 阅读(360) 评论(0) 推荐(0) 编辑
摘要: 一、network利用root帐户# service networking restart 或者/etc/init.d/networking restart 二、ifdown/ifup# ifdown eth0# ifup eth0 三、ifconfig# ifconfig eth0 down# i 阅读全文
posted @ 2019-08-12 14:47 DiYong 阅读(284) 评论(0) 推荐(0) 编辑
摘要: 简历篇 请自我介绍 请介绍项目 基础篇 基本功 面向对象的特征 final, finally, finalize 的区别 int 和 Integer 有什么区别 重载和重写的区别 抽象类和接口有什么区别 说说反射的用途及实现 说说自定义注解的场景及实现 HTTP 请求的 GET 与 POST 方式的 阅读全文
posted @ 2019-08-12 01:36 DiYong 阅读(756) 评论(0) 推荐(0) 编辑
摘要: 八种基本数据类型的大小,以及他们的封装类 引用数据类型 Switch能否用string做参数 equals与==的区别 自动装箱,常量池 Object有哪些公用方法 Java的四种引用,强弱软虚,用到的场景 Hashcode的作用 HashMap的hashcode的作用 为什么重载hashCode方 阅读全文
posted @ 2019-08-12 01:15 DiYong 阅读(1670) 评论(0) 推荐(0) 编辑
摘要: 一 、java基础1.String和StringBuffer、StringBuild的区别:http://blog.csdn.net/rmn190/article/details/14920132.hashcode和equals方法的关系:http://blog.csdn.net/lijiecao0 阅读全文
posted @ 2019-08-12 01:04 DiYong 阅读(313) 评论(0) 推荐(0) 编辑
摘要: 项目介绍 大部分情况,这是一场面试的开门题,面试官问这个问题,主要是考察你的概述能力和全局视野。有的人经常抱怨自己每天在堆业务,但没有成长。事实上,很多情况下确实在堆业务,但并不是没有成长的。并非做中间件或者技术架构才是成长,例如我们的需求分析能力,沟通协作能力,产品思维能力,抽象建模能力等都是一个 阅读全文
posted @ 2019-08-12 01:01 DiYong 阅读(693) 评论(0) 推荐(1) 编辑