08 2019 档案

面试链接
摘要:Scala面试题: https://www.cnblogs.com/Gxiaobai/p/10460336.html spark-Streaming面试题: http://app.myzaker.com/news/article.php?pk=59a6517b1bc8e03276000029 spa 阅读全文

posted @ 2019-08-29 19:44 hdc520 阅读(284) 评论(0) 推荐(0) 编辑

spark与Hadoop的区别
摘要:1. Mapreduce和Spark的相同和区别 两者都是用mr模型来进行并行计算 hadoop的一个作业:job job分为map task和reduce task,每个task都是在自己的进程中运行的 当task结束时,进程也会结束 spark用户提交的任务:application 一个appl 阅读全文

posted @ 2019-08-28 17:08 hdc520 阅读(697) 评论(0) 推荐(0) 编辑

hive之wordcount
摘要:1.创建一张表,记录文件数据,使用换行符作为分隔符 create table file_data(content string) row format delimited fields terminated by '/n' 2.将准备的数据(/home/hadoop/wordcount.tx)添加到 阅读全文

posted @ 2019-08-27 09:39 hdc520 阅读(182) 评论(0) 推荐(0) 编辑

count(*),count(1),count(列名)的区别
摘要:count(*)和count(1)无任何差别,永远优于count其他字段只要存在普通索引,count就会使用普通索引,只存在主键时,count(*)和或count(1)会使用主键索引 count(a) (1).当a=null时,count(null) (2).a=*或者1时,count(*)为表的行 阅读全文

posted @ 2019-08-26 20:40 hdc520 阅读(438) 评论(0) 推荐(0) 编辑

导航