上一页 1 ··· 7 8 9 10 11 12 13 下一页
摘要: 1.感谢它的博文, https://blog.csdn.net/plg17/article/details/78758593 阅读全文
posted @ 2019-12-25 02:11 挪威森林猫Zzz 阅读(120) 评论(0) 推荐(0) 编辑
摘要: 1.要求,性别分组 , 然后数据使用量的降序排列 , 采用了,row_number() over (partitionrown by class order by score desc ) as rank --注意,会生成排名,如果想要去掉 , 嵌套查询就可以了. 阅读全文
posted @ 2019-12-25 01:50 挪威森林猫Zzz 阅读(1116) 评论(1) 推荐(0) 编辑
摘要: 1.右侧的pid保证是同一个人的属性 2. 有一个方法 max('name',null) 输出是一个字符串 , 这样间接去掉了null 阅读全文
posted @ 2019-12-25 01:19 挪威森林猫Zzz 阅读(3656) 评论(0) 推荐(1) 编辑
摘要: import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * Created by Administrator on 2019/12/17 */ public class PassWord_Che 阅读全文
posted @ 2019-12-17 15:48 挪威森林猫Zzz 阅读(626) 评论(0) 推荐(0) 编辑
摘要: 1. hive数据仓库 , 元数据和HDFS上的数据 , 映射为一张表 , 支持分区 hive --service metastore& 再次hive 就可以进入 hive shell 1. use database , 可以进入某一个数据库 依然支持 select * from student; 阅读全文
posted @ 2019-12-08 16:23 挪威森林猫Zzz 阅读(109) 评论(0) 推荐(0) 编辑
摘要: 采用 MAVEN 项目POM添加 <dependency> <groupId>org.apache.lucene</groupId> <artifactId>lucene-core</artifactId> <version>4.0.0</version></dependency> import o 阅读全文
posted @ 2019-11-22 18:06 挪威森林猫Zzz 阅读(1564) 评论(0) 推荐(0) 编辑
摘要: 求一 ( 日新日活 ) : 用户 session 统计,用户行为,action 表,步长,时长,session 聚合, https://blog.csdn.net/qq_34319644/article/details/100098299 阅读全文
posted @ 2019-10-29 18:03 挪威森林猫Zzz 阅读(85) 评论(0) 推荐(0) 编辑
摘要: 1. 查询某一列或多列. select id from 表名 1. 嵌套查询-->使用上一次查询结果需要添加临时表名, from > (select ..... ) a 阅读全文
posted @ 2019-10-25 00:17 挪威森林猫Zzz 阅读(135) 评论(0) 推荐(0) 编辑
摘要: 1.准备 idea , 配置好scala ,需要有 Spark sql包 !注意:如果自己Spark能跑 ,就不要复制我的POM了,代码能直接用. 贴一下POM , 我用的是Spark版本是 2.4.3, Spark_core以及sql是2.11 <?xml version="1.0" encodi 阅读全文
posted @ 2019-10-22 21:27 挪威森林猫Zzz 阅读(2119) 评论(0) 推荐(0) 编辑
摘要: package scala.spark.Day3; import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkConte 阅读全文
posted @ 2019-10-16 13:08 挪威森林猫Zzz 阅读(474) 评论(0) 推荐(0) 编辑
上一页 1 ··· 7 8 9 10 11 12 13 下一页