摘要: https://www.cnblogs.com/yuxuefeng/articles/9235431.html 阅读全文
posted @ 2021-03-04 19:12 大数据程序员 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 【1】数据 文件vpnlog 数据如下 {"userName":"a","ts":"2020-04-07T00:12:02.000Z","type":"logout"} {"userName":"a","ts":"2020-04-07T00:25:36.000Z","type":"login"} { 阅读全文
posted @ 2021-03-04 17:22 大数据程序员 阅读(565) 评论(0) 推荐(0) 编辑
摘要: 【1】数据 文件 registuser.csv 数据如下 uid,regist_day,regist_os u1,20200401,android u2,20200401,iphone u3,20200401,android u4,20200402,iphone u5,20200402,androi 阅读全文
posted @ 2021-03-04 16:54 大数据程序员 阅读(271) 评论(0) 推荐(0) 编辑
摘要: 根据用户访问网站的浏览时长统计以下信息:1、统计每个用户每天访问网站的总时长(当天总时长是累加之前日期的)2、统计每个用户当前天及前一天访问网站总时长3、统计每个用户当前天访问的网站时长(当前天统计的时长除了当前天访问的总时长还包含前一天和后一天的访问总时长)4、统计每个用户访问网站的总时长【1】数 阅读全文
posted @ 2021-03-04 16:36 大数据程序员 阅读(637) 评论(0) 推荐(0) 编辑
摘要: 【1】数据 文件 rowcolumnData 数据如下 username,item,price zhangsan,A,1 zhangsan,B,2 zhangsan,C,3 lisi,A,4 lisi,C,5 zhangsan,D,6 lisi,B,7 wangwu,C,8 【2】scala代码实现 阅读全文
posted @ 2021-03-04 16:30 大数据程序员 阅读(121) 评论(0) 推荐(0) 编辑
摘要: 【1】数据 文件 rowcolumnData 数据如下 username,item,price zhangsan,A,1 zhangsan,B,2 zhangsan,C,3 lisi,A,4 lisi,C,5 zhangsan,D,6 lisi,B,7 wangwu,C,8 【2】scala代码实现 阅读全文
posted @ 2021-03-04 16:26 大数据程序员 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 直接正常读取json格式数据,然后某些下是嵌套的格式,直接使用 "列.属性" 就可以获取对应的值【1】数据 文件 NestJsonFile 数据如下 {"name":"zhangsan","score":100,"infos":{"age":20,"gender":'man'}} {"name":" 阅读全文
posted @ 2021-03-04 16:19 大数据程序员 阅读(801) 评论(0) 推荐(0) 编辑
摘要: get_json_object(jsonstr,json属性)scala代码: 1 package com.it.baizhan.scalacode.sparksql.examples 2 3 import org.apache.spark.sql.SparkSession 4 5 /** 6 * 阅读全文
posted @ 2021-03-04 16:13 大数据程序员 阅读(883) 评论(0) 推荐(0) 编辑
摘要: 【1】数据 文件jsonArrayFile 数据如下 {"name":"zhangsan","age":18,"scores":[{"xueqi":1,"yuwen":98,"shuxue":90,"yingyu":100},{"xueqi":2,"yuwen":98,"shuxue":78,"yi 阅读全文
posted @ 2021-03-04 11:40 大数据程序员 阅读(355) 评论(0) 推荐(0) 编辑
摘要: 开窗函数 + 表的自关联实现【1】数据 文件test.csv数据如下 ID,CHANGE,NAME id1,1,a id1,1,b id1,1,c id1,2,d id1,2,e id1,1,f id2,2,g id2,2,h id2,1,i id2,1,j id2,2,k id3,1,l id3, 阅读全文
posted @ 2021-03-04 10:46 大数据程序员 阅读(53) 评论(0) 推荐(0) 编辑