会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
pengh
博客园
首页
新随笔
联系
订阅
管理
随笔 - 126 文章 - 0 评论 - 5 阅读 -
95010
上一页
1
2
3
4
5
6
···
13
下一页
2022年11月7日
将数组按照指定的顺序排序处理
摘要: 转载:https://blog.csdn.net/yang_shibiao/article/details/124968139 1. 数据准备建表语句: create table temp( province string, city string, score bigint ) ;插入数据: IN
阅读全文
posted @ 2022-11-07 17:53 大鹏的鸿鹄之志
阅读(590)
评论(0)
推荐(0)
编辑
2022年9月29日
自学笔记
摘要: 1,方法使用static修饰时,调用该方法时就不用通过对象.方法。而是直接写方法名字就可以完成调用 2,一个java文件可以有多个类,但是只能有一个用public修斯的类。 3,短路与或非 && || ! 当结果是false ,&&不执行后面的运算 4、JSON.parseObject,是将Json
阅读全文
posted @ 2022-09-29 21:05 大鹏的鸿鹄之志
阅读(52)
评论(0)
推荐(0)
编辑
2022年9月21日
HIVE 开窗函数
摘要: first_value 用法:select id, money, first_value(money) over(partition by id order by money) from winfunc; id money first_value_window_0 1001 100 100 1001
阅读全文
posted @ 2022-09-21 00:38 大鹏的鸿鹄之志
阅读(131)
评论(0)
推荐(0)
编辑
2022年9月19日
hive substring_index 函数
摘要: substring_index详解 substring_index(str,delim,count) str:要处理的字符串 delim:分隔符 count:计数 例子:str=www.wikibt.com substring_index(str,'.',1) 结果是:www substring_i
阅读全文
posted @ 2022-09-19 21:02 大鹏的鸿鹄之志
阅读(3133)
评论(0)
推荐(0)
编辑
2022年9月4日
复杂格式数据处理
摘要: 1 SELECT 2 code, 3 name, 4 ai.ACode, 5 ai.AName, 6 bi.BCode, 7 bi.BName 8 FROM (SELECT 9 get_json_object(t.value, '$.base.code') AS code, 10 get_json_
阅读全文
posted @ 2022-09-04 20:52 大鹏的鸿鹄之志
阅读(30)
评论(0)
推荐(0)
编辑
2022年8月20日
Flink sql
摘要: 转载:https://blog.csdn.net/u012443641/article/details/126124660
阅读全文
posted @ 2022-08-20 23:58 大鹏的鸿鹄之志
阅读(39)
评论(0)
推荐(0)
编辑
Flink 内置函数
摘要: 转载:https://blog.csdn.net/u011707542/article/details/101013751?spm=1001.2101.3001.6650.3&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7
阅读全文
posted @ 2022-08-20 23:55 大鹏的鸿鹄之志
阅读(29)
评论(0)
推荐(0)
编辑
2022年8月17日
GROUPING SETS、ROLLUP、CUBE三者的使用异同
摘要: 转载:https://blog.51cto.com/u_13446/7644265 1 SELECT supplier_id, rating, COUNT(*) AS total 2 FROM 3 (VALUES 4 ('supplier1', 'product1', 4), 5 ('supplie
阅读全文
posted @ 2022-08-17 14:52 大鹏的鸿鹄之志
阅读(35)
评论(0)
推荐(0)
编辑
2022年7月28日
拉链表的设计
摘要: 转载:https://blog.csdn.net/xiaoyc2012/article/details/100545971 转载:https://zhuanlan.zhihu.com/p/75070697 转载:https://blog.csdn.net/liminghui4321/article/
阅读全文
posted @ 2022-07-28 22:58 大鹏的鸿鹄之志
阅读(47)
评论(0)
推荐(0)
编辑
2022年7月19日
Hive UDTF 编写
摘要: aaa
阅读全文
posted @ 2022-07-19 22:44 大鹏的鸿鹄之志
阅读(10)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
···
13
下一页
昵称:
大鹏的鸿鹄之志
园龄:
9年5个月
粉丝:
3
关注:
12
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
随笔分类
clickhouse(5)
Flink(5)
Flume(1)
GIT(3)
Hadoop(2)
Hive(22)
JAVA(14)
Presto(4)
Python(2)
SQL刷题笔记(1)
大数据(2)
机器学习--西瓜书(4)
离线数仓开发(21)
数据分析趣事(1)
推荐系统(1)
小工具(1)
学习小笔记(17)
更多
随笔档案
2025年2月(1)
2024年10月(2)
2024年9月(1)
2023年9月(1)
2023年3月(1)
2022年12月(1)
2022年11月(4)
2022年9月(4)
2022年8月(3)
2022年7月(8)
2022年6月(3)
2022年4月(1)
2022年3月(1)
2022年1月(2)
2021年12月(5)
2021年11月(1)
2021年10月(2)
2021年9月(5)
2021年8月(2)
2021年7月(1)
2021年6月(1)
2021年5月(2)
2021年4月(7)
2021年3月(6)
2021年2月(2)
2021年1月(4)
2020年12月(2)
2020年11月(5)
2020年10月(2)
2020年9月(6)
2020年1月(1)
2019年12月(5)
2019年11月(21)
2019年10月(13)
更多
阅读排行榜
1. clickhouse日期函数(16904)
2. 数据倾斜的原因和解决方案(11173)
3. HIVE解析json数组(4502)
4. IDEA打开java项目后不能运行(3894)
5. HIVE函数大全(3525)
评论排行榜
1. MR运行流程(2)
2. Hadoop(2)
3. hive调优(1)
推荐排行榜
1. Presto的基本概念(2)
2. Presto常见问题优化(1)
3. HIve实现数据抽样(1)
4. 数据倾斜的原因和解决方案(1)
最新评论
1. Re:MR运行流程
这块我有一个疑问,楼主,为啥reduce端不用环形缓冲区呢?用环形缓冲区应该也没问题吧
--dachun777
2. Re:MR运行流程
感谢up主,解决了我的疑问,reduce端的缓冲区的问题,被这个问题困扰了好久了
--dachun777
3. Re:Hadoop
client和namenode之间是通过rpc通信;
datanode和namenode之间是通过rpc通信;
client和datanode之间是通过简单的socket通信。
--大鹏的鸿鹄之志
4. Re:Hadoop
Hadoop是怎么保证不同的副本会在不同的机器上的?
--大鹏的鸿鹄之志
5. Re:hive调优
本章只是从HQL层面介绍一下,日常开发HQL中需要注意的一些优化点,不涉及Hadoop层面的参数、配置等优化。其中大部分是我之前发过的博客文章,这里整理了下。11.1 使用分区剪裁、列剪裁在SELEC...
--pengh
点击右上角即可分享