会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
人不疯狂枉一生
博客园
首页
新随笔
联系
订阅
管理
随笔 - 90
文章 - 5
评论 - 0
阅读 -
50312
02 2024 档案
Hive数据线下导入Mysql
摘要:1.背景 最近在处理一个数据量级在1亿左右的数据,没办法mysql不好处理,只能把数据放到大数据集群进行处理,处理好后再把这亿级数据导入本地Mysql。 2.实践 (1)把需要处理的数据手动传到集群,上传的数据只有一万条左右,经过笛卡尔积以及各种运算后,结果数据条数有一亿左右,文件大小有5G左右。
阅读全文
posted @
2024-02-01 09:36
人不疯狂枉一生
阅读(80)
评论(0)
推荐(0)
编辑
公告
昵称:
人不疯狂枉一生
园龄:
10年10个月
粉丝:
1
关注:
0
+加关注
<
2025年3月
>
日
一
二
三
四
五
六
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
1
2
3
4
5
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
C#
(2)
webx
(1)
thrift
(1)
Tensorflow
(1)
SSM
(1)
Scala开发环境
(1)
python多版本
(1)
python
(1)
mysql
(1)
maven包依赖
(1)
更多
积分与排名
积分 - 45498
排名 - 37316
合集
kafka(1)
flink(6)
随笔分类
elasticsearch(1)
Hadoop(7)
Hive(2)
IDEA(1)
kafka(1)
python(1)
SpringCloud(2)
web(1)
大数据(2)
爬虫(1)
随笔档案
2024年12月(1)
2024年11月(1)
2024年10月(1)
2024年5月(11)
2024年2月(1)
2024年1月(1)
2023年12月(1)
2023年11月(2)
2023年10月(2)
2023年9月(5)
2023年8月(9)
2023年7月(8)
2023年5月(1)
2023年4月(2)
2023年3月(1)
2023年2月(4)
2022年12月(1)
2022年11月(1)
2022年9月(1)
2022年8月(2)
2022年6月(1)
2021年7月(3)
2021年6月(1)
2021年4月(1)
2020年12月(1)
2020年10月(1)
2020年9月(1)
2020年7月(1)
2019年11月(3)
2019年8月(2)
2019年7月(1)
2019年5月(2)
2018年6月(1)
2018年5月(2)
2018年4月(1)
2018年3月(2)
2018年2月(2)
2018年1月(3)
2017年12月(1)
2016年4月(2)
2016年3月(1)
2014年11月(1)
更多
文章分类
跨语言(1)
阅读排行榜
1. Eureka学习例子(7397)
2. mac for Idea配置Tomcat(4110)
3. maven包依赖问题排除(2841)
4. 基于Livy的Spark提交平台搭建与开发(2512)
5. Maven打包Spark程序Pom配置(2484)
推荐排行榜
1. Maven打包Spark程序Pom配置(1)
点击右上角即可分享