每日总结0925
HIVE数据分析检验报告
信2105-3 张博文
- 数据导入
使用VM中下载的虚拟机工具将csv文件导入到虚拟机中并记住存储路径
建表:
DataGrip连接hive:
将数据导入到test2表中:
- 数据清洗:
创建一个一样的表test3,然后将数据清洗到该表
insert overwrite table test3 select date_add('2021-8-31',cast(day_id AS INT)) as day_id,sale_nbr,buy_nbr,cnt,round from test2;
- 数据处理分析:
首先创建一个存储该数据的表text3_1
Create table text3_1(day_id varchar(30), sale_nbr varchar(30), cnt varchar(30), round varchar(30)) row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde' WITH SERDEPROPERTIES
(
"separatorChar"=","
)
STORED AS TEXTFILE;
以此类推创建其余的三个表。
4.处理结果入库:将数据导入到MySQL中
5.可视化分析:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!