Hive的使用以及如何利用echarts实现可视化在前端页面展示(二)---hive部分的实现
1、利用远程连接器上传csv文件
2、进入hive创建表结构:
创建一个Hive表的SQL语句:这个表名为 "sales",包含了五个列:day_id、sale_nbr、buy_nbr、cnt 和 round。此表的数据格式为逗号分隔的文本文件,每一行都用逗号分隔字段。
create table sales(day_id string,sale_nbr string,buy_nbr string,cnt string,round string) row format delimited fields terminated by ',';
3、导入csv数据
LOAD DATA LOCAL INPATH '/opt/software/testdata/sales.csv' INTO TABLE sales;
4、查看是否导入成功
5、数据清洗
SELECT day_id, date_add('2021-09-01', CAST(day_id AS INT)) AS cleaned_day_id FROM your_table_name;
6、根据题目要求创表插入数据
insert overwrite table new_sales select date_add('2021-09-00',cast(day_id as int)) as day_id,sale_nbr as sale_nbr,buy_nbr as buy_nbr,cnt as cnt,round as round from sales;
这一步的话如果你没有问题,直接插入就行,我这边报错了,花了很长时间解决问题,我放在另一篇博客上https://www.cnblogs.com/gbrr/p/17725082.html
7、hive得基本工作就搞定了,我觉得主要还是题目的理解,尽量不要参考别人的sql语句,自己静下心来想想怎么设计比较好,当然我不是