hive的相关学习1---wordCount实例
1、新建一个名为file1.txt的txt文件存储数据
2、在sss数据库中新创建一个名为docs的表
create table if not exists docs(line string);
3、将file1.txt的数据导入到新创建的docs表中
load data local inpath '/data/' overwrite into table docs;
4、编写sql语句实现wordCount算法
create table wordcount as
select word,count(1) as count from
(select explode(split(line,' ')) as word from docs) w
group by word
order by word;
其中,
explode()函数------代表为数据打散,即将一行数据才分为多行;
上面的第三行语句则表示为------根据空格字符将各个字符且存储为多行字符;
而w代表------他只是作为数据分析过程中的一个临时表(不要误认为为写入操作);
然后直接执行,等待程序运行完成即可:
它说它运行成功了:
查看运行结果: