上一页 1 ··· 41 42 43 44 45 46 47 48 49 ··· 127 下一页
摘要: 我看到了这个 跟着实操一下! 1、加载数据(已经提供了csv文件) 建库建表 >这个比较简单,根据文件的字段名创建合适的表; create table msg( msg_time string comment "消息发送时间", sender_name string comment "发送人昵称", 阅读全文
posted @ 2023-09-27 18:06 yesyes1 阅读(28) 评论(0) 推荐(0) 编辑
摘要: 1、explode函数(输入一行,输出多行) 引入lateral view侧视图的概念解决上面问题的限制: 2、UDAF聚合函数 增强聚合——grouping sets(相当于union all) 增强聚合——cube 增强聚合——rollup(是cube的子集,以左侧维度为主) 阅读全文
posted @ 2023-09-27 16:21 yesyes1 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 1、内置函数 1、字符串、时间类型函数 之前也是在c语言里面学过,包括concat、split等; 时间类型函数: 前不久用到的函数: date_add >当前日期的后的第几天的日期; date_sub >当前日期的前的第几天的日期; 2、数学函数、集合函数 round--取整数值(还能指定保留的精 阅读全文
posted @ 2023-09-27 15:29 yesyes1 阅读(38) 评论(0) 推荐(0) 编辑
摘要: 1、查看所有运算符 show functions; 2、关系运算符--是二元运算符,执行的是比较运算 每个关系运算符返回的都是boolean类型; 3、算术运算符--操作数必须为数字类型,分为一元运算符和二元运算符 4、逻辑运算符 与之前学过的一样,没难度; 阅读全文
posted @ 2023-09-27 14:40 yesyes1 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 1、Batch Mode批处理模式 在bin/hive后面使用-e或者-f时,就会进入到批处理模式,运行完成这一句命令,就会直接退出hive命令行 例如, bin/hive -e 'show databases' 2、Interactive Shell 交互式模式 该模式运行完成后并不退出hive命 阅读全文
posted @ 2023-09-27 09:28 yesyes1 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 1、update和delete操作 hive表如果不是事务表,就无法进行update操作 stored as orc TBLPROPERTIES('transactional'='true') 将表定义为事务表,之后进行update操作,就不会报错了。 2、select查询数据 就是跟mysql十分 阅读全文
posted @ 2023-09-27 09:11 yesyes1 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 问题描述 今天看到这么一个问题: 看到清洗这两个字,就觉得可高级可高级了!!! 所以,就把这个问题的解决方法也看了看,学了学; 问题的具体解决方法 看到了对ETL的分析(抽取-->过滤-->加载): 首先创建一个在原表的结构基础上,新增我们所需数据的字段的表; 然后执行insert+select操作 阅读全文
posted @ 2023-09-26 22:37 yesyes1 阅读(25) 评论(0) 推荐(0) 编辑
摘要: 今日收获 中午下课之后,就抓紧时间将大型数据库作业写完啦!(自认为很好地实现了老师要求的各个功能); 今天下午和小组的友友们一起讨论了C#管理系统的基本思路,整体进展还算顺利; 学习了一下hive的基础知识,对大数据的只是进行了一定程度上的巩固; 每日一背的单词怎么会少嘞~ 提前预习一下明天课程的内 阅读全文
posted @ 2023-09-26 22:13 yesyes1 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 1、load加载 load语法: 2、Hive3.X新特性 能够使用load将文件数据存储到分区中,将分区默认作为表格数据的最后一列; 3、insert+select向表插入数据 这个语法就是在上次测试的时候遇到过的问题嘞! insert+values这个语法执行效率就很慢,而换用insert+se 阅读全文
posted @ 2023-09-26 21:05 yesyes1 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 1、内部表和外部表 没有指定建表的类型的话,默认为内部表(Internal Table或者是Managed Table) 可以通过这行代码查看表的类型: describe formatted 表名; 内部表和外部表的区别以及适合使用的范围: 2、分区表--避免全表扫描,提高查询效率 需要注意的是,在 阅读全文
posted @ 2023-09-26 19:47 yesyes1 阅读(29) 评论(0) 推荐(0) 编辑
上一页 1 ··· 41 42 43 44 45 46 47 48 49 ··· 127 下一页