Hadoop笔记
1.Hive支持行级别的查询, 数据更新,不支持多行事务;
2.Hive 有两种数据库,
- Derby 内置的
- mysql 或其他
3. 连接MySQL 时,需要将mysql-jdbc 的驱动包放入hive的lib目录下
4. 变量和属性
四种命名空间:
hivavar: 用户自定义变量空间
hiveconf:hive配置
system:java相关
env: linux相关
定义变量
hive --define name=xxh
hive --hivevar name=xxh
或 hive>set hivevar: name=xxh;
查看或设置变量
hive>set name; 查看变量
hive> set name=xxx; 设置变量
或
hive> set hivevar:name;
hive> set hivevar: name=xxx;
--hiveconf 配置属性
如:
hive --hiveconf hive.cli.print.current.db = true;
会打印出数据库名字
5. 静默模式 hive -S 不会打印出OK,time token
6.从文件中执行查询 hive -f /path/*.hql
7 hive -i 每次执行时会首先读 指定的文件.
8. hive shell 下的技巧
Ctrl + A 到行首
Ctrl + B 到行尾
执行系统命令: !pwd ;
9. 显示字段名称
hive --hiveconf hive.cli.print_header=true;
或
hive> set hive.cli.print_header=true;