摘要: 修改hive表字段的注释 ==== 修改之前 alter table 修改之后 阅读全文
posted @ 2018-11-28 14:26 大数据-大道至简 阅读(10890) 评论(0) 推荐(1)
摘要: 这里创建了表page_view,有表的注释,一个字段ip的注释,分区有两列,分别是dt和country。 [ROW FORMAT DELIMITED]关键字,是用来设置创建的表在加载数据的时候,支持的列分隔符。 不同列之间用一个'\001'分割, 集合(例如array,map)的元素之间以'\002 阅读全文
posted @ 2018-11-28 14:25 大数据-大道至简 阅读(1447) 评论(0) 推荐(0)
摘要: hive显式使用mapjoin 阅读全文
posted @ 2018-11-28 14:24 大数据-大道至简 阅读(8245) 评论(0) 推荐(0)
摘要: hive函数weekofyear应用及怪异的姿势分析 阅读全文
posted @ 2018-11-28 14:23 大数据-大道至简 阅读(3573) 评论(0) 推荐(0)
摘要: error in shuffle in fetcher 分析及方案 阅读全文
posted @ 2018-11-28 14:21 大数据-大道至简 阅读(2284) 评论(0) 推荐(0)
摘要: hive正则解析字符串以及 hive get_json_object 解析 json 字符串 阅读全文
posted @ 2018-11-28 14:13 大数据-大道至简 阅读(927) 评论(0) 推荐(0)
摘要: Hive外表创建和加载数据 阅读全文
posted @ 2018-11-28 14:11 大数据-大道至简 阅读(4445) 评论(2) 推荐(0)
摘要: hive 表写入数据的方式 少量数据 insert into 大文件 load data 数据量比较大的,可以将数据存放成 csv 格式的文件,通过 hive 的 load data 命令加载到 hive 表,由于数据是文本文件,因此,此处的 hive 表也必须是普通表。 否则在使用 load da 阅读全文
posted @ 2018-10-18 11:06 大数据-大道至简 阅读(578) 评论(0) 推荐(0)
摘要: 有时git库里的东西比较多,我们只希望像SVN一样,只拉取git库的一个目录。 例如:基础代码仓库dw_etl有很多基础代码,我们只想拉取仓库里fct_ordr_path_off目录的文件。 参考 https://askubuntu.com/questions/460885/how-to-clone 阅读全文
posted @ 2018-10-18 11:05 大数据-大道至简 阅读(128) 评论(0) 推荐(0)
摘要: 敏捷开发的4句宣言 阅读全文
posted @ 2011-07-20 19:34 大数据-大道至简 阅读(193) 评论(0) 推荐(0)
知识共享许可协议
本作品采用知识共享署名-非商业性使用-禁止演绎 3.0 未本地化版本许可协议进行许可。