03 2018 档案

摘要:转载 git 提交解决冲突 http://www.cnblogs.com/qinbb/p/5972308.html 一:git命令在提交代码前,没有pull拉最新的代码,因此再次提交出现了冲突。 error: You have not concluded your merge (MERGE_HEAD 阅读全文
posted @ 2018-03-23 12:38 harrychinese 阅读(876) 评论(0) 推荐(0) 编辑
摘要:时间函数 --当前时间戳now()current_timestamp() --当前时间戳相对于 linux epoch 的秒数unix_timestamp() , 不带参数, 则返回 '1970-01-01 00:00:00' UTC 到现在的秒数 -- 转换到相对于 linux epoch 的秒数 阅读全文
posted @ 2018-03-21 09:01 harrychinese 阅读(50508) 评论(0) 推荐(0) 编辑
摘要:常用字符串函数 base64decode(string str) : base64 解码.base64encode(string str) : base64 编码. fnv_hash(type v) : 对参数值做hash, 注意结果有正有负 trim(string a): 去除 leading 和 阅读全文
posted @ 2018-03-21 08:59 harrychinese 阅读(23020) 评论(0) 推荐(0) 编辑
摘要:查看内置的函数 hive 不需要进入什么内置数据库, 即可使用 show functions 命令列出所有内置的函数. show functions; -- hive仅显示函数的名称, 没有参数和返回值信息. desc function function_name ; -- 该命令能显示函数的具体用 阅读全文
posted @ 2018-03-21 08:58 harrychinese 阅读(10248) 评论(0) 推荐(0) 编辑
摘要:Impala 特有的操作符 ILIKE 操作符, 忽略大小写的 like 操作符.REGEXP 操作符, 正则匹配操作符.RLIKE 操作符, 同 REGEXP 操作符.IREGEXP 操作符, 忽略大小写的正则匹配符.IS DISTINCT FROM 操作符, 判断前后两个表达式是否不相等, 和< 阅读全文
posted @ 2018-03-21 08:54 harrychinese 阅读(3320) 评论(0) 推荐(0) 编辑
摘要:Impala 获取hive 的 metadata Impala 通常和Hive共用同一个metadata 数据库(通常是MySQL/PostgreSQL), 所以Impala 能够读取到Hive的元数据信息. 如果Impala需要访问Hive表, 需要将Hive metadata 刷新到impala 阅读全文
posted @ 2018-03-19 09:02 harrychinese 阅读(6781) 评论(0) 推荐(1) 编辑
摘要:使用git管理Kettle 作业的一个注意 之前 ETL 作业是用 svn 管理的, 迁移到 git 管理也算是大势所趋吧. 这里重点讲一个git管理kettle作业的注意事项: kettle 既支持基于数据库的repository也支持基于文件repository, 但我更推荐基于文件的repos 阅读全文
posted @ 2018-03-15 09:14 harrychinese 阅读(864) 评论(0) 推荐(0) 编辑
摘要:<<Pentaho Kettle解决方案:使用PDI构建开源ETL解决方案>>, Matt Casters等著,初建军翻译<<Hadoop应用架构>> Mark Grover编著, OREILLY出版<<Hadoop权威指南>> Tom White编著, OREILLY出版<<数据仓库工具箱 --维 阅读全文
posted @ 2018-03-05 18:27 harrychinese 阅读(1803) 评论(0) 推荐(0) 编辑
摘要:Apache Kudu 支持Insert/Update/Delete 等写操作(Kudu 随机写效率也很高, 实测对一个窄表做全字段update, 其速度达到了Insert速度的88%, 而vertica的update效率比insert差很多), Kudu 表文件是列式数据格式(和Parquet格式 阅读全文
posted @ 2018-03-05 18:24 harrychinese 阅读(5291) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示