07 2020 档案
摘要:一、Oracle数据库是GBK编码导入到UTF-8的mysql数据库出现乱码 Oracle数据库有一套自己的编码方法,当客户端和数据库编码不一致时会自动转换编码方式;客户端获取数据时Oracle会自动将GBK转为UTF-8,因此,需要在Mysql的url上设置编码为UTF-8保持和mysql的一直即
阅读全文
摘要:一、python版本问题报错显示 java.lang.Exception: File "/home/hundsun/workspace/dap/tools/bdata-datago/DataX/bin/datax.py", line 114 print readerRef ^SyntaxError:
阅读全文
摘要:一、概述 将数据以parquet模式写入到hive的分区表中时,底层源码有个错误,在进行分割字段判断时,没有引用已传入字符,多了一个“=”;该错误在hive的client中也会碰到 错误原因是底层分割符引用错误, 二、解决方法 从https://github.com/apache/parquet-m
阅读全文
摘要:一、TDH开启kerberos后登陆hive方式 TDH的hive是继承到平台中的,需要使用远程的方式连接hive数据库,当kerberos开启后,需要添加kerberos协议规则;使用方式如下 beeline -u 'jdbc:hive2://localhost:10000/demo;princi
阅读全文
摘要:一、没有开通kerberos而使用kerberos方式连接报错 报错:Peer indicated failure: Unsupported mechanism type GSSAPI 这是因为hive所在集群已经关闭了kerberos,但是连接字符串还是采用kerberos方式就会爆此错误; 此时
阅读全文
摘要:一、概述 1、 hive中的Timestamp Hive在0.8的版本后开始支持Timestamp的格式。Hive在储存时间戳的时候会先把时间转成UTC的时间,然后再把转换后的时间存储到Parquet文件中。在读取Parquet文件的时候Hive会把时间从UTC时间再转化回成本地的时间。这样的话,如
阅读全文