1.hive表和mysql表的编码格式

    如果通过sqoop出现中文乱码情况

    请修改mysql的配置文件/etc/my.cnf

     vim /etc/my.cnf

         添加如下两行

init_connect='SET collation_connection = utf8_unicode_ci'
init_connect='SET NAMES utf8'
character-set-server=utf8
collation-server=utf8_unicode_ci
skip-character-set-client-handshake

2.sqoop 导入数据过程中因为空格等脏字符报错

  解决办法 加上--input-null-non-string '\\N'

sqoop export --connect jdbc:mysql://master:3306/jd_comment --username  **** --password ******* --table pinglun --fields-terminated-by ';'
--input-null-non-string '\\N' --export-dir /user/hive/warehouse/jd.db/pinglun_dateformat;

  

 

posted on 2022-03-14 17:53  sakura_xxg  阅读(136)  评论(0编辑  收藏  举报