随笔 - 148,  文章 - 0,  评论 - 5,  阅读 - 10633

1.hive表和mysql表的编码格式

    如果通过sqoop出现中文乱码情况

    请修改mysql的配置文件/etc/my.cnf

     vim /etc/my.cnf

         添加如下两行

1
2
3
4
5
init_connect='SET collation_connection = utf8_unicode_ci'
init_connect='SET NAMES utf8'
character-set-server=utf8
collation-server=utf8_unicode_ci
skip-character-set-client-handshake

2.sqoop 导入数据过程中因为空格等脏字符报错

  解决办法 加上--input-null-non-string '\\N'

1
sqoop export --connect jdbc:mysql://master:3306/jd_comment --username  **** --password ******* --table pinglun --fields-terminated-by ';'<br> --input-null-non-string '\\N' --export-dir /user/hive/warehouse/jd.db/pinglun_dateformat;

  

 

posted on   sakura_xxg  阅读(149)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2021-03-14 大二下第2周总结
< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示