doris踩坑csv格式分割问题

简单记录一下问题和解决方法
doris,spark-doirs-connector
Reason: actual column number in csv file is  more than  schema column number.actual number: 26, schema column number: 25; line delimiter: [
], column separator: [	], result values:

报错信息如上，解决如下
默认的读取是以csv进行，在行列值分割时候导致分割失败，数据插入失败，转换为以json方式读取可以避免问题出现，另外官方文档里面也有一些参数可以优化
        map.put("doris.sink.properties.format","json");//   http-outgoing-5 >> read_json_by_line: true
        map.put("doris.sink.batch.size","5000");

posted @ 2025-01-09 17:54 堕落先锋阅读(49) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· content_split() takes 0 positional arguments but 1 was given

· list分三个组问题python

· Doris写入数据异常提示actual column number in csv file is less than schema column number

· DataFrame 提取部分再转存为DataFrame

· 使用spark-sql处理Doris大表关联

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· 闲置电脑爆改个人服务器（超详细） #公网映射 #Vmware虚拟网络编辑器
· ollama系列01：轻松3步本地部署deepseek，普通电脑可用

历史上的今天：
2020-01-09 排序001选择排序于冒泡排序

公告

昵称：堕落先锋
园龄： 6年
粉丝： 2
关注： 2

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:flink 的一个错误（我还没解决掉，谁会解决欢迎留言啊）
哈哈,我也入坑了.
大哥,有解决办法吗?
--阿尔冯斯
2. Re:flink 的一个错误（我还没解决掉，谁会解决欢迎留言啊）
我也遇到了同样问题，我不过这个问题我算是解决了，不过我仍然不知道是什么导致的，我只知道是我的yarn集群的问题导致的，后来我把yarn集群重装了就可以了
--Red.rain
3. Re:flink 的一个错误（我还没解决掉，谁会解决欢迎留言啊）
一样的问题，请问你解决了吗？换个备份的虚机就没问题，是环境问题，但根因最终没能找到，如果谁能有什么发现请告知，多谢！
--向前向前向前向前
4. Re:分享一个基于ssm框架下的webService接口开发
我代码原本是完整的，怎么就只能看到一部分了哈哈
--乌云散尽