使用notepad++/excle快速将cvs文件转换为insert语句技巧以及注意点

使用notepad++/excle快速将cvs文件转换为insert语句技巧以及注意点

业务场景

最近nc项目经理从第三方弄来了一个300w行的csv文件,让导入数据库做处理,出现了下列问题:

csv文件中的字段分隔符,默认使用,进行分隔的,insert的字段个数必须和插入字段的个数对应上,错误的原因就是:存储的问题子当中,有用,分隔的内容,导入的时候导致多一个字段,每次导入一部分就出错

注意事项/问题:

  • csv文件不能用excle编辑保存,编辑后,出现格式乱码,可使用notepad++编辑保存;

  • 拆分后的文件也不宜过大,否则进行字符替换的时候,编辑器会卡死;

  • 由于使用转为insert语句导入的原因,空字符串在导入的过程中容易出错,所以讲空用""或者''将内容包含住;

  • 特被注意转义字符,即\+特殊字符,在字段值末尾,导致sql语句结构破坏,sql语句不可用

  • 文件过大,excle/notepad++均无法打开,使用linux工具对文件进行按行拆分

    #将文件上传到linux中,使用下面命令,total.csv为需要拆分的文件,company为拆分后的文件名
    split -l 100000 total.csv company
    

一、使用notepad++转换sql语句

1.使用正则表达是将最后一个行最后的字符替换为";

​ "$"找到最后一个字符;

2.将最后一个字符替换为);,及sql语句的结束语句;这一步和上一步虽然都是在末尾插入,但是要分开,猜测应该是字符转义的原因;

前两步效果:

​ 将,替换为",",因为csv文件中如果为空值,会直接用,隔开,不会区分字段的分割,

​ 将开头换为"(,记得要使用转义字符,不然无法替换

​ 再将开头换为insert语句

​ 最后结果:

二、使用excle替换

这次不用在意文件的格式,因为最后是保存sql语句,利用excle的公式在文档最后一行插入公式,生成需要的sql语句

下面是公式

=CONCATENATE("INSERT INTO `new1_copy`(`DWMC`, `DWDZ`, `ZZJGDM`, `DWDH`, `DWDJ`, `DWXZ`, `XZQY`, `AQZRR`, `DWLX`, `AQZRRSFZ`, `AQZRRDH`, `JZMJ`, `DWZSX`, `GIS_X`, `GIS_Y`, `Deleted`) VALUES ('",A1,"','",B1,"','",C1,"','",D1,"','",E1,"','",F1,"','",G1,"','",H1,"','",I1,"','",J1,"','",K1,"','",L1,"','",M1,"','",N1,"','",O1,"','",P1,"');")

如果数据量很大,下拉很慢,双击公式单元格左下角:

会自动往下生成

posted @ 2019-12-21 17:46  李维维(levi)  阅读(2163)  评论(0编辑  收藏  举报