Fork me on GitHub

AWK批量处理SQL语句

需求

更新表的某个字段,DBA要求一条SQL语句不能超过5000行,且必须主键更新(行锁),且更新完后需要sleep 3秒;
以前处理这种数据的时候,都是用excel,但是excel处理大量数据的时候可能就会崩溃。。。而且对于某些特定行的处理不是很方便(其实是我菜,不会excel),为了更好的处理数据,

脚本

查阅shell资料,憋出了如下awk脚本,命名为awk_data.awk文件,

BEGIN{
	printf "update table set is_ok=1 where table_id in (\n"
}

{
	if(NR%100 == 0)
		printf $1");\n select sleep(3);\n update table set is_ok=1 where table_id in (\n"
	else
		printf $1",\n"
}

END{
	printf ");"
}

终端中输入

awk -f awk_data.awk data > temp

得到如下结果

update table set is_ok=1 where table_id in (
    1,
    2,
    ......
    100);
     select sleep(3);
    ......
    ......
    199999,);

bug

可以看到,最后一行多出了一个逗号,会导致SQL语法错误。其实解决办法有多种。

fix bug

第一种就是判断行号是否是最后一行,如果是最后一行,无需加逗号输出。这种办法很笨,因为AWK不是很好获取最后一行。换一种思路,我们可以将上一行的逗号放到下一行开头输出,这样我们只要判断第一行行首,无需加逗号就行了
第二种就是手动删除最后的逗号,让语法正确,我是不是很机智。。。
第三种是在最后END的代码块里一行加一个不存在的主键ID,即

END{
	printf "-1);"
}
posted @ 2019-04-15 15:07  gitmoji  阅读(675)  评论(0编辑  收藏  举报