Python日常实践(1)——SQL Prompt的Snippets批量整理
引言
个人平时在写sql脚本的时候会使用到SQL Prompt这款插件,除了强大的智能提示和格式化sql语句功能,我还喜欢使用Snippets代码段功能。比如我们可以在查下分析器输入ssf后按Tab键,SQL Prompt就可以帮我们快速的输入SELECT * FROM 。
但是个人不习惯看大写的sql代码,所以就想捣鼓着将代码段输出的代码变成小写。打开代码段管理界面,发现管理工具提供了编辑代码段的功能,但是如果要一个个的编辑,自行转换成小写,再保存,那显然不是咱的风格。可以看到SQL Prompt存放代码段的路径:
找到路径中的文件打开可以看到,代码段文件是一个扩展名为sqlpromptsnippet的xml文件。
所以想着使用python来批量的将代码段文件中的代码转换成小写。
一. xml操作——找到Code节点并获取代码段的sql语句
1. xml格式文件节点类型详细介绍可以参考 W3School教程
2. python中读写xml文件可以使用mxl.dom.minidom模块,查找Code节点代码如下:
import xml.dom.minidom snippet = xml.dom.minidom.parse('ssf.sqlpromptsnippet') root = snippet.documentElement print(root.nodeType,root.nodeName,root.nodeValue) code = snippet.getElementsByTagName('Code')[0] print(code.nodeType,code.nodeName,code.nodeValue)snippet = xml.dom.minidom.parse('ssf.sqlpromptsnippet') :表示打开当前路径中名为'ssf.sqlpromptsnippet'的xml文件,并把xml文件对象赋值给snippet对象。
root = snippet.documentElement :表示获取snippet对象的文档元素(根节点),并把获得的对象给root。
code = snippet.getElementsByTagName('Code')[0] :表示查找root根节点下面所有名为Code的子元素,并将第一个子元素赋值给code对象。
执行结果:
1 CodeSnippets None 1 Code None
因为CodeSnippets和Code节点都不是文本节点,所有其nodeValue属性为None。Code节点为1个 CDATASection节点,其有以下属性:
所以找到Code节点并获取代码段的sql语句的正确语句如下:
import xml.dom.minidom snippet = xml.dom.minidom.parse('ssf.sqlpromptsnippet') root = snippet.documentElement #print(root.nodeType,root.nodeName,root.nodeValue) code = snippet.getElementsByTagName('Code')[0] #print(code.nodeType,code.nodeName,code.nodeValue) statement = code.firstChild.data # code的第1个(也是唯一的)子元素才是CDATASection节点 print (statement)执行结果:
SELECT * FROM
二. sql代码转换操作——大写转小写
1. sql语句大写转小写,可以直接使用str类的lower函数即可:
statementlower = statement.lower() print (statementlower)执行结果:
select * from
2. SQL Prompt中有部分代码段是含有占位符的,占位符的格式为”$CURSOR$”,而且其是区分大小写的,所以占位符不能转换成小写。所以需要先将代码段中个sql语句中的占位符全部找出来,并存储起来,在sql语句转换成小写之后替换回去。
因为占位符都是以“$”开头,也以“$”结尾,所以我们可以很方便的使用正则表达式来查找sql语句中的所有占位符。查找出来之后先将占位符和其小写形式使用dict存储起来。
import xml.dom.minidom import re snippet = xml.dom.minidom.parse('ct.sqlpromptsnippet') root = snippet.documentElement #print(root.nodeType,root.nodeName,root.nodeValue) code = snippet.getElementsByTagName('Code')[0] #print(code.nodeType,code.nodeName,code.nodeValue) statement = code.firstChild.data # code的第1个(也是唯一的)子元素才是CDATASection节点print (statement) print (statement) # 输出原语句 # 正则查找所有的占位符 keylist = re.findall("\$\w+\$",statement) # 将占位符和其小写形式存储成字典 placeholds = dict() for key in keylist: placeholds[key] = key.lower() print(placeholds) # 先将语句转换成小写 statementlower = statement.lower() # 循环占位符字典,替换回占位符 for k,v in placeholds.items(): statementlower = statementlower.replace(v,k) print (statementlower)执行结果:
CREATE TABLE $table_name$ ( $CURSOR$ ) {'$table_name$': '$table_name$', '$CURSOR$': '$cursor$'} create table $table_name$ ( $CURSOR$ )
三. xml操作——将转换代码写回xml文件
xml写操作使用的是writexml文件,具体代码如下:
import xml.dom.minidom import re snippet = xml.dom.minidom.parse('ct.sqlpromptsnippet') root = snippet.documentElement #print(root.nodeType,root.nodeName,root.nodeValue) code = snippet.getElementsByTagName('Code')[0] #print(code.nodeType,code.nodeName,code.nodeValue) statement = code.firstChild.data # code的第1个(也是唯一的)子元素才是CDATASection节点print (statement) keylist = re.findall("\$\w+\$",statement) placeholds = dict() for key in keylist: placeholds[key] = key.lower() statementlower = statement.lower() for k,v in placeholds.items(): statementlower = statementlower.replace(v,k) #更新XML对象 code.firstChild.data = statementlower # 打开文件对象,再写入 f = open('result\ct.sqlpromptsnippet', 'w',encoding = 'utf-8') snippet.writexml(f, addindent='', newl='',encoding='utf-8') f.close()执行结果生成文件对比:
四. 批量操作——循环代码段文件批量处理
1. 循环目录下的文件,使用的是os模块的listdir方法。
>>> import os >>> os.listdir() ['DLLs', 'Doc', 'include', 'Lib', 'libs', 'LICENSE.txt', 'NEWS.txt', 'python.exe', 'python3.dll', 'python35.dll', 'pythonw.exe', 'README.txt', 'Scripts', 'tcl', 'Tools', 'vcruntime140.dll']2. 先将单个转换封装成方法sqllower,再循环读取目录下的代码段文件即可完成批量处理,完整代码如下:
import xml.dom.minidom import re import os def sqllower(name): snippet = xml.dom.minidom.parse(name) root = snippet.documentElement #print(root.nodeType,root.nodeName,root.nodeValue) code = snippet.getElementsByTagName('Code')[0] #print(code.nodeType,code.nodeName,code.nodeValue) statement = code.firstChild.data # code的第1个(也是唯一的)子元素才是CDATASection节点print (statement) #print (statement) keylist = re.findall("\$\w+\$",statement) placeholds = dict() for key in keylist: placeholds[key] = key.lower() #print(placeholds) statementlower = statement.lower() for k,v in placeholds.items(): statementlower = statementlower.replace(v,k) #print (statementlower) #更新XML对象 code.firstChild.data = statementlower f = open('result\\' + name, 'w',encoding = 'utf-8') snippet.writexml(f, addindent='', newl='',encoding='utf-8') f.close() # 循环进行转换 for f in os.listdir(): if f.endswith('.sqlpromptsnippet'): print('正在转换'+ f) sqllower(f) print ('所有转换完成。')
五. 总结
本文从日常使用中提取出sql代码段大小写转换的需求,将其使用Python实现。使用到了如下的模块:
1. xml.dom.minidom模块,用来读写xml文件。
2. re模块,使用了正则表达式,查询所有的占位符。
3. os模块,使用listdir方法来循环目录中个文件。