Python3 ElementTree.tostring()导致标签前辍变为ns0/ns1处理
一、说明
python中我们经常借助xml.etree.ElementTree对xml进行处理,其中ElementTree.fromstring()将字符串格式化成et对象,ElementTree.tostring()将et对象转回字符串。
但ElementTree.tostring()转回字符串时,有可能会出现标签从<config>变为<ns0:config>或<s:config>变为<ns0:config>的情况,尤其在处理soap请求的时候。
二、处理办法
暂时还没搞清楚什么情况会变什么情况不会变,但处理办法就是使用ElementTree.register_namespace()注册命名空间。
直接使用stackoverflow的回答(https://stackoverflow.com/questions/8983041/saving-xml-files-using-elementtree):
从效果上个人理解为:
如果父标签的那堆xmlns中有这些url,那么如果其子孙标签中如果有“ows”这些前辍,要认为这些前辍是合法的不要去改变他们(即不要改成ns0等);第一个‘’表示空前辍。
另外注意两点:
一是那些url并不(一定)是什么存在标准规范的urlET也不会去访问这些url,url就是ET分析xml时当标志使用乱来也是可以的,只要要分析xml和register_namespace的url一致即可。
二是soap也是xml,所以ElementTree处理soap引起标签改变也同这里一样用register_namespace处理即可。
三、效果演示
直接ElementTree.fromstring()-ElementTree.tostring()引起标签自动添回ns0前辍如下:
ElementTree.fromstring()-ElementTree.tostring()前插入ET.register_namespace('', "http://www.ipc.com/ver10"),结果转回正常如下:
参考:
https://stackoverflow.com/questions/8983041/saving-xml-files-using-elementtree