JAVA与DOM解析器基础 学习笔记
文件对象模型(Document Object Model,简称DOM),是W3C组织推荐的处理可扩展置标语言的标准编程接口。各种语言可以按照DOM规范给出解析XML文件的解析器。Sun公司发布的JDK1.4的后续版本中提供了解析XML文件的网API(Java API for XML Processing)。关于XML语法请参考这里。为什么没有对java类和实际对象没做详细说明,我已经到代码中写了注释了,到这里就不做过多的说明了。
检测命名空间:TestNameSpace.java
import java.io.File; import java.io.IOException; import javax.xml.parsers.ParserConfigurationException; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; /** * 检查命xml标记的命名空间 * @author licheng * */ public class TestNameSpace { /** * @param args */ public static void main(String[] args) { // TODO Auto-generated method stub SAXParserFactory factory=SAXParserFactory.newInstance(); //语法解析器的工厂对象 factory.setNamespaceAware(true); //允许使用命名空间 try { SAXParser saxParser=factory.newSAXParser(); //获取语法解析器 MyHeader handle=new MyHeader(); //创建输出句柄 saxParser.parse(new File("student.xml"), handle); //开始语法解析 文件放到项目根目录不是WebRoot } catch (Exception e) { //抛出异常 // TODO Auto-generated catch block e.printStackTrace(); } } } /** * 创建输出句柄对象 * @author Administrator * */ class MyHeader extends DefaultHandler{ @Override //覆盖父类的方法 public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { if(uri.length()>0) System.out.println("标记:"+localName+"的命名空间是:"+uri); else System.out.println("标记:"+localName+"没有命名空间"); } }
浏览器中的DOM解析器只检测XML文件是否是规范的,而不能检测XML文件的有效性,此时我们可以使用JAVA提供的DOM解析器来检查一个XML文件的有效性:
TestValidate.java
import java.io.File; import java.io.IOException; import java.util.Scanner; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document; import org.xml.sax.SAXException; import org.xml.sax.SAXParseException; import org.xml.sax.helpers.DefaultHandler; /** * 检查XML文件的有效性 * 浏览器中的XML解析器只检查XML文件是否是规范的,并不检查XML文件是否遵守DTD规定的约束条件。 * 此时就可以使用DOM解析器来检查一个XML文件是否是有效的。 * @author licheng * */ public class TestValidate { public static void main(String[] args) { String fileName=null; Scanner reader=new Scanner(System.in); System.out.print("请输入要验证有效性的XML的文件:"); fileName=reader.nextLine(); //从控制台读取一行数据 DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); //DocumentBuilderFactory工厂对象 获取自身实例 factory.setValidating(true); //设置有效性检测为真 try { DocumentBuilder builer=factory.newDocumentBuilder();//获取DOM解析器 MyHandler handler=new MyHandler(); //创建MyHandler实例 builer.setErrorHandler(handler); // 设置解析器的错误句柄为 MyHandler的实例 Document document=builer.parse(new File(fileName)); //DOM解析器解析 XML文件 if(handler.errorMessage==null){ //判断handler对象是否含有错误信息 System.out.print(fileName+"文件是效的"); }else{ System.out.print(fileName+"文件是无效的"); } } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); } } } /** * 创建输出句柄 * @author Administrator * */ class MyHandler extends DefaultHandler{ String errorMessage=null; /** * 一般性错误 */ public void error(SAXParseException e) throws SAXException { errorMessage=e.getMessage(); System.out.print("一般错误:"+ errorMessage); } /* * * 致命错误 程序终止 */ public void fatalError(SAXParseException e) throws SAXException { errorMessage=e.getMessage(); System.out.print("致命错误:"+ errorMessage); } }
获取XML声明信息,根节点名称,指定节点的信息:JAXPOne.java
import java.io.File; import java.io.IOException; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.xml.sax.SAXException; /** * JAVA DOM解析器入门 * 输出书籍信息 * @author licheng * */ public class JAXPOne { public static void main(String[] args) { // DocumentBuilderFactory对象调用newInstance方法实例化一个DocumentBuilderFactory对象 DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); try { //factory对象调用newDocumentBuilder创建 domParser DOM解析器 DocumentBuilder domParser=factory.newDocumentBuilder(); try { Document document=domParser.parse(new File("student.xml")); String version=document.getXmlVersion(); //获取XML版本号 System.out.println("version:"+version); String encoding=document.getXmlEncoding(); //获取声明编码 System.out.println("encoding:"+encoding); Element root=document.getDocumentElement(); //获取根节点 是先要获取根节点吗 String rootName=root.getNodeName(); //获取节点的名称 System.out.println("rootName:"+rootName); System.out.println(rootName+"类型为:"+root.getNodeType()); //获取节点类型 dom的级别 NodeList nodelist=root.getElementsByTagName("book"); //获取节点列表 int size=nodelist.getLength(); for(int k=0;k<size;k++){ Node node=nodelist.item(k); //获取节点 String name=node.getNodeName(); //节点名称 String content=node.getTextContent(); //获取内容 包含子孙节点中的文本数据 System.out.println(name+":"+content); //System.out.println(name+"节点类型:"+node.getNodeType()); //获取节点类型 dom的级别 } } catch (SAXException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } } catch (ParserConfigurationException e) { // TODO Auto-generated catch block e.printStackTrace(); } } }
使用递归方法输出节点中的数据:JAXPTwo.java
import java.io.File; import java.io.IOException; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.w3c.dom.Text; import org.xml.sax.SAXException; /** * 递归方法输出节点中的数据 * @author licheng * */ public class JAXPTwo { /** *主函数 */ public static void main(String[] args) { DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); try { DocumentBuilder domParser=factory.newDocumentBuilder(); Document document=domParser.parse(new File("bookinfo.xml")); NodeList nodeList=document.getChildNodes(); output(nodeList); } catch (Exception e) { e.printStackTrace(); } } /** * 递归输出节点数据 * @param nodelist 节点列表 */ public static void output(NodeList nodelist){ int size=nodelist.getLength(); //获取接点列表的长度 for(int k=0;k<size;k++){ Node node=nodelist.item(k); //获取节点列表中的一项 if(node.getNodeType()==node.TEXT_NODE){ //节点类型为TEXT Text textNode=(Text)node; String content=textNode.getWholeText(); System.out.print(content); } if(node.getNodeType()==Node.ELEMENT_NODE){ //节点类型为ELEMENT Element elementNode=(Element)node; String name=elementNode.getNodeName(); System.out.print(name); NodeList nodes=elementNode.getChildNodes(); output(nodes); //递归掉用该方法 } } } }
输出Text节点信息,统计一共有多少个Text文本节点:JAXPText.java
import java.io.File; import java.io.IOException; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.w3c.dom.Text; import org.xml.sax.SAXException; /** * 统计一共有多少个Text节点 * @author licheng * */ public class JAXPText { /** *主函数 */ public static void main(String[] args) { GiveData give=new GiveData(); DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); try { DocumentBuilder domParser=factory.newDocumentBuilder(); Document document=domParser.parse(new File("bookinfo.xml")); NodeList nodeList=document.getChildNodes(); give.output(nodeList); System.out.println("一共有"+give.m+"个Text节点"); } catch (Exception e) { e.printStackTrace(); } } } class GiveData{ int m=0; //text的个数 public void output(NodeList nodelist){ int size=nodelist.getLength(); //获取接点列表的长度 for(int k=0;k<size;k++){ Node node=nodelist.item(k); //获取节点列表中的一项 if(node.getNodeType()==node.TEXT_NODE){ //节点类型为TEXT Text textNode=(Text)node; String content=textNode.getWholeText(); m++; System.out.print(content); } if(node.getNodeType()==Node.ELEMENT_NODE){ //节点类型为ELEMENT Element elementNode=(Element)node; String name=elementNode.getNodeName(); System.out.print(name); NodeList nodes=elementNode.getChildNodes(); output(nodes); //递归掉用该方法 } } } }
获取Attr属性节点信息:JAXPAttr.java
import java.io.File; import java.io.IOException; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Attr; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.NamedNodeMap; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.w3c.dom.Text; import org.xml.sax.SAXException; /** * 遍历属性节点信息 * @author licheng * */ public class JAXPAttr { /** *主函数 */ public static void main(String[] args) { GiveData3 give=new GiveData3(); try { DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); factory.setIgnoringElementContentWhitespace(true); //忽略空白缩进 DocumentBuilder domParser=factory.newDocumentBuilder(); Document document=domParser.parse(new File("student.xml")); Element root=document.getDocumentElement(); NodeList nodeList=root.getChildNodes(); give.output(nodeList); } catch (Exception e) { e.printStackTrace(); } } } class GiveData3{ public void output(NodeList nodelist){ int size=nodelist.getLength(); //获取接点列表的长度 for(int k=0;k<size;k++){ Node node=nodelist.item(k); //获取节点列表中的一项 if(node.getNodeType()==node.TEXT_NODE){ //节点类型为TEXT Text textNode=(Text)node; String content=textNode.getWholeText(); System.out.print(content); } if(node.getNodeType()==Node.ELEMENT_NODE){ //节点类型为ELEMENT Element elementNode=(Element)node; String name=elementNode.getNodeName(); System.out.print(name); NamedNodeMap map=elementNode.getAttributes(); //获取属性节点集合 /** * 属性节点操作 */ for(int m=0;m<map.getLength();m++){ Attr attrNode=(Attr)map.item(m); String attrName=attrNode.getName(); //属性名称 String attrValue=attrNode.getValue(); //属性值 System.out.print(" "+attrName+"="+attrValue); } NodeList nodes=elementNode.getChildNodes(); output(nodes); //递归掉用该方法 } } } }
忽略文本空白:JAXPEight.java
import java.io.IOException; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.parsers.ParserConfigurationException; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.NodeList; import org.w3c.dom.Text; import org.xml.sax.SAXException; public class JAXPEight { public static void main(String[] args) { GiveD give=new GiveD(); DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); factory.setIgnoringElementContentWhitespace(true); //这个确实是可行的吗?? try { DocumentBuilder domPaser=factory.newDocumentBuilder(); Document document=domPaser.parse("student.xml"); Element root=document.getDocumentElement(); NodeList nodeList=root.getChildNodes(); give.output(nodeList); } catch (Exception e) { // TODO Auto-generated catch block e.printStackTrace(); } } } class GiveD{ int m=0; public void output(NodeList nodeList){ int size=nodeList.getLength(); for(int k=0;k<size;k++){ Node node=nodeList.item(k); if(node.getNodeType()==Node.TEXT_NODE){ Text textNode=(Text)node; String content=textNode.getWholeText(); m++; System.out.print(content); } if(node.getNodeType()==Node.ELEMENT_NODE){ Element elementNode=(Element)node; String name=elementNode.getNodeName(); System.out.print(" "); NodeList nodes=elementNode.getChildNodes(); output(nodes); } } } }
[使用DOM生成XML文件]此类通过已经存在的文件 获取Document对象 修改DOM后 创建XML文件:JAXPTransformer.java
import java.io.File; import java.io.FileOutputStream; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.transform.Transformer; import javax.xml.transform.TransformerFactory; import javax.xml.transform.dom.DOMSource; import javax.xml.transform.stream.StreamResult; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.NodeList; /** * 通过已经存在的文件 获取Document对象 * 修改DOM后 * DOM创建XML文件 * @author licheng * */ public class JAXPTransformer { public static void main(String[] args) { ModifyNode modify=new ModifyNode(); try { DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); factory.setIgnoringElementContentWhitespace(true); //忽略空白缩进 DocumentBuilder domParser=factory.newDocumentBuilder(); Document document=domParser.parse(new File("mobileNumber.xml")); //通过已经存在的文件创建Document对象 Element root=document.getDocumentElement(); NodeList nodeList=root.getChildNodes(); modify.modifyNode(nodeList, document); //调用修改DOM的方法 TransformerFactory transFactory=TransformerFactory.newInstance(); //工厂对象获取transFactory实例 Transformer transformer=transFactory.newTransformer(); //获取Transformer实例 DOMSource domSource=new DOMSource(document); File file=new File("newXML.xml"); FileOutputStream out=new FileOutputStream(file); StreamResult xmlResult=new StreamResult(out); transformer.transform(domSource, xmlResult); out.close(); } catch (Exception e) { e.printStackTrace(); } } } class ModifyNode{ int m=0; Document document; public void modifyNode(NodeList nodeList,Document document){ this.document=document; int size=nodeList.getLength(); for(int k=0;k<size;k++){ Node node=nodeList.item(k); if(node.getNodeType()==Node.ELEMENT_NODE){ Element elementNode=(Element)node; //这里获取节点 String name=elementNode.getNodeName();//节点名称 if(name.equals("用户")){ //节点判断 m++; Node textN=document.createTextNode("80元"); //创建文本节点 Node elementN=document.createElement("月租费"); //穿件节点 elementN.appendChild(textN); elementNode.appendChild(elementN); } NodeList nodes=elementNode.getChildNodes(); modifyNode(nodes, document); //此处递归 } } } }
[使用DOM生成XML文件]上例中通过已有的XML文件产生一个Document对象,而本例直接 调用 newDocument()方法获取对象。
JAXPTransformer2.java
import java.io.File; import java.io.FileOutputStream; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import javax.xml.transform.Transformer; import javax.xml.transform.TransformerFactory; import javax.xml.transform.dom.DOMSource; import javax.xml.transform.stream.StreamResult; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.Node; import org.w3c.dom.NodeList; /** * domPaser 调用 newDocument() 方法获取Document对象 * 然后为Document节点添加子孙节点 * 使用Transformer生成一个新的XML文件 * @author licheng * */ public class JAXPTransformer2 { public static void main(String[] args) { try { String[] personName={"张三","李四","王五"}; String[] phoneNumber={"123","456","789"}; DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); factory.setIgnoringElementContentWhitespace(true); //忽略空白缩进 DocumentBuilder domParser=factory.newDocumentBuilder(); Document document=domParser.newDocument(); //通过调用newDocument() 方法获取实例 document.setXmlVersion("1.0"); //设置 xml版本号 Element root=document.createElement("手机用户表"); document.appendChild(root); //添加根节点 for(int k=1;k<=personName.length;k++){ Node node=document.createElement("用户"); //添加多个用户节点 root.appendChild(node); } NodeList nodeList=document.getElementsByTagName("用户"); int size=nodeList.getLength(); for(int k=0;k<size;k++){ Node node=nodeList.item(k); if(node.getNodeType()==Node.ELEMENT_NODE){ Element elementNode=(Element)node; //有必要创建此对象吗??? Node nodeName=document.createElement("姓名"); Node nodeNumber=document.createElement("号码"); nodeName.appendChild(document.createTextNode(personName[k])); nodeNumber.appendChild(document.createTextNode(phoneNumber[k])); elementNode.appendChild(nodeName); elementNode.appendChild(nodeNumber); } } TransformerFactory transFactory=TransformerFactory.newInstance(); //工厂对象获取transFactory实例 Transformer transformer=transFactory.newTransformer(); //获取Transformer实例 DOMSource domSource=new DOMSource(document); File file=new File("phone.xml"); FileOutputStream out=new FileOutputStream(file); StreamResult xmlResult=new StreamResult(out); transformer.transform(domSource, xmlResult); out.close(); } catch (Exception e) { e.printStackTrace(); } } }
作者:Li-Cheng
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。