在java中使用dom解析xml
dom是个功能强大的解析工具,适用于小文档
为什么这么说呢?因为它会把整篇xml文档装载进内存中,形成一颗文档对象树
总之听起来怪吓人的,不过使用它来读取点小东西相对Sax而言还是挺方便的
至于它的增删操作等,我是不打算写了,在我看教程的时候我就差点被那代码给丑到吐了
也正因为如此,才有后来那些jdom和dom4j等工具的存在……
不多说,直接上代码
Dom解析示例
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 | import java.io.File; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Document; import org.w3c.dom.Element; import org.w3c.dom.NamedNodeMap; import org.w3c.dom.Node; import org.w3c.dom.NodeList; public class Demo { public static void main(String[] args) throws Exception { //创建解析器工厂实例,并生成解析器 DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance(); DocumentBuilder builder = factory.newDocumentBuilder(); //创建需要解析的文档对象 File f = new File( "books.xml" ); //解析文档,并返回一个Document对象,此时xml文档已加载到内存中 //好吧,让解析来得更猛烈些吧,其余的事就是获取数据了 Document doc = builder.parse(f); //获取文档根元素 //你问我为什么这么做?因为文档对象本身就是树形结构,这里就是树根 //当然,你也可以直接找到元素集合,省略此步骤 Element root = doc.getDocumentElement(); //上面找到了根节点,这里开始获取根节点下的元素集合 NodeList list = root.getElementsByTagName( "book" ); for ( int i = 0 ; i < list.getLength(); i++) { //通过item()方法找到集合中的节点,并向下转型为Element对象 Element n = (Element) list.item(i); //获取对象中的属性map,用for循环提取并打印 NamedNodeMap node = n.getAttributes(); for ( int x = 0 ; x < node.getLength(); x++) { Node nn = node.item(x); System.out.println(nn.getNodeName() + ": " + nn.getNodeValue()); } //打印元素内容,代码很纠结,差不多是个固定格式 System.out.println( "title: " +n.getElementsByTagName( "title" ).item( 0 ).getFirstChild().getNodeValue()); System.out.println( "author: " + n.getElementsByTagName( "author" ).item( 0 ).getFirstChild().getNodeValue()); System.out.println(); } } } |
输出结果:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 【译】Visual Studio 中新的强大生产力特性
· 10年+ .NET Coder 心语 ── 封装的思维:从隐藏、稳定开始理解其本质意义
· 【设计模式】告别冗长if-else语句:使用策略模式优化代码结构