通过DOM操作XML数据

来源:百度文库 编辑:神马文学网 时间:2024/06/03 11:56:11
1、DOM树
所有类型的XML解析器都要求处理对象是“格式良好”的XML文档,有些还能根据DTD或XML Schema进行有效性验证,DOM(Document Object Model)解析器将XML文档一次性解析,生成一个位于内存中的对象树用以描述该文档。
DOM是一种与平台和语言无关的接口,它允许程序和脚本动态访问和修改文档的内容、结构和类型。它定义了一系列的对象和方法对DOM树的节点进行各种随机操作:
● Document对象:作为树的最高节点,Document对象是对整个文档进行操作的入口。
● Element和Attr对象:这些节点对象都是文档某一部分的映射,节点的定级层次恰好反映了文档的结构。
● Text对象:作为Element和Attr对象的子节点,Text对象表达了元素或属性的文本内容。Text节点不再包含任何子节点。
● 集合索引:DOM提供了几种集合索引方式,可以对节点按指定方式进行遍历。索引参数都是从0开始记数的。
DOM树中的所有节点都是从Node对象继承而来的。Node对象定义了一些最基本的属性和方法,利用这些方法可以实现对树的遍历,同时,根据属性还可以得知节点的名称、取值并判断其类型。
利用DOM,开发人员可以动态地创建XML、遍历文档、增加/删除/修改文档内容。DOM提供的API与编程语言无关,所以对一些DOM标准中没有明确定义的接口,不同解析器的实现方法也可能有所差别。为方便描述,本文的举例均采用MSXML DOM方案并用VB Script编写代码。
2、DOM树的结构
Document对象建立之后,就可以与XML文档或数据岛联系在一起。数据岛的加载方法是将数据岛ID赋给Document对象:

Set doc = dsoDetails.XMLDocument
加载文档大体上分为三步:
1.使用CreateObject方法创建分析器实例;
2.设置async属性为False,禁止异步加载,这样当文档加载完毕,控制权才会返回给调用进程,如果想获取文档加载状态,可以读取readyState属性值;
3.使用load方法加载指定文档。
Set doc = CreateObject(“Microsoft.XMLDOM”)
doc.async = False
doc.load “Books.xml”
XML DOM还提供了一种loadXML的方法可以把XML字符串加载到DOM树中,使用时只要把XML字符串直接作为该方法的参数即可。
3、DOM树的访问
在文档加载完毕之后就可以使用documentElement属性访问根元素:
Set rootNode = doc.documentElement
一旦建立了对DOM树中某个节点(例如根节点)的引用,就可以根据节点间的等级关系调用适当的方法进行遍历。
下面以books.xml为例说明各种方法的使用:


The Gourmet Microwave
9.95
Charlotte M. Cooper
Shelley B. Burke
Regina P. Murphy

Sushi, Anyone?
14.99

Straight Talk About Computers 19.99
Lars Peterson

建立对第二个元素的引用:
Set theNode =dsoBooks.XMLDocument.documentElement.childNodes(1)
● 根节点:theNode.ownerDocument返回Document节点,指向XML文档本身;
● 兄弟节点:theNode.previousSibling返回第1个元素,theNode.nextSibling返回第3个元素;
● 父节点:theNode.parentNode返回元素;
● 子节点:theNode.firstChild返回元素,theNode.lastChild返回<price>元素,theNode.childNodes返回子节点集合,包括Sushi下面的所有元素。节点记数从0开始,即theNode.childNodes(0)的结果与theNode.firstChild的结果是一样的。<br>获得节点的引用后,就可以读取节点的相关信息:<br>● 节点类型:theNode.nodeType,本例为1,Document对象类型为9,元素类型为1,属性类型为2;<br>● 节点名称:theNode.nodeName,本例为book;<br>● 节点值:theNode.nodevalue,本例为null,对于Attr节点,返回的是属性值,而对于Element节点,返回的是null。<br>在MSXML中,对Node对象还提供了一些额外的方法和属性:<br>● nodeTypeString:用字符串的方式显示节点类型,如theNode.nodeTypeString的结果是“element”;<br>● text: 显示当前节点及其所有子节点的文本内容;<br>● xml:获取XML文档数据,通常是从根元素开始的所有内容。<br>4、XML格式的动态转换<br>通过学习XSL,我们已经能够使用样式单对XML文档进行转换。但这种过程是静态的,即在编写代码时,已经指定了作用在XML上的XSL文件,在程序运行过程中不能再做改变。而利用DOM,我们能够实现XML格式的动态转换,即在程序运行时,将XSL载入并对XML文档进行转换。<br>把XSL载入DOM对象的步骤基本上与XML文档的载入过程是一样的(XSL本身就是XML文档):<br>Set stylesheet = CreateObject(“Microsoft.XMLDOM”)<br>stylesheet.async = False<br>stylesheet.load “TransformDetails.xsl”<br>DOM提供了两个函数进行这种转换,作用对象可以是树中任何节点。这样就可以实现对DOM树的任意的部分进行格式转换。<br>● transformNodeToObject方法:该方法需要两个参数,第一个参数指向XSL文件,第二个参数存放转换后的XML数据的节点。例如:<br>Set targetNode = CreateObject(“Microsoft.XMLDOM”)<br>srcNode.transformNodeToObject stylesheet, targetNode<br>● transformNode方法:该方法只需要一个参数指明XSL文件。如下例是将源节点转换为一个字符串变量str:<br>str = srcNode.transformNode(stylesheet)<br>上面介绍的方法在服务器上一样可以实现,而且更具实际意义:服务器可以根据客户端的不同身份,使用不同的样式单进行转换,同一份XML文档呈现在不同用户面前的形式是不一样的!<br>1、DOM解析时的错误<br>DOM在解析XML文档的时候可能会产生各式各样的错误,可以根据ParseError对象中的属性得知出错的可能原因及相关信息。<br>常用的属性及其含义如下表所示:<br>属性 说明<br>errorCode 错误代码<br>filepos 错误在文档中的绝对字符位置<br>line 错误所在行的行号<br>linepos 错误所在行的字符位置<br>reason 错误产生原因<br>srcText 错误所在行的源代码<br>url 最近一份含有解析错误的XML文档的URL地址<br><br>2、访问DOM树中的元素与属性<br>DOM还提供了许多查找节点的方法。其中基于搜索机制的方法有:<br>● 根据标签名称搜索元素;<br>● 使用XSL模式搜索节点;<br>● 利用集合索引搜索节点。<br>以books.xml为例,Document对象中的getElementsByTagName方法就是根据参数中的标签名称在全文范围内查找元素的,返回值是一个NodeList对象:<br>Set doc = dsoDetails.XMLDocument<br>Set authors = doc.getElementsByTagName(“author”)<br>上述查询结果中包含了文档中出现的全部4位作者。如果调用的是Element对象中的getElementsByTagName方法,除了搜索范围缩小为该元素的所有后继节点之外,其他的情况都是一样的。<br>所有类型的节点都带有selectNodes方法,该方法的唯一参数是XSL的模式规则,返回值是匹配该规则的结果集合。调用这个方法可以利用XSL的模式匹配策略查找节点。例如:<br>Set rootNode = doc.documentElement<br>Set cheapbooks = rootNode.selectNodes(“//book[price < 10]”)<br>这个例子返回所有售价低于10元的<book>元素。另外,节点中的selectSingleNodes方法的用法与selectNodes是一样的,只是返回结果为查找到的满足条件的第一个节点而已。<br>对于元素节点,获取元素标签名称的方法有两种:anyElement.nodeName和anyElement.tagName。前者是Node对象的属性,后者是Element对象的属性。<br>如果想获取元素中的文本内容,如: <price>9.95<br></price>时,访问Element对象中的nodevalue属性是错误的,这时返回结果是null,而不是预期的9.95。含有文本内容的元素都包含一个Text类型的子节点,所以只有通过Text对象中的nodevalue属性才能真正访问到文本内容。<br>添加元素的步骤如下:<br>● 创建一个Text节点并赋值;<br>● 创建Element节点;<br>● 把Text节点挂在Element节点下,作为它的子节点;<br>● 把Element节点插入到XML文档的合适位置上。<br>对于元素节点的删除和替换操作,首先都要对操作对象进行定位,然后相应地执行对象节点所属父节点的removeChild方法和replaceChild方法即可。<br>Attr节点的各种操作在原理上与Element节点相同。Attr对象同样继承了Node对象中的各种方法和属性,并且MSXML中还提供了name属性和value属性,能够更直接地访问到属性信息。另外,还可以通过属性所属元素的相关方法访问属性,如通过getAttribute和setAttribute方法读取属性值或修改属性值,或者用getAttributeNode方法直接返回Attr对象。<br>创建新属性最直接的办法就是使用Element对象中的setAttribute方法。也可以先用Document对象中的createAttribute方法设置属性值,然后使用Element对象中的setAttributeNode方法把新节点添加到DOM树中。同样地,删除属性最直接的方法是调用Element中的removeAttribute方法。另外一种方案是先用getAttributeNode方法对操作对象进行定位,然后执行removeAttributeNode操作。<br>从以上的介绍中可以看出,由于节点间的继承关系,以及各种类型节点本身提供的丰富的接口,用户可以很容易地找到一套适合自己需要的对象操作方案。<br><br>3、DOM的显示功能<br>DOM技术还可以用来显示XML数据。XSL样式单面向的是XML文档的转换,用于显示格式的转换是其应用的一个方面,所以在显示功能上还存在着一些不足:<br>● 不易完成对XML数据的复杂处理,如将英文字母全部转换为大写,截取指定长度的字符串,忽略一些特定的标点等;<br>● 不易对XML数据中的数值进行计算;<br>● 一个XSL通常是静态地作用到一个XML文档上,无法将多个XML文档中的数据用一个XSL合并转换为一个输出结果。<br>使用DOM就能够很好地解决上述问题,而且编写的脚本在服务器端和客户端都能够执行。在客户端可以根据情况创建友好的用户界面与用户进行交互,在服务器端使用脚本利用DOM可以按客户端的需求将数据进行组织并且发送。<br>下面的这个例子就是把XML文档转换成HTML中的表格:<br>Dim outstr<br>outstr = “<TABLE BORDER=1>”<br>Set listOrderitem = doc.selectNodes(“//orderitem”)<br>For Each node In listOrderitem<br>outstr = outstr & “<TR>” & _<br>“<TD>” & node.getAttribute(“title”) & _<br>“</TD>” & _<br>“<TD>” & node.getAttribute(“isbn”) & _<br>“</TD></TR>”<br>Next<br>outstr = outstr & “</TABLE>”<br>下面的这个例子则是对XML数据进行数值运算,计算书本的平均售价:<br>totalPrice = 0<br>Set listPrice = doc.selectNodes(“//price”)<br>For Each node In listPrice<br>totalPrice = totalPrice + node.firstChild.nodevalue<br>Next<br>avgPrice = totalPrice / listPrice.length<br>最后的这个例子显示了DOM 把多个XML文档合并转换显示的强大功能:<br><XML ID=“dsoOrders” src="/blog/“Orders.xml"”></XML><br><XML ID=“dsoCustomers” src="/blog/“Customers.xml"”></XML><br>Set docOrders = dsoOrders.XMLDocument<br>Set docCustomers = dsoCustomers.XMLDocument<br>outstr = “<P>Number of order items: ” & _<br>docOrders.selectNodes(“//orderitem”).length & _<br>“<P>Number of customers: ” & _<br>docCustomers.selectNodes(“//customer”).length</div> <div class="list-group"> <a href="/article/29446" class="list-group-item">通过DOM操作XML数据</a> <a href="/article/162339" class="list-group-item">Java的XML文件操作之DOM入门篇</a> <a href="/article/721624" class="list-group-item">Java的XML文件操作之DOM入门篇</a> <a href="/article/257330" class="list-group-item">Firefox中的XML DOM</a> <a href="/article/1695352" class="list-group-item">四种操作xml的方式: SAX, DOM, JDOM , DOM4J的比较 - J2EE社...</a> <a href="/article/1958260" class="list-group-item">四种操作xml的方式: SAX, DOM, JDOM , DOM4J的比较</a> <a href="/article/472446" class="list-group-item">JavaScript 操作 DOM</a> <a href="/article/874690" class="list-group-item">jQuery DOM操作</a> <a href="/article/4838" class="list-group-item">XML认证教程,第 9 部分:DOM</a> <a href="/article/55947" class="list-group-item">用PHP读取和编写XML DOM</a> <a href="/article/9315" class="list-group-item">通过xalan实现关系型数据库到XML的数据交换</a> <a href="/article/383557" class="list-group-item">Java下XML编程接口比较:DOM SAX JDOM JAXP</a> <a href="/article/1509110" class="list-group-item">Java将DOM文档和XML文件互相转换</a> <a href="/article/12097" class="list-group-item">Java 中的 XML: 数据绑定</a> <a href="/article/67206" class="list-group-item">XML - 报表数据的新大陆</a> <a href="/article/261411" class="list-group-item">XML 数据绑定框架 JiBX</a> <a href="/article/1314771" class="list-group-item">XML - 报表数据的新大陆</a> <a href="/article/1828748" class="list-group-item">XML 数据绑定框架 JiBX</a> <a href="/article/160144" class="list-group-item">C#操作XML简要教程</a> <a href="/article/1211574" class="list-group-item">C#操作XML简要教程</a> <a href="/article/766342" class="list-group-item">XML解析 DOM(文档对象模型)与 SAX(XML简易应用应用程序编程接口)_VICTO...</a> <a href="/article/67559" class="list-group-item">使用XML的DOM和XPath来创建多项选择题的在线测试</a> <a href="/article/304179" class="list-group-item">在VC6中使用MSXML 4.0 DOM处理XML文档(1) - MSXML - 技术应用...</a> <a href="/article/144027" class="list-group-item">XML 观察: 准备好数据,去旅行</a> </div> </div> </div> </div> </div> </div> <footer id="footer" class="footer hidden-print"> <div class="container"> <div class="panel panel-default"> <div class="panel-heading">相关问题</div> <div class="panel-body"> <a class="btn btn-default" href="/article/2646492" title="惬意的宁静--花鸟虫草精彩摄影">惬意的宁静--花鸟虫草精彩摄影</a> <a class="btn btn-default" href="/article/2646493" title="龙擎苑社区社会治安综合治理工作总结">龙擎苑社区社会治安综合治理工作总结</a> <a class="btn btn-default" href="/article/2646494" title="保证一天不困的25个小要领">保证一天不困的25个小要领</a> <a class="btn btn-default" href="/article/2646495" title="饵的轻重对浮标的影响,经典收藏,鱼乐无限 快乐无限">饵的轻重对浮标的影响,经典收藏,鱼乐无限 快乐无限</a> <a class="btn btn-default" href="/article/2646496" title="腰椎间盘突出症的自我保健疗法(绿色养生)">腰椎间盘突出症的自我保健疗法(绿色养生)</a> <a class="btn btn-default" href="/article/2646497" title="“进京自首”,只因“北京警察才可靠”?">“进京自首”,只因“北京警察才可靠”?</a> <a class="btn btn-default" href="/article/2646498" title="女性多吃大枣山药粥暖胃">女性多吃大枣山药粥暖胃</a> <a class="btn btn-default" href="/article/2646499" title="揭秘部分央企领导职务消费:日均挥霍4万 1次舞会上百万">揭秘部分央企领导职务消费:日均挥霍4万 1次舞会上百万</a> <a class="btn btn-default" href="/article/2646500" title="水中快走跳街舞等12种简单运动有效燃烧脂肪">水中快走跳街舞等12种简单运动有效燃烧脂肪</a> <a class="btn btn-default" href="/article/2646501" title="超模巴尔-莱法利性感内衣秀【美女组图】系列7">超模巴尔-莱法利性感内衣秀【美女组图】系列7</a> <a class="btn btn-default" href="/article/2646502" title="资中筠:我怕年轻人不知道当代史-中国选举与治理网">资中筠:我怕年轻人不知道当代史-中国选举与治理网</a> <a class="btn btn-default" href="/article/2646503" title="应该立即停止对国有大中型企业的绞杀 【凯迪社区 】经济风云">应该立即停止对国有大中型企业的绞杀 【凯迪社区 】经济风云</a> <a class="btn btn-default" href="/article/2646504" title="赚钱的七大定律!!!生活百科 阅读614 评论4">赚钱的七大定律!!!生活百科 阅读614 评论4</a> <a class="btn btn-default" href="/article/2646505" title="做爱自己的女人">做爱自己的女人</a> <a class="btn btn-default" href="/article/2646506" title="玫瑰花">玫瑰花</a> <a class="btn btn-default" href="/article/2646507" title="引用 [曾孝濂绘]云南百花图(五) - 森林绿色一片天的日志 - 网易博客">引用 [曾孝濂绘]云南百花图(五) - 森林绿色一片天的日志 - 网易博客</a> <a class="btn btn-default" href="/article/2646508" title="弱水三千,只取一瓢">弱水三千,只取一瓢</a> <a class="btn btn-default" href="/article/2646509" title="开眼界了,西瓜竟然可以切成这样子!">开眼界了,西瓜竟然可以切成这样子!</a> <a class="btn btn-default" href="/article/2646510" title="图:毛泽东延安时期的绯闻女翻译吴莉莉">图:毛泽东延安时期的绯闻女翻译吴莉莉</a> <a class="btn btn-default" href="/article/2646511" title="转贴:【转】男女科处方药">转贴:【转】男女科处方药</a> <a class="btn btn-default" href="/article/2646512" title="蒋纬国到底是谁的儿子?">蒋纬国到底是谁的儿子?</a> <a class="btn btn-default" href="/article/2646513" title="老龄化是否意味“人口红利”枯竭">老龄化是否意味“人口红利”枯竭</a> <a class="btn btn-default" href="/article/2646514" title="武汉中澳整形医院(严重)出现医疗事故">武汉中澳整形医院(严重)出现医疗事故</a> <a class="btn btn-default" href="/article/2646515" title="罪恶——从豆蝈蝈灭绝说起">罪恶——从豆蝈蝈灭绝说起</a> <a class="btn btn-default" href="/article/2646516" title="谁造成了梁启超的英年早逝">谁造成了梁启超的英年早逝</a> <a class="btn btn-default" href="/article/2646517" title="年线恶斗历史回顾:前8回合多方3胜5负">年线恶斗历史回顾:前8回合多方3胜5负</a> <a class="btn btn-default" href="/article/2646518" title="中国古史上八大乱伦帝王">中国古史上八大乱伦帝王</a> <a class="btn btn-default" href="/article/2646519" title="揭秘部分央企领导职务消费:日均挥霍4万 1次舞会上百万">揭秘部分央企领导职务消费:日均挥霍4万 1次舞会上百万</a> <a class="btn btn-default" href="/article/2646520" title="童话故事神笔马良遭盗版篡改 用笔画汽车谈恋爱">童话故事神笔马良遭盗版篡改 用笔画汽车谈恋爱</a> <a class="btn btn-default" href="/article/2646521" title="句句戳中要害-----张爱玲语录【转载】">句句戳中要害-----张爱玲语录【转载】</a> <a class="btn btn-default" href="/article/2646522" title="蒋介石三气刺儿头史迪威">蒋介石三气刺儿头史迪威</a> </div> </div></div> <div class="copy-right"> <p>神马文学网,客观、专业、权威的知识性互动百科全书。</p></div> </footer> </body> </html>