XJL：XML文件处理

来源：百度文库编辑：神马文学网时间：2024/07/07 09:49:58

http://www.blogjava.net/huanzhugege/archive/2007/03/26/106373.html
XML技术是随着Java的发展而发展起来的。在XML出现之前对于简单的数据格式通常是存储在ini配置文件等文本文件中，复杂的格式则采用自定义的文件格式，因此对于每种文件格式都要有专门的解析程序。XML出现以后解决了这个问题，程序面对的是有固定格式的XML文件，只要通过标准API就可以进行XML文件的处理。
XML文件在案例系统中应用是很广泛的，比如ClientConfig.xml、ServerConfig.xml文件就是使用XML文件来做配置文件的，元数据文件以及元数据加载器更是离不开XML。因此本章将系统讲解一下XML文件的处理技术。
1.1   XML处理技术比较
在Java领域XML文件的技术大致分为两类：XML API和OXMapping。XML API是XML处理的基础，可选技术包括JDOM、Dom4j等；OXMapping是Object-XML Mapping的简称，这种技术隐藏了XML底层操作的细节，可以将XML文件映射成一个JavaBean对象，也可以把一个JavaBean对象保存成一个XML文件，可选技术XStream、Digester、Castor等。XML API和OXMapping的关系类似于JDBC和ORMaping的关系，OXMapping内部实现使用XML API来完成，两种实现技术从不同的层面实现了XML的处理。
XML API
此类XML处理技术中最流行的莫过于JDOM和Dom4j了，二者的使用方式非常相似。不过Dom4j的优势比JDOM更明显一些：
Dom4j大量的使用接口，这使得Dom4j比Dom4j更加灵活和具有可扩展性；
Dom4j的性能表现比JDOM好；
Dom4j支持XPath等高级特性；
正是由于这些优点，很多开源项目都开始使用Dom4j做XML解析技术，本书也将使用Dom4j做为XML处理的首选。
OXMapping
使用XML API解析是略显烦琐的，受ORMapping技术的启发，人们发明了OXMapping技术，使用OXMapping技术，我们可以将XML文件映射成一个JavaBean对象，也可以把一个JavaBean对象保存成一个XML文件，这大大简化了我们的开发工作量，使得开发人员能更多的关注应用层面的东西。
开源世界中涌现出很多OXMapping框架，包括XStream、Digester、Castor等。XStream和Digester把映射的过程在代码中完成，而Castor则需要写一个和Hibernate中cfg.xml类似的映射配置文件。与Digester比起来，XStream的主要优点就是更加小巧，使用也更加方便，不过目前使用Digester是“开源名牌”Apache下的子项目，网上可以参考的资料也比XStream多，好在XStream比较简洁，所以并不会对XStream造成太大影响。
http://www.blogjava.net/huanzhugege/
1.2   Dom4j的使用
Dom4j是一个易用的、开源的库，用于XML，XPath和XSLT。它应用于Java平台，采用了Java集合框架并完全支持DOM，SAX和JAXP。Dom4j是sourceforge.net上的一个开源项目，地址为http://sourceforge.net/projects/dom4j。
Dom4j里基于接口编程是一个非常显著的优点，下面是其主要的接口的继承体系结构图：
图5.1
这些接口大部分都是定义在包org.dom4j中，下面简单介绍各个接口的意义：
表5.1 Dom4j主要接口
Node
Node 为是 dom4j 中所有的 XML 节点的基类型接口
Attribute
Attribute 定义了 XML 的属性
Branch
Branch 为能够包含子节点的节点如 XML 元素 (Element) 和文档 (Docuemnts) 定义了一个公共的行为
Document
定义了 XML 文档
Element
Element 定义 XML 元素
DocumentType
DocumentType 定义 XML DOCTYPE 声明
Entity
Entity 定义 XML entity
CharacterData
CharacterData 是一个标识借口，标识基于字符的节点。如 CDATA ， Comment, Text
CDATA
CDATA 定义了 XML CDATA 区域
Comment
Comment 定义了 XML 注释的行为
Text
Text 定义 XML 文本节点
ProcessingInstruction
ProcessingInstruction 定义 XML 处理指令
读取XML文件
在XML应用中，最常用的莫过于XML文件的解析读取了，Dom4j提供了多种读取XML文档的方式，包括Dom树遍历、Visitor方式和XPath方式。
无论哪种方式，我们首先都要根据xml文件构造一个Document对象：
SAXReader reader = new SAXReader();
Document document = reader.read(new File(fileName));
这里我们选用了SAXReader做为XML读取器，我们同样也可以选择DOMReader做为XML读取器：
SAXReader reader = new DOMReader();
Document document = reader.read(new File(fileName));
其中reader的read方法有多个重载方法，可以从InputStream, File, URL等多种不同的源来读取XML文档。
（1）Dom树遍历
这种读取方式中把Dom看成一个普通的树，要读取XML中某个节点的值，只要采用数据结构中的树遍历算法定位到需要读取的节点即可。
要便利Dom树，首先要取得树的根节点：
Element root = document.getRootElement();
取得根节点以后就可以一级一级的向下读了：
// 遍历所有子节点
for ( Iterator i = root.elementIterator(); i.hasNext(); )
{
Element element = (Element) i.next();
// do something
}
// 遍历名称为“foo”的节点
for ( Iterator i = root.elementIterator(“foo”); i.hasNext();)
{
Element foo = (Element) i.next();
// do something
}
// 遍历属性
for ( Iterator i = root.attributeIterator(); i.hasNext(); )
{
Attribute attribute = (Attribute) i.next();
// do something
}
（2）Visitor方式
Dom树遍历是最普通，也是最常用的XML读取方式，其他的XML解析引擎，比如JDom等，也是使用这种方式进行XML的读取。不过Dom4j提供了另外一种读取方式，那就是Visitor方式。这种方式实现了Visitor模式，调用者只要编写一个Visitor就可以了。Visitor模式使得访问者易于增加新的操作，同时使访问者集中相关的操作而分离无关的操作。
编写的Visitor必须实现org.dom4j.Visitor接口，Dom4j还提供了一个Default Adapter模式的默认适配器org.dom4j.VisitorSupport。
public class DemoVisitor extends VisitorSupport
{
public void visit(Element element)
{
System.out.println(element.getName());
}
public void visit(Attribute attr)
{
System.out.println(attr.getName());
}
}
然后在要开始遍历的节点调用此Visitor即可：
root.accept(new DemoVisitor ())
此方式需要遍历所有的节点和元素，因此速度会稍慢一些。
（3）XPath方式
Dom4j最吸引人的特性莫过于对XPath的集成支持了，这个特性并不是所有的XML解析引擎都支持的，但是确实一个非常有用的特性。
XPath 是寻址、搜索和匹配文档的各个部分的语言。它使用路径标记法来指定和匹配文档的各个部分，该标记法与文件系统和 URL 中使用的类似。例如，XPath:/x/y/z 搜索文档的根节点 x，其下存在节点 y，其下存在节点 z。该语句返回与指定路径结构匹配的所有节点。/x/y/* 返回父节点为 x 的 y 节点下的任何节点。/x/y[@name=a] 匹配所有父节点为 x 的 y 节点，其属性称为 name，属性值为 a。
XPath大大简化了XML的寻址操作，使用者只要通过匹配表达式告诉引擎要匹配文档的哪些部分即可，具体的匹配工作由XPath引擎来完成。这种方式更加接近于人类的自然思维方式。我们来看一个实际的例子：
有一个XML文件记录了一个部门的基本情况：

开发部
2

name代表部门名称，level为部门的级别，employeeList下是部门所有的员工列表。下面编写一个程序读取此文件并打印出部门的信息。
代码5.1 XPath演示
InputStream inStream = null;
try
{
inStream = Dom4jDemo01.class.getResourceAsStream(
"/com/cownew/Char0502/Department01.xml");
SAXReader reader = new SAXReader();
Document doc = reader.read(new InputStreamReader(inStream));
Node nameNode = doc.selectSingleNode("//department/name");
System.out.println("部门名称:" + nameNode.getText());
Node levelNode = doc.selectSingleNode("//department/level");
System.out.println("部门级别:" + levelNode.getText());
List employeeNodeList = doc
.selectNodes("//department/employeeList/employee");
System.out.println("部门下属雇员:");
for (int i = 0, n = employeeNodeList.size(); i < n; i++)
{
DefaultElement employeeElement = (DefaultElement) employeeNodeList
.get(i);
String name = employeeElement.attributeValue("name");
String number = employeeElement.attributeValue("number");
System.out.println(name + "，工号:" + number);
}
} finally
{
ResourceUtils.close(inStream);
}
运行结果：
部门名称:开发部
部门级别:2
部门下属雇员:
Tom，工号:001
Jim，工号:002
Lily，工号:003
使用XPath以后，我们只要使用“//department/name”这种非常清晰的方式就可以直接定位到具体的节点。XPath方式中定位单个节点使用selectSingleNode方法，而定位多节点则使用selectNodes方法。
案例系统中所有的XML文件都是使用XPath方式进行解析的，包括ClientConfig.java、ServerConfig.java、EntityMetaDataParser.java等。
XML文件的创建
Dom4j中XML文件的创建和其他的XML引擎类似，首先以Document的根节点为基础构造出一棵节点树，然后调用相应的IO类库就可以将XML文件保存到适当的介质中了。
下面演示一下生成上文提到的那个部门信息XML文件的过程：
代码5.2 XML创建演示
import java.io.FileWriter;
import java.io.IOException;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;
public class Dom4jDemo02
{
public static void main(String[] args)
{
// 创建文档对象
Document document = DocumentHelper.createDocument();
// 添加根节点"department"
Element departElement = document.addElement("department");
// 添加"name"节点
Element departNameElement = DocumentHelper.createElement("name");
departNameElement.setText("开发部");
departElement.add(departNameElement);
// 添加"level"节点
Element departLevelElement = DocumentHelper.createElement("level");
departLevelElement.setText("2");
departElement.add(departLevelElement);
// 添加员工列表"employeeList"节点
Element employeeElementList = DocumentHelper
.createElement("employeeList");
departElement.add(employeeElementList);
// 添加员工节点"employee"
Element emp1Element = DocumentHelper.createElement("employee");
emp1Element.addAttribute("number", "001");
emp1Element.addAttribute("name", "Tom");
employeeElementList.add(emp1Element);
Element emp2Element = DocumentHelper.createElement("employee");
emp2Element.addAttribute("number", "002");
emp2Element.addAttribute("name", "Jim");
employeeElementList.add(emp2Element);
Element emp3Element = DocumentHelper.createElement("employee");
//添加属性
emp3Element.addAttribute("number", "003");
emp3Element.addAttribute("name", "Lily");
employeeElementList.add(emp3Element);
try
{
writeToFile(document, "c:/department.xml");
} catch (IOException e)
{
e.printStackTrace();
}
}
private static void writeToFile(Document document, String file)
throws IOException
{
// 美化格式
OutputFormat format = OutputFormat.createPrettyPrint();
format.setEncoding("GB2312");
XMLWriter writer = null;
try
{
writer = new XMLWriter(new FileWriter(file), format);
writer.write(document);
} finally
{
if (writer != null)
writer.close();
}
}
}
运行以后就可以在c:/下发现生成了和5.2.1的文件内容一样的department.xml了。
这里有两点需要注意的：
（1）OutputFormat format = OutputFormat.createPrettyPrint()
XML通常是需要人阅读的，Dom4j默认的生成格式是紧缩格式的，这样可以减少空间占用，但是带来的缺点就是文件格式非常难看，因此我们采用锁紧格式进行输出。
（2）format.setEncoding("GB2312")
Dom4j默认的编码格式是“UTF-8”，这在输出中文字符的时候会有问题，因此我们改成“GB2312”格式。
这里使用了Dom4j提供的工具类DocumentHelper提供的createElement方法来创建一个节点，这个工具类还有public static CDATA createCDATA(String text)、public static Comment createComment(String text)、public static Entity createEntity(String name, String text) 等方法可以帮助我们更快的创建节点。DocumentHelper还提供了parseText方法，可以直接将字符串解析成Documen对象。
http://www.blogjava.net/huanzhugege/
1.3   XStream的使用
在使用XStream之前首先到http://xstream.codehaus.org下载XStream的最新版本，然后把XSteam***.jar和xpp3-***.jar导入到ClassPath下，然后就可以使用了，当然不加入xpp3-***.jar也可以，我们可以使用DomDriver做为XML解析驱动（只要在实例化XStream的时候使用new XStream(new DomDriver())即可），不过Xpp3为XStream提供的一个很有效率的XML pull-parser实现，推荐使用，可以提高解析的效率。
XML的解析
我们有一个记录书籍进行的XML文件：

J2EE Guide Book

Jerry
Jerry@mail.com

为了解析此XML文件，我们首先创建代表书籍和人员的两个JavaBean。
代码5.3人员和书籍的JavaBean
public class BookInfo
{
private String name;
private PersonInfo author;
public PersonInfo getAuthor()
{
return author;
}
public void setAuthor(PersonInfo author)
{
this.author = author;
}
public String getName()
{
return name;
}
public void setName(String name)
{
this.name = name;
}
}
public class PersonInfo
{
private String name;
private String email;
public String getEmail()
{
return email;
}
public void setEmail(String email)
{
this.email = email;
}
public String getName()
{
return name;
}
public void setName(String name)
{
this.name = name;
}
}
然后我们就可以进行文件的解析了，这也是重头戏：
代码5.4 XStream的XML解析
XStream xstream = new XStream();
xstream.alias("book", BookInfo.class);
xstream.alias("author", PersonInfo.class);
InputStream inStream = XStreamDemo.class
.getResourceAsStream("/com/cownew/Char0503/Books.xml");
InputStreamReader reader = new InputStreamReader(inStream);
BookInfo book = (BookInfo) xstream.fromXML(reader);
StringBuffer sb = new StringBuffer();
sb.append(book.getName()).append("的作者");
sb.append(book.getAuthor().getName()).append("的Email为:");
sb.append(book.getAuthor().getEmail());
System.out.println(sb);
运行结果：
J2EE Guide Book的作者Jerry的Email为:Jerry@mail.com
由于book节点和author节点对应的数据类型是我们的自定义类型，因此我们必须首先向XStream注册这两个类型：
xstream.alias("book", BookInfo.class);
xstream.alias("author", PersonInfo.class);
由于我们是使用XStream解析已有的XML文件，因此我们必须让XStream知道标签对应的类型是什么，如果我们是使用XStream进行XML文件的生成，那么我们甚至无需向XStream注册别名即可进行文件解析。
注册完类型以后，调用XStream类的fromXML方法即可把XML解析成JavaBean对象，无需额外的操作。
XML文件的保存
我们不仅需要解析XML文件，有的时候还需要将数据保存到XML文件，XStream同样能很好的完成，并且能更体现出XStream的强大。
代码5.5 XStream中XML的保存
List bookList = new ArrayList();
PersonInfo p1 = new PersonInfo();
p1.setName("Tom");
p1.setEmail("Tom@mail.com");
PersonInfo p2 = new PersonInfo();
p2.setName("Jerry");
p2.setEmail("Jerry@mail.com");
BookInfo book1 = new BookInfo();
book1.setName("About Face");
book1.setAuthor(p1);
BookInfo book2 = new BookInfo();
book2.setName("UI Design");
book2.setAuthor(p2);
bookList.add(book1);
bookList.add(book2);
XStream xstream = new XStream();
String xml = xstream.toXML(bookList);
System.out.println(xml);
List list = (List) xstream.fromXML(xml);
for(int i=0,n=list.size();i{
BookInfo book = (BookInfo) list.get(i);
StringBuffer sb = new StringBuffer();
sb.append(book.getName()).append("的作者");
sb.append(book.getAuthor().getName()).append("的Email为:");
sb.append(book.getAuthor().getEmail());
System.out.println(sb);
}
运行结果：

About Face

Tom
Tom@mail.com

UI Design

Jerry
Jerry@mail.com

About Face的作者Tom的Email为:Tom@mail.com
UI Design的作者Jerry的Email为:Jerry@mail.com
不可思议吧！我们就是像在序列化一样把JavaBean“序列化”为XML格式字符串，然后又轻松的将XML格式字符串“反序列化”为JavaBean。
不过美中不足的就是“ ”这个标签显得有点罗嗦。解决方式很简单，使用5.3.1一节中提到的alias方法就可以办到：
将xstream.alias("book", BookInfo.class);添加到XStream xstream = new XStream();之后，然后重新运行：

About Face

Tom
Tom@mail.com

UI Design

Jerry
Jerry@mail.com

About Face的作者Tom的Email为:Tom@mail.com
UI Design的作者Jerry的Email为:Jerry@mail.com
posted on 2007-03-26 13:14CowNew开源团队阅读(621)评论(3) 编辑收藏引用

XJL：XML文件处理 XJL：XML文件处理使用JAXP处理XML文件使用 XStream 解析xml文件 ANT-build.xml文件详解 DOM4J解析xml文件001 用JDOM处理XML文档 PHP 操作 XML 文件 - 读取、显示 java解析xml文件四种方式 Spring的applicationContext.xml文件1 ant脚本文件build.xml示例- 使用 MSXML 分析器处理 XML 文档用Digester简化XML文档处理 PDF 文件处理 PDF 文件处理公司文件处理笺【怎样处理删不掉的文件】 JR 精品文章 - 利用jdom实现读取数据库生成XML及读取XML文件插入数据库 XML 文件：XML 架构快速指南－ MSDN Magazine，2002年4月 xml asp取动态表单中数据并写入xml文件将数据库表里的数据直接转为XML文件 ANT-build.xml文件详解 - 爪哇咖啡馆 - BlogJava 使用XML文件来实现对Servlet的配置