[返回]
计算机世界2002年第11期用Java和XML构建分布式系统
Java和XML是当前Web应用中的两种最常见的技术,将两者结合起来,可以开发出功能强大的分布式应用系统。
可扩展标记语言(XML)作为一种简单、中性、易读的数据表示形式已经变得越来越流行,许多软件厂商宣布“支持XML”,意味着他们的产品将能生成或处理XML数据。XML也被看做在企业间交换数据的最佳格式。它允许企业在所交换数据的XML文档类型定义(Document Type Definitions,DTDs)或模式(Schema)上取得一致,这些DTDs或Schema是独立于企业使用的数据库模式的。
本文将讨论在不同计算机之间通信以处理XML数据的分布式系统的构建方法,主要是运行在不同虚拟机上的Java应用之间的XML通信。
XML通信
万维网协会(World Wide Web Consortium, W3C)在XML规范中定义了XML的语法和语义。为了处理XML数据,XML文档必须经过解析。W3C定义了文档对象模型(DOM),它是程序员处理XML数据的接口。DOM已经有包括Java在内的许多语言的实现,Java应用程序可以通过DOM API来访问XML数据。XML解析器将产生XML文档的DOM表示。
图1说明了处理XML文档的Java分布式应用的简单模型。这个模型假设数据可以从诸如关系数据库之类的数据源得到。Java代码处理数据并最终产生DOM表示,这些代码表示为图1中的处理器。
![]()
处理器代码将DOM代表的XML数据传给发送者。发送者是与接收者进行XML数据通信的Java代码。接收者(Java代码)接受XML数据,产生DOM表示的数据,并把它传送给另一个处理器。简而言之,发送者和接收者抽象了DOM表示的XML数据的通信。
发送者和接收者不是在同一个Java虚拟机上执行的,它们是通过分布式系统的构件来相连的。无论是接收者还是发送者都既是客户端又是服务器端,两者的数据传输都是双向的。
XBeans
就像将要看到的一样,在本文中描述的发送者和接收者的三种实现方法都是通过XBeans来实现的。XBeans是一种接收XML数据作为输入,处理这个输入,然后向下一个XBeans输出XML结果的软件构件。XBeans的输入输出都是XML的DOM文档,亦即传送给XBeans的不是需要XML解析器解析的字符串,而是通过W3C的标准DOM API解析成了文档对象。图2说明了一个XBeans的作用。
![]()
XBeans可以是JavaBeans,支持封装、重用、连接和客户化Java代码。通过适当的一些XBeans和JavaBeans的设计工具,我们就能编很少的代码构建非常有用的分布式应用。
实现发送方和接收方
下面将介绍用Java实现发送者和接收者的三种不同的方法,然后对每种方法做一个简单的分析。
1.用标准的Web服务器
这种方法只是简单地将XML作为文本发送给远程计算机上的Web服务器。发送方必须将DOM表示的XML转化为文本来与接收方进行通信,然后,接收方必须将文本还原为DOM表示。
以下代码段用HTTP来实现发送者。这里用到了IBM Java开发包中的DOMWriter类来实现DOM表示到文本XML表示的转换。
public void documentReady(DOMEvent evt)
throws XBeansException {
try {
URL receiver=new URL(getRemoteURL ());
URLConnection receiverConnection =
receiver.openConnection();
receiverConnection.setDoOutput(true);
//向发送者打开一个输出流,然后发送文本形式的XML数据
OutputStream out =receiverConnection
.getOutputStream();
DOMWriter writer=new DOMWriter();
writer.setPrintWriter(new PrintWriter(out));
writer.documentReady( new com.ibm.xml.xpk4j.dom.DOMEvent( this,evt.getDocument()));
out.close(); //为结果打开一个输入流
BufferedReader in = New
BufferedReader( new InputStreamReader(receiverConnection.getInputStream()));
//处理结果:“OK” 表示成功,“Exception”表示输入流串行化异常
......
in.close();
} catch (Throwable e) {
e.printStackTrace(System.err);
}
}
以上的documentReady()方法用remoteURL属性得到服务器上的CGI脚本的URL。为了与HTTP兼容,CGI脚本类用字符串“Content-type: text/html”封装接收者的输出。这个脚本然后调用服务器上的receiverMain()方法。 Main()函数只是简单地实例化接收者,然后调用其receiveDocument()方法。
import org.xbeans.communication.stdio.receiver.*;
public class receiverMain {
static Bean theReceiver = new Bean();
public static void main(String[] args) {
theReceiver.receiveDocument();
}
}
最后receiveDocument()方法的代码段重新生成DOM表示以便进一步处理,这里用到了IBM的XML解析器。
DOMParser parser = new DOMParser();
// 构造解析器
try { // 调用解析器
parser.parse(new InputSource(System.in));
} catch (Throwable e) {
……
}
//将文档传向下一个Bean
DOMListener.documentReady(new DOMEvent(this,parser.getDocument()));
2. 通过Java远程方法调用串行化文档
这个方法通过Java远程方法调用(Java RMI)和DOM串行化(serialization)从发送者向接收者传输XML DOM文档(如图4所示)。
![]()
以下代码用Java远程方法调用实现发送方与接收方的通信。
public void documentReady(DOMEvent evt) throws XBeansException {
if (DOMListener==null) {
try {
DOMListener = (DOMListener)Naming.lookup(getReceiverName());
} catch (Exception e) {
throw new XBeansException( evt.getDocument().getNodeName(), “sender”,“error obtaining remote receiver”, “The name may be wrong or the network may be down.”);
}
}
DOMListener.documentReady(evt); }
以下是接受方的Java远程方法调用的实现,setReceiverName()方法将接收这个调用并传送给RMI注册(registry),documentReady()方法仅仅将接收到的文档传送给下一个组件。
public void setReceiverName(String newName) {
try {
if (receiverName!=null) Naming.unbind(receiverName);
receiverName = newName;
Naming.rebind(receiverName, this );
} catch( Exception e ) {
System.out.println( e );
}
}
public void documentReady(Document incomingDocument)
throws RemoteException, XBeansException {
if (DOMListener==null) {
throw new XBeansException(……);
}
DOMListener.documentReady(new DOMEvent(this,incomingDocument));
}
3. CORBA-IIOP
第三种方法用CORBA-IIOP(CORBA over Internet Inter-ORB Protocol)来传输数据。对象管理组织(OMG)正在建议扩展接口定义语言(IDL)将XML数据类型包括进去。这样,将来CORBA产品将能传输XML数据。
以下的OMG IDL给出了发送者和接收者CORBA实现的接口。
exception RemoteReceiverException {
string remoteIdentifier;
string documentName;
string componentName;
string message;
string moreMessage;
};
typedef sequence<octet> byteArray;
interface XMLReceiver {
void documentReady(in byteArray serializedDocument)
raises(RemoteReceiverException);
};
以下代码用Java串行化DOM,用CORBA实现发送者。
public void documentReady(DOMEvent evt) throws XBeansException {
Document documentToSend=evt.getDocument();
try {
ByteArrayOutputStream bastream = new ByteArrayOutputStream();
ObjectOutputStream p = new ObjectOutputStream(bastream);
p.writeObject(documentToSend);
p.flush();
org.omg.CORBA.ORB orb = org.omg.CORBA.ORB.init( new String[0], System.getProperties());
XMLReceiver receiver = urlToObject(orb,getReceiverURL());
receiver.documentReady(bastream.toByteArray());
} catch (RemoteReceiverException rre) {
……
} catch (Throwable e) {
……
}
}
以下代码用Java串行化DOM,用CORBA实现接收者。
public void documentReady(byte[] serializedDocument)throws RemoteReceiverException {
// 反串行化字节流
ByteArrayInputStream bais = new ByteArrayInputStream(serializedDocument);
Document theDocument;
try {
ObjectInputStream ois = new ObjectInputStream(bais);
theDocument=(Document)ois.readObject();
} catch(Throwable e) {
……
}
try { //将文档传向监听者
local.DOMListener.documentReady(new DOMEvent(this,theDocument));
} catch (XBeansException xbe) {
……
}
}
分析
下表总结了各种方法的优(+)缺(-)点:
测试表明,纯文本表示的XML要比DOM串行化表示性能更好。同时,解析DOM和文本所用的时间也要比用Java直接串行化所用的时间少。
标准的Web服务器方式的优势是其应用基础要广泛许多。CGI脚本能够在绝大多数Web服务器上运行,而且,接收方能够很容易地通过URL标识。而对于RMI,则需要RMI注册。CORBA的解决办法则需要在服务器上安装对象请求代理(Object Request Broker,ORB ),而且CORBA发送者的实现使用的是一个URL的命名模式而不是接收者的CORBA对象引用,它用一个字符串与一个URL相联系,然后在客户端转化。
CORBA和RMI支持Java 客户端到Java服务器的解决方案,没有CGI脚本也不需要从标准输入中读取编码异常,而且不需要在发送者每次用XML通信时都启动一个Java虚拟机,它们两者均支持接收者的自动激活。
Java RMI方式只能在Java代码之间工作,对于Web服务器(包括CORBA)理论上能在任何编程语言之间通信。对于Java串行化的DOM来说,除客户端和服务器端均需要Java代码外,它还存在另外一个困难,即Java串行化要求客户端和服务器端运行的是相同的DOM实现。
结 论
正如上面所述,有许多方法可以实现在Java分布式应用中发送XML数据,每一种方法的性能和互操作性都是不同的。重要的是应该把XML通信从分布式应用逻辑中抽取出来,也就是实现发送和接收XML的代码应从应用逻辑的代码中分离出来。通过把代码打包成软件组件,就能够改变发送方和接收方的代码而不会影响到应用的其余实现。