[返回]
计算机世界1999年第41期

基于Documentum组件的
Internet/Intranet 文档管理

张新亮

  在迈向21 世纪的进程中,知识管理尤其是知识共享,将成为商业的迫切要求。发达国家的经济模式已经向知识经济作出实质性的转变,我国的一些大公司、机构也在知识经济方面跃跃欲试。在实现这一目标的过程中,有大量的文档信息需要管理、保存,留待以后查询。在这一领域,美国Documentum 公司的文档管理软件应属佼佼者。

Documentum 能干什么?

  我们工作中用到的一切文件、资料都有不同的来源和存储形式,它们可能是新产生的、存档的或者是外部输入的;其存在的形式可能是电子文件格式或纸张文件;其内容可能是文字、图形或多媒体文件。对这些资料和信息,你需要保存、修改,并且对特定用户保持高可用性,这种" 高可用性" 包括以下方面:

  * 可以方便地按关键字、正文查找;
  * 可以反复使用;
  * 按照需要控制文档的生命周期(例如产生、修改、批准、发布等);
  * 方便的查询访问,例如通过Internet 从全球任何地方进行访问;
  * 用户权限的严格控制。

  我们可以把" 高可用性" 简单地概括为一句话:特定的用户可以方便地访问到有效的资料,特定的资料能送给正确的用户。所有这些任务,Documentum 都可以帮助我们方便地完成。

Documentum 的基本结构

  Documentum 是一家专门提供企业文档Internet 和Intranet 解决方案的公司,Documentum 文档管理软件的主要组件由该公司开发,并且可以集成许多流行的第三方产品,如Microsoft Word、ArborText 的ADEPT Publisher 等。
off051_1.jpg (33512 bytes)
  图1 为Documentum 基本的三层结构图,包括客户端应用层、文档服务器层和支持层。实际上第二层含有两个子层:用于文档管理的Docbase 和用于支持Internet/Intranet 的Rightsite。

  最上一层的用户端产品包括Documentum WorkSpace、Documentum ViewSpace、Documentum SmartSpace 、集成的客户端应用组件(如MS Word、MS Excel 等)、第三方Web 应用程序(如IE 和Netscape 等),用户可以根据不同的需要安装其中的部分组件。例如,如果只需要用Web 方式查看或下载文件,可以只安装第三方Web 应用程序;对于需要全方位交互访问的用户,需要安装WorkSpace,用户可以通过它完成产生、修改、移动、复制、删除文档,以及对同一文档的版本管理、产生和管理虚拟文档、Check in 和Check out 对象、执行复杂的属性关键字或者全文查找、产生和管理工作流、通过Inbox 和Outbox 完成工作流的节点任务等。该软件的客户端产品目前支持Windows、Mac 和Motif 三种平台。
  第二层包括Documentum DocPage Server 和Rightsite。其中DocPage Server 是关键,它是运行在主机上的服务器程序,目前支持包括NT 和Unix 在内的主要操作系统平台。DocPage Server 管理着关系数据库和操作系统文件的存储、查找等操作,同时响应客户端的申请。从用户端看,数据库和操作系统文件完全被屏蔽掉,用户以object 为单位向DocPage Server 提出各种操作申请,系统对object 的访问权限也通过DocPage Server 控制;Rightsite 是运行在HTTP 服务器上的应用程序,其作用是当用户通过浏览器向HTTP 服务器提出申请时,有关文档管理的申请被转到Rightsite 服务器,随后,Rightsite 将申请变成对Docpage 的申请,Docpage 最终把申请变成对关系数据库和操作系统文件的操作,并将结果沿图中箭头方向返回,最终到达Web 用户(图2)。
off051_2.jpg (20284 bytes)
  第三层是操作系统和关系数据库。操作系统可以是NT 和Unix, 它向文档服务器提供运行环境和文件存储服务;关系数据库可以是通用的,目前支持Oracle、Sybase、Informix、Ms SQL 等,可以单独运行在一个物理服务器上,也可以与Docpage 运行在同一台服务器上。

Documentum 的主要特色

  ·类(type)与对象(object)
  在Documentum 系统中,对实体的管理通过类来实现,系统中已经预定义了大约20 个类,这些类涉及用户注册表、目录、路由、程序、系统类和权限控制表等,这些类对于一般的应用来说已经足够。所有的object 在生成时都要确定好所依据的类。当新的object 生成时,系统为其分配一个唯一的内部标识号,并在相关类系表中生成其属性信息,这时你可以编辑它的内容或者属性,并存储到某个目录(目录本身也是object) 中。由于Documentum 采用了type 和object,使用户在开发应用时能很容易地把业务处理实体映射成不同继承关系的类,方便用户的理解和使用。
  ·工作流
  工作流是Documentum 的又一鲜明特色,用户可以用可视化的拖拉方式或编程方式生成工作流。当启动工作流之后,需要处理的对象会沿着既定的路线,从一个工作组(或者人)到另一个工作组(或者人),用户收到和发出任务的传递工作是在Inbox 窗口和Outbox 窗口中通过按钮实现的。工作流的好处是把业务规则和手工文件的传递变成程序控制,文件漫天飞和失去控制的情况可以得到显著改善。
  ·对文档生命周期的控制
  有了工作流,任何一个文档,只要你觉得有必要,都可以让它经历一系列过程,通过不同职责的人完成撰写、修改、审批和定稿等任务;同时系统的版本控制功能可以使你保留修改前的历史版本。
  ·虚拟文档
  虚拟文档是Documentum 系统区别于其他系统的又一特点。虚拟文档由其他文档组成,这些子文档也可以是虚拟文档。当你把一系列对象安装到虚拟文档中之后,便可以把它们作为一个集合来管理,而不必考虑子文档的位置,同时子文档的改变可以反映到最终文档中。
  ·查询语言多样化
  为了方便对系统中文档的操作,Documentum 开发了文档查询语言DQL 和WWW 查询语言WebQL。其中文档查询语言是在ANSI-SQL 标准基础上开发的查询语言,是ANSI SQL 的扩展集。熟悉ANSI-SQL 的用户可以很容易使用,用户通过它可以完成基于类的复杂查询。万维网查询语言可以镶嵌到网页中,使网页得到动态刷新。