返回


1997年 .第35期 .技术专题版

技术纵横



企业信息化与数据环境的重建

大连海事大学信息系统工程研究所 高复先

随着国民经济信息化的不断推进,许多企业都把本单位的信息系统建设提到了重要的议事日 程。当前,摆在企业领导和信息系统负责人面前的重要问题是:如何联系国家信息化的宏观任 务来把握企业的信息化建设任务?在诸多任务中,什么是最重要的基础性任务?怎样组织实施 企业信息化建设?

一、企业信息化的重要任务

企业信息化与国家经济信息化有着密切的关系,是国家经济信息化总体任务在企业里的 具体落实。因此,正确、全面地认识企业信息化的任务是十分重要的。

根据近一时期的研究,我们认为企业信息化有以下四项重要任务:

1.建立企业信息基础设施

国家信息化要建立国家信息基础设施(NII),同样,企业(尤其是大企业)的信息化建设也 要搞好信息基础设施,这是大环境和小环境的关系。企业信息基础设施(EII)是指根据企业当 前的业务和可预见的发展对信息采集、处理、存储和流通的要求,选购和构筑由信息设备、 通信网络、数据库和支持软件等组成的环境。这是现代企业有效运作和参与市场竞争的最重 要的企业基础环境。

2.建立信息资源管理标准

信息资源是企业最重要的资源之一,开发信息资源既是企业信息化的出发点,又是企业信 息化的归宿。建立信息资源管理的基础标准,保证标准化、规范化地组织好信息是开发信息 资源的基础工作。

3.开发企业集成信息系统(EIS)

生产型企业重点要搞好生产过程的信息化,建立从设计到制造和经营管理的集成化的信 息系统,即计算机集成制造系统(CIMS)。服务型企业重点要搞好业务处理过程的信息化,既要 开发企业各部门信息共享的内部集成化的信息系统,又要实现企业与业务伙伴或客户间的信 息自动交换。外部互联的有效方法就是电子数据交换(EDI)的应用。实际上,应建立更大范围 的集成化的信息系统。

4.信息化教育

提高全员信息化认识水平,激励全员参与信息资源管理和开发使用集成化的信息系统。

企业领导重视企业信息化建设,主要体现在高层构思、策划组织和把握企业信息化的重 要任务上。企业信息系统负责人和系统分析员,在探讨、选择科学的理论指导和寻求实用的 方法、工具方面,负有重要责任,以保证企业信息化任务的完成。

二、数据环境建设

数据环境建设是企业信息化关键的基本工作。分析企业信息化四项任务的相互关系及实 现难度,很容易发现:企业信息基础设施基本上是花钱买来的,而信息资源的开发利用却是花 钱也无法买到的,至于真正意义上的企业集成信息系统,从来也没有哪一家集成商的"交钥匙 工程"获得过成功。一个时期以来,不少人"重硬轻软"、"重软件轻数据",只重视通信网和计 算机网,不重视信息资源网,这对企业信息化建设来说,都是"见木不见林"。

企业集成信息系统的基础与核心是数据集成,或者说是标准化、规范化的信息资源管理 ,只有在这个基础上才能建立和运行集成化的信息系统。

准确地理解和创建企业共享数据库是一个关键技术问题。例如,某公司最先开发了工资 系统,按职工工资单建立了数据存储。后来又开发了人事系统,按人事档案建立了人事数据存 储。在管理工作中,工资系统要用人事数据,人事系统要用工资数据,这就需要编制至少2个数 据抽取和格式转换接口。随着公司的发展和职工人数的增加,又开发了职业历史跟踪系统,并 购买了工班计划软件包。这样,四个应用系统相互使用数据,就至少需要12个接口。而接口的 数目和复杂性,随着新的应用的增加而按几何级数增加,因此,靠增加接口的办法实现系统集 成是不可能的。

全企业信息系统建设搞总体数据规划的基本目的,就是要对相互有关的应用项目的信息 资源搞好规划和协调。通过这项工作,可以最大限度地提高数据的共享,使数据冗余度降到最 低。上例四个应用中,如果将有关职工的信息组织成共享数据库,四个应用都直接存取共享数 据库,而不是通过接口互用数据,就简单、可靠、高效率地实现了四个应用的集成。

工资单和人事登记表等是管理人员使用的数据格式,我们把它叫作"用户视图"。一般来 说,不能按用户视图的原样子来建立数据库。然而,实际工作中许多应用系统都是这样"建库 "的,这正是许多单位信息系统搞不上去的根本原因。

詹姆斯·马丁(James Martin)在80年代初提出了企业计算机信息系统以数据为中心的原 理,写出了数据集成的理论和方法专著《信息工程与总体数据规划》。"数据中心"原理是指 ,只要企业的性质和目标不变,它的数据类就是稳定的,任何经营管理活动都离不开对这些数 据的存取。信息系统的开发应该面向数据,而不应该面向处理过程,因为处理过程是多变的。 他明确提出"数据环境"(Data Environment)的概念,认为企业的计算机应用有四类数据环境 ,反应了由低级到高级的发展过程。我们说,企业信息系统集成的基础与核心任务是数据集成 ,就是要改造以数据文件和应用数据库为主的、混乱的、低档次的数据环境。企业信息系统 集成的重要标志是达到高档次的数据环境——主题数据库和信息检索系统。

诺兰(Nolan)模型把集成和数据管理分为前后两个阶段,似乎可以先搞集成后搞数据管理 。但后来的大量实践证明这是行不通的。

米歇(Mische)模型对此做了修正,说明了信息系统集成与数据管理不可分,集成阶段的重 要特征就是搞好数据组织,或者说信息系统集成的实质是数据集成。企业信息资源管理(IRM )的技术工作就是数据环境的建设,特别强调以主题数据库为主体的集成化的数据环境的建设 。

三、信息资源管理基础标准

企业数据环境建设实际上包括两个方面的数据集成,其一是企业内部的数据集成,以保证 各部门的信息共享,从而使IRM问题集中在共享数据库的标准化、规范化设计上;其二是企业 与外单位(政府部门、业务伙伴和客户等)的信息自动化交换,特别是远程异地的信息自动化 交换,使IRM问题集中在数据交换标准化、规范化的协调和设计上。这两个方面共同的关键问 题是信息资源管理的基础标准问题。把数据环境建设作为信息资源管理的重要工作来抓,就 是要抓好信息资源管理的基础标准建设。经过借鉴和研究,我们在1992年曾提出信息资源管 理的5个基础标准,经过几年来的推广应用,逐步为一些行业或企业所采纳。

1.数据元素标准

数据元素(Data Elements)是最小的不可再分的信息单位,是数据对象的抽象。

数据元素的定义是指用一简明的短语来描述一个数据元素的意义和用途。该短语的一般 结构是:

修饰词 — 基本词— 类别词

其中类别词和基本词都只有一个,修饰词可以有一个或多个;类别词居后,修饰词和基本 词居前。

数据元素名称是指数据元素的代码,是计算机和管理人员共同使用的标识。数据元素名 称用限定长度的字母字符串表达,可按中文词抽取首音字母,也可按英文取其词首字母或按缩 写规则得出。

数据元素名称和数据元素定义在全系统中要保持一致,要控制同名异义和同义异名的数 据元素。由于数据元素具有"原子"意义,所以,全行业中任一企业的数据元素,不仅数目有统 计规律,而且还有共同的子集。

在采用UN/EDIFACT标准的情况下,数据元素应该尽量上靠国际标准,可建立数据元素名对 照表,例如,缩写字母串数据元素名-四位数字编码数据元标识对照表。

2.信息分类编码标准

信息分类编码(Information Classifying and Coding)对象是一些最重要的数据元素, 它们决定着信息的自动化处理、检索和传输的质量与效率。

应遵照《国家经济信息系统设计与应用标准化规范》和《标准化工作导则——信息分类 编码规定》(GB7026-86),按"国际/国家标准-行业标准-企业标准"序列,建立起全组织的信息 分类编码标准。

首先要确定分类编码对象;然后要制订编码规则,即对每一编码对象要制订码长、分层和 各码位意义的取值规则;最后编制编码表,即每一编码对象按既定的编码规则编制出该编码数 据元素的所有可能的取值表。

在采用UN/EDIFACT标准的情况下,某些代码表应与国际标准的数据元代码一致。为方便 系统内部信息的处理与共享,并满足与系统外的信息交换,可以制订简化编码规则标准与上级 标准的自动换码表。

3.用户视图标准

用户视图(User View)是一组数据元素的抽象,它反映了最终用户的信息需求和对数据实 体的看法,主要包括单证、报表、帐册、屏幕格式等。 规范并简化用户视图是MIS内外信息交换,特别是开发EDI应用系统所必需的,这就需要规 范用户视图的命名、分类编码和组成结构。

用户视图名称是用一短语表达用户视图的意义和用途;用户视图分类编码是标识和分析 处理的根据;用户视图组成是指顺序描述其所含的数据元素,一般格式是:

序号 — 数据元素名称 — 数据元素定义

对于规范化的存储类用户视图应该标出主关键字。

在EDI标准中,格式化报文是一种规范化的用户视图,在采用UN/EDIFACT国际标准时,必须 按其数据元、段、格式化报文来设计标准的业务单证。

4.概念数据库标准

概念数据库(Conceptual Database)是最终用户对数据存储的看法,反映了用户的综合性 信息需求。概念数据库一般用数据库名称及其内容(简单数据或复合数据)的列表来表达。

总体数据规划的重要成果是产生总体数据模型。这种模型首先要做到概念级,即概念数 据库的列表,以便反映用户信息需求的总体观点。规范概念数据库需要较广泛深入的业务域 知识或经验,因此,需要业务行家参与,以便分析、识别、定义出各数据库的标识与名称、主 关键字和数据内容。

5.逻辑数据库标准

逻辑数据库(Logical Database)是系统分析设计人员的观点。在关系数据库模型中,逻 辑数据库是一组规范化的基本表(Base Table)。

把概念数据库演化为逻辑数据库的主要工作是采用数据结构规范化原理与方法,将每个 概念数据库分解成三范式的一组基本表,一个逻辑数据库就是这一组三范式基本表的统一体 。逻辑数据库标准涉及各基本表的命名标识、主码、属性列表及基本表之间的结构关系。

在总体数据规划的过程中建立IRM基础标准。以IRM基础标准为规范,建立全域数据模型 是总体数据规划最重要的成果。

四、经验与教训

新港船厂修船分厂于1992年开始进行集成化修船信息系统建设。他们通过调研和反复讨 论,选择了信息工程方法论作指导,坚持以数据为中心的原理,在业务领导亲自参与下,组织系 统分析人员与业务代表密切合作,用半年时间做总体数据规划,分析稳定的数据类,规划出修 船主题数据库,从而证明了修船信息的内核是修船信息化成功的关键。他们的总体数据规划 工作是在专门的计算机软件工具辅助下进行的,采用了10个步骤,产生了12种标准化文档(计 算机化的机内文档,与通常使用文字编辑、图表软件工具做出的文档有本质的区别)。他们执 行了上述信息资源管理的5个基础标准,建立了较完善的全域数据模型。在总体数据规划的基 础上,采用Oracle数据库管理系统及其4GL工具,总投资不到40万元,在微机网络环境下实现了 全修船厂生产经营的集成化电脑管理。

河北省电力局信息中心主任从1992年开始认真研读信息工程方法论专著,不断结合实际 ,总结MIS开发经验。该中心于1993年末举办了省局MIS开发人员总体数据规划研讨班,培养骨 干人员掌握数据环境建设的理论、方法和工具。他们在时间短、投资少的情况下,以稳定的 数据结构为基础,抓住供用电生产经营中的主干业务,实现计算机化,在关键指标统计自动化 方面有突破性的进展,不仅于1996年顺利通过电力部的MIS实用化验收,而且为省局供用电信 息化上台阶打下了坚实的基础。

我国的一个万人大企业,为追求集成化的全企业MIS建设,在1987年制订了"以数据库为龙 头"的开发策略,要求所有基层单位停止各种应用开发,等待总体组进行为期一年的"数据库设 计"和之后为期一年的"集中开发"成果。由于项目总工程师拒绝信息工程方法论的指导,不懂 得数据分析,而片面强调"以数据库为龙头",结果一年的"数据库设计"搞出了上千个"表"(即 按用户视图"建库",犯忌之一),而且大部分是"接口表"(靠接口实现系统集成,犯忌之二)。第 二年,8个开发组齐头并进式的、在一堆乱"表"上的"集中开发"情景是可想而知的。结果是几 年的光阴和几千万元浪费了,广大用户和开发人员的积极性也挫伤了。

另一个大企业为支持集约化的改革而购买了200万美元的国外应用软件。该公司虽然有 多年应用开发的经验,也确实有一些实用的信息系统,但一直没有进行规范化的信息资源管理 ,不重视数据环境的建设。因此,没有进行外购软件的数据标准化准备工作,并且既没有向供 应商提出定制的数据结构,也没有提出与现有系统必要的数据接口,花大价钱买来软件后才不 得不考虑这些问题,结果搞了一年多也用不上。

有一家因搞系统仿真而出名的开发公司,为一大单位搞集成化的MIS开发。由于不懂得数 据集成的道理,过分看重CASE工具的作用,却低估了研制CASE工具的复杂性和工作量,决定在 短时间内自行研制出一套MIS开发的"自动化工具",再用来快速地开发出该单位用户的MIS,以 便在全行业推广。有了这种错误思路和技术路线,那么,系统的命运又能是什么样呢?

五、结论:不搞好企业的数据环境重建就没有企业信息化

当前,大多数企业(尤其是大企业)信息化建设的基础与核心任务是搞好全企业数据环境 的重建。因此,有以下要求:

(1)学习信息资源管理、信息工程与总体数据规划的有关理论,结合实际,总结经验,

找到科学正确的理论与技术指导。

(2)设立首席信息负责人(CIO)和一批数据管理员(DA),组建工作班子。

(3)正规地进行全企业的总体数据规划,分析现有系统的数据结构,建立信息资源管理

的5个基础标准,结合实际需求,在全域数据模型的控制下进行数据库建设。

(4)采用计算机化的数据字典系统进行数据管理工作,辅助实施数据环境的重建。

企业数据环境的重建和信息资源管理标准化工作是一致的、密不可分的,既是当务之急 ,又是长远之计,企业应有计划、有步骤地完成这一信息化建设的基础与核心工作。