[返回]
中国计算机用户2000年第25期

让数据成为企业的“军师”
大连农行数据仓库建设探索

乔 琳 曹 军

  信息是企业的最大财富之一,要占据市场优势,必须根据客观事实进行业务决策并实施明智独到的业务战略,而这一切,离不开对海量级业务数据的挖掘和有效利用。大连农行从1999年8月开始,在全面实现所有营业网点联网和各项业务系统实时处理、数据大集中的基础上,积极迈出了建设数据仓库系统的步伐,创造了良好的效益也取得了一定的经验。


  需求推动应用


  随着大连农行各项业务电子化建设的逐步完善,积累了大量的经营、管理数据。信息是企业的最大财富之一,是进行业务决策并实施经营战略的关键,而这些有用的信息分散在各种不同类型的数据库中。各业务部门出于管理需要,需要向基层要数据做分析报表,这些数据来源既缺乏科学性管理又大量重复,造成劳动力的极大浪费,也难以满足高层管理人员对数据即时、全面、准确的需求。因此,必须利用数据仓库技术将业务数据转化为分析信息,为决策管理人员提供准确的市场视觉和方向。


  细搭系统


  现代企业需要针对日常操作和针对决策支持的应用程序优化过的数据,这是两类性质完全不同的数据,需要不同的数据环境支持。作为一个系统,数据仓库应该包括数据获取、数据存储和管理、信息访问3个基本的部分,其中:

  ◆ 数据获取:负责从外部数据源获取数据,区分有用的数据,进行拷贝或重新定义格式后,装入数据仓库。

  ◆ 数据存储和管理:负责数据仓库的内部维护和管理,提供的服务包括数据存储的组织、数据的维护、数据分析模型的建立、数据仓库的例行维护等。

  ◆ 信息访问:信息访问部分属于数据仓库的前端,面向不同种类的最终用户,主要由查询生成工具、多维分析工具和数据挖掘工具等工具集组成,以实现决策支持系统的各种要求。

  数据仓库应用是一个典型的C/S结构,服务器端完成系统清洗、转换、建模、计算等各类综合功能;客户端完成交互或格式化查询及定制报表等功能。现在最流行的是三层结构,即在客户和服务器之间增加一个在线分析服务器,它能加强和规范支持服务工作,集成和简化原客户端和数据仓库服务器的部分工作,降低系统数据传输量,因此工作效率更高。我行采用的就是这种模式。


  制定规则


  在数据仓库系统的建设中,大连农行遵循了以下原则:

  1、分阶段、循序渐进的原则

  数据仓库的建设是一个漫长的过程,但这个过程是可切分的,即可以将数据仓库的建设分成一个个小步骤来实现它,分步实施、由简入繁,边建设、边应用、边见效,以应用促发展,逐步提高决策管理人员的认识程度,然后分步实施更复杂的开发主题,这样既能减少投资,又可以达到事半功倍的效果。

  2、实用性原则

  在国内银行业对数据仓库建设缺乏成功经验的情况下,应尽量针对当前银行最关心的主题,从数据比较规整的业务子系统入手,并进行细致分析,尽可能用简单、统一、易于使用的方式来实现,避免追求片面的复杂和完美。

  3、知识原则

  在设计、开发、实施过程中结合专家培训和服务,逐步培养出自己的系统管理、维护和开发人员。当系统投入使用时,这些人员可以对系统进行维护和管理,并负责对最终用户进行培训。


  实施步骤


  1. 制订长远规划

  大连农行数据仓库的数据来源于大型机的业务数据,包括全市的储蓄、对公、信用卡等基础数据;信贷综合管理系统、国际业务系统、人事管理系统、保卫系统、监察系统等经营管理业务数据库;动态采集的文本等三大类。尽管目前已有的各项业务系统或多或少有一些分析功能,但在数据挖掘、预警预测等方面还缺乏有效的手段。所以我们希望做到今后各项业务系统只承担数据采集的任务,所有的分析工作都由数据仓库完成,既有单项业务的分析,也有综合业务的分析,统一分析口径,统一报表风格。

  2.细致分析需求

  本着“统一规划、分步实施、实用性”原则,大连农行选择以统计分析项目为基础的、涵盖统计、会计、计划等多种业务报表的系统作为第一期的开发主题,由技术人员同业务人员一起对需求进行详细的分析,从而对数据源的取向心中有数。

  3.设计分析模型

  在数据仓库建设过程中,设计数据仓库的体系结构是一个关键环节。

  4.网上信息发布

  客户只需要打开浏览器就可以进行动态查询,并且还可以自己设计报表。


  理顺关系,事半功倍


  1、组织管理

  数据仓库的建设涉及到很多部门和单位,以及现行工作方式的变革,因此组织管理问题是关键,特别需要领导的关心和与各部门的协调。建设数据仓库是一项投资大、周期长、见效慢的系统工程,如果得不到领导在行政上、尤其是财政上的支持,项目的顺利实施是很难想象的。但是也不能求胜心切,做出与事实不符的承诺,只有让领导在一开始就对可能出现的困难有较好的思想准备,才有可能对项目有自始至终的大力支持。另外,各项电子化业务的规范操作也是数据仓库建设好的前提,因为数据仓库的数据来自各项业务系统,如果操作不规范,数据不完整,最后的分析结果将带给管理决策人员误导。解决问题的办法是与业务部门共同加强管理和监视,甚至可以制定一些处罚办法。我们的做法是:如果某个营业所的业务没有规范完成,则在信息网上通报批评。数据仓库系统肯定会给银行带来工作方式的变革,甚至影响到一些人的切身利益,在这方面也需要做大量细致的工作。

  2、设计思路

  数据仓库的设计思路有两个方向,一个是从数据提需求;另一个是从需求找数据。所谓从数据提需求,就是通过已有业务系统所提供的数据,分析从这些数据能抽取出哪些对决策有用的信息。而从需求找数据,则是针对用户的应用需求,考虑从那些业务系统中抽取以及怎样抽取。数据仓库的先驱者——凯瑟琳曾经有一个比较精辟的比喻:一个成功的数据仓库就像是一只鸭子。它的两掌可能在水下费劲的划着水,但在外人看来它却似乎正悠闲地在水面上游弋。可见,数据仓库系统应该是:无论我们付出多少努力,提供给管理者的都应该尽量完美。因此,比较两种设计思路,显然后者更符合我们的理想。这种做法,可能与以往系统的设计思路有所不同。

  3、需求问题

  数据仓库系统的最终用户是企业的中上层领导或其辅助人员,这就与业务系统直接面对具体的操作人员有明显的不同。需求制定阶段要特别注意的一个问题是不要让过多的用户参与到项目的需求制定中来。在这方面我们曾经走过弯路:开始我们认为,在做需求时接触的用户越多越广泛,那么最终的系统功能就越强大,而我们系统的最终目标,当然也是让每一位使用者满意。但是与太多的用户进行交流,他们提出的不同的、复杂的甚至有些冲突的需求让我们无所适从。最后,还是定位在面向经营分析的统计系统。还有一个问题是需求分析的持续性。我们做数据仓库,业务部门的参与和建议,要贯穿项目的整个过程,这是项目取得成功必不可少的一个方面。

  4、长远打算

  建设数据仓库系统要“统一规划、分步实施”。为了避免项目开发中断或延迟,需要做好几个方面工作:第一、要保持技术人员的稳定性,并且要明确分工,系统分析员负责沟通需求和分析设计;开发人员负责具体的开发工作,操作员负责疑难解答和技术支持。这样就可以应用一期,开发二期,设计三期,以保证系统开发的持续性。第二、要保证物力、财力投入的持续性,各级领导都要充分认识数据仓库建设的长期性和艰巨性,在重视程度上不能前紧后松。第三,要注重数据的积累,经营管理信息是银行的财富,有些肯定有价值的数据可能暂时还用不到,但是最好把它抽取到数据仓库中,因为数据的积累对将来的挖掘分析和预测分析都将非常有利。


  成效显著,再接再厉


  目前,大连农行的统计分析表已全部通过数据仓库系统从业务数据库中直接提取数据,从源数据的提取到最终报表的形成全部由自动引擎完成,基本不需要人力操作。这样做一方面增强了数据的可靠性,真正做到了“下情上达”。另一方面大大减少了基层行在人力、物力上的投入,降低了统计工作的劳动强度,提高了统计信息的实效性。一定程度上提高了经营理念。此外,数据仓库具有较好的灵活性和易维护性,客户端不需要安装任何软件,又减轻了维护工作量,同时还支持远程访问。不再需要配备专门的报表人员,为机构精简打下基础。

  大连农行数据仓库第一期的开发工作一方面在技术人员的培养上奠定了基础,另一方面也引起了管理决策人员的兴趣和关注。目前,我们已经开始了第二个阶段的开发,即面向不同业务部门的需求建立不同的主题,业务部门关心的指标有两方面:一是与其业务相关的客户情况,二是基层工作人员的业务量。将主要完成信贷业务处、信用卡部、业务拓展处在内的所有业务部门的信息查询分析要求。下一步还要对客户进行预警分析,及时发现各种违规操作和潜在危险;对客户进行预测分析,从而确定市场动向和银行的发展方向。

  我们相信:随着数据仓库系统建设的逐步深入,必会给我行的管理模式和经营理念带来很大的转变,对机构人员的精简、劳动效率的提高也会起到很好的作用。