基于瑞切公司BI系统的需求,以及IBM公司在数据仓库领域的经验,我们提出以下解决方案: 采用一个企业级的数据仓库,实现各分行业务数据的自动采集、清洗、汇总,并且通过多维分析工具,让用户能够有效的将数据转化为灵活的报表和决策支持信息,最终满足用户的信息需求。 该方案的实现方式如下: 首先,在数据主要来源于两个方面:综合业务系统和新录入的数据。综合业务系统中的数据通过数据仓库工具进行自动采集、清洗、整理,而需要新录入的数据则通过浏览器方式录入。 在构造数据仓库的过程中,我们采取以点带面的做法,采用小步长、逐步地建立数据仓库的策略。以瑞切公司报表系统为开端,分阶段地实现商业智能应用。小的项目可以立即显示数据仓库的价值,同时也提供了更快的投资回报。而且,先在只有少量的数据和用户的小系统上进行学习和实践,对技术人员来说会学得更快。我们希望首先在需求较为迫切的领域,选择一些比较有意义的主题;基于这些主题,我们将建立一个数据集市,待用户能够对数据仓库的概念和一些技术有了比较深刻的认识之后,再综观全局,构建起企业级的数据仓库。数据录入可以采用数据文件快速装入的方式,也可以采用专门应用的方式。如果采用后者,我们可以考虑使用IBM的WebSphere和VisualAge for Java进行开发,它们产品是IBM电子商务应用的重要部件。利用这两个工具,我们可以方便地建立Web页面,生成Java程序,包括Applet、Servlet和Application等等。并且系统的维护工作也比较方便,当需要修改应用时,只需要修改服务器上的程序就可以了,不需要在客户端做工作。另外,这种结构对客户机的配置要求也不太高。 在建造数据仓库的过程中,我们推荐使用IBM的Warehouse Manager,该产品是IBM用来建立数据仓库的工具,利用该工具,我们可以方便、快捷地构造起数据仓库来,因为我们应该认识到数据仓库必须建立在一个开放的、可更改的结构上,以便能够处理数据和需求的不断膨胀。Warehouse Manager正是这样的一个工具。提供一个开放的,从数据源到数据仓库的一致的解决方案。 在瑞切公司的 BI系统中,通过Warehouse Manager管理器可以方便地建立数据加工的流程(process)和步骤(step),这些步骤反映了瑞切公司具体业务数据的流程、规则。在各步骤中可以定义代理(agent)来自动运行数据传递、清洗和汇总功能,这些步骤可以按时间、事件运行,或由其它步骤触发。代理可以运行在Warehouse Manager服务器上,也可以运行在远程的业务主机上,并且可以有多个代理运行以提高效率。可以以非常直观的图形化方式管理数据仓库,当报表系统的业务需求发生变化时,可以非常方便地修改步骤,满足变化多端的商业竞争环境。 Warehouse Manager是专门为商业应用设计的,它可以自动在网络上进行数据的传送,不需要人为干预,并且利用它的日志功能可以对系统运行很好地监控。在DB2 Warehouse Manager(DWM)中含有Warehouse Agent部件,它可以用来在位于数据仓库的目标数据库DB2 UDB中执行直接执行数据仓库的数据加工。另外,在数据仓库服务器于业务系统之间的文件数据FTP传输以及从表中抽取少量数据也可以通过Agent直接执行。 建立数据仓库之后,选择一些有意义的主题,抽取相关的数据到DB2 OLAP Server中,利用DB2 OLAP Server的强大分析功能,给最终用户提供在线多维分析的功能,能够让最终用户充分挖掘出数据中包含的信息。 DWM在执行完数据的提取任务后,自动触发预先定义好的OLAP操作,将数据经过汇总计算后加载至DB2 OLAP Server中。
最终用户工具我们选用DB2 OLAP Analyzer,这个产品是一个数据仓库的前端分析工具,利用这个工具用户可以很容易地访问OLAP Server中经过处理的数据,制作各种形式、风格的报表,报表内容可以包括数字、图像、曲线等,使得管理层可以直接、直观地查看企业的经营情况。 文章来自:it33 链接:http:\\www.it33.com
|