快捷搜索:

数据仓库解决方案指南

作者:Sybase软件(北京)有限公司 市场部副总监 夏红

内容:数据仓库观点,Sybase的数据仓库办理规划

--------------------------------------------------------------------------------

数据仓库的观点

任何一个公司和企业,在订货、存货清单、票据清单、帐目清算、客户办事以及

财务申报等方面都存在大年夜量的营业利用和技巧环节。数据仓库的感化在于:从这

些利用系统中获守信息并转换到一个新的数据库,经由过程对新库中的历史信息和面

向主题的信息进行阐发,为决策供给支持。以往的产品系统,如订货或购置系统,

则很难从中得到有关商业成长状况的信息。

数据仓库是企业决策支持的一部分。在做出下一个抉择前,每个商业机构中的行

政职员和阐发职员都必要将许多关键商业问题搞清楚,例如:哪些产品最有利可

图?哪些客户会为我们带来最大年夜利益?哪些环节必要花费很高的用度?哪些市场活动

运行得最好,为什么?我们有可能会掉去哪些客户,为什么?

这些都是数据仓库要

回答的“百万利润”问题,也同时是一个最大年夜的市场。据 Gartner预计,60%

的关

系数据库治理系统被用作决策支持系统的利用开拓。

数据仓库与数据集市的对照

在二十世纪八十年代中期,Bill Inmon首次提出“数据仓库”这一名词。它最初被

设计为一个商业数据库, 具有稳定性(主要因素不变)、历史性(包孕历史信息)和面

向主题(信息由客户、产品和市场等组成)等特征。这些最初的“数据仓库”根据

对客户、产品、贩卖环境和财务状况等信息的阐发,获得对企业活动的整体熟识。

要建立一个数据仓库,一样平常分为四个步骤:

第一步:数据库设计,即设计出一个包孕商业数据和信息的数据库,为商业实体

所用;

第二步:开拓数据抽取和转换法度榜样,从产品系统中将数据掏出后放入数据仓库中;

第三步:开拓数据加载和更新技巧,使得在产品数据发生变更时,数据仓库获得

动态实时的更新;

第四步:购置查询和报表天生对象,令应用者经由过程企业内部网和小我谋略机很方

便地获守信息。

多年以来客户发明:只管企业级数据仓库很有吸引力,然则详细操作起来有些难

度。1996年“IDC钻研”查询造访结果注解:只管为建立数据仓库匀称投入了三年多

光阴和近320万美元,50%没有达到应有的效果。从项目开始算起,三年后,大年夜多

数贩子发明所面临的商业问题已经不再是开始树马上的样子,发生了很大年夜变更。

别的,只管开拓进度被延长了一年又一年,仍旧做不到让所有感兴趣的客户对想

看到什么信息给出明确的需求定义。因而“企业数据模型”切实着实立犹如演习一样

进行了一年又一年。

在近来的18-24个月的光阴里,呈现了一种新的办理法子,那便是数据集市。数据

集市也是一种数据仓库,只是它更精练,更面向主题。Sybase公司自创立以来,

便确立了在数据集市技巧上的引导职位地方。今朝,应用Sybase产品的2万多家客户中

的大年夜多半已经建立了运行在SQL Server上的数据集市,只管平日也称为数据仓库,

却险些没有一个是企业级的。

数据集市的上风在于扶植周期的缩短和用度上的大年夜大年夜低落。此中周期以月代替了年,

用度从几百万下降到一百万。因为全部企业的数据很宏大年夜,真正将它们集中到一个

数据库中险些是弗成能的。有人便对很多大年夜数据仓库实质上是不是数据集市孕育发生了

狐疑。应用数据集市后。设计、抽取、转换、加载和查询等环节变得加倍简单,因

为客户中的一部分人能够更正确地知道他们自己所必要的信息是什么。

然而,假如有很多的数据集市却不能使它们维持同步,数据集市办理规划就会碰到

艰苦。一旦一个单位创建了两个或两个以上的数据集市,最大年夜的问题便是若何使它

们之间和谐同等,若何使它们实时操作,以及若何掩护所有的数据抽取和转换。另

外,当一个单位要创建两个或两个以上的数据集市时,会发明每一个都要颠末一个

从新的设计、抽取、加载和查询步骤。于是,在面对多个数据集市的开拓时,若何

共享设计和布局成为一个有现实意义和寻衅性的问题。

运作型数据存储与合并式数据仓库

针对上述问题,一种办理规划是采纳一种全新的数据仓库观点 ---“运作型数据存

储 (Operational Data Store,ODS)”。在ODS要领下,数据被从营业数据库中复制到

一其中间位置,再从这里被抽取到多个数据集市中。ODS是从客户、产品和其他商

业角度来组织的,被称为商业状况的“实时快照”。它不包孕历史信息,但可以很

轻易地满意一个历史数据库或一组面向主题的数据集市的必要。

我们一样平常称之为“合并式数据仓库”,由于它在进入决策支持数据库曩昔是一个信

息的结合点。ODS虽小,却能被常常地改动,因而异常得当于建立在Adaptive

Server

Enterprise 和 Replication Server上。

多维或OLAP(联机阐发处置惩罚)市场

作为数据仓库利用环节中的一部分,在市场份额上获得快速增长,变得越来越大年夜。

简单来说,OLAP是从商业角度进行信息组织,而不象平日的由行、列和表构成。

例如,在一个类似 Arbor 或 Oracle Express 的 OLAP数据中,信息是经由过程客户、产

品、日期、贩卖部门和地域等属性来存取的,这对付数据理解和信息获取来说都

显得异常直不雅。

OLAP产品取得关系数据后,将它放入一个异常简单的表格中,使之很轻易阐发。

数据库和一个OLAP产品可被看做一个多维表格。这个市场相称热门,Arbor、

Oracle的 Express 和 Microstrategy 在此领域中各占一席之地,而 Sybase的

Power

Dimentions (原名whitelight),Cognos的 Impromptu 和 Powerplay,Brio Technology 的

BrioQuery处于上风职位地方。

竞争对手与相助伙伴一览

RDBMS公司:Sybase,Oracle,IBM,Teradata/NCR,Informix,Microsoft

硬件公司:IBM,Teradata,Sun,Digital/Compaq,HP

转换对象:VMARK,Infomatica,Carleton/Apertus,ETZ,Prism Solutions

OLAP:Sybase/PowerDimentions,Arbor,Oracle/Express,Microstrategy,

Information Advantage。

Sybase 的办理规划及其组成

Sybase拥有一个独特而强有力的点对点规划,用来设计、建立和治理数据仓库和数

据集市。各个部门之间经由过程集中的元数据进行交互,这便具有了完备性、集中性和

机动性等特征。我们的对象也具有很多良好机能。

下表列出了各个组成部分:

(1)PowerDesigner Warehouse Architect

PowerDesigner不只是业界有名的数据库设计对象,也是数据仓库模型设计对象。其

中的 Warehouse Architect模块支持多种数据仓库模型,包括星型模式、雪花模式、以

及雪暴模式。这是同业业中最优秀、最机动的开拓对象,可用来设计一个关系的或

OLAP的软件仓库。PowerDesigner在数据仓库设计对象市场中占领最大年夜份额。它能从

已有的数据库进行反向工程,从运行系统中将现存的数据布局抽掏出来形成数据模

型,使设计变得简单。

(2) PowerStage

强大年夜的数据抽取和数据转换产品。它是引导市场的客户/办事器转换措施,使数据仓

库模型用PowerDesigner实现起来加倍轻易,加倍直不雅。PowerStage真恰是安然并基于

引擎的。它有一个简单的面向处置惩罚的图形用户接口,使得用户可以快速启动,重复

使用以往的

您可能还会对下面的文章感兴趣: