文件名称:
The Data Warehouse ETL Toolkit (中文版).pdf
开发工具:
文件大小: 4mb
下载次数: 0
上传时间: 2013-03-13
详细说明: 抽取-转换-加载(Extract-Transform-Load)系统是数据仓库的基础。一个设计良好的ETL系统从源系统抽取数据,执行数据质量和一致性标准,然后规格化数据,从而使分散的源数据可以集中在一起使用,最终再以可以展现的格式提交数据,以便应用开发者可以创建应用系统,也使最终用户可以制定决策。该书围绕这四个步骤进行组织。 ETL系统既能成就数据仓库也能毁了它。因为虽然创建ETL系统是后台工作,对于最终用户并不可见,但是对于实施和维护一个典型的数据仓库系统来说,它所耗费的资源会很容易达到70%。 ETL系统能使数据明显地增值,它的工作也绝不是简单的把数据从源系统抽取到数据仓库中。特别是,ETL系统能够: 消除数据错误并纠正缺失数据 提供对于数据可信度的文档化衡量 为保护数据获取相互作用的数据流程 把多个源数据整合到一起 将数据进行结构化供最终用户使用 ETL是个既简单又复杂的题目。几乎所有人都能理解ETL系统的基本作用:把源中的数据加载到数据仓库中。另外大多数人也都认为在这个过程中清洗和转换数据是必要的,这就是简单的观点。然而一个无法更改的事实是,紧接着的下一步就要根据数据源、业务规则、现存软件系统以及特定的报表应用系统的不同,将 ETL系统分拆成成百上千的小的子过程。这带给我们的挑战是,既要耐心地对待这上千个子过程,同时又要保持对整个ETL系统主要目标的简单视角。看看本书是如何应对这一挑战的吧! ...展开收缩
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.