DecisionStream是Cognos公司出品的一款ETL工具,完全采用多维模型的思想设计,非常适合用多维数据仓库的数据抽取,转换和装载过程。主要包括两个组件:DecisionStream Engine和DecisionStream Designer。前者是运行引擎,后者则是设计工具。
比起其他两款比较著名的ETL工具:Informatica和DataStage,DecisionStream要简单得多。软件自身带了一些示例数据和一个Step by Step的教程(Discoving DecisionStream)。如果对多维模型的概念比较熟悉,那么安装完后按照教程操作一遍,很快就能上手。
Catalog是DS的元数据知识库,Catalog使用Oracle/SQL Server/Sybase/DB2等常见的关系数据库来作为Catalog的数据存储实体,也支持ODBC,其自带的示例Catalog就是通过ODBC连接到Access文件。
Catalog主要包含以下table:
- ds_component
- ds_component_line
- ds_component_run
- ds_jobnode_run
- ds_sequence
- ds_delivery_hist
- ds_audit_trail
- ds_audit_msg
- ds_audit_msg_line
通过Designer的Tools->Manage Database Schema可以管理Catalog;通过File->Document Catalog菜单,可以将Catalog中的元数据内容自动生成HTML文档。
在Designer中,可以看到Catalog主要分为四个文件夹:
- Builds
- JobStreams
- MetaData
- Library
其中Builds包括Fact Builds和Dimension Builds,这里是整个DS的核心部分,整个的ETL逻辑都是在这里设计,多个Build可以组成JobStream,以确定多个builds之间的执行顺序。MetaData则主要用于元数据的管理。Library中包括用于构建build的组件,包括Dimensions,connections和Functions。