一个简单的ETL开发的过程(informatica)

一个简单的ETL开发的过程(informatica)大致的了解过程,中间不涉及组件部分。 正文PowerCenter的开发过程大致可以分为几步:1.在客户端PowerCenterDesigner中导入源表和目标表的结构定义。(只是表结构)2.在PowerCenterDesigner中执行的事件为:   1>.创建Mapping。   2>.拖动源和目标进入Mapping。(类似于定义变量)   …

大家好,又见面了,我是你们的朋友全栈君。

大致的了解过程,中间不涉及组件部分。

 

正文

PowerCenter的开发过程大致可以分为几步:

1.在客户端PowerCenter Designer中导入源表和目标表的结构定义。(只是表结构)

2.在PowerCenter Designer中执行的事件为:

    1>.创建Mapping。

    2>.拖动源和目标进入Mapping。(类似于定义变量)

    3>.建立源和目标的映射。(对变量进行赋值)

3.运行Workflow,提供相对应的配置信息以及参数。在PowerCenter中的载体是Workflow和Session。

4.通过Workflow Monitor客户端进行监控。

 

前提

在进行开发PowerCenter之前,一般需要完成两件事。(后续不再需要,第一次新环境才需要)

1.使用PowerCenter客户端连接域(Domain)和Repository Service。

2.建立一个Folder文件夹。(用于开发学习)

前提过程:

1.1.打开Repository Manager客户端,选择菜单Repository -> Configure Domains。Add a new domain,填写信息。

这里有几点需要注意:

    1).Domain Name:打开Admin Console。Admin Console是一个基于Web的管理控制台,一般通过类似于URL”http://host1:6005″进行访问。host1就是安装了PowerCenter服务器的机器名,6005是端口号。在Domain Navigator树的最顶层就是Domain Name。

    2).Gateway Host,这里填写服务器的主机名。在安装了PowerCenter的Windows客户端,还需要配置hosts文件,目录位于C:\WINDOWS\System32\drivers\etc,在hosts文件中增加类似条目:192.168.75.129host1.

    3).Gateway Port,默认端口6005,这是在安装过程中确定的,如果在安装的过程中有更改,这边也需要更改,保持一致性。

1.2.信息输入完之后,确认。下一界面,勾选Repository Service名字,这个也可以在Admin Console中找到相对应的信息。再确认之后双击你的Repository Service,输入用户名以及密码。默认用户名是Administrator,密码是在安装的时候确认的。点击Connect可以确认是否客户端连接服务器成功。

2.在Repository Manager,选择菜单Folder -> Create,弹出Create Folder菜单,输入Folder Name信息确认即可。

 

 

定义源表

打开客户端PowerCenter Designer,点击Source Analyzer图标。源表来源多样,这边只举一例子。So 选择菜单Sources,选择Import From Database命令,在弹出的Improt Tables对话框输入信息。

如果是第一次使用,需要创建一个ODBC DSN。单击”…”图标,选择”系统DSN”,单击”添加”,选择驱动程序,以Oracle数据库为例子,选择”DataDirect 7.1 Oracle Wire Protocol”。填写数据库信息,这时候就新建完了。到ODBC Oracle Wire Protocol Driver Setup中,输入Data Source Name,用户名,密码,可以测试连接,没有问题的话回到Import Tables,选择要的表做完源表的结构。

 

定义目标表

打开客户端PowerCenter Designer,点击Target Designer图标,剩下的步骤类似于定义源表,都是Import From Database等等。

 

好了,这时候我们已经把源表,目标表的结构定义好了。

下面需要进行一个关键的步骤,Mapping。(类似于C Main程序)

 

Mapping

点击Mapping Designer图标,选择菜单Mappings -> Create,在弹出的菜单中输入Mapping的名称,相关的命名规则参照PowerCenter内部建议的命名规范,这对大规模的Mapping开发的时候很有帮助。

在之前创建的Folder文件夹下面选择到所创建的源表,按住鼠标,拖动到Mapping Designer工作区。

同样的把Target表拖动到Mapping Designer工作区。这时候在Mapping Designer中会出现三个框,一个Source,一个SQ,一个Target。这时候需要为变量赋值,选择SQ表中的内容,拖动到Target上面,至此,一个简单的Mapping完成了。

这时候,需要保存(ctrl+s)

如果在Folder中的mappings中看到我们的Mapping是带有感叹号的,是无效的,需要更正。

 

Workflow

打开PowerCenter Workflow Manager,选择Workflow Designer,菜单栏中选择Workflows ->Wizard,在弹出来的对话框中输入Workflow的名字,命名规则参考Velocity Methodology。选择PowerCenter Integration Service,点击下一步进入Create Sessions界面。在左边可以看到Mapping,点击 Add session for the selected mapping。可以看到右边出现了一个session。然后下一步,完成即可。

在Workflow Designer中可以看到生成的过程。然后点击我们的session,选择Mapping Tab,选择Source,这里为源表创建一个数据库连接。方法:选择菜单,选择Connections -> Relational。单击NEW,输入连接的name,数据库的用户名,密码,连接串。

完成后ctrl + s保存。

同理:选择Target,设置WRITERS,在output type中设置信息可以设置为目标表导出。

 

监控运行

启动Workflow之后,打开Workflow Monitor,双击Session,可以查看Session运行的详细信息,包括运行状态,开始,结束时间,读取,写入行数,吞吐量以及运行的时候的错误等信息。

 

至此,一个简单的过程结束。

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/139569.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Dell T40服务器系统安装问题[通俗易懂]

    Dell T40服务器系统安装问题[通俗易懂]问题安装系统找不到硬盘在正常安装系统2016时遇到无法找到驱动器,用此系统安装别的机器发现可以装,确定系统是好的,但是用这个系统安装T40服务器时就是找不到硬盘,具体解决步骤如下:首先重启电脑,进入bios界面,选择restoresettings,进入下拉框,在选择BIOSdefault,就行bios恢复出厂值,之后再重新安装就OK了解析:因为2016及以上版本的系统都是集成了软阵列的…

    2022年10月4日
    5
  • jsonObject转map_json字符串转jsonobject对象

    jsonObject转map_json字符串转jsonobject对象Map转JSONObject<!–https://mvnrepository.com/artifact/com.alibaba/fastjson–><dependency><groupId>com.alibaba</groupId><artifactId>fastjson</artifactId><version>1.2.59</version></depende

    2022年9月28日
    2
  • Stack overflow at line 解决办法(重复引入JS导致)

    Stack overflow at line 解决办法(重复引入JS导致)这几天碰到了个莫名其妙的问题,我在一个TR的onDblClick事件里写了一个window.open(XXX);可是每当我双击这一行的时候总是给我报Stackoverflowatline7这个错误,在网上找了很多方法都不行,后来查看源文件发现我把一个外部JS引入了2次,我本身的jsp引入的一次,我每个jsp都会去引入一个公共的jsp,在公共jsp里面我又引入了一次。后来我把本身的jsp引入

    2022年7月15日
    13
  • CentOS7下使用YUM安装MySQL5.6

    CentOS7下使用YUM安装MySQL5.6(1)检查系统中是否已安装MySQL。rpm-qa|grepmysql返回空值的话,就说明没有安装MySQL。注意:在新版本的CentOS7中,默认的数据库已更新为了Mariadb,而非MySQL,所以执行yuminstallmysql命令只是更新Mariadb数据库,并不会安装MySQL。(2)查看已安装的Mariadb数据库版本…

    2022年6月12日
    31
  • 计算机前沿技术介绍

    计算机前沿技术介绍简要的说明了一些当今,热门、前沿技术,只是大致介绍了一下,想详细了解的,请自行查阅。

    2022年10月19日
    2
  • python进阶(20) 正则表达式的超详细使用[通俗易懂]

    python进阶(20) 正则表达式的超详细使用[通俗易懂]正则表达式正则表达式(RegularExpression,在代码中常简写为regex、regexp、RE或re)是预先定义好的一个“规则字符率”,通过这个“规则字符串”可以匹配、查找和替换那些

    2022年7月29日
    7

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号