一个简单的ETL开发的过程(informatica)

一个简单的ETL开发的过程(informatica)大致的了解过程,中间不涉及组件部分。 正文PowerCenter的开发过程大致可以分为几步:1.在客户端PowerCenterDesigner中导入源表和目标表的结构定义。(只是表结构)2.在PowerCenterDesigner中执行的事件为:   1>.创建Mapping。   2>.拖动源和目标进入Mapping。(类似于定义变量)   …

大家好,又见面了,我是你们的朋友全栈君。

大致的了解过程,中间不涉及组件部分。

 

正文

PowerCenter的开发过程大致可以分为几步:

1.在客户端PowerCenter Designer中导入源表和目标表的结构定义。(只是表结构)

2.在PowerCenter Designer中执行的事件为:

    1>.创建Mapping。

    2>.拖动源和目标进入Mapping。(类似于定义变量)

    3>.建立源和目标的映射。(对变量进行赋值)

3.运行Workflow,提供相对应的配置信息以及参数。在PowerCenter中的载体是Workflow和Session。

4.通过Workflow Monitor客户端进行监控。

 

前提

在进行开发PowerCenter之前,一般需要完成两件事。(后续不再需要,第一次新环境才需要)

1.使用PowerCenter客户端连接域(Domain)和Repository Service。

2.建立一个Folder文件夹。(用于开发学习)

前提过程:

1.1.打开Repository Manager客户端,选择菜单Repository -> Configure Domains。Add a new domain,填写信息。

这里有几点需要注意:

    1).Domain Name:打开Admin Console。Admin Console是一个基于Web的管理控制台,一般通过类似于URL”http://host1:6005″进行访问。host1就是安装了PowerCenter服务器的机器名,6005是端口号。在Domain Navigator树的最顶层就是Domain Name。

    2).Gateway Host,这里填写服务器的主机名。在安装了PowerCenter的Windows客户端,还需要配置hosts文件,目录位于C:\WINDOWS\System32\drivers\etc,在hosts文件中增加类似条目:192.168.75.129host1.

    3).Gateway Port,默认端口6005,这是在安装过程中确定的,如果在安装的过程中有更改,这边也需要更改,保持一致性。

1.2.信息输入完之后,确认。下一界面,勾选Repository Service名字,这个也可以在Admin Console中找到相对应的信息。再确认之后双击你的Repository Service,输入用户名以及密码。默认用户名是Administrator,密码是在安装的时候确认的。点击Connect可以确认是否客户端连接服务器成功。

2.在Repository Manager,选择菜单Folder -> Create,弹出Create Folder菜单,输入Folder Name信息确认即可。

 

 

定义源表

打开客户端PowerCenter Designer,点击Source Analyzer图标。源表来源多样,这边只举一例子。So 选择菜单Sources,选择Import From Database命令,在弹出的Improt Tables对话框输入信息。

如果是第一次使用,需要创建一个ODBC DSN。单击”…”图标,选择”系统DSN”,单击”添加”,选择驱动程序,以Oracle数据库为例子,选择”DataDirect 7.1 Oracle Wire Protocol”。填写数据库信息,这时候就新建完了。到ODBC Oracle Wire Protocol Driver Setup中,输入Data Source Name,用户名,密码,可以测试连接,没有问题的话回到Import Tables,选择要的表做完源表的结构。

 

定义目标表

打开客户端PowerCenter Designer,点击Target Designer图标,剩下的步骤类似于定义源表,都是Import From Database等等。

 

好了,这时候我们已经把源表,目标表的结构定义好了。

下面需要进行一个关键的步骤,Mapping。(类似于C Main程序)

 

Mapping

点击Mapping Designer图标,选择菜单Mappings -> Create,在弹出的菜单中输入Mapping的名称,相关的命名规则参照PowerCenter内部建议的命名规范,这对大规模的Mapping开发的时候很有帮助。

在之前创建的Folder文件夹下面选择到所创建的源表,按住鼠标,拖动到Mapping Designer工作区。

同样的把Target表拖动到Mapping Designer工作区。这时候在Mapping Designer中会出现三个框,一个Source,一个SQ,一个Target。这时候需要为变量赋值,选择SQ表中的内容,拖动到Target上面,至此,一个简单的Mapping完成了。

这时候,需要保存(ctrl+s)

如果在Folder中的mappings中看到我们的Mapping是带有感叹号的,是无效的,需要更正。

 

Workflow

打开PowerCenter Workflow Manager,选择Workflow Designer,菜单栏中选择Workflows ->Wizard,在弹出来的对话框中输入Workflow的名字,命名规则参考Velocity Methodology。选择PowerCenter Integration Service,点击下一步进入Create Sessions界面。在左边可以看到Mapping,点击 Add session for the selected mapping。可以看到右边出现了一个session。然后下一步,完成即可。

在Workflow Designer中可以看到生成的过程。然后点击我们的session,选择Mapping Tab,选择Source,这里为源表创建一个数据库连接。方法:选择菜单,选择Connections -> Relational。单击NEW,输入连接的name,数据库的用户名,密码,连接串。

完成后ctrl + s保存。

同理:选择Target,设置WRITERS,在output type中设置信息可以设置为目标表导出。

 

监控运行

启动Workflow之后,打开Workflow Monitor,双击Session,可以查看Session运行的详细信息,包括运行状态,开始,结束时间,读取,写入行数,吞吐量以及运行的时候的错误等信息。

 

至此,一个简单的过程结束。

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/139569.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • latex求和符号上下标_latex中高阶无穷小符号

    latex求和符号上下标_latex中高阶无穷小符号\sum_{}^{}例如\sum_{k=0}^{\infty}x^k∑k=0∞xk\sum_{k=0}^{\infty}x^kk=0∑∞​xk

    2022年10月12日
    0
  • string 保留小数点后两位(js中保留小数点后两位)

    js保留小数点后N位的方法介绍利用toFixed函数代码如下复制代码document.write(“JS保留两位小数例子”);vara=2.1512131231231321;document.write(“原来的值:”+a+””);document.write(“两位小数点:”+a.toFixed(2)+”四位小数点”+a.toFixed(4));四舍五入的转换函数,如下:代码如下复制代码f…

    2022年4月13日
    384
  • 域名、服务器、IP之间的关系[通俗易懂]

    域名、服务器、IP之间的关系[通俗易懂]文章转载自:[https://www.jianshu.com/p/c3d3f6629c13](https://www.jianshu.com/p/c3d3f6629c13)本文主要针对域名、服务器和IP之间的关系进行介绍,并通过实际案例讲解域名解析过程本文目录基础概念案例分析阿里云域名解析过程基础概念服务器:服务器其实就像我们的家用电脑一样,也有主板、CPU、内存、硬盘、电源等。根据功能来说服务器可分为web服务器、ftp服务器、数据库服务器、邮件服务器等等,做什么用途就可以叫做什么服务器

    2022年9月29日
    0
  • 语义分割和实例分割概念

    语义分割和实例分割概念有些概念容易混淆,整理一下,备注记忆。一、概念区分1.图像分类(imageclassification)识别图像中存在的内容;2.物体识别和检测(objectrecognitionanddetection)识别图像中存在的内容和位置(通过边界框);3.语义分割(semanticsegmentation)识别图像中存在的内容以及位置(通过查找属于它的所有像素…

    2022年8月23日
    3
  • python 进行socket 通信

    python 进行socket 通信

    2021年11月10日
    44
  • Protostuff 介绍

    Protostuff 介绍2019独角兽企业重金招聘Python工程师标准>>>…

    2022年5月10日
    46

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号