一个简单的ETL开发的过程(informatica)

一个简单的ETL开发的过程(informatica)大致的了解过程,中间不涉及组件部分。 正文PowerCenter的开发过程大致可以分为几步:1.在客户端PowerCenterDesigner中导入源表和目标表的结构定义。(只是表结构)2.在PowerCenterDesigner中执行的事件为:   1>.创建Mapping。   2>.拖动源和目标进入Mapping。(类似于定义变量)   …

大家好,又见面了,我是你们的朋友全栈君。

大致的了解过程,中间不涉及组件部分。

 

正文

PowerCenter的开发过程大致可以分为几步:

1.在客户端PowerCenter Designer中导入源表和目标表的结构定义。(只是表结构)

2.在PowerCenter Designer中执行的事件为:

    1>.创建Mapping。

    2>.拖动源和目标进入Mapping。(类似于定义变量)

    3>.建立源和目标的映射。(对变量进行赋值)

3.运行Workflow,提供相对应的配置信息以及参数。在PowerCenter中的载体是Workflow和Session。

4.通过Workflow Monitor客户端进行监控。

 

前提

在进行开发PowerCenter之前,一般需要完成两件事。(后续不再需要,第一次新环境才需要)

1.使用PowerCenter客户端连接域(Domain)和Repository Service。

2.建立一个Folder文件夹。(用于开发学习)

前提过程:

1.1.打开Repository Manager客户端,选择菜单Repository -> Configure Domains。Add a new domain,填写信息。

这里有几点需要注意:

    1).Domain Name:打开Admin Console。Admin Console是一个基于Web的管理控制台,一般通过类似于URL”http://host1:6005″进行访问。host1就是安装了PowerCenter服务器的机器名,6005是端口号。在Domain Navigator树的最顶层就是Domain Name。

    2).Gateway Host,这里填写服务器的主机名。在安装了PowerCenter的Windows客户端,还需要配置hosts文件,目录位于C:\WINDOWS\System32\drivers\etc,在hosts文件中增加类似条目:192.168.75.129host1.

    3).Gateway Port,默认端口6005,这是在安装过程中确定的,如果在安装的过程中有更改,这边也需要更改,保持一致性。

1.2.信息输入完之后,确认。下一界面,勾选Repository Service名字,这个也可以在Admin Console中找到相对应的信息。再确认之后双击你的Repository Service,输入用户名以及密码。默认用户名是Administrator,密码是在安装的时候确认的。点击Connect可以确认是否客户端连接服务器成功。

2.在Repository Manager,选择菜单Folder -> Create,弹出Create Folder菜单,输入Folder Name信息确认即可。

 

 

定义源表

打开客户端PowerCenter Designer,点击Source Analyzer图标。源表来源多样,这边只举一例子。So 选择菜单Sources,选择Import From Database命令,在弹出的Improt Tables对话框输入信息。

如果是第一次使用,需要创建一个ODBC DSN。单击”…”图标,选择”系统DSN”,单击”添加”,选择驱动程序,以Oracle数据库为例子,选择”DataDirect 7.1 Oracle Wire Protocol”。填写数据库信息,这时候就新建完了。到ODBC Oracle Wire Protocol Driver Setup中,输入Data Source Name,用户名,密码,可以测试连接,没有问题的话回到Import Tables,选择要的表做完源表的结构。

 

定义目标表

打开客户端PowerCenter Designer,点击Target Designer图标,剩下的步骤类似于定义源表,都是Import From Database等等。

 

好了,这时候我们已经把源表,目标表的结构定义好了。

下面需要进行一个关键的步骤,Mapping。(类似于C Main程序)

 

Mapping

点击Mapping Designer图标,选择菜单Mappings -> Create,在弹出的菜单中输入Mapping的名称,相关的命名规则参照PowerCenter内部建议的命名规范,这对大规模的Mapping开发的时候很有帮助。

在之前创建的Folder文件夹下面选择到所创建的源表,按住鼠标,拖动到Mapping Designer工作区。

同样的把Target表拖动到Mapping Designer工作区。这时候在Mapping Designer中会出现三个框,一个Source,一个SQ,一个Target。这时候需要为变量赋值,选择SQ表中的内容,拖动到Target上面,至此,一个简单的Mapping完成了。

这时候,需要保存(ctrl+s)

如果在Folder中的mappings中看到我们的Mapping是带有感叹号的,是无效的,需要更正。

 

Workflow

打开PowerCenter Workflow Manager,选择Workflow Designer,菜单栏中选择Workflows ->Wizard,在弹出来的对话框中输入Workflow的名字,命名规则参考Velocity Methodology。选择PowerCenter Integration Service,点击下一步进入Create Sessions界面。在左边可以看到Mapping,点击 Add session for the selected mapping。可以看到右边出现了一个session。然后下一步,完成即可。

在Workflow Designer中可以看到生成的过程。然后点击我们的session,选择Mapping Tab,选择Source,这里为源表创建一个数据库连接。方法:选择菜单,选择Connections -> Relational。单击NEW,输入连接的name,数据库的用户名,密码,连接串。

完成后ctrl + s保存。

同理:选择Target,设置WRITERS,在output type中设置信息可以设置为目标表导出。

 

监控运行

启动Workflow之后,打开Workflow Monitor,双击Session,可以查看Session运行的详细信息,包括运行状态,开始,结束时间,读取,写入行数,吞吐量以及运行的时候的错误等信息。

 

至此,一个简单的过程结束。

 

 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/139569.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月29日 下午4:16
下一篇 2022年5月29日 下午4:16


相关推荐

  • 微服务调用链路追踪_区块链地址追踪

    微服务调用链路追踪_区块链地址追踪目录第一章Sleuth+Zipkin介绍1.1、什么是Sleuth1.2、什么是Zipkin第二章Sleuth+Zipkin入门案例2.1、项目准备与启动2.2、搭Zipkin服务端2.3、搭Zipkin客户端2.4、链路跟踪的测试配套资料,免费下载链接:https://pan.baidu.com/s/1la_3-HW-UvliDRJzfBcP_w提取码:lxfx复制这段内容后打开百度网盘手机App,操作更方便哦第一章Sleuth+Zipkin介绍1.1、什么是Sleuth我们已经接触

    2025年7月10日
    66
  • ASP.NET微信公众号获取AccessToken

    access_token是公众号的全局唯一接口调用凭据,公众号调用各接口时都需使用access_token。开发者需要进行妥善保存。access_token的存储至少要保留512个字符空间。acces

    2021年12月28日
    41
  • PMP考试心得分享(已通过)

    PMP考试心得分享(已通过)01 前言终于终于等到了你 我的 PMP 通过了 这一路走来不容易啊 我是 2020 年 3 月份报考培训班的 因为家庭以及工作的缘故 拖了整整一年 最终打算在 2021 年 3 月参加培训考试 因为疫情的原因 一直被延考 心态都崩了 几乎每次都是考前的 10 天才通知 可以看出歪果仁的风险管理真的十分 一波三折 还好自己能参加 9 月 25 号 并最终通过了考试 附上我的证书 本文主要分享我的一些考试心得 02 报名前准备在考试前 我是准备得很充分的 当时我只知道这条证是对简历的镀金 对将来转管理

    2026年3月19日
    2
  • 《大话数据结构》pdf

    《大话数据结构》pdf下载地址:网盘下载编辑推荐编辑超级畅销书《大话设计模式》作者的新作!用户群更为广泛,写作风格一如既往,技术沉淀更加深厚,势必掀起全民数据结构的热潮!内容简介编辑本书为超级畅销书《大话设计模式》作者程杰潜心三年推出的扛鼎之作!以一个计算机教师教学为场景,讲解数据结构和相关算法的知识。通篇以一种趣味方式来叙述,大量引用了各种各样的生…

    2022年6月24日
    22
  • 5大开源多智能体 AI 框架

    5大开源多智能体 AI 框架

    2026年3月15日
    2
  • Spring-boot_Spring Boot

    Spring-boot_Spring Boot1概述Jasypt是一个加密库,Github上有一个集成了Jasypt的SpringBoot库,叫jasypt-spring-boot,本文演示了如何使用该库对配置文件进行加密。2依赖首先添加依赖:<dependency><groupId>com.github.ulisesbocchio</groupId><artifactId>jasypt-spring-boot-starter</artifactId>

    2026年4月14日
    5

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号