Informatica ETL开发入门实例

Informatica ETL开发入门实例Informatica客户端工具:5个Designer——定义源及目标结构设计转换规则,生成ETL映射RepositoryManager——元数据资料库,依赖性分析,安全性管理等RepositoryServerAdministratorConsole——Repository的建立与维护WorkflowManager——合理的实现复杂的ETL工作流基于时间或事件的作业高度WorkflowMonitor——监控workflow和session,生成工作日志及报告…

大家好,又见面了,我是你们的朋友全栈君。

一、ETL开发前准备工作

注:Informatica的存储服务和集成服务必须已经启动,客户端才能连接并进行ETL实例开发

客户端工具:

  • PowerCenter Designer:D客户端
  • PowerCenter Repository Manager:R客户端
  • PowerCenter Workflow Manager:W客户端
  • PowerCenter Workflow Monitor:M客户端

1、配置域
打开R客户端(Repository Manager),点击【存储库】,选择【配置域】
在这里插入图片描述
配置域(参考下图):

域名:domain_notebook8(domain_:域名前缀,必须写)
网关主机:notebook8
网关端口:6005

在这里插入图片描述
在这里插入图片描述
连接成功:
在这里插入图片描述
2、创建文件夹
点击【文件夹】,选择【创建】,创建文件夹
关于mapping、任务、工作流,都是在相应的文件夹里面操作的,因此首要就是:打开R客户端(Repository Manager),创建一个文件夹,为后面的ETL实例开发做好准备。
在这里插入图片描述
三、准备源数据
1、准备ODS层、EDW层、DM层

OLTP —> ODS —> EDW —> DM

2、准备BI_ODS用户、BI_EDW用户、BI_DM用户

scott —> BI_ODS —> BI_EDW —> BI_DM

(1)创建 BI_ODS 用户并授权

--Create User BI_ODS
create user bi_ods				--用户名
	identified by bi_ods		--密码
	default tablespace USERS	--默认表空间
	temporary tablespace TEMP;	--临时表空间

--Grant/Revoke role privileges
grant connect to bi_ods;
grant dba to bi_ods;
grant resource to bi_ods;

--Grant/Revoke system privileges
grant unlimited tablespace to bi_ods;

(2)创建 BI_EDW 用户并授权

--Create User BI_EDW
create user bi_edw
	identified by bi_edw
	default tablespace USERS
	temporary tablespace TEMP;

--Grant/Revoke role privileges
grant connect to bi_edw;
grant dba to bi_edw;
grant resource to bi_edw;

--Grant/Revoke system privileges
grant unlimited tablespace to bi_edw;

(3)创建 BI_DM 用户并授权

--Create User BI_DM
create user bi_dm
	identified by bi_dm
	default tablespace USERS
	temporary tablespace TEMP;

--Grant/Revoke role privileges
grant connect to bi_dm;
grant dba to bi_dm;
grant resource to bi_dm;

--Grant/Revoke system privileges
grant unlimited tablespace to bi_dm;

四、ETL开发入门实例
将【scott用户的emp表】的数据抽取到【bi_ods用户的ods_emp表】

期望结果如下:

scott用户:源表(EMP)
在这里插入图片描述
bi_ods用户:目标表(ODS_EMP)
在这里插入图片描述
1、创建目标用户(bi_ods)并授权

(scott)					目标(bi_ods层)
用户名:scott				用户名:bi_ods
密码:tiger					密码:bi_ods
数据库服务实例:orcl			数据库服务实例:orcl

注:scott用户和scott用户下的源表(EMP)本身就有,无需另行创建。

2、导入源表
打开D客户端(Designer),从数据库导入

注意:这里的BI_ODS这个文件夹要双击选中(会看到字体变粗),上面的菜单栏才会显示出源(S)这个可选项,否则可能会找不到!

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
3、构建目标表
把源表复制到目标表,并重命名ODS_EMP:
在这里插入图片描述
在这里插入图片描述
点击【目标】,选择【生成/执行SQL】,生成目标表
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
连接PL/SQL,登录bi_ods用户,查看是否生成目标表ODS_EMP:
在这里插入图片描述
4、创建映射
在这里插入图片描述
在这里插入图片描述
5、定义任务
打开W客户端(Workflow Manager)
在这里插入图片描述
在这里插入图片描述
scott用户:
在这里插入图片描述
bi_ods用户:
在这里插入图片描述
结果:
在这里插入图片描述
6、创建任务会话
在这里插入图片描述
在这里插入图片描述
源:ora_source_scott
在这里插入图片描述
目标:ora_source_scott
在这里插入图片描述
默认是Bulk(桶)加载,这里改成Normal(正常)加载:
在这里插入图片描述
7、创建工作流
在这里插入图片描述
在这里插入图片描述
8、启动任务/通过任务启动工作流
在这里插入图片描述
【启动任务】或【通过任务启动工作流】 ,然后会自动弹出M客户端(Workflow Monitor):
在这里插入图片描述
通过M客户端可以看到任务的执行情况!

9、检查数据
打开PL/SQL工具,查看数据是否从scott用户的源表(EMP)加载到bi_ods用户的目标表(ODS_EMP):
在这里插入图片描述
至此,一个简单ETL开发入门实例完成 ~ ~ ~

通过D客户端打开组件
右击映射,选择“打开”:
在这里插入图片描述

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/132141.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • java书籍借阅系统_基于JAVA的图书借阅管理系统-.doc[通俗易懂]

    摘要各单位图书资料,传统的图书管理方已无法适应形势需,用计算机发图书资管理系统地查询、修改和维护相关信图书馆拥有丰富的文献信息资源,是社会信息系统的重要组成部分,在信息社会中的作用愈来愈重要。JAVA环境下连接数据库的并提取信息的一个管理信息系统的过程。通过对图书管理的调查和需求分析,创建了一套行之有效的计算机管理图书馆的方案。文章详细介绍了该系统的各个部分的功能,包括图书管理,学生管理,借阅…

    2022年4月12日
    46
  • 高斯光束的简单matlab仿真「建议收藏」

    高斯光束的简单matlab仿真「建议收藏」clcclearallcloseall%%假设在z=0处有一振幅为A的高斯光束N=100;lambda=1064e-6;%波长为1064nmk=2*pi/lambda;%波矢A=1;%振幅w=3;%高斯光束的束宽[x1,y1]=meshgrid(linspace(-10,10,N…

    2022年5月29日
    48
  • java set 排序的_Set集合排序

    java set 排序的_Set集合排序TreeSet使用元素的自然顺序对元素进行排序,或者根据创建set时提供的Comparator进行排序,具体取决于使用的构造方法。通俗一点来说,就是可以按照排序后的列表显示,也可以按照指定的规则排序。Setset=newTreeSet();set.add(“f”);set.add(“a”);set.add(“b”);set.add(“c”);set.add(“d”);set.add(“e”…

    2022年5月26日
    39
  • Tomcat 配置WEB虚拟映射 及 配置虚拟主机

    Tomcat 配置WEB虚拟映射 及 配置虚拟主机

    2021年12月9日
    39
  • linux系统抓包工具_kali 抓包

    linux系统抓包工具_kali 抓包在使用ECS服务器时,发现网络流量异常,或者发现服务器有异常向外发包行为,可使用抓包工具抓取网络流量包,分析流量包的特征,看看这些流量包来自哪里,或者发向哪里了。根据这些信息,可进一步诊断异常。本文介绍Linux系统,使用tcpdump工具分析流量的方法。TcpDump可将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤,并提供and、not、or等逻…

    2022年8月21日
    3
  • pycharm2020.3.4安装教程_python安装pycharm的方法

    pycharm2020.3.4安装教程_python安装pycharm的方法Pycharm2020安装及使用和python3.9的安装以及使用python3.9环境安装及使用python下载:推荐网址:https://www.python.org/getit/建议:在官网上下载python,在其它下载,一般是有捆绑软件python安装打开界面,选上ADDpython3.9topath,就是吧python环境变量加到电脑上。​2.我这里卸载后在安装的​3.这里可以更改软件路径,建议像我这样勾4.安装成

    2022年8月25日
    10

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号