java etl 简单实例_东方通ETL开发实例[通俗易懂]

java etl 简单实例_东方通ETL开发实例[通俗易懂]东方通ETL开发实例下面通过一个简单的“OracleCDC增量抽取”实例,带大家感受一下TIETL的开发思路和强大的数据处理能力。功能需求:同一数据库(localhost_etl)下,现有cdc_source和cdc_target两张表如下:表cdc_source表cdc_target现表cdc_source的增量(增、删、改)需同步到cdc_target中TIETL环境下开发思路:类似于jav…

大家好,又见面了,我是你们的朋友全栈君。

东方通ETL开发实例

下面通过一个简单的“Oracle CDC增量抽取”实例,带大家感受一下TIETL的

开发思路和强大的数据处理能力。

功能需求:

同一数据库(localhost_etl)下,现有cdc_source和cdc_target两张表如下:

表cdc_source

a4c26d1e5885305701be709a3d33442f.png

表cdc_target

a4c26d1e5885305701be709a3d33442f.png

现表cdc_source的增量(增、删、改)需同步到cdc_target中

TIETL环境下开发思路:

类似于java

OO开发,需要什么功能?—>这种功能属于哪种类?—>当前是否存在这种类?—>是,则载入并使用,否则创造后使用

这里把OO中“类”替换为“组件(具有某种特定功能的部件)”即可,另外本实例要实现的功能,现有的组件完全可以满足,所以

不存在需创造的情况(TIETL支持自定义组件开发,由于本文只介绍其基本使用方法,故组件开发在此不作介绍)。

转换设计:

根据对需求的分析结合TIETL现有的组件设计如下

a4c26d1e5885305701be709a3d33442f.png

因TIETL对数据库插入/更新和删除操作做了区别对待,所以通过中间的内容路径进行流程控制。

现分别对每个组件进行配置和解释。

图:Oracle CDC增量抽取

a4c26d1e5885305701be709a3d33442f.png

订阅字段及需要同步的字段,匹配字段一般选用主键(唯一标识),用于源和目的表记录的匹配。

图:内容路由

a4c26d1e5885305701be709a3d33442f.png

OPERATION$包括数据库插入、更新、删除操作分别对应值I,UN,D

图:数据库记录插入/更新

a4c26d1e5885305701be709a3d33442f.png

提交记录数量为一次提交数量,若CDC增量多于这个值则会分次执行。

勾选“不执行任何更新”后只执行插入操作。

图:数据库记录删除

a4c26d1e5885305701be709a3d33442f.png

执行过程:

cdc_source表中插入若干数据

a4c26d1e5885305701be709a3d33442f.png

cdc_target表为空

执行前面设计的转换后

cdc_target表如下

a4c26d1e5885305701be709a3d33442f.png

CDC成功执行!更新和删除操作执行过程相同,故不作赘述。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/133399.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月1日 下午6:00
下一篇 2022年5月1日 下午6:20


相关推荐

  • 股票历史数据库(腾讯股票历史数据接口)

    歪枣网财经数据下载接口集合,百度搜索歪枣网官网序号 名称 接口描述 数据字段 更新日期 操作0 A股列表 沪深京A股基本信息 code股票代码name股票名称stype股票类型,1:深证股票,2:上证股票,3:北证股票,4:港股hsgt沪深港通,1:沪股通:2:深股通、3:港股通(沪)、4:港股通(深)、5:港股通(沪+深)bk所属板块,个股包括主板、创业板、科创板cfg成分股,该板块的成分股roeROEzgb总股本(股)ltgb流通股本(股)ltsz流通市值(元)

    2022年4月10日
    289
  • 信号完整性之“过冲”(振铃)深度分析

    信号完整性之“过冲”(振铃)深度分析信号在传输的过程中 往往不是标准的矩形波信号 尤其在高速信号中 保证信号的完整性是十分重要的 影响信号完整性最主要的因素之一 就是阻抗不匹配 通常表现在传输线上 而阻抗不匹配直接导致信号的反射 反射信号与原始信号叠加 就会产生过冲 回沟 台阶等信号完整性问题 本文将主要对因传输线阻抗不匹配导致信号产生过冲 上冲 overshoot 下冲 undershoot 进行深度分析 并提出部分可行的解决方案 一 过冲的定义过冲是振铃的一部分 信号电平发生跳变后 第一个峰值电压或谷值电压超过设定的标准电压 主要表现为一

    2026年3月18日
    2
  • ioremap函数分析

    ioremap函数分析nbsp 开始之前 先说一下 ioremap 的作用 ioremap 主要是把寄存器做映射 为什么要映射 内核空间只能访问虚拟地址的 3 4G 的地址空间 通常 3 4G 的空间一部分是映射物理内存 通常默认不会映射寄存器 如果想要访问某个寄存器 则需要把这个寄存的虚拟地址映射到高端内存上 这样内核空间才能直接访问 nbsp 下面这篇文章 对 3 4G 的内核空间和 io 映射分析的比较好 值得好好看一下 ht

    2026年3月18日
    2
  • mysql修改字段的名称类型_MySQL修改字段名和字段数据类型

    mysql修改字段的名称类型_MySQL修改字段名和字段数据类型使用 ALTERTABLE 语句可以直接修改字段名和该字段的数据类型 实例 将 itbiancheng 表中的 sex 字段改名为 stu sex 并且数据类型修改为 INT 2 操作步骤如下 1 使用 DESC 语句查看 itbiancheng 表的结构 从查询结果可以看出 itbiancheng 表中存在 sex 字段 并且数据类型为 TINYINT 1 2 执行 ALTERTABLE 语句修改 sex 字段名和数据类型

    2026年3月17日
    2
  • 解决 OpenClaw 无法自动推送的方法:从踩坑到落地的完整指南

    解决 OpenClaw 无法自动推送的方法:从踩坑到落地的完整指南

    2026年3月13日
    2
  • wireshark 无法解密tls_用Wireshark轻松解密TLS浏览器流量

    wireshark 无法解密tls_用Wireshark轻松解密TLS浏览器流量用 Wireshark 轻松解密 TLS 浏览器流量 2015 02 1319 37 17 阅读 0 次概述 引言大多搞 IT 的人多少知道点 Wireshark 它是一款浏览分析器 可以帮助你知道有多少网络在运行 诊断网络问题等等 Wireshark 运行的一个问题是它无法轻易地分析出加密流量 如 TLS 之前你只要有密钥 将它们输入 Wireshark 就可以解密流量 但只有在密钥交换机制使用 RSA 时才能起作用 随着使

    2026年3月18日
    1

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号