kettle工具使用教程

kettle工具使用教程kettle工具使用教程Kettle简介Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

kettle工具使用教程

Kettle简介

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。(引用百度百科)

具体教程

原文链接

  1. Kettle的下载与安装(在本文中使用的kettle版本为6.1.0.1-196)
    kettle的最新下载地址:http://community.pentaho.com/projects/data-integration/
  2. 打开kettle。
    首先解压下载下来的压缩包如:pdi-ce-6.1.0.1-196.zip
     然后打开Spoon.bat,如图所示:
     图1
  3. 建立转换。
    在文件->新建装换。
    新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:
    图2
    建立数据库连接的过程与其他数据库管理软件连接数据库类似。
    注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。
    ps:达梦数据库配置截图
    图3
  4. 简单的数据表插入\更新
    (1)新建表插入新建表插入
    在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:
    图4
    双击拖过来的表,可以编辑表输入。
    选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。
    图5
    (2)通过插入\更新输出到表。
    在左边面板中选择核心对象、选择“输出->插入\更新”如图所示:
    图6
    编辑插入更新:
      首先:表输入连接插入更新。
        选中表输入,按住shift键,拖向插入更新。
    图7
    然后:双击插入更新,编辑它。
    图8
      到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。
  5. 使用作业控制上面装换执行。
    使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。
    图9
    双击start可以编辑,可以设置执行时间等等
    图10
    点开装换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr
    图11
      最后点击运行即可。
    到这里,一个简单的通过作业调度的kettle就算做完了。

注意点

Oracle数据库历史数据同步需注意点:
表输入时,注意类型转换,不然执行同步转换步骤时会出现无效数字的情况。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/181275.html原文链接:https://javaforall.net

(0)
上一篇 2022年10月16日 下午6:16
下一篇 2022年10月16日 下午6:16


相关推荐

  • 前端缓存详解

    前端缓存详解HTTP 缓存分为 2 种 一种是强缓存 另一种是协商缓存 主要作用是可以加快资源获取速度 提升用户体验 减少网络传输 缓解服务端的压力 这是缓存运作的一个整体流程图 强缓存不需要发送请求到服务端 直接读取浏览器本地缓存 在 Chrome 的 Network 中显示的 HTTP 状态码是 200 在 Chrome 中 强缓存又分为 DiskCache 存放在硬盘中 和 MemoryCache 存放在内存中 存放的位置是由浏览器控制的 是否强缓存由 Expires Cache Cont

    2026年3月18日
    2
  • JsonPath文档

    JsonPath文档1.介绍本文翻译自官方文档,JsonPath表达式通常是用来路径检索或设置Json的。其表达式可以接受“dot–notation”和“bracket–notation”格式,例如$.store.book[0].title、$[‘store’][‘book’][0][‘title’]2.操作符符号 描述 $ 查询的根节点对象,用于表示一个json数据,可以是数组或对象…

    2022年6月15日
    135
  • Ajaxpro组件

    Ajaxpro组件这一篇我们来看一个开源的组件:ajaxpro。虽然这是一个比较老的组件,不过实现思想和源码还是值得我们学习的。通过上一篇的介绍,我们知道要调用页面对象的方法,就是靠反射来实现的,关键是整个处理过程,包括反射调用方法、参数映射等。ajaxpro不仅在后台帮我们实现了这个过程,在前台也封装了请求调用的方法,例如ajax的相关方法,用ajaxpro的方法就可以发送异步请求了,不需要自己封装js或者使用j…

    2022年7月12日
    18
  • lvs常用命令

    lvs常用命令lvs命令(具体参数的意思可以参看其他文章)1,查看配置ipvsadm-ln2,清空所有配置ipvsadm-Clistener添加:ipvsadm-A-t192.168.11.60:80-srr修改:ipvsadm-E-t192.168.11.60:80-swrr删除:ipvsadm-D-t192.168.11.60:80realserv…

    2022年7月23日
    26
  • DreamWeaver CS5视频教程(建站必备)

    DreamWeaver CS5视频教程(建站必备)月云网赚论坛免费分享:(建站必备)DreamWeaverCS5视频教程,学完就可以做自己想要做的网网站了。01dreamweaver教程CS5视频教程_工具栏介绍02dreamweaver教程CS5视频教程_编码工具栏03dreamweaver教程CS5视频教程_“插入”面板104dreamweaver教程CS5视频教程“插入”面板205dreamweav

    2022年6月3日
    37
  • 双因素认证解决方案

    双因素认证解决方案什么使得双因素认证方案更方便企业使用 哪些产品需要公司考虑实施 在本文中 我们将介绍由著名的双因素认证服务提供商提供的七种最合适的数据保护工具 访问网络帐户的标准过程包括输入登录详细信息 登录名和密码 这是单因素身份验证 双因素认证 2FA 是一种附加的数据保护措施 这意味着执行例行登录过程需要额外的步骤 与单一因素不同 身份验证要求用户输入密码并登录 如他们所知 以访问数据 2FA 可能需要输入

    2026年3月19日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号