kettle工具使用教程

kettle工具使用教程kettle工具使用教程Kettle简介Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

kettle工具使用教程

Kettle简介

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。(引用百度百科)

具体教程

原文链接

  1. Kettle的下载与安装(在本文中使用的kettle版本为6.1.0.1-196)
    kettle的最新下载地址:http://community.pentaho.com/projects/data-integration/
  2. 打开kettle。
    首先解压下载下来的压缩包如:pdi-ce-6.1.0.1-196.zip
     然后打开Spoon.bat,如图所示:
     图1
  3. 建立转换。
    在文件->新建装换。
    新建转换后在左边的主对象树中建立DB连接用以连接数据库。如图所示:
    图2
    建立数据库连接的过程与其他数据库管理软件连接数据库类似。
    注意:在数据库链接的过程中,可能会报某个数据库连接找不到的异常。那是因为你没有对应的数据库链接驱动,请下载对应驱动后,放入kettle的lib文件夹。
    ps:达梦数据库配置截图
    图3
  4. 简单的数据表插入\更新
    (1)新建表插入新建表插入
    在左边的面板中选择“核心对象”,在核心对象里面选择“输入->表输入”,用鼠标拖动到右边面板。如图所示:
    图4
    双击拖过来的表,可以编辑表输入。
    选择数据库连接和编辑sql语句,在这一步可以点击预览,查看自己是否连接正确。
    图5
    (2)通过插入\更新输出到表。
    在左边面板中选择核心对象、选择“输出->插入\更新”如图所示:
    图6
    编辑插入更新:
      首先:表输入连接插入更新。
        选中表输入,按住shift键,拖向插入更新。
    图7
    然后:双击插入更新,编辑它。
    图8
      到这里基本上,这个转换就要做完了,可以点击运行查看效果,看是否有误,这个要先保存了才能运行,可以随意保存到任何一个地方。
  5. 使用作业控制上面装换执行。
    使用作业可以定时或周期性的执行转换,新建一个作业。并从左边面板拖入start 和转换。
    图9
    双击start可以编辑,可以设置执行时间等等
    图10
    点开装换,可以设置需要执行的转换任务,比如可以执行上面我们做的转换,XXX.ktr
    图11
      最后点击运行即可。
    到这里,一个简单的通过作业调度的kettle就算做完了。

注意点

Oracle数据库历史数据同步需注意点:
表输入时,注意类型转换,不然执行同步转换步骤时会出现无效数字的情况。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/181275.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • python开发h5页面_大数据和python有关吗

    python开发h5页面_大数据和python有关吗文章目录前言HDF与h5简介数据组织方式HDFView下载与安装在WIN10系统安装后打开出现黑框闪退的解决方法python对h5文件的操作批量制作h5文件h5文件的提取,另存为nii文件前言一般来说,深度学习的训练数据和训练后的参数都会保存为h5格式文件,对于训练数据来说,深度学习中当训练大量数据时,如果从硬盘中加载再预处理,再传递进网络,这是一个非常耗时的过程。其中从硬盘中读取图片会花费大量时间,更可行在方法是将其存在单个文件中,如h5文件。那么h5文件对于深度学习训练具有什么优势呢?可以支持

    2022年9月4日
    2
  • nacicat15激活码_通用破解码

    nacicat15激活码_通用破解码,https://javaforall.net/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

    2022年3月17日
    95
  • 振动与频谱分析_10频震动什么意思

    振动与频谱分析_10频震动什么意思

    2022年10月15日
    0
  • 计算机程序的构造和解释——笔记(一)

    计算机程序的构造和解释——笔记(一)

    2021年7月9日
    67
  • 【推荐】mysql联合 索引(复合索引)的探讨

    【推荐】mysql联合 索引(复合索引)的探讨 Mysql联合索引(复合索引)的使用原则 命名规则:表名_字段名需要加索引的字段,要在where条件中。 数据量少的字段不需要加索引。最窄的字段放在键的左边。 如果where条件中是OR关系,必须所有的or条件都必须是独立索引,否则加索引不起作用。见:mysql关于or的索引问题 最左匹配原则。 只要列中包含有NULL值都将不会被包含在索引中,复合索引中只要有一列含有NULL…

    2022年5月18日
    58
  • lcd1602使用手册_lcd液晶屏工作原理

    lcd1602使用手册_lcd液晶屏工作原理1602液晶也叫1602字符型液晶,它是一种专门用来显示字母、数字、符号等的点阵型液晶模块。1602LCD是指显示的内容为16X2,即可以显示两行,每行16个字符液晶模块(显示字符和数字)。lcd1602引脚状态字的说明:RAM映射地址:控制接口的时序:1.读的时序2.写的时序3.时序的相关参数读状态:RS=L,R/W=H,EN=H读数据:RS=H,…

    2022年9月23日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号