Kettle工具的基本使用[通俗易懂]

Kettle工具的基本使用[通俗易懂]2.1Kettle简介2.1.1Kettle概述Kettle是国外免费的开源轻量级ETL工具,是基于Java语言开发的,可以在Windows.Linux,UNIX系统上运行,且绿色不需安装,可用于各种数据库之间的连接。Kettle工具主要有四个组件组成,分别是Spoon,Pan,Kitchen以及Carte组件,具体功能如下:*Spoon为集成开发软件,用于构建作业和转换,执行或调试作业和转换,还可以用于监控ETL操作性能。*Pan以命令行形式执行Spoon生成的转…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

2.1 Kettle简介

  2.1.1 Kettle概述

 Kettle是国外免费的开源轻量级ETL工具,是基于Java语言开发的,可以在Windows.Linux,UNIX系统上运行,且绿色不需安装,可用于各种数据库之间的连接。

Kettle工具主要有四个组件组成,分别是Spoon,Pan,Kitchen以及Carte组件,具体功能如下:      *Spoon为集成开发软件,用于构建作业和转换,执行或调试作业和转换,还可以用于监控ETL操作性能。

  *Pan以命令行形式执行Spoon生成的转换程序。

  *Kitchen以命令行的方式执行Spoon生成的作业程序

  *Carte是一个重要组件,是基于Jetty的轻量级HTTP服务器,主要用于监控HTTP执行作业和转换的进度。

 2.1.2Kettle设计原则:易于开发,避免自定义开发,所有用户都可以通过用户界面完成,无命名限制,透明,灵活的数据通道,只映射需要映射的字段。

2.2 Kettle的下载安装

1、Kettle官网的下载地址为:http://sourceforge.net/projects/pentaho/files/Data%20Integration/,在官网下载安装包。

  2、解压文件,执行spoon.bat。

  3、配置Kettle(在网上搜索即有详细的引导步骤)。

  4、启动Kettle。

2.3 Kettle的基本概念

Kettle工具的执行分为两个层次,即转换和作业,这两个层次的主要区别在于数据传递和执行方式。具体如下图:

Kettle工具的基本使用[通俗易懂]

  2.3.1转换

转换是ETL方法解决中重要部分之一,主要用于数据抽取,转换和加载等等,其本质是一组图形化的数据转换配置逻辑结构。包括读取文件,过滤输出行,数据清洗或将数据加载到数据库中等步骤,转换中的步骤是通过跳连接的。下图为Kettle转换示例:

Kettle工具的基本使用[通俗易懂]

 以上转换示例是实现从数据库中读取数据,并把数据写到文本文件中,该转换包含了步骤,跳,注释以及数据行,具体介绍如下;

 1.步骤:转换中的基本组成部分,也可称之为控件,以图标的方式呈现。

       特性:每个步骤必须要有一个名字且这个名字在转换范围内唯一;

                 每个步骤都可以读,写数据行,生成步骤除外,该步骤只用于写数据;

                 步骤通过输入跳接收数据;

                 大多数步骤都有多个输出跳,一个步骤的数据发送可以设置为轮流发送和复制发送;

                在运行转换时,一个线程运行一个步骤和步骤的多个副本,所有步骤的线程几乎同时运          行,数据行就会连续流过步骤之间的跳。

2.跳:数据的通道,应用于连接两个步骤,实现将元数据从一个步骤传递到另一个步骤,支持分发和复制等方式。

    注:由于每个步骤都是单独的线程,当启动转换时,每个步骤都会创建各自的线程并接收和推送数据(这样并发程序最高),所以数据处理的顺序并不是按照节点连接箭头的顺序执行的。由于转换里的步骤都依赖于前一个步骤获取字段值,因此当创建新跳时,在转换里不能循环进行。

3.注释:以文本描述的方式呈现在作业中,只为增强流程的可读性,可放在任何一个位置。(注释并不参与程序的处理)

4.数据行:数据是以数据行形式沿着步骤流动。一个数据行是从零到多个字段的集合。Kettle中字段的数据类型一共有10种,具体见下图:

Kettle工具的基本使用[通俗易懂]

2.3.2 作业

一个作业包含一个或多个作业项,且都是按照某种顺序进行执行的。下图为一个作业示例:

 Kettle工具的基本使用[通俗易懂]

 该作业中包含了作业项,作业跳以及多路径和回溯,具体介绍如下:

1.作业项:作业的基本构成部分,也可称之为控件。

    注:作业项可以进行复制;作业项可以传递一个结果对象;作业项目是以串行方式执行的。

2.作业跳作业项之间的连接线,定义了作业的执行路径。

3.多路径和回溯:Kettle使用一种回溯算法执行作业里的所有作业项,且作业项的执行结果(真/假)决定执行的路径。

4.作业项结果

2.4 Kettle的基本功能

  2.4.1转换管理

   主要包括输入,输出,转换,应用,流程,脚本,查询,连接,检验,作业,映射,批量加载等功能。转换功能常用控件如下图所示:

Kettle工具的基本使用[通俗易懂]

Kettle工具的基本使用[通俗易懂] 2.4.2 作业管理

主要包括通用,邮件,文件管理,条件,脚本,批量加载等。下图描述Kettle作业常用功能的控件:

Kettle工具的基本使用[通俗易懂]

 Kettle工具的基本使用[通俗易懂]

2.4.3 数据库连接

数据库种类多,因此Kettle工具的数据库连接窗口包含多种数据库类型,具体如下图所示: 

 Kettle工具的基本使用[通俗易懂]

                                              一般标签界面

Kettle工具的基本使用[通俗易懂]

高级标签界面

 Kettle工具的基本使用[通俗易懂]

选项页面

 Kettle工具的基本使用[通俗易懂]

连接池页面

 Kettle工具的基本使用[通俗易懂]

 集群页面

注:本文为学习《数据清洗》——黑马程序员   后的学习笔记。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/181193.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • 逻辑漏洞之密码找回漏洞(semcms)「建议收藏」

    逻辑漏洞之密码找回漏洞(semcms)「建议收藏」目录什么是密码找回漏洞一般流程可能产生该漏洞的情况脑洞图1.用户凭证暴力破解2.返回凭证3.邮箱弱token4.用户凭证有效性5.重新绑定6.服务器验证7.用户身份验证8.找回步骤9.本地验证10.注入11.Token生成12.注册覆盖13.session覆盖演示暴破验证码找回密码更改id号修改admin密码靶场cms下载什么是密码找回漏洞利用漏洞修改他人帐号密码,甚至修改管理员的密码。一般流程1首先尝试正常找回密码流程,选择不同的找回方式,记录所有数据包2分析数据包,找到敏感部分3

    2022年4月30日
    72
  • 婴儿照片大全可爱萌萌_好萌图片

    婴儿照片大全可爱萌萌_好萌图片萌翻了!这是一组可爱的婴儿照片,你可以从中学习到优秀的婴儿照片拍摄技术。就像我以前说的,婴儿总是持续在运动,因此很难找到一个好的角度。拍摄的时候,试着和婴儿保持同一水平,使用长de焦距。特别在最初几

    2022年8月4日
    5
  • 测试用例的设计方法:等价类划分法[通俗易懂]

    测试用例的设计方法:等价类划分法[通俗易懂]欢迎大家关注我的个人公众号:小朱谈软件测试,全是干货哦。测试用例的设计方法对测试人员来说,非常重要,在工作中,确实会用到。测试用例设计的越全面,线上问题肯定越少,合理地运用这些设计方法,可以减少冗余用例,提高测试效率和覆盖率。常见测试用例的设计方法有八种,下图中标红的是需要掌握的。优先级从等价类划分法,边界值分析法方向排序。每种设计方法,我都会分析,今天我们先一起看看什么是等价类划分法。等价类划分法:官方定义:将程序所有可能的输入数据…

    2022年10月18日
    0
  • S3C2440 LED驱动总结

    S3C2440 LED驱动总结1.电路图2.使用说明此驱动实现二种操作模式: 普通操作模式:./LedTest<led1/led2/led3><on/off> 点亮或熄灭某个LED灯 掩码操作模式:./LedTestled_mask led_mask只能是:000、001、010、011….111 可以同时设置三个LED,对应1位置的LED被点亮,对应0位置熄灭…

    2022年5月12日
    57
  • c语言学生成绩管理系统(c语言链表实现学生管理系统)

    本代码供读者学习使用,请不要随意转载。一、设计题目:学生成绩管理系统二、目的与要求每位学生记录包含有学号、姓名、性别、出生日期、三门功课的成绩(高等数学、大学英语、C语言)、总分和平均分系统菜单:(1)录入学生记录(2)添加学生记录(3)删除学生记录(4)修改学生记录(要求输入密码)(5)查找学生记录(按学号、按姓名)(6)按总分对记录进行降序排列…

    2022年4月9日
    150
  • 个人能不能开发ctp期货交易_什么是程序化交易期货

    个人能不能开发ctp期货交易_什么是程序化交易期货接触CTP也才半年多,一边学习一边摸索,看到各大CTP的QQ群里,也都是在问一些很菜的问题,就简单总结和介绍下,今天主要是基础知识,即CTP程序的基础和开源的Demo版本:CTP交易接口是由::::::上海期货信息技术有限公司::::::开发的,提供C++的接口,网上也有很多C++的Demo版本,可以直接使用。1:上期所的接口为两个.dll、两个.lib和四个.h文件,初学者可以不要C

    2022年10月8日
    0

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号