kettle使用教程(超详细)

kettle使用教程(超详细)今天详细详细说一下kettle的安装,安装的版本:jdk:jdk-8u152-windows–x64kettle:KETTLE-5.4一、环境部署1、安装JDK,按默认值安装即可2、设置环境变量,如图下图具体步骤:1.右击我的电脑-属性-高级系统设置-环境变量-系统变量-新建2.变量名:JAVA_HOME3.变量值:JDK安装目录3、…

大家好,又见面了,我是你们的朋友全栈君。

今天详细详细说一下kettle 的安装,安装的版本:

jdk:jdk-8u152-windows–x64

kettle:KETTLE-5.4

一、环境部署

1、安装JDK,按默认值安装即可

2、设置环境变量,如图下图

具体步骤:
 1.右击我的电脑-属性-高级系统设置-环境变量-系统变量-新建
 2.变量名:JAVA_HOME
 3.变量值: JDK安装目录

kettle使用教程(超详细)

3、 Kettle程序打开(无需安装),如下图:

kettle使用教程(超详细)

二、资源库

1、连接开发方案,选择资源库方式,如图

kettle使用教程(超详细)

kettle使用教程(超详细)

2、录入资源库信息, 如下图:

数据库:
主机名称:
数据库名称: 
端口号: 
账号:
密码:

kettle使用教程(超详细)

3、选择并登录资源库,如下图:

账号: 

密码:

kettle使用教程(超详细)

 三、资源管理

1、文件夹建立

kettle使用教程(超详细)

kettle使用教程(超详细)

 2、配置数据库连接(数据源/数据仓库)

kettle使用教程(超详细)

四、方案开发

1、新建转换,更改转换名称,选择转换归属

kettle使用教程(超详细)

2、建立表输入


步骤:
1在组件组-输入中找到组件-表输入
2.选择数据库连接(数据源)
3.填写SQL语句,可预览结果

kettle使用教程(超详细)

3、建立表输出

步骤:
1、在组件组-输出中找到组件-表输出
2.建立表输入和表输出的连接
3.选择数据库连接(数据仓库)
4.录入目标表名,指定数据库字段
5.获取字段
6.执行SQL(建表)

kettle使用教程(超详细)

kettle使用教程(超详细)

4、建立清理SQL

*步骤:
1在组件组-脚本中找到组件-执行SQL脚本
2.选择数据库连接(数据仓库)#此处选择必须谨慎,避免清理了数据源的数据
3.填写SQL语句
4.建立与表输入的关系

kettle使用教程(超详细)

5、测试转换是否能正常工作

kettle使用教程(超详细)

6、新建作业,更改作业名称,选择作业归属

kettle使用教程(超详细)

7、添加组件

*步骤:
1在组件组-通用中找到组件-START(作业开始,用于作业调度设置)
2.在组件组-通用中找到组件-转换(如有多个可以多次添加)
3.通过引用指定转换文件
4.在组件组-通用中找到组件-成功(作业结束)
5.按执行顺序建立组件间的关系

kettle使用教程(超详细)

8、作业定时调度及测试,

kettle使用教程(超详细)

         这样就算你可以入门了,我相信在不断的探索中你会有更多的心得的。在此也要提醒一点,KETTLE的性能可能会有不稳定的情况出现,所以注意保存你已经做过的东西。

更新:

很早之前写的文章,发现大家许多人想要下载安装包,我就给大家把链接顺便也找到了

jdk下载地址:

https://www.oracle.com/cn/java/technologies/javase/javase-jdk8-downloads.html

Kettle下载地址:

Pentaho from Hitachi Vantara – Browse /Data Integration at SourceForge.net

以为这就完了,no,再附加个人网盘地址:

kettle使用教程(超详细)

kettle下载链接:

链接:https://pan.baidu.com/s/1tmFK1sdU7DDTT3YzoJVnwQ 
提取码:76yw 

点击下方链接,输入上方提取码即可
链接:https://pan.baidu.com/s/1tmFK1sdU7DDTT3YzoJVnwQ 

 

升级版本:

      最近由于需要连接clickhouse数据库,kettle目前的版本没有clickhouse驱动,所以没法连接,需要自定义插件,又重新安装了kettle的9.2版本尝试一下,应该是比较新的了所以就把资源也更新一下,希望对你有帮助的小伙伴可以点赞支持。

由于kettle的连接中暂时没有clickhouse插件,需要自己搞定,先看下官网提示:

https://help.hitachivantara.com/Documentation/Pentaho/8.1/Developer_Center/PDI/Extend/020

查找相关资料在githubs上找到源码,连接如下:

https://github.com/aaa8210/kettle2clickhouse

上面是自己查找的一些资料,下面分享安装包及插件:

kettle的9.2版本:

kettle使用教程(超详细)

百度云链接如下(包含kettle安装包、连接mysql驱动和clickhouse插件):

https://pan.baidu.com/s/1CH5wYQjAxnuvOz-C0koO2w

提取码:4sy0 

链接:https://pan.baidu.com/s/1CH5wYQjAxnuvOz-C0koO2w 
提取码:4sy0 
注:连接clickhouse版本kettle版本需要对应.

1、下载分享资源

2、解压 kettle 安装包后将驱动包里的 clickhouse-plugins文件夹复制到 kettle 的 data-integration\plugins文件夹里

kettle使用教程(超详细)

看一下clickhouse-plugins 里就是自定义的插件jar包

 kettle使用教程(超详细)

 3、复制驱动中的其余jar包

kettle使用教程(超详细)

粘贴到 kettle 的 data-integration\libswt\win64 目录下(根据自己的系统而定,我的是win64) 

 kettle使用教程(超详细)

4、启动kettle,选择新建连接就可以选择Clickhouse了kettle使用教程(超详细) 目前感觉使用还不错,虽然kettle自带调度任务,但是前提是保持kettle打开,并且作业和转换在运行状态,这个不太适用与远程服务器安装windows客户端,或者一些学习的同学可以在本地windows设置调度任务也可以,在linux上安装部署kettle并调度是一个比较合适的方法。

参考如下步骤:

运用crontab执行kettle程序
1.建立目录存放kettle文件

# mkdir /data/kettle/kettle_job // 存放作业文件

# mkdir /data/kettle/kettle_transition // 存放转换

# mkdir /data/kettle/kettle_sh // 存放执行脚本

# mkdir /data/kettle/kettle_log // 存放执行kettle产生的日志文件

将从windows上配置好的.ktr和.kjb程序分别放在transition目录和job目录下
(或linux下编写后直接保存到该目录下),注意:job中的转换对应的目录需要做相应修改

2:编写执行脚本

# cd /data/kettle/kettle_sh

# vi ceshi.sh

文本内容如下:

#!/bin/bash

#执行job程序

cd /data/kettle/data-integration

export JAVA_HOME=/usr/local/jdk1.8.0_201/

export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

export PATH=$PATH:$JAVA_HOME/bin

./kitchen.sh -file=/data/kettle/kettle_job/testjob.kjb >>/data/kettle/kettle_log/ceshi_$(date +%Y%m%d).log

注:(因为crond是个守护进程,它不归属于任何用户,虽然之前以root用户配置了java环境变量,
但是crond一样找不到java命令,所以,当crond执行kettle任务时,
需要动态设置java环境变量,否则会出现手动执行.sh没问题,放crontb里面执行后无效果)

保存ceshi.sh,执行赋予执行权限的命令
# chmod +x ceshi.sh
测试ceshi.sh是否可以正常执行
# sh -x ceshi.sh

3:设定crontab 定时执行任务

# crontab -e

*/1 * * * * /data/kettle/kettle_sh/ceshi.sh //每分钟执行一次ceshi.sh

# systemctl restart crond

# systemctl enable crond

注意:

在linux中,如果是通过图形界面执行程序的话,点击那个绿色的三角即可。
如果是命令行启动,后台执行进行进程不能中断。
因此,在linux中不推荐使用kettle里面的自动执行,使用操作系统的定时执行要稳定的多。
Windows下使用定时任务计划,linux下使用crontab。

/usr/share/java /data/java/jdk1.8.0_141/bin/java

 

这个版本使用还不错,这样做完调度在之后就可以了。 

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/142100.html原文链接:https://javaforall.net

(0)
上一篇 2022年5月24日 下午1:40
下一篇 2022年5月24日 下午1:40


相关推荐

  • 2010年度 中国WEB应用防火墙厂家和产品大全

    2010年度 中国WEB应用防火墙厂家和产品大全中国WEB应用防火墙厂商与产品大全排名依据根据“厂家名称”的首字母拼音,无特殊含义。更新日期:2010年03月23日发布网站:www.cnciso.com、www.youxia.org联系人QQ:55984512、175589438厂家名称产品名称公司网址联系电话北京绿盟科技绿盟WEB应用防火墙www.nsfocus.com400-818-6868北京瑞达时代科技有限公…

    2022年6月2日
    40
  • linux 大总结[通俗易懂]

    linux 大总结[通俗易懂]1.Linux介绍Linux内核最初只是由芬兰人林纳斯·托瓦兹(LinusTorvalds)在赫尔辛基大学上学时出于个人爱好而编写的。Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。Linux能运行主要的UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承Unix以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。目前市面上较

    2022年6月7日
    47
  • byte与word的区别_女生类型分类

    byte与word的区别_女生类型分类在Visual C++ 6.0中,BYTE与WORD,DWORD本质上都是一种无符号整型,它们在WINDEF.H中被定义,定义如下:typedef unsigned char BYTE;typedef unsigned short WORD;typedef unsigned long DWORD;也就是说BYTE是无符号的char型(char型本质上也是一…

    2022年8月18日
    6
  • 十款很不错的磁盘碎片整理工具「建议收藏」

    十款很不错的磁盘碎片整理工具「建议收藏」
    说到磁盘整理工具,应该说说磁盘碎片的定义,为什么磁盘碎片会对系统性能造成影响。首先我不是专业的电脑人员,对很专业的理论知识不懂,在这里只可以用很通俗很日常的语言来表达。其实磁盘碎片应该称为文件碎片,是因为文件被分散保存到整个磁盘的不同地方,而不是连续地保存在磁盘连续的簇中形成的。为什么这些碎片多了,会对系统性能造成影响呢?打个比方,你的房间你很久没有整理和清洁了,原本有条不紊的东西变得乱七八糟,你找起东西来自然不方便,耗时间。系统读取硬盘数据也一样,硬盘数据琐碎散落,系统读取起来就

    2022年6月25日
    205
  • InnoDB中的索引类型

    InnoDB中的索引类型InnoDB数据引擎使用B+树构造索引结构,其中的索引类型依据参与检索的字段不同可以分为主索引和非主索引;依据B+树叶子节点上真实数据的组织情况又可以分为聚族索引和非聚族索引。每一个索引B+树结构都会有一个独立的存储区域来存放,并且在需要进行检索时将这个结构加载到内存区域。真实情况是InnoDB引擎会加载索引B+树结构到内存的BufferPool区域。聚簇索引(聚集索引)聚簇索引指的是这样的数据组织结构:索引B+树的每个叶子节点直接对应了真实的DataPage。并且B+树所有的叶子节点在最底层共同描

    2022年6月1日
    38
  • halcon模板匹配快速入门

    halcon模板匹配快速入门算子 创建模板 create aniso shape model 匹配模板 find aniso shape model 例子 测试用的图像 代码 dev set draw margin read image Image C Users 斌 Desktop temp png rgb1 to gray Image GrayImage

    2026年3月19日
    2

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号