kettle下载安装使用教程

kettle下载安装使用教程Kettle简介Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行, 数据抽取高效稳定。Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两…

大家好,又见面了,我是你们的朋友全栈君。

Kettle简介

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行, 数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

1、Kettle的下载与安装(本文使用kettle版本为pdi-ce-7.1.0.0-12)点击下载地址官方网站

2、下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可。然后打开Spoon.bat,如图所示:

kettle下载安装使用教程

因为,运行spoon在不同的平台上运行spoon所支持的脚本:

Spoon.bat:在Windows平台上运行spoon;

Spoon.sh:在Linux、AppleOSX、Solaris平台上运行Spoon。

kettle下载安装使用教程

kettle下载安装使用教程

 

3、初步启动和使用可能出现的问题总结

因为是纯java编写要安装jdk配置环境变量

如果启动还报错 ERROR:could not create the java virtual machine! 

不是Java虚拟出了问题,修改一下spoon.bat里内存配置: 

if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-XX:MaxPermSize=256m"

 改为:

 if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx1024m" "-XX:MaxPermSize=256m"

若要连接mysql数据库,需要下载mysql驱动包 不然就会报下面这种错误

kettle下载安装使用教程

Driver class’sun.jdbc.odbc.JdbcOdbcDriver’ could not be found,make sure the sun.jdbc.odbc.JdbcOdbcDriver

意思就是没有找到你的mysql驱动包,所以我们要下载该jar包

下载地址:https://dev.mysql.com/downloads/connector/j/

或者点击直接下载里面包含MySQL和Oracle驱动包

如下图点击直接下载

kettle下载安装使用教程

下载好后,解压该文件将文件夹中的mysql-connector-java-5.1.46-bin.jar文件复制到kettle所安装的E:\kettle-pdi-ce-7.1.0.0-12\data-integration\lib下即可。

4、新建转换

kettle下载安装使用教程

kettle下载安装使用教程

kettle下载安装使用教程

kettle下载安装使用教程

kettle下载安装使用教程

kettle下载安装使用教程

5、新建作业job

kettle下载安装使用教程

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/142260.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • Oracle、plsql安装以及使用教程「建议收藏」

    Oracle、plsql安装以及使用教程「建议收藏」Oracle安装Oracle(11g)数据库安装详细图解教程plsql安装PLSQL下载、安装、配置、连接详细教程创建数据库注意略过关于监听配置的所有部分Oracle创建数据库实例plsql连接数据库如下所示,按照上述步骤完成安装创建之后,只需要在database前面加个127.0.0.1/你创建的数据库即可建表点击file->new->table之后根据需要创建数据库即可…

    2022年5月30日
    42
  • EVT 极值理论「建议收藏」

    EVT 极值理论「建议收藏」EV参考:http://www.360doc.com/content/10/1225/05/974066_81117880.shtml

    2025年8月19日
    3
  • AI经典案例_人工智能挑战

    AI经典案例_人工智能挑战来源:Stanford编辑:好困David「AI100」报告第二弹!本次报告评估了2016年至2021年间人工智能的发展,涵盖14大问题,探讨了人工智能发展的关键领域。主题是「人工智能在…

    2022年9月27日
    3
  • BN层理解_理解六层次总结

    BN层理解_理解六层次总结bn层计算的均值和方差是channel的输入数据是nchw,求得的均值和方差均是长度为c的向量mini-batch指的是一个batch的所有样本对应通道组合成一个minibatch,1个nchw的数据有c个mini-batch一个mini-batch在一起进行求均值和方差HW的归一化,求出NC个均值与方差,然后N个均值与方差求出一个均值与方差的Vector,size为C,即相同通道的一个mini_batch的样本求出一个mean和variance每次迭代时采用的是滑动平均方式更新,.

    2022年10月14日
    5
  • Java多线程-线程池ThreadPoolExecutor构造方法和规则

    Java多线程-线程池ThreadPoolExecutor构造方法和规则为什么用线程池博客地址http://blog.csdn.net/qq_25806863原文地址http://blog.csdn.net/qq_25806863/article/details/71126867有时候,系统需要处理非常多的执行时间很短的请求,如果每一个请求都开启一个新线程的话,系统就要不断的进行线程的创建和销毁,有时花在创建和销毁线程上的时间会比线程真正执行的时间还长。而且当线程数

    2022年7月12日
    16
  • pytest运行_ios自动清理缓存

    pytest运行_ios自动清理缓存前言pytest运行完用例之后会生成一个.pytest_cache的缓存文件夹,用于记录用例的ids和上一次失败的用例。方便我们在运行用例的时候加上–lf和–ff参数,快速运行上一

    2022年7月28日
    17

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号