kettle下载安装使用教程

kettle下载安装使用教程Kettle简介Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行, 数据抽取高效稳定。Kettle中文名称叫水壶,该项目的主程序员MATT希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两…

大家好,又见面了,我是你们的朋友全栈君。

Kettle简介

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行, 数据抽取高效稳定。Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

1、Kettle的下载与安装(本文使用kettle版本为pdi-ce-7.1.0.0-12)点击下载地址官方网站

2、下载kettle压缩包,因kettle为绿色软件,解压缩到任意本地路径即可。然后打开Spoon.bat,如图所示:

kettle下载安装使用教程

因为,运行spoon在不同的平台上运行spoon所支持的脚本:

Spoon.bat:在Windows平台上运行spoon;

Spoon.sh:在Linux、AppleOSX、Solaris平台上运行Spoon。

kettle下载安装使用教程

kettle下载安装使用教程

 

3、初步启动和使用可能出现的问题总结

因为是纯java编写要安装jdk配置环境变量

如果启动还报错 ERROR:could not create the java virtual machine! 

不是Java虚拟出了问题,修改一下spoon.bat里内存配置: 

if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms1024m" "-Xmx2048m" "-XX:MaxPermSize=256m"

 改为:

 if "%PENTAHO_DI_JAVA_OPTIONS%"=="" set PENTAHO_DI_JAVA_OPTIONS="-Xms512m" "-Xmx1024m" "-XX:MaxPermSize=256m"

若要连接mysql数据库,需要下载mysql驱动包 不然就会报下面这种错误

kettle下载安装使用教程

Driver class’sun.jdbc.odbc.JdbcOdbcDriver’ could not be found,make sure the sun.jdbc.odbc.JdbcOdbcDriver

意思就是没有找到你的mysql驱动包,所以我们要下载该jar包

下载地址:https://dev.mysql.com/downloads/connector/j/

或者点击直接下载里面包含MySQL和Oracle驱动包

如下图点击直接下载

kettle下载安装使用教程

下载好后,解压该文件将文件夹中的mysql-connector-java-5.1.46-bin.jar文件复制到kettle所安装的E:\kettle-pdi-ce-7.1.0.0-12\data-integration\lib下即可。

4、新建转换

kettle下载安装使用教程

kettle下载安装使用教程

kettle下载安装使用教程

kettle下载安装使用教程

kettle下载安装使用教程

kettle下载安装使用教程

5、新建作业job

kettle下载安装使用教程

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/142260.html原文链接:https://javaforall.net

(0)
全栈程序员-站长的头像全栈程序员-站长


相关推荐

  • WireShark抓包后数据分析

    WireShark抓包后数据分析在分析数据之前,我们先了解一下我们传输数据的结构体系,如下图:这是两种体系,我们常知的一般都是TCP/IP体系结构。TCP/IP体系架构分析不难发现,TCP/IP体系中包含着很多我们熟悉的协议,比如说:http、smtp、https等。而我们人(使用者)是站在应用层之上的,我们想把数据上传或者说发送给别人,就要通过一些应用,如:QQ、微信、百度网盘等。然后就经过一层层加密(在数据包前加个“头”),一层层的传递。Frame层(物理层)分析这是我自己抓包的一个例子,我从我自己的QQ发了一条消息给朋友,

    2025年9月6日
    9
  • sklearn库安装_sklearn简介[通俗易懂]

    sklearn库安装_sklearn简介[通俗易懂]Scikitlearn也简称sklearn,是机器学习领域当中最知名的python模块之一。sklearn包含了很多机器学习的方式:Classification分类Regression回归Clustering非监督分类Dimensionalityreduction数据降维ModelSelection模型选择Preprocessing数据与处理使用sklea…

    2022年10月9日
    2
  • CentOS6 更换yum源的方法

    CentOS6 更换yum源的方法

    2021年6月4日
    147
  • SPSS数据分析之列联分析与卡方检验、方差分析与LSD方法【操作详解】

    SPSS数据分析之列联分析与卡方检验、方差分析与LSD方法【操作详解】关于SPSS进行数据分析时的常用方法操作详解,卡方检验、方差分析、LSD方法分析。

    2022年10月21日
    3
  • GateWay网关 – 环境搭建v2「建议收藏」

    GateWay网关 – 环境搭建v2「建议收藏」目录基础使用Maven依赖application配置Gateway整合Nacos实现服务转发Maven依赖application配置自定义TokenFilter实现参数拦截gateWay高可用集群方式基础使用Maven依赖注意:不能引入spring-cloud-starter-web,会出现错误<parent>…

    2025年11月11日
    3
  • Webgame 设计与开发之内容简介

    Webgame 设计与开发之内容简介Webgame设计与开发之内容简介内容简介      本书将webgame设计方法,编程方法,设计过程完全的结合起来,详细阐明webgame设计与开发的各个方面。本书首先介绍webgame的市场趋势,以及开发wengame所需要的主要技术,然后分成三大部分:客户端设计,服务端设计,数值设计。最后以一个完整的webgame游戏展现在读者面前。     本书结构紧凑,内容由浅入深,是学习

    2022年6月6日
    31

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号