Kettle工具使用及总结

Kettle工具使用及总结Kettle工具使用及总结,kettle主要用于数据清洗,即常见ETL工具,拥有图形化界面且免费的优点。其下载包直接解压打开就能用,遇到的问题:1.连接MySQL报错:①报错:Driverclass’org.gjt.mm.mysql.Driver’couldnotbefound,makesurethe’MySQL’driver(jarfile)isinstalled.org.gjt.mm.mysql.Driver原因:没有识别

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

Kettle工具使用及总结

一、kettle安装及报错:

kettle主要用于数据清洗,即常见ETL工具,拥有图形化界面且免费的优点。其下载包直接解压打开就能用,遇到的问题:

1.连接MySQL报错:

Kettle工具使用及总结

①报错:

Driver class ‘org.gjt.mm.mysql.Driver’ could not be found, make sure the ‘MySQL’ driver (jar file) is installed.

org.gjt.mm.mysql.Driver

原因:没有识别到连接数据库的驱动jar包

解决方法:

将驱动jar包复制粘贴到data-integration\lib文件下(data-integration为kettle安装目录);重启spoon。

操作完成之后反复尝试还是报相同的错,识别不到,则说明你的kettle版本与你的驱动版本不容,无法识别。(例如我的kettle7.0无法识别mysql-connector-java-8.0.19.jar)。那么只有换版本或者换连接的数据库(这里我放弃连接MySQL,转为连接sqlserver)

②报错:

Error connecting to database: (using class org.gjt.mm.mysql.Driver)

Unknown initial character set index ‘255’ received from server. Initial client character set can be forced via the ‘characterEncoding’ property.

原因:你导入的jar包被kettle识别,但是它与你本地MySQL版本不容

解决方法:换连接驱动的jar包(因为驱动版本是跟数据库版本一致的,间接说明你的kettle与MySQL版本不容)

连接SQL server:

 Kettle工具使用及总结

连接成功:

 Kettle工具使用及总结

操作:(本案例演示csv文件拆分字段转存sqlserver数据库)

二、kettle实例

(1)建立作业,连接数据库

Kettle工具使用及总结

(2)执行sql脚本(对数据库表初始化操作)

 下面的sql脚本在sqlserver运行不出错,但在kettle就会报错(不知道为什么,所以现在我sql脚本没有写,不过想想确实还不如直接去数据库客户端里建表方便)

IF NOT EXISTS (select * from dbo.sysobjects where xtype=’U’ and Name = ‘kettle_test’)

BEGIN

CREATE TABLE kettle_test

(

kind varchar(255),

time varchar(255),

processingDepartment varchar(255),

content varchar(255)

);

END

 Kettle工具使用及总结

执行结果出错(如下图),后来我把sql语句删了,动手在数据库里建的表。

Kettle工具使用及总结

 (3)在转换1中新建一个转换;完成输入csv文件,字段切分,输出到表的操作

Kettle工具使用及总结

(这里,观察左菜单栏就会发现它的数据清洗功能)

Kettle工具使用及总结

①给转换建立数据库连接;

Kettle工具使用及总结

②进行csv文件输入:

Kettle工具使用及总结

CSV输入设置

Kettle工具使用及总结

拆分字段:

Kettle工具使用及总结

Excel输入设置

从输入组件中拖入EXCEL输入,点击设置:

(1)在弹出框中选择“表格类型”为“Excel 2007 XLSX (Apache POI)”;

(2)点击“文件或目录“后的“浏览”选择需要导入的Excel表格,点击“增加”添加至选中文件列表中;

Kettle工具使用及总结

(3)单击“工作表”,在工作表页面选择“获取工作表名称”,选择相应的“可用项目”添加至“你的选择”中;

Kettle工具使用及总结

(4)单击“字段”,在字段页面点击“获取来自头部数据的字段”,(所以Excel表格最好带有列字段列名),并可以对获取的数据字段类型进行调整,可以点击“预览记录”查看数据;

Kettle工具使用及总结

表输出设置

展开”输入”列表将”表输出”模块拖入右侧空白区域;

Kettle工具使用及总结

Kettle工具使用及总结

⑤点击文件,保存

⑥返回作业,为转换1设置:

Kettle工具使用及总结

(4)保存,执行

Kettle工具使用及总结

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。

发布者:全栈程序员-站长,转载请注明出处:https://javaforall.net/181111.html原文链接:https://javaforall.net

(0)
上一篇 2022年10月17日 上午8:36
下一篇 2022年10月17日 上午8:36


相关推荐

  • pr添加删除关键帧_pr怎么全选关键帧

    pr添加删除关键帧_pr怎么全选关键帧使用的版本依旧是PrProCC2017添加关键帧双击需要添加关键帧的素材左边指向区域双击后,区域会变大,鼠标滚轮滑动效果一样然后点击素材,在点左侧的指向区域的小点点,添加或删除关键帧点

    2022年8月3日
    12
  • Android studio安装教程(2020/11/20最新版本的安装)[通俗易懂]

    Android studio安装教程(2020/11/20最新版本的安装)[通俗易懂]最新版Androidstudio的安装教程,安装步骤详细!对于gradle下不下来以及想整一个低版本的SDK的问题进行了解答!

    2022年5月23日
    384
  • echarts中国地图 飞线 热力

    echarts中国地图 飞线 热力template divstyle width 100 height 100 padding 5px10px divid map style width 788px height 700px divid map style width 788px height 700px divstyle width 100 height 100 padding 5px10px template script importaxiosf axios importchinaf script

    2026年3月26日
    2
  • JS 5种遍历对象的方式

    JS 5种遍历对象的方式1 forinforin 循环是最基础的遍历对象的方式 它还会得到对象原型链上的属性 创建一个对象并指定其原型 bar 为原型上的属性 constobj Object create bar bar foo 为对象自身的属性 obj foo foo for letkeyinobj console log obj key foo bar 可以看到对象原型上的属性也被循环出来了在这种情况下可以使用对象的 hasOwnP

    2026年3月26日
    2
  • Labview 上位机编写

    基于kvaser的Labview上位机编写实现数据接收和发送功能传感器协议解析数据接收以及动态分析诊断服务

    2022年4月6日
    75
  • js promise的用法

    js promise的用法nbsp 在理解 promise 的使用之前 首先要理解 js 语言的运行环境是单线程的 也就是说一次只能完成一个任务 也就是一条流水线 如果有多个任务就必须排队 前面一个任务完成 再执行后面一个任务 以此类推 这与 java 的多线程环境截然不同 所以要加以区分 1 对于 js 同步和异步 在这里需要加以备注一下 我们可以简单的理解为 可以改变程序执行顺序的操作就可以看成为异步操作 其实异步和同步的差别很简单 就在于这

    2026年3月19日
    3

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注全栈程序员社区公众号