kettle的基本文件有两种,分别是转换与作业,转换中包含基本的数据操作逻辑,包含数据的读取,加工与插入。
作业包含了转换是将多个转换汇总的文件。
转换是由控件堆积出来的,控件的种类很多。每种都有自己的作用,这里介绍最常用的表输入与表输出。
表输入是读取关系型数据库数据使用的控件,可以选择数据源,并编写sql。将根据sql内容查询数据。
表输出是将之前步骤(如表输入)中获取的数据插入关系型数据库的控件,也需要配置数据库连接并其中最关键的部分是指定获取的数据与目标数据库之间字段的对应关系。
在配置的数据源是目标数据源时为了提高效率应在编辑界面添加三个选项,插入效率可以提升十倍左右
| rewriteBatchedStatements |TRUE |
|useServerPrepStmts | FALSE|
|useCompression | TRUE |
MySql 的批量操作,要加rewriteBatchedStatements参数
useCompression :与服务器进行通信时采用zlib压缩(真/假)? 默认值为“假”。
useServerPrepStmts:如果服务器支持,是否使用服务器端预处理语句? 默认值为“真”。
因篇幅问题不能全部显示,请点此查看更多更全内容