目录
ETL简介
ETL:extract(提取)——>transform(转换、该步可省略)——>load(装载),本篇文章将介绍企业中ETL常用工具——kettle(壶)
kettle简介:
Kettle是一款国外绿色开源免费的ETL工具,纯java编写(安装前请先配置jdk),可以在Window、Linux、Unix上运行,数据抽取高效稳定,该软件名副其实,它的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。
Kettle中有两种脚本文件,job(.kjb)和transformation(.ktr),job则完成整个工作流的控制,transformation完成针对数据的基础转换。Job和Transformation的差别:Transformation专注于数据的ETL,而Job的范围比较广,可以是Transformation,也可以是Mail、SQL、Shell、FTP等,甚至可以是另外一个Job。简而言之,job包含transformation(.kjb包含.ktr)
kettle四大家族(核心组件)
Chef(厨师):工作(job)设计工具&n