Kettle-Grundlagen
Zielsetzung
Das Anwendungsspektrum vom OpenSource-Werkzeug zum Datenmanagement Kettle / Pentaho Data Integration reicht vom Kopieren einzelner Daten zwischen zwei Quellen bis zum professionellen "Data Warehousing". Für diesen Zweck bietet das Werkzeug eine mächtige Funktionalität und graphische Oberfläche. Die Nutzung des Werkzeugs wird unten anhand von praktischen Beispielen aus der Hochschulverwaltung vorgestellt.
Geschichte von Kettle
Zeitpunkt |
Was passierte... |
Sommer 2001 |
Der Belgier Matt Casters gründet eigenes Unternehmen als BI-Consultant |
Ab 2003 |
Start der Arbeiten an Kettle. Ursprünglich war geplant, Kettle als KDE-Anwendung zu implementieren, daher der Name KDE Extraction, Transportation, Transformation and Loading Environment. |
2004 |
Kettle Version 1.2 mit SWT statt AWT. Das belgische Verkehrszentrum setzt Kettle ein |
2005 |
Kettle 2.0 wird veröffentlicht, mit Plugin-Architektur und SAP-Plugin. Matt Casters stellt Kettle unter OpenSource-Lizenz. In der ersten Woche hat Kettle 35.000 Downloads |
2006 |
Pentaho wechselt von Octopus zu Kettle, Matt Casters wird angestellt. Kettle wird zu PDI (Pentaho Data Integration) |
2010 |
Kettle / PDI 4.0 Release |
2015 | Pentaho wurde von Hitachi Data Systems aufgekauft. |
2022 | Der Kettle Fork "hop" wird ein Top-Level Produkt der Apache Foundation. |
Wir sehen dass die Software eine "bewegte" Geschichte hat. Durch die ganzen Namensänderungen bleiben wir erstmal beim Namen "kettle". Weitere Details siehe Wikipedia-Eintrag.
Alternativen
Eine Übersicht finden Sie auf Wikipedia:
Kommerzielle Produkte im DWH-Bereich:
- IBM InfoSphere
- Informatica
OSS-Tools
- Talend
- PDI / Kettle
- Octopus
Installation und Einrichtung
Voraussetzungen
- Kettle läuft unter Windows und Linux bzw. anderen Systemen mit Java Runtime
- Derzeit wird Java 1.8 vorausgesetzt, und zwar nur genau diese Version. Ältere Java Versionen und Java 11 oder höher werden derzeit nicht unterstützt.
Entgegen der Dokumentation funktioniert auch ein Open Source Java, z.B. openjdk, Sie müssen nicht Oracle Java nehmen.
Download und Installation
Kettle oder PDI (Pentaho Date Integration) steht unter Apache License V.2.0.
- Es gibt einen Community Bereich bei Hitachi, wo Sie die Software nach Registrierung herunterladen können: https://community.hitachivantara.com/home
- Einen Download ohne Registrierung erhalten Sie auch
- auf Sourceforge: https://sourceforge.net/projects/pentaho/
- auf github: https://github.com/pentaho/pentaho-kettle (nur Quellcode)