Pentaho: Von den Daten zum Online-Report
Der ETL-Prozess
Die produktiven Daten eines Unternehmens eignen sich in der Regel nicht direkt zur Erstellung von Reports. Zum einen müssen sie oft aus verschiedensten Quellen zusammengetragen werden (XLS, CSV, TXT, XML, …), zum anderen ist die Struktur von Produktiv-Datenbanken auf andere Belange hin optimiert und bietet beim Reporting daher keine gute Performance. Deshalb erstellt man vor dem eigentlichen Report erst mal ein Datawarehouse. Das ist ein Datentopf, in dem Daten in einer Struktur abgelegt werden, die die einfache und schnelle Report-Erstellung erlaubt. Um diese Aufgabe zu bewältigen benötigt man ein ETL-Werkzeug (Extrahieren, Transformieren, Laden). Die Pentaho-Werkzeugkiste enthält dafür das Programm „Pentaho Data Integration“ (PDI), früher bekannt unter dem Namen „Kettle“. Mit PDI kann man grafisch definieren, welche Daten von wo gelesen werden sollen, wie sie aufbereitet und wohin sie dann geschrieben werden. Man tut dies, indem man diverse Komponenten auf die Arbeitsfläche zieht und diese dann miteinander verbindet. Das Ergebnis nennt sich „Transformation“. In der Regel beginnt eine Transformation mit einem oder mehreren Eingabe-Komponenten (z. B. Lesen von Daten aus Datenbanken, Dateien und Online-Quellen) und endet mit einer Ausgabe-Komponente (z. B. Schreiben von Daten in eine Datenbank). Dazwischen können noch beliebige Schritte zur Aufbereitung der Daten stehen (z. B. Berechnungen, Filter, Nachschlagen weiterer Details).
Das Report-Design
Wenn das Datawarehouse steht, kann man den Pentaho Report Designer anwerfen. Hier erstellt man den Report, entweder zu Fuß oder mit Hilfe des Report-Design-Wizards. Aus dem Report Designer heraus kann man sich die Reports für den Eigenbedarf direkt erzeugen, man kann den Report aber auch von dort aus auf den BI-Server publizieren.
Die Arbeit im Report-Designer beginnt mit dem Konfigurieren der Datenquelle. Das kann zum Beispiel ein SQL-Statement sein, die daraus resultierenden Daten stehen dann für den Report zur Verfügung. Pro Report kann nur eine Datenquelle (also zum Beispiel nur ein SQL-Statement) genutzt werden. Es ist allerdings möglich, Unterreports mit anderen Datenquellen einzubinden.
Ist die Datenquelle definiert, geht es an das Layout.
Am 22. July 2010 um 00:46 Uhr
Buy:Nymphomax.Acomplia.Prozac.Advair.Buspar.Ventolin.Lipothin.Wellbutrin SR.Zocor.Zetia.Female Cialis.SleepWell.Seroquel.Aricept.Lipitor.Cozaar.Amoxicillin.Lasix.Female Pink Viagra.Benicar….