SAP hatte Anfang Oktober auf der SAP TechEd in Barcelona mit der neuen Business Technology Platform auch die SAP Data Warehouse Cloud vorgestellt. Viele Kunden waren gespannt, was sich hinter dem Begriff verbirgt und wer die Zielgruppe für ein Data Warehouse in der Cloud sein wird.
Basierend auf der SAP Cloud Platform bildet die SAP Data Warehouse Cloud einen weiteren Baustein im Konzept einer zentralisierten Cloud-Architektur, die die SAP schon länger verfolgt. Zusammen mit der SAP HANA Cloud und der SAP Analytics Cloud vereint die neue Business Technology Platform verschiedene Dienste zur Datenintegration aus heterogenen Quellen mit einem zentralen Analysewerkzeug. Dabei müssen die Daten nicht mehr zwingend in ein Business Warehouse geladen werden. Die SAP Data Warehouse Cloud kann auch nur Verbindungen zu den verschiedensten Datenquellen verwalten, ohne die Daten zentral zu sammeln. Das ist der Ansatz eines modernen Data Warehouse in der Cloud.
Um einen Einblick in die neue Cloud-Lösung zu bekommen, hat SAP ein Hands-On Tutorial entwickelt, was jeder unter sapdatawarehouse.cloud für sich selbst testen kann. Es ist lediglich ein Trial Account notwendig und schon kann es losgehen. Dazu hat SAP das Tutorial in sechs Bereiche geteilt:
Wer schon ein wenig mit der SAP Cloud Platform gearbeitet hat, wird sich in der Data Warehouse Cloud schnell zurechtfinden. Auch hier muss zu Beginn ein Space angelegt werden. Ein Space definiert einen Applikationsbereich, dem Ressourcen (Speicher), User und Connections zugewiesen werden.
Da bei Teamfact eine Affinität zu Themen rund um das Fahrrad besteht, lege ich den Teamfact Bike SPACE an, um darin beispielsweise die Daten eines Bike Shops analysieren zu können.
Um Daten in die SAP Data Warehouse Cloud zu integrieren, kann ein Data Provisioning Agent zu einem HANA Service oder einer HANA native Instanz eingerichtet werden. Wer seine Daten im HANA Service der SAP Cloud Platform hat, findet hier ein gutes Tutorial wie solch ein Zugriff eingerichtet werden kann: developers.sap.com/tutorials/haas-dm-connect-sdi.html
Für diesen ersten Test sollten lokale CSV-Dateien (max. 1GB) als Datengrundlage ausreichen. Diese lassen sich einfach in den Space laden:
Nachdem die Dateien mit Verkaufs- und Kundendaten geladen wurden, geht es weiter mit der Definition des Datenmodells mit Hilfe des Tools New Graphical View. Hier lassen sich grafisch die Beziehungen zwischen den Tabellen modellieren:
Mithilfe der Projektion können wir anschließend definieren, welche Spalten mit welchem Namen dem Business zur Verfügung gestellt werden sollen. Sobald die semantische Definition abgeschlossen ist, können wir das Datenmodell für die Analyse in eine Story einbinden. Eine Story dient zur Visualisierung der Daten und ist uns bereits aus der SAP Analytics Cloud bekannt. Genaugenommen wird in der SAP Data Warehouse Cloud die SAP Analytics Cloud für die Analyse und Visualisierung genutzt:
Auf die Möglichkeiten der Datenvisualisierung mittels der SAP Analytics Cloud möchte ich hier nicht näher eingehen. Das kann in Blogbeitrag Filmdaten-Analyse mit der SAP Analytics Cloud nachgelesen werden.
Dieser erste Test hat gezeigt, dass der Ansatz vielversprechend ist. Persönlich würde ich die SAP Data Warehouse Cloud noch als "im Beta Status mit geringem Funktionsumfang" bezeichnen. Einige technische Probleme gab es im Test. Beispielsweise konnte ich bei einigen Feldern im Nachhinein den Datentyp nicht von String auf Numerisch ändern. Oder es gab die nichts aussagende Fehlermeldung "Something went wrong", wenn ich eine Story anlegen möchte. SAP zeigt mit der SAP Data Warehouse Cloud, wo der Fokus bei den Walldorfern liegt: Es geht in die Cloud. Ich bin gespannt, wann wir die ersten Kundenanfragen diesbezüglich erhalten werden. Bis dahin muss noch Einiges an Zeit und Entwicklungsarbeit in die neuen Lösungen investiert werden.