Zeitabhängige Stammdaten in SAP Datasphere

Was sind zeitabhängige Stammdaten?

Zeitabhängige Stammdaten, auch bekannt als time-dependent master data, sind Daten, die sich im Laufe der Zeit ändern können. Diese Änderungen müssen sorgfältig dokumentiert und nachvollziehbar gemacht werden, um präzise Analysen und fundierte Entscheidungen zu ermöglichen. Zu den häufigen Beispielen für solche Stammdaten gehören:

  • Kategorisierung von Produkten
  • Adressänderungen von Kunden
  • Gehaltsänderungen von Mitarbeitern    

Durch die Historisierung dieser Daten können Unternehmen fundierte Analysen durchführen und nachvollziehen, wie sich bestimmte Werte im Laufe der Zeit verändert haben.

Warum sind zeitabhängige Stammdaten wichtig?

Die Verwendung von zeitabhängigen Stammdaten ist für Unternehmen von zentraler Bedeutung, da sie eine historische Datenanalyse ermöglicht. Ohne eine gründliche Historisierung könnten wichtige Informationen verloren gehen, was zu Fehlinterpretationen und falschen Entscheidungen führen könnte. Die wichtigsten Vorteile von zeitabhängigen Stammdaten umfassen:

  • Bessere Marktanalysen: Durch die Analyse historischer Daten können Unternehmen frühzeitig Trends erkennen und besser auf Marktveränderungen reagieren.
  • Langfristige strategische Entscheidungen: Unternehmen können auf der Grundlage historischer Stammdaten fundierte Entscheidungen für die langfristige Planung treffen.
  • Nachvollziehbarkeit von Geschäftsprozessen: Alle Änderungen werden systematisch dokumentiert, was eine lückenlose Rückverfolgbarkeit der Geschäftsprozesse ermöglicht.

Häufig findet man im Kontext von Data Warehousing auch den Begriff Slowly Changing Dimensions (SCD), wenn es um zeitabhängige Stammdaten geht. Dabei muss jedoch zwischen verschiedenen Typen unterschieden werden, da nicht jeder Typ für zeitabhängige Stammdaten geeignet ist.

Arten von Slowly Changing Dimensions (SCD)

SCD-Techniken helfen dabei, Daten zu speichern und ihre Historie nachzuvollziehen. Es gibt verschiedene SCD-Typen, die sich je nach den Anforderungen eines Unternehmens unterscheiden:

  • SCD Typ 1: Überschreiben der alten Daten (keine Historie).   
CustomerID CustomerType Region
101 B2B EU

      

  • SCD Typ 2: Historisierung von Daten, indem mehrere Versionen der Daten mit Gültigkeitsdaten gespeichert werden.
CustomerID CustomerType Region Valid_From Valid_To
101 B2C EU 01.01.2020 31.12.2021
101 B2B EU 01.01.2022 31.12.9999

  • SCD Typ 3: Speicherung des vorherigen Wertes, normalerweise wird nur der vorherige Wert gespeichert.
CustomerID CurrentType PreviousType Region
101 B2B B2C EU

  • SCD Typ 4: Speicherung der Historie in einer separaten Tabelle.

                   Tabelle (aktuell)                          

CustomerID CustomerType Region
101 B2B EU

                  Tabelle (historisch) 

CustomerID CustomerType Region Valid_From Valid_To
101 B2C EU 01.01.2020 31.12.2021
101 B2B EU 01.01.2022 31.12.9999

              

 

SAP Datasphere und Zeitabhängige Stammdaten

SAP Datasphere ist eine leistungsstarke Datenplattform, die Unternehmen hilft, Daten aus verschiedenen Quellen zu integrieren, zu modellieren und in Echtzeit zu analysieren. Für die Verwaltung von zeitabhängigen Stammdaten bietet SAP Datasphere eine flexible und skalierbare Lösung.

Wie unterstützt SAP Datasphere die Verwaltung von SCD?

SAP Datasphere unterstützt die Verwaltung von Slowly Changing Dimensions (SCD), indem es Funktionen zur Versionierung und historischen Nachverfolgung von Daten bereitstellt. Insbesondere SCD Typ 2 wird eingesetzt, um Änderungen an Stammdaten nachvollziehbar zu speichern, ohne frühere Werte zu überschreiben. So können Unternehmen zeitbezogene Analysen durchführen und Datenstände aus unterschiedlichen Zeitpunkten zuverlässig vergleichen.

Best Practices für Zeitabhängige Stammdaten

Im Rahmen der Umsetzung von zeitabhängigen Stammdaten in SAP Datasphere werden wir nun die notwendigen Schritte durchgehen, die wir auf Basis unseres Entity-Relationship (ER)-Modells umsetzen werden. Dieser Artikel führt Sie durch den Prozess und zeigt, wie Sie Zeitabhängigkeit in Ihren Stammdaten effektiv integrieren können.

1. Erstellung der LT Customer Tabelle

Zu Beginn erstellen wir die Tabelle „LT Customer“, die eine Sammlung wichtiger Kundenstammdaten darstellt.

Sie beinhaltet die folgenden Attribute

Die Struktur unserer Datensätze gestaltet sich wie folgt:

2. Erstellung der LT Sales Tabelle

Als nächstes erstellen wir die Tabelle „LT Sales“, die Verkaufsdaten beinhaltet.

Diese Tabelle umfasst die Verkaufsattribute, darunter:

Zusätzlich zu den grundlegenden Verkaufsattributen fügen wir Measures (Kennzahlen) hinzu, um die Verkaufszahlen quantitativ zu analysieren und zu visualisieren.

Unsere Datensätze sehen folgendermaßen aus:

Nachdem die grundlegenden Tabellen erstellt sind, werden wir einen View entwickeln, der Joins enthält, um die Daten miteinander zu verknüpfen.

wir haben einen Input-Parameter eingeführt.

In der CSN-Annotation fügen wir die Angabe    @Semantics.businessDate.at : true  hinzu. 

Dazu haben wir in den Filteroptionen folgende Bedingung ergänzt:

Um sicherzustellen, dass alles korrekt funktioniert, erstellen wir ein Analytics Model. Dieses Modell ermöglicht uns, die erstellten Views und Daten visuell zu überprüfen und eine genaue Analyse der Zeitabhängigkeit vorzunehmen.

Der im Bild dargestellte grüne Pfeil weist auf die Drag-and-Drop-Funktion hin, die im Analytics Model verwendet wird.

Im Preview-Modus können wir die Daten für verschiedene Zeiträume betrachten und sicherstellen, dass alle Verknüpfungen korrekt sind.

Bei der Previews-Modus erscheint ein Popup, in dem wir das gewünschte Stichtagsdatum eingeben können .Zum Beispiel das heutige Datum oder ein Datum aus der Vergangenheit.

Die Daten sehen beispielsweise so aus:

Wir möchten herausfinden, wie der Customer Type vor vier Jahren aussah . also zu einem früheren Stichtag, etwa dem 26.09.2021.

Für den Kunden mit der ID 101 ergibt sich dabei folgendes Bild:

  • Am 26.09.2021 war der Customer Type noch B2C.
  • Heute hingegen ist derselbe Kunde als B2B klassifiziert.

Auf diese Weise lässt sich die zeitliche Entwicklung von Stammdaten transparent nachvollziehen.

Fazit und Ausblick

Die Umsetzung von zeitabhängigen Stammdaten in SAP Datasphere ermöglicht eine tiefere und zeitlich differenzierte Analyse Ihrer Daten. Durch die richtige Konfiguration von Views, Assoziationen und Zeitfunktionen können Unternehmen die Entwicklung ihrer Geschäftsprozesse besser nachvollziehen und fundiertere Entscheidungen treffen.

Dieser Prozess stellt sicher, dass die Stammdaten in SAP Datasphere sowohl jetzt als auch in der Zukunft immer den richtigen historischen Kontext widerspiegeln. So können Unternehmen nicht nur ihre aktuellen Daten, sondern auch historische Daten effektiv nutzen und analysieren.