Mit der SAP Analytics Cloud (kurz: SAC) lassen sich nicht nur Geschäftsdaten analysieren, sondern das Self-Service-Analyse-Werkzeug eignet für sämtliche Anwendungsfälle, in denen Daten generiert und analysiert werden müssen. Einer der populärsten Einsätze in der jüngeren Vergangenheit war sicherlich in Kombination mit dem SAP-eigenen Modul SAP Sports One bei der Fußballweltmeisterschaft: Die Deutsche Nationalmannschaft nutzte die analytischen Funktionen, um die Leistungsdaten der Spieler und Spiele in ?högschter? Auflösung zu analysieren und Rückschlüsse zu erhalten. Dass die gewonnen Erkenntnisse bei der letzten Weltmeisterschaft dann doch nicht zur erhofften Titelverteidigung geführt haben, soll an dieser Stelle jedoch komplett auf andere Faktoren geschoben werden (siehe die ausufernde mediale Berichterstattung).

Da für uns als SAP BI-Berater die SAC natürlich von hohem Interesse ist, haben wir uns den aktuellen Stand des Tools auf einer unserer letzten Expert Communication Days im Rahmen eines Weiterbildungs-Workshops genauer angesehen. Für unsere Lernzwecke wollten wir dazu ein möglichst illustratives Thema aussuchen. Und da für die Performance-Analyse der Nationalmannschaft aufgrund des frühzeitigen Ausscheidens nur wenige Daten zur Verfügung standen, haben wir uns einen alternativen gut zugänglichen Anwendungsfall ausgesucht: die Analyse von Filmdaten. 

Auf www.kaggle.com haben wir uns dafür einen Datensatz heruntergeladen, welcher ca. 45.000 Filme inklusive Einspielergebnis und Kosten, die zugehörigen Schauspieler und Crew-Mitglieder, die Drehorte, die Keywords und die Bewertungen (Anzahl und Durchschnitt) enthält. Weiterhin ließen sich von der offiziellen Oscar-Website die Oscar-Gewinner extrahieren und mit den Filmdaten in Verbindung setzen.

Mit den Daten an der Hand, durfte nun jeder loslegen und musste sich zu folgender Fragestellung Gedanken machen:

Ihr wollt einen Film drehen und sucht Investoren, die euren Traum finanzieren. Was für einen Film wollt ihr drehen (und mit wem, wo, etc.) und wie genau begründet ihr eure Entscheidung.

Ganz dem BI-Ansatz folgend wollten wir also nicht aus dem Bauch heraus (oder nach Vorlieben) entscheiden, sondern evidenzbasiert die Daten nutzen, um zu lernen, wie wir Geld für einen echten Blockbuster bekommen könnten, um letztlich potenziell einen hohen Gewinn zu erzielen. Ganz nebenbei ließen sich dabei auch die neuesten Features der SAC an einem "realen" Projekt testen.
Da das Themengebiet sehr offen gewählt war, konnte jeder Mitarbeiter seine eigenen Ideen frei einbringen. In Folgendem möchte ich kurz meine Idee vorstellen und erläutern. Und um beim Thema Film zu bleiben, ist hier der Cliffhanger: Wer wissen möchte, ob ich zum Schluss den Zuschlag erhalten habe, muss den Artikel nun auch weiterlesen. 

Was ist Kaggle?

Kaggle (www.kaggle.com) ist eine Website, auf der Unternehmen und Privatpersonen Data Science-Projekte veröffentlichen können. Insbesondere bei Unternehmen (z.B. Google, Mercedes) sind diese oft mit einem Preisgeld versehen und stellen echte analytische Fragestellungen der Unternehmen dar. Jeder registrierte Nutzer hat dann die Möglichkeit, an diesen in Form einer "Competition" teilzunehmen und seine Lösung einzureichen. Die Auswahl der verwendeten Werkzeuge ist dabei frei.

Modelle, Stories und Digital Boardrooms

Bevor ich in die Analyse einsteige, möchte ich erstmal drei (der vielen) grundlegenden Elemente beim Arbeiten mit der SAC knapp vorstellen:

Modelle

Die Modelle sind die Datenbasis, auf denen die Analysen erstellt werden, und beschreiben die Struktur der Daten. Modelle können unterschiedlich mit Daten versorgt werden: Neben der Live-Abfrage aus bestehenden (SAP-)Systemen können die Daten auch direkt in ein Modell hochgeladen und in der SAC gespeichert werden.
Da wir unsere Film-Daten im CSV-Dateiformat vorliegen hatten, standen sie uns nach dem Hochladen dann direkt für die Analyse zur Verfügung.

Stories

In Stories hat man die Möglichkeit, die Daten visuell aufzubereiten und zu analysieren. Um seine Story mit grafischen Elementen zu unterstützen, kann man hier auf Tabellen und diverse Chart-Typen zurückgreifen. Diese lassen sich in vielen Details konfigurieren und man kann so die Darstellung im Hinblick auf die Aussage optimieren. 
Für unseren Workshop wurden von jedem Mitarbeiter Stories angelegt, die jeweils ein Teil der Geschichte der Daten erzählen sollten.

Digital Boardroom

Hat man seine Analysen erst einmal in einzelnen Stories erstellt, so will man diese natürlich auch optimal präsentieren. Hier bietet die SAC die Möglichkeit, so genannte Digital Boardrooms zu erstellen. In einem Boardroom kann man seine Stories importieren und einem Erzählpfad folgend zu einer Präsentation zusammenfassen.

Um meine Idee zu präsentieren, habe ich folgenden Boardroom erstellt:
Als erstes habe ich mir die erfolgreichsten Filme und deren angeschaut, um einen ersten Überblick zu gewinnen. Danach habe ich mir nicht monetäre Kennzahlen angeschaut und inwieweit sie Auswirkungen auf den finanziellen Erfolg eines Filmes haben. Auf Basis dieser Erkenntnisse habe ich dann in den einzelnen Kategorien ausgelotet, welche einzelnen Faktoren für einen finanziell erfolgreichen Film herangezogen werden sollten.

Umsatz, Budget und Return on Investment

Im ersten Teil meiner Präsentation habe ich mich mit den Umsätzen beschäftigt. Auf den ersten Blick sieht man in folgendem Chart, dass die großen Blockbuster Avatar, Star Wars: The Force Awakens und Titanic durch einen enorm hohen Umsatz (Revenue) auffallen. Wenn man aber den Umsatz ins Verhältnis zu den Kosten setzt (und damit die prozentuale Abweichung berechnet), stechen auch zwei andere Filme heraus: Die Minions und der letzte Teil der Herr der Ringe-Saga haben das zehnfache Ihrer Kosten eingespielt.
Die gewonnenen Erkenntnisse für meine spätere Auswahl halten sich in Grenzen, aber dennoch interessant zu sehen, welche Filme mein künftiger Blockbuster aus den Top 20 verdrängen wird.

Bewertungen und Oscars

Während soweit finanzieller Erfolg wichtig war, soll auch dem nicht betriebswirtschaftlichen Ansatz des Themas Genüge getan werden. Erfolg kann man neben an Geld auch an Anerkennung - zum Beispiel in Form von Oscar-Awards - messen. Wie das folgende Punktdiagramm zeigt, können auch beide Erfolgskriterien miteinander kombiniert werden. Die Frage, die durch das Schaubild geklärt werden soll, ist, ob ein Zusammenhang zwischen den gewonnen Oscars und den erzielten Gewinnen besteht. Idealerweise könnte ich so zwei Fliegen mit einer Klappe schlagen und beide Erfolgskriterien abdecken.

Bei dem Vergleich der 20 finanziell erfolgreichsten Filme und den Oscars fällt jedoch auf, dass es zwar einige finanziell erfolgreiche Filme gibt, die Oscars gewonnen haben, jedoch lediglich zwei Filme mit einer sehr hohen Anzahl an Oscars herausstechen (Titanic und Lord of The Rings: The Return of the King). Daraus schließe ich, dass ich mich erst einmal um einen finanziell erfolgreichen Film kümmern sollte. Dies scheint darüber hinaus auch planbarer zu sein. Ohnehin bin ich recht zuversichtlich, dass mein künstlerisches Talent Anerkennung finden wird, und mein zukünftiger Film mit Oscars ausgezeichnet werden wird. 

Eine weitere Definition von Erfolg könnte auch die Zuschauerbeliebtheit sein. Hierzu finden sich in den Daten die durchschnittliche Zuschauerbewertung der Filme bei IMDb. Erstaunlich an den Daten ist, dass die Bewertung eigentlich von 1 bis 10 geht und die aufgeführten Top 20 mit ihren Durchschnittsbewertungen deutlich darüber liegen.

Hier liegt anscheinend ein Datenqualitätsproblem in den Daten von Kaggle vor. Und wenn man sich die Top 20-Filme so ansieht, dann scheint es da ein Muster in der Bewertungsverfälschung zu geben... welches zudem auf einen (für mich) fragwürdigen Filmgeschmack hindeutet.

Nach meinen Analysen musste ich jetzt für mich entscheiden, was für mich einen erfolgreichen Film ausmacht. Da mein Ziel war, Geld für einen Film zu bekommen und ich so schon eher über Geld nachgedacht habe, habe ich mich gegen die Anerkennung von Kritikern und Publikum und für den Gewinn Erfolgskriterium entschieden. Daher habe ich mir im nächsten Schritt die vorhandenen Daten angeschaut und bin die einzelnen Kategorien des Filmes durchgegangen. Die Kategorien, die ich aus den Daten entnehmen konnte, waren:

  • Produktionsland
  • Genre
  • Regisseur
  • Schauspieler
  • inhaltliche Ausgestaltung.

Produktionsland

Um zu sehen, in welchem Land die erfolgreichsten Filme gedreht wurden, ist die Darstellung einer GeoMap sinnvoll, welche die Daten auf einer Landkarte visualisiert. Leider besitzt die GeoMap-Komponente in der SAC noch die Einschränkung, dass keine verknüpften Modelle zusammen analysiert werden können. Und da Umsatz und Produktionsland in zwei unterschiedlichen Modellen gespeichert waren, konnte man nur darstellen, wie viele Filme pro Land gedreht wurden.
Hier ist auf den ersten Blick erkennbar, dass die mit weitem Abstand meisten Filme in den USA gedreht wurden. Mein Film wird also schon einmal in den USA gedreht.

Genre

Genres gibt es viele und eine Auswahl gibt dem Film natürlich ein enges Korsett vor. Deswegen muss die Auswahl hier gut gewählt sein. Die folgende Visualisierung als Treemap zeigt, dass die größten Umsätze mit Action und Adventure-Filmen erzielt wurden: Mein Film wird also ein Action-Adventure. 

Regisseur

Die Analyse der erfolgreichsten Regisseure ergibt ein relativ eindeutiges Bild: Steven Spielberg thront über allen anderen. Für meinen erfolgreichen Film ist Steven Spielberg als Regisseur damit auch die beste Wahl. Mit den erzielten Umsätzen wird er sich sogar noch ein ganzes Stückchen weiter absetzen können.

Schauspieler

Bevor wir zu den einzelnen Schauspielern kommen, möchte ich kurz meine Gedanken zu diesem Thema ausführen: Da ich mich für ein Action-Adventure entschieden habe (und nur deshalb, nicht aus Gründen der Emanzipation), brauchen wir einen männlichen Hauptdarsteller und eine weibliche Hauptdarstellerin. Zusätzlich habe ich mich dazu entschieden, jeweils noch einen Nebendarsteller und eine Nebendarstellerin zu casten.

Männlich

An diesem Beispiel ist schön zu sehen, dass Daten zwar eine gute Basis für eine Entscheidung darstellen können, jedoch immer auch eine logische Auseinandersetzung mit einem Sachverhalt erfordern: Wenn es nach dem reinen Umsatz geht, ist Stan Lee der erfolgreichste Schauspieler aller Zeiten. Grund dafür ist, dass er in jedem Film des Marvel-Cinema-Universums einen Cameo Auftritt hatte.
Für meinen Film ist dies allerdings keine gute Idee: Stattdessen habe ich mich dafür entschieden, dass meine ideale Kombination aus Haupt- und Nebendarsteller Samuel L. Jackson und Warwick Davis darstellt

Weiblich

Bei den weiblichen Darstellern habe ich mich für Helena Bonham Carter als Hauptdarstellerin und Emma Watson als Nebendarstellerin entschieden. Da Emma Watson noch sehr jung ist, stelle ich ihr in Aussicht, in späteren Sequels aber auch die Hauptrolle übernehmen zu können. Das wird sie so nicht ausschlagen können.  

Inhaltliche Aspekte

Drehtort, Genre, Regisseur und Schauspieler stehen fest, aber worum soll es in meinem Film eigentlich gehen? Die Treemap der verwendeten Top 20 Keywords der erfolgreichsten Filme zeigt ein klares Bild: Das Suchen und Finden (find) von Leben (life) und Liebe (love) scheinen die angesagtesten Themen zu sein. Es erfordert natürlich eine gewisse Kreativität, diese in einem Action-Adventure-Film unterzubringen. Hier ist also der Abstract, der dem ausgewählten Genre treu bleibt und dabei aber möglichst viele Keywords beinhaltet:

A man and father searches for the 
love of his life and family, who have been kidnapped by a group of old friends. This action packed movie makes the hero travel to many adventurous places across the world in order to get back what he is missing every day since it's been taken away; But he only has little time to bring this story to an successful end.

Damit steht nun auch die Story.

Fazit

Im Hinblick auf die Rahmenbedingungen des Workshops lässt sich zusammenfassend sagen, dass die SAP Analytics Cloud ein einfach zu bedienendes Werkzeug ist, um Daten schnell und intuitiv zu analysieren und visualisieren. Der aktuelle Fortschritt in der Entwicklung lässt zwar hier und da noch ein wenig Luft nach oben (siehe Verweis auf die GeoMap-Komponente), aber die vorhandenen Features machen einen reifen Eindruck, der sich auch vor hauseigenen (Lumira) oder fremden Tools (Tableau) nicht verstecken muss. Und viele der Features (z. B. Planung, Predictive) haben wir gar nicht mal verwendet.

Für mich persönlich lief der Workshop leider nicht so positiv. Auch wenn für mich die Gründe nicht ersichtlich sind, konnten meine mit Fakten hinterlegten Entscheidungen und Ideen die Investoren leider nicht überzeugen. Den Zuschlag für die Investition und den dafürstehenden TEAMFACT-Oscar konnte mein Kollege Jochen abstauben. Alles Gute, Jochen und viel Erfolg mit deinem Film!
Ich bleibe dann wohl doch lieber SAP BI-Berater...