Advanced & Predictive: Potential & Herausforderungen der Datenanalyse

by Jannik
3 Monaten ago
308 Views

Advanced & Predictive Analytics – Potenziale und Prozesse

Advanced Analytics ist die autonome oder teilautonome Untersuchung von Daten oder Inhalten mit ausgefeilten Techniken und Tools, typischerweise jenseits der traditionellen Business Intelligence (BI), um tiefere Einblicke zu gewinnen, Vorhersagen zu treffen oder Empfehlungen zu generieren. Zu diesem fortschrittlichen Analyseverfahren gehören unter anderem Data-Mining Verfahren, Machine Learning Prozesse, neuronale Netze und Predictive Analytics.

Anwendungsgebiete von Advanced & Predictive Analytics

Advanced Analytics beschreibt Datenanalysen, die über einfache mathematische Berechnungen wie Summen und Durchschnittswerte oder Filtern und Sortieren hinausgehen. Diese fortgeschrittenen Analysen verwenden mathematische und statistische Formeln und Algorithmen, um neue Informationen zu generieren, Muster zu erkennen und Trends festzustellen. Ebenfalls spielt das Thema Machine Learning eine zentrale Rolle innerhalb der Advanced Analytics. Typische Anwendungsgebiete von Advanced Analytics sind:

  • Segmentierung (Erstellung von Gruppen basierend auf Ähnlichkeiten)
  • Assoziation (Feststellung der Häufigkeit gemeinsamer Vorkommnisse)
  • Klassifikation (z.B. von bisher nicht eingeordneten Elementen)
  • Korrelationsanalyse (Identifizierung von Beziehungen)

Predictive Analytics konzentrieren sich auf die Identifizierung zukünftiger Ereignisse mit ihren jeweiligen Wahrscheinlichkeiten. Dabei werden vor allem historische Daten verwendet, um ein mathematisches Modell zu erstellen, mit dem Trends erfasst werden. Dieses Modell wird anschließend auf aktuelle Daten angewendet, um Aussagen über zukünftige Ereignisse zu treffen. Es gibt eine Vielzahl an möglichen Anwendungsfällen für Predictive Analytics:

  • Luft-/Raumfahrt – Zustandsüberwachung von Triebwerken und anderen wichtigen Maschinenteilen
  • Energieproduktion – Vorhersage von Strombedarf und -preis
  • Finanzdienstleistung – Vorhersage von Kreditrisiken
  • Maschinenbau & Automatisierung – Vorhersage von Ausfällen
  • Medizin – Mustererkennungsalgorithmen zur Erkennung von Krankheiten
  • Automobilbranche – Entwicklung von Fahrerassistenz-Algorithmen

Weitere allgemeine Beispiele sind die Erstellung von Prognosen zu Einkommen, Preisen, Umsatz, Anforderungen oder Kundennutzen, um beispielsweise Quoten von Vertragsstornierungen u.a. zu minimieren, das Überwachen und Bewerten von Social Media Aktivitäten und sogar Hilfestellungen in der Polizeiarbeit. Auch in Predictive Analytics Prozessen kommen Big Data und Machine Learning zum Tragen.

Mit Daten besser entscheiden

Workflow von Predictive Analytics

Typischer Workflow eines Predictive Analytics Prozesses
Typischer Workflow eines Predictive Analytics Prozesses

Innerhalb von Predictive Analytics Prozessen werden mathematische Modelle (prädiktive Modelle) aufgestellt, um aktuelle Trends festzustellen und daraufhin Vorhersagen über zukünftige Ereignisse zu treffen. Um solche Modelle zu erstellen, verwenden diese Prozesse Daten (auch Big Data), in Kombination mit Analysen, Statistiken und Machine-Learning Verfahren.

Solche Vorhersagen dienen dazu, die Ressourcennutzung zu optimieren, Zeit zu sparen und Kosten zu senken. Auch lassen sich optimierte Timelines für die Einführung neuer Produkte oder Dienstleistungen erstellen. Die im Prozess entwickelten Modelle sollen dazu beitragen, die gesetzten Ziele zu erreichen, bzw. zu unterstützen.

Schritt 1 – Datenimport

Zunächst werden alle relevanten Daten, die für die Vorhersage von Bedeutung sind, importiert. Dies geschieht aus verschiedenen Datenquellen wie beispielsweise Datenbanken, Webarchiven, Kalkulationstabellen oder anderen Arten von Dateien.

Schritt 2 – Datenaufbereitung

Damit die Analyse auch zu wertvollen Ergebnissen führt, müssen die importierten Daten zunächst aufbereitet werden. Dazu zählt das Bereinigen von Ausreißern, die Identifizierung fehlender Daten und das Kombinieren verschiedener Datenquellen.

Schritt 3 – Entwicklung des prädiktiven Modells

Bei der Entwicklung des prädiktiven Modells kommen oftmals Methoden des überwachten Machine Learning zum Einsatz. Überwachtes Lernen ist eine von zwei Arten des Machine Learning, bei dem eine künstliche Intelligenz einen Datensatz (den sogenannten Trainingsdatensatz) verwendet, um Hypothesen zu finden und Vorhersagen zu treffen. Der Trainingsdatensatz enthält Eingabedaten und entsprechende Reaktionswerte. Daraus soll der überwachte Lernalgorithmus ein Modell aufbauen, das Vorhersagen über die Reaktionswerte bei einem neuen Datensatz treffen kann. Die Verwendung größerer Trainingsdatensätze führt oft zu Modellen mit höherer Vorhersagekraft, die sich gut für neue Datensätze eignen.

Schritt 4 – Integration des Modells in das System

Wurde mit Hilfe der Machine-Learning Techniken ein geeignetes Modell entwickelt, muss dies nun in die Unternehmensumgebung bzw. in ein Produktionssystem implementiert werden. Dadurch werden Analysen für weitere Softwareprogramme und Geräte verfügbar wie Serveranwendungen, mobile Geräte, Webanwendungen und Enterprisesysteme.

Dieser Workflow ähnelt dem iterativen Ablauf des CRISP-DM Modells – dem CRoss-Industry Standard Process for Data Mining. Dieses branchenübergreifende Modell beschreibt den zugrunde liegenden Prozess hinter jedem Datenanalyseprojekt in sechs Phasen und wurde bereits 1996 entwickelt. Die sechs Phasen sind Business Understanding (Geschäftsverständnis), Data Understanding (Datenverständnis), Data Preparation (Datenvorbereitung), Modeling (Modellierung), Evaluation (Evaluierung) und Deployment (Bereitstellung). Innerhalb des Modelles laufen die Phasen nicht strikt nacheinander ab, sondern werden oftmals wiederholt und gewechselt.

CRISP-DM-Modell
Typischer Ablauf eines Datenprojekts (CRISP-DM Modell)

Der nächste Schritt: Prescriptive Analytics

Für Unternehmen ist nach der erfolgreichen Implementierung von Predictive Analytics oftmals die Einführung von Prescriptive Analytics das Ziel. Ergänzend zur Vorhersage-Funktion der prädiktiven Modelle geben Prescriptive Analytics darüber hinaus eine Handlungsempfehlung, wie auf bestimmte zukünftige Ereignisse am besten reagiert werden kann.

Ein Beispiel für eine präskriptive Analyse ist die Festlegung von Produktions- und Lagerbeständen, die sich mit einer vorhergesagten Nachfrage deckt. Prescriptive Analytics Verfahren ermöglichen es dabei Handlungsempfehlungen zu geben, wie viel Ware zu einzelnen Verkaufsstandorten geliefert werden sollten, um auf die entsprechende Prognose effizient zu reagieren.

Die prädiktiven Modelle werden also dahingehend erweitert, dass sie nicht nur Ereignisse vorhersagen, sondern zusätzlich Aktionen abstrahieren, damit diese Ereignisse zu optimalen Ergebnissen führen.

Unsere Leistungen im Bereich Analyse

Herausforderungen von Advanced Analytics

Die herkömmlichen BI-Reportings bilden oftmals Daten lediglich ab und visualisieren somit nur einen Ist-Zustand. Wenn der Datensatz qualitativ hochwertig ist, dann sind auch die Berichte höchstwahrscheinlich zuverlässig, da die meisten modernen BI-Umgebungen inzwischen recht ausgereift sind und ihre Reportingmethoden und -konzepte einen hohen Entwicklungsstand erreicht haben. Es gibt jedoch eine keine 100-Prozent-Garantie dafür, dass Advanced Analytics immer die gewünschten Ergebnisse liefern.

Heute stehen eine Vielzahl von Standardalgorithmen und -methoden für spezifische Anwendungsfälle (z.B. Kundenklassifizierung) zur Verfügung, und es werden ständig neue entwickelt. Die Suche nach der am besten geeigneten Lösung für einen Datensatz hängt stark von den Fähigkeiten des Benutzers und der verwendeten Software ab. Es ist jedoch auch möglich, dass Algorithmen aufgrund fehlender oder fehlerhafter Daten ausfallen. Wenn ein Advanced Analytics Prozess zeigt, dass keine Ergebnisse gefunden werden können, sollte der Prozess abgebrochen werden und die Daten neu aufgearbeitet werden.

Darüber hinaus sollten Anwender von Advanced Analytics Methoden über Kenntnisse in der Arbeit mit Wahrscheinlichkeiten verfügen. Während klassische BI-Reportings fast immer die richtigen Zahlen liefern, müssen die durch Advanced Analytics generierten Wahrscheinlichkeiten interpretiert werden. Beispielsweise muss die Qualität einer Umsatzprognose oder Kundenklassifizierung daher nicht nur für jede einzelne Analyse notiert und kommuniziert, sondern auch kontinuierlich überwacht und optimiert werden.