Was ist ein Cloud Data Warehouse

by Philipp Kremer
5 Monaten ago
207 Views

Was ist ein Cloud Data Warehouse?

Mit zunehmender Komplexität digitaler Prozesse benötigen Unternehmen genaue Analysen und Reportings, um wichtige, erkenntnisbasierte Entscheidungen zu treffen. Gleichzeitig transformieren IoT und Cloudlösungen die Art und Weise, wie Daten gespeichert, strukturiert und abgerufen werden – zum Beispiel im Cloud Data Warehouse.

Immer öfter stellt die Integration verschiedener Datenquellen in Cloud Data Warehouses die Grundlagen notwendiger erkenntnisbasierter Entscheidungen dar. Die Informationen in diesen Cloud Data Warehouses stammen meist aus einer Kombination unterschiedlicher z.T. vernetzter Datenquellen (z. B. CRM, Produktverkäufe, Maschinendaten usw.). Cloud Data Warehouses bieten ein organisiertes Schema für diese vernetzten Daten und erleichtern dem Endbenutzer sowohl den Zugriff als auch die Interpretation dieser Informationen.

Vorteile eines Cloud Data Warehouse

Der Umstieg auf die Cloud ermöglicht es, den veränderten Charakteristika und Anforderungen an Abfrageleistungen bei großen Datenmengen gerecht werden zu können. Durch die direkte Verknüpfung von Speicher und Datenverarbeitung können traditionelle Data Warehouse-Infrastrukturen schnell veraltet und teuer werden.

Vor allem bei Peaks, in denen die Menge an anfallenden Daten deutlich über dem Durchschnitt liegt, ist eine traditionelle Data Warehouse Lösung schnell unflexible und unvorteilhaft. Mit den Möglichkeiten des Cloud Data Warehousing können Unternehmen heute horizontal skalieren, um je nach Bedarf entweder Rechen- oder Speicheranforderungen zu erfüllen. Dies hat die Besorgnis über die Verschwendung von finanziellen Ressourcen durch übermäßige Bereitstellung von Servern für die Bewältigung von Datenabfragen oder eines nur kurzfristigen Projekts erheblich verringert.

Deutliche Vorteile des Cloud Data Warehouse liegen in der Flexibilität. In der Vergangenheit mussten IT-Teams schätzen, wieviel Speicherkapazitäten für ihre Business Units bereitgestellt werden muss – oftmals mehrere Projekte und Entwicklungsstufen in die Zukunft hinein. Fehlkalkulationen waren kostenintensiv und unwiderruflich. Durch die problemlose Skalierbarkeit von Cloud Data Warehouses fehlt dieses Risiko nahezu vollständig weg.

Aufbau eines Cloud Data Warehouse

Ein schrittweiser Ansatz, bei dem Sie zunächst die einfachsten und technisch geringsten Workloads in das Cloud-basierte Data Warehouse migrieren, ist oftmals das sinnvollste Vorgehen. Variable Arbeitslasten, wie z.B. Finanzberichterstattung, sind gute Kandidaten für die Erstmigration, da sie nicht kontinuierlich Data Warehouse Ressourcen nutzen. Geschäftsfeldspezifische Workloads als Teil eines abteilungsspezifischen Data Mart sind für die Erstmigration auch gut geeignet.

Nachhaltige Workloads wie das tägliche Reporting, das taktische Geschäftsentscheidungen vorantreibt, können später migriert werden, ebenso wie geschäftskritische, prüfungsintensive Workloads. Das schrittweise Vorgehen kann Vertrauen in das Cloud Data Warehouse schaffen und die gewonnenen Erfahrungen sind für die Migration komplexerer Workloads und Anwendungsfälle vorteilhaft.

Traditionell werden ETL (Extract, Load, Transform) Werkzeuge verwendet, um Daten aus transaktionalen Systemen in ein Data Warehouse zu verschieben und zu integrieren. Im Kontext von Cloud DWHs sind zunehmen auch ELT (Extract, Load, Transform) verbreitet. Final werden in beiden Fällen die Daten konsolidiert und transformiert, bevor sie im Cloud Data Warehouse landen. Für Unternehmen ist es wichtig, sicherzustellen, dass bestehende Datenflüsse für eine Cloud-Implementierung mit Unterstützung von Cloud-nativen Technologien validiert werden.

Für Unternehmen, die ihren ersten Schritt in Richtung Data Warehousing machen, ist es vielleicht am besten, nach nativen Cloud-Datenintegrationstools (ETL oder ELT as a Service) zu suchen, die speziell für die Herausforderung entwickelt wurden, Daten aus transaktionalen lokalen Datenbanksystemen in ein Cloud-Repository zu integrieren.

Flexible Lösung: Cloud Data Warehouse

In den letzten Jahren gibt es einen zunehmenden Trend von der klassischen Data-Warehouse-Architektur in Richtung Cloud-basierter Lösungen und weg von traditionellen On-Site-Lösungen. Zusammenfassend einige der Vorteile eines Cloud DWH im Vergleich zu On-Premise-Lösungen:

  • Skalierbarkeit: Die Skalierung von Data Warehouses in der Cloud ist im Vergleich zu On-site Warehouses viel einfacher
  • Kosten: Cloud-basierte Warehouses sind billiger einzurichten, da es keine Hardware oder im Voraus anfallende Lizenzkosten gibt.
  • Time-to-Market: Es ist schnell und einfach, ein Data Warehouse in der Cloud in Betrieb zu nehmen. Die Bereitstellung eines lokalen Data Warehouse dauert viel länger
  • Leistung: Cloud Data Warehouses sind für die Analyse optimiert. Sie nutzen säulenartigen Speicher und massiv parallele Verarbeitung (MPP), was eine wesentlich bessere Performance bei der Ausführung komplexer Abfragen ermöglicht
Wir bauen Ihre Infrastruktur!