.Snowflake:.
.Skalierbare Cloud Data Warehouses 

Snowflake: Skalierbare Cloud Data Warehouses

Snowflake: Eine moderne Datenplattform für jede Cloud

Snowflake Logo

Snowflake ist eines der wenigen Cloud Data Warehouses für Unternehmen, das Einfachheit ohne Abstriche bei einer hohen Leistungsfähigkeit bietet. Es skaliert automatisch, sowohl nach oben als auch nach unten, um das richtige Verhältnis zwischen Leistung und Kosten zu finden. Snowflakes Anspruch auf Erfolg besteht darin, dass es Data Computing und Data Storage voneinander trennt. Das ist deshalb so wichtig, weil fast jede andere Datenbank, einschließlich Redshift, beides miteinander kombiniert. D.h. Sie müssen sich auf eine maximale Systemlast einstellen und die damit verbundenen Kosten tragen.

Mit Snowflake können Sie alle Ihre Daten an einem einzigen Ort speichern und Ihre Berechnungen unabhängig voneinander durchführen. Wenn Sie z.B. für komplexe Transformationen nahezu in Echtzeit geladene Daten benötigen, aber relativ wenige komplexe Abfragen in Ihrem Reporting haben, können Sie ein riesiges Warehouse für die Datenlast skripten. Und es nach Fertigstellung wieder herunterskalieren – alles in Echtzeit. Dies spart Kosten, ohne Ihre Lösungsziele zu gefährden.

Near-Zero Management

  • Die Plattform vermeidet die Verwaltungs- und Managementaufwendungen traditioneller Plattformen und großer Datenlösungen
  • Sie stellt eine echte Datenplattform als Service dar, die in der Cloud läuft.
  • Die Plattform managed automatisch Infrastruktur, Optimierung, Verfügbarkeit und Datenschutz, so dass Sie sich auf die Nutzung statt die Verwaltung Ihrer Daten konzentrieren können

Bessere Skalierung durch Snowflake

  • Die sekundengenaue, verbrauchsabhängige Preisfestsetzung für Berechnung und Speicherung bedeutet, dass Sie nur für die Menge an Daten bezahlen, die Sie speichern und für die Menge an Compute Processing, die Sie verwenden.
  • Verabschieden Sie sich von Vorabkosten, übermäßig bereitgestellten Systemen oder ungenutzten Clustern, die unnötig Geld verbrauchen.

Überzeugende Leistung

  • Verarbeiten Sie Queries und Tasks in einem Bruchteil der Zeit, die herkömmliche On-Premises- und Cloud-Datenplattformen benötigen.
  • Die Datenbank-Engine für spaltenbasierte Datenbanken verwendet fortschrittliche Optimierungen, darunter automatisches Clustering.
  • In Kombination mit der Fähigkeit zur sofortigen und nahezu unbegrenzten Skalierung, erhalten Sie genau die Leistung, die Sie benötigen – genau dann, wenn Sie sie benötigen.

Der Modern Data Stack mit Snowflake

Mit Fivetran + Snowflake + Tableau führen heute schon viele Unternehmen Analysen aus mehr Quellen durch und haben einen schnelleren Zugang zu wichtigen Performance-Messungen.

Das Hybride Modell von Snowflake

Einzigartige High-Level-Architektur

Snowflake kann so schnell Ergebnisse liefern, weil es eine Mischung aus traditioneller Datenbankarchitektur mit gemeinsam genutzten Datebanken und Datenbankarchitekturen ohne gemeinsame Nutzung ist. Genau wie die Datenbank mit gemeinsam genutzten Datenträgern verwendet sie ein zentrales Repository für persistente Daten, auf das von allen Rechenknoten aus zugegriffen werden kann. Auf der anderen Seite verarbeitet das Tool, ähnlich wie bei der Shared-Nothing-Architektur, Anfragen mit MPP-Computerclustern (MPP = Massive Parallel Processing), bei denen jeder Knoten einen Teil des gesamten Datensatzes lokal speichert.

Dieser Ansatz kombiniert die Einfachheit einer Shared-Disk-Architektur mit der Leistung und den Skalierungsvorteilen einer Shared-Nothing-Architektur.

Wenn Daten geladen werden, reorganisiert Snowflake diese Daten in ihr internes optimiertes, komprimiertes, kolumnares Format. Die Plattform speichert diese optimierten Daten in einem Cloud Storage.

Es werden alle Aspekte der Speicherung dieser Daten verwaltet – die Organisation, Dateigröße, Struktur, Komprimierung, Metadaten, Statistiken und andere Aspekte der Datenspeicherung. Die gespeicherten Datenobjekte sind für Kunden weder direkt sichtbar noch zugänglich; sie sind nur über SQL-Abfrageoperationen zugänglich, die mit dem Tool ausgeführt werden.

Die Abfrageausführung wird in der Verarbeitungsschicht durchgeführt. Snowflake verarbeitet Anfragen mit Hilfe ” Virtual Warehouses”. Jedes virtuelle Warehouse ist ein MPP-Compute-Cluster, das aus mehreren Compute-Knoten besteht, die von einem Cloud-Provider zugewiesen werden.

Jedes virtuelle Warehouse ist ein unabhängiges Compute-Cluster, das keine Compute-Ressourcen mit anderen virtuellen Warehouses teilt. Infolgedessen hat jedes virtuelle Warehouse keinen Einfluss auf die Leistung anderer virtueller Warehouses.

Die Ebene der Cloud Services ist eine Sammlung von Diensten, die Aktivitäten über Snowflake hinweg koordinieren. Diese Dienste verbinden alle verschiedenen Komponenten, um Benutzeranfragen zu bearbeiten, von der Anmeldung bis zum Bereitstellen der Abfragen. Die Cloud-Services-Schicht läuft auch auf Compute-Instanzen, die Snowflake vom Cloud-Provider zur Verfügung gestellt werden.

Ihr Ansprechpartner

Frederic Bauerfeind
Data Consultant

frederic.bauerfeind@taod.de

Sie möchten Snowflake live erleben?

Gerne zeigen wir Ihnen das Tool und seine Möglichkeiten in einer persönlichen Session. GRATIS und auf Wunsch auch mit Ihren eigenen Daten. Senden Sie uns einfach unkompliziert Ihre Anfrage______