
Hannah Ziemons im Gespräch zum Thema Data Science im Modern Data Stack
Hannah war Data Scientist bei taod und hat bereits ganz verschiedene Data Science Projekte begleitet. So verschieden wie die Projekte war auch der jeweils vorhandene Data Stack, auf den sie als Scientist in den wenigsten Fällen Einfluss hatte. Deshalb weiß sie um die Möglichkeiten innerhalb eines Modern Data Stacks und dessen Bedeutung für Unternehmen.
taod: Hannah, was macht einen idealen Modern Data Stack für dich aus?
Hannah Ziemons: Das sind vor allem drei wichtige Aspekte. Zunächst einmal ist ein hoher Automatisierungsgrad essenziell für einen guten Modern Data Stack. Es macht keinen Sinn, etwas neu zu programmieren, das weniger fehleranfällig bereits in einer Software-Lösung bereitgestellt werden kann. Außerdem ist kollaborative Funktionalität wichtig. Dank der Cloud bieten die allermeisten Tools Sharing-Funktionalitäten und kollaborative Features an, die eine Zusammenarbeit des Teams technologisch unterstützen.
Hast Du ein Beispiel für solch ein kollaboratives Feature?
Da fällt mir die automatische Dokumentations-Funktion ein, die das ETL Tool dbt bietet. Hier wird der Aufwand der wenig beliebten und doch so wichtigen Aufgabe der Dokumentation deutlich verringert. Gleichzeitig wird die Zusammenarbeit und die Einigung auf ein gemeinsames Wissen und Vorgehen verbessert.
Das fördert gleichzeitig die Datenkultur innerhalb des Teams. Zurück zum optimalen Modern Data Stack: Wie lautet dein dritter Aspekt?
Flexibilität. Jedes Tool schafft zwar eine gewisse Abhängigkeit, aber sie sollte so gering wie möglich gehalten werden. Eine technische Lösung muss nicht zehn Probleme auf einmal erledigen, dafür aber das Problem, auf das sie spezialisiert ist. Und zwar so, dass sie auch flexibel mit anderen Tools kombiniert und in Data Science Prozesse integriert werden können.