Smart Data Fabric ist das neue Ideal im Datenmanagement
Jeden Tag werden Menschen mit neuen Nachrichten und Zahlen konfrontiert und auch in Unternehmen werden kontinuierlich Daten produziert. Vom richtigen Umgang mit ihnen hängt unmittelbar der eigene Geschäftserfolg ab. In dieser Hinsicht etabliert sich mit dem Konzept der Smart Data Fabric gerade ein neues Ideal für das Datenmanagement.
Unternehmen wollen durch Digitalisierung ihre Prozesse beschleunigen und modernisieren, ihre Risiken reduzieren sowie ihren Kunden mit neuen, noch vorteilhafteren Leistungen zusätzlichen Nutzen bieten und dadurch dauerhaft an sich binden. All das trägt dazu bei, sich Wettbewerbsvorteile zu verschaffen und Ergebnisse zu verbessern. Im Kontext dieser Digitalisierungsbestrebungen wird die enorme Bedeutung von Datenqualität und -verfügbarkeit immer offenbarer: Ohne den unmittelbaren Zugriff auf gut verwertbare Daten haben solche Innovationsinitiativen kaum Aussicht auf Erfolg. Die Herausforderung besteht für viele Unternehmen schon heute darin, mit der stetig wachsenden Datenmenge umzugehen. Und die Aufgabe wird in Zukunft ganz sicher nicht leichter, denn dank der weiter voranschreitenden Digitalisierung aller Lebensbereiche ist kein Ende dieser Datenexplosion abzusehen. Wie ein Bericht der International Data Corporation (IDC) und Seagate zeigt, wird die Menge der Daten in Unternehmen im Jahr 2021 im Vergleich zum Ende des Vorjahres voraussichtlich um 42,2 Prozent zunehmen [1].
Zusätzlich erschwert wird das Datenmanagement durch unverbundene Anwendungen und Speicherorte, sogenannte Anwendungs- bzw. Datensilos. Diese entstehen, wenn eingehende Daten nur in bestimmten Datenbanken, Applikationen oder Services gespeichert werden. Unternehmen können so nicht den maximalen Nutzen aus ihren Informationen ziehen, da die Datensilos die Verknüpfung aller verfügbaren Daten und damit eine der Realität entsprechende Echtzeitansicht aller relevanten Informationen verhindern. Nur dann sind Unternehmen aber in der Lage, fundierte Entscheidungen zu treffen und datengetriebene Geschäftsmodelle erfolgreich umzusetzen. Laut einer Umfrage von Vanson Bourne und MuleSoft sehen weltweit 89 Prozent der befragten IT-Leiter ihre Datensilos als Herausforderung für die digitale Transformation ihres Unternehmens [2]. Kaum verwunderlich, denn laut derselben Studie verfügen Unternehmen im Durchschnitt über 900 Anwendungen, von denen gegenwärtig lediglich etwas über ein Viertel (28 Prozent) bereits integriert sind. Ein wichtiger Grund hierfür: Herkömmliche Lösungen wie ein Data Warehouse oder ein Data Lake wurden nicht dazu konzipiert, Informationen über alle Datenquellen und -formate sowie Anwendungsfälle hinweg zeitnah zusammenzuführen und übergreifend nutzbar zu machen.
Deshalb wurde etwa seit Mitte des vergangenen Jahrzehnts das Architekturkonzept der (Enterprise) Data Fabric entwickelt. 2019 bezeichneten die Marktforscher von Gartner den Ansatz als Technologietrend und als die Zukunft des Datenmanagements. Spätestens damit rückte das Konzept der Data Fabric branchenübergreifend in den Fokus technischer Entscheider.
Data Fabric sorgt für Interoperabilität
Vereinfacht ausgedrückt werden mit der Data Fabric Brücken in der IT-Architektur eines Unternehmens errichtet. Sie ist eine Struktur (engl. fabric; Struktur, Gewebe) aus Verbindungen zwischen diversen Datenquellen, die für Interoperabilität sorgt und dadurch den Zugriff auf Informationen vereinfacht sowie beschleunigt. Dabei baut die Data Fabric auf der bestehenden IT-Infrastruktur auf. Das heißt, bereits vorhandene Technologien, Anwendungen und Dienste können unverändert weiterverwendet werden, da sie über die Data Fabric miteinander "verwoben" sind. Ist die Struktur einmal geschaffen, lassen sich Daten schnell und fehlerfrei aus internen sowie externen Quellen zusammenführen, bereinigen sowie harmonisieren, unabhängig von der Datenquelle, dem Übertragungsprotokoll oder dem Datenformat. Folglich gehören Anwendungs- und Datensilos in der betrieblichen Praxis der Vergangenheit an. Gerade auch im Hinblick auf die zunehmende parallele Nutzung von On-Premise-, Hybrid-Cloud- und Cloud-Infrastrukturen ist das von entscheidender Bedeutung.
Verdeutlicht wird der Stellenwert der Data Fabric durch einen Report von 451 Research und Sinequa: Demnach haben 23 Prozent der Unternehmen mehr als 50 Datensilos – bei stark datengetriebenen Unternehmen sind es sogar 39 Prozent [3]. Sobald diese Silos nicht mehr existieren, können Unternehmen ihre betrieblichen Ziele wesentlich effizienter verwirklichen. Das Marktforschungsunternehmen Forrester Research nennt das Resultat der Data Fabric eine zentrale, vertrauenswürdige und umfassende Ansicht auf alle Daten in einem Unternehmen. Nur mit ihr ist es möglich, im Sinne der Digitalisierung alle verfügbaren Informationen auf einmal zu überblicken, miteinander zu verknüpfen und dann auszuwerten sowie zu nutzen.
Vergleich mit Data Warehouse und Data Lake
Im Gegensatz dazu sind herkömmliche Lösungen wie ein Data Warehouse oder ein Data Lake in ihrer Leistungsfähigkeit limitiert. Typischerweise bieten sie Daten, die in ihnen gesammelt vorliegen, je nach Quelle in jeweils unterschiedlichen Formaten an. Die Daten liegen also nicht in einem einheitlichen Format vor, was ihre Zusammenführung, Bereinigung und Harmonisierung schwieriger und vor allem zeitaufwändiger gestaltet. Dementsprechend können Unternehmen ihre Daten nicht so einfach überblicken und auf sie zugreifen. Weitere Komplexität entsteht durch die zunehmende Verfügbarkeit von Echtzeitdaten und die daraus resultierende Anforderung, diese Informationen synchron zu Batch-Daten verwenden zu können. Mit einem Data Warehouse oder einem Data Lake ist die Aufgabe, historische und aktuelle Daten über alle Quellen der unterschiedlichen Unternehmensbereiche hinweg direkt miteinander zu kombinieren, um fundierte Entscheidungen in Echtzeit zu treffen, wie beispielsweise bei der Risiko- und Betrugserkennung, nicht umsetzbar. Kurzum: Die etablierten Lösungen können mit den Anforderungen an ein modernes Datenmanagement nicht länger Schritt halten.
Von der Data Fabric zur Smart Data Fabric
Mit der Data Fabric steht Unternehmen eine bewährte Alternative zur Verfügung. Die Smart Data Fabric ist die konsequente Weiterführung dieses Konzepts, die sich zusätzlich durch integrierte Analysefunktionen sowie den möglichen Einsatz von künstlicher Intelligenz und maschinellem Lernen auszeichnet. Zu den Analysefunktionen zählen zum Beispiel Datenexploration, Business Intelligence und Natural Language Processing. Insgesamt liefert die Smart Data Fabric das Fundament dafür, zuvor schon aufbereitete Daten sofort zu verwenden, anstatt sie aufwändig und zeitraubend an andere Anwendungen oder Systeme zu übergeben, wie beispielsweise BI-Tools oder KI-Plattformen. Das erlaubt unter anderem Echtzeitanalysen und den effizienten Einsatz von künstlicher Intelligenz und maschinellem Lernen. So können historische und aktuelle Daten direkt miteinander kombiniert werden, um schnell und unkompliziert neue Erkenntnisse zu gewinnen, fundierte Entscheidungen in Echtzeit zu treffen sowie zukünftige Entwicklungen durch Predictive Analytics besser zu antizipieren.
Wesentliche Eigenschaften der Smart Data Fabric
Die SDF lässt sich – wie auch eine Data Fabric – einfach in die bestehende IT-Infrastruktur eines Unternehmens integrieren, allerdings ergänzt um Anbindungen an bestehende Analyse- und KI/ML-Werkzeuge. Eine aufwändige Neugestaltung – ein sogenanntes "Rip and Replace" – ist somit nicht notwendig. Vielmehr werden bereits vorhandene Technologien, Anwendungen und Dienste weiterhin genutzt. Dabei spielt es keine Rolle, wo sich diese genau befinden. Sie können problemlos sowohl lokal als auch in der Cloud betrieben werden. Eine umfangreiche Konnektivität zwischen allen Datenquellen ist zu jeder Zeit gegeben. Mit der Smart Data Fabric können Unternehmen auch zukünftig einen Mehrwert aus ihren früheren Investitionen ziehen. Die Legacy-Systeme erhalten sozusagen ein ergänzendes Update, um eine umfassende Vernetzung und ein modernes Datenmanagement sicherzustellen. Dadurch reduziert die Smart Data Fabric die Komplexität einer IT-Infrastruktur signifikant und vereinfacht deren Betrieb sowie deren Wartung. Mithilfe der Smart Data Fabric ist es zudem möglich, große Mengen an Daten gleichzeitig aufzunehmen und zu verarbeiten, um den Leistungs- und Echtzeitanforderungen bestimmter Anwendungsfälle wie beispielsweise im Wertpapierhandel gerecht zu werden. Die Grundlage für das Vorgehen ist hierbei ein Hybrid Transactional/Analytical Processing (HTAP), das eine sehr hohe Leistung und Effizienz für Multi-Workloads in Echtzeit garantiert. Darüber hinaus lässt sich die Smart Data Fabric frei und flexibel vertikal wie auch horizontal skalieren, wenn ein Unternehmen wächst oder die Anzahl der Workloads beziehungsweise der Daten steigt.
Weitere Vorteile der Smart Data Fabric
Smart Data Fabrics werden schon in vielen Branchen produktiv eingesetzt und unterstützen dort unterschiedliche Business-Initiativen.
Der erste große Vorteil ist die zentrale Sicht auf alle Daten im Unternehmen – eine Single Source of Truth (SSOT). Diese umfassende Transparenz erlaubt neben Data Discovery und Data Lineage auch eine informative Cockpit- oder Dashboard-Darstellung der Unternehmensprozesse. Wie hilfreich das sein kann, zeigt der Vergleich mit der Arbeit eines Piloten, der selbst auf eine Vielzahl von Daten zu achten hat. Aufgrund des technologischen Fortschritts werden in Flugzeugen heute Daten automatisch in Echtzeit kombiniert und analysiert. Eine eigene Interpretation der Informationsflut durch den Piloten ist nicht mehr nötig. Stattdessen liest er die entsprechenden Werte und Alarme, die vor Zwischenfällen warnen und Korrekturmaßnamen vorschlagen, von seinem Display ab. Diese Übersicht unterstützt folglich das Handeln eines Piloten und ist in gefährlichen Situationen, wie beispielsweise bei einem drohenden Strömungsabriss, von entscheidender Bedeutung. In ähnlicher Weise wünschen sich Unternehmen die Möglichkeit, unwichtige Daten herauszufiltern und nur wichtige Informationen zu sehen – insbesondere solche, die durch die Vernetzung mehrerer Datenquellen zum Vorschein kommen. Durch die zentrale Sicht auf die Daten steigern Unternehmen ihre Flexibilität und sind in der Lage, schneller und dynamischer auf geschäftliche Anforderungen und Probleme mit Produkten und Diensten zu reagieren, weil sie Informationen unmittelbar erhalten. Auch Neuentwicklungen rund um die eigenen Produkte und Dienste lassen sich mit der Smart Data Fabric schnell verwirklichen, da sie dafür die notwendigen Informationen liefert. Das heißt, eine größere einheitliche Datenbasis fördert die interne Forschung. Unternehmen sind so ihrer Konkurrenz einen Schritt voraus und sichern sich durch neue innovative Angebote treue Kunden. Obendrein sinken durch die einfachere Architektur der Smart Data Fabric die Gesamtkosten eines Betriebs, der folglich zukunftssicherer aufgestellt ist.
Die Smart Data Fabric hat auch Einfluss auf die Erfüllung der Anforderungen aus dem Bereich Data Governance. Da das Datenmanagement zentral durchgeführt und kontrolliert wird, lässt sich mit ihr das Risiko eines Verstoßes gegen innerbetriebliche Vorgaben und/oder gesetzliche Vorschriften maßgeblich verringern. Neue Regularien lassen sich schneller umsetzen, da es zu allen wesentlichen Daten einen zentralen Zugriff gibt. Im Ergebnis führen diese Eigenschaften der Smart Data Fabric dazu, dass Entscheider fundierte, datenbasierte Entscheidungen fällen können und in Krisensituationen schneller als der Wettbewerb agieren können.
Umsetzung mithilfe einer modernen Datenplattform
Voraussetzung für die erfolgreiche Implementierung einer Smart Data Fabric ist eine moderne Datenmanagementplattform. Mithilfe einer solchen Datenplattform der nächsten Generation ist es möglich, schnell und unproblematisch eine unternehmensweite Smart Data Fabric für komplexe geschäftliche Anforderungen zu implementieren. Genauer gesagt vereint sie leistungsstarke Funktionen aus den Bereichen Datenbankmanagement, Integration, Analytics, Anwendungsentwicklung, Machine Learning und API-Management in einem einzigen Produkt. Im Kern der Datenplattform steckt eine transaktionsanalytische Datenbank-Engine für Analysen in Echtzeit und mit niedriger Latenz. So erleichtert sie die Entwicklung fortschrittlicher Anwendungen, denn sie unterstützt neben allen verbreiteten modernen Programmiersprachen – wie zum Beispiel Python, C++ oder Java – zugleich eine Vielzahl von Datenmodellen. Zusätzlich sind direkt in der Datenpattform Funktionen für den Einsatz von künstlicher Intelligenz und maschinellem Lernen eingebettet, die durch das Tool IntegratedML realisiert werden und unter anderem Natural Language Processing ermöglichen. IntegratedML erleichtert es beispielsweise Business Analysts oder Entwicklern mit grundlegenden SQL-Kenntnissen, eigenständig ML-Szenarien umzusetzen, indem ML-Prozesse mittels SQL-ähnlicher Funktionsaufrufe initiiert werden können. Das Tool besitzt eine einfache Benutzerführung, die neben der Erstellung und Ausführung von ML-Modellen auch die Kontrolle der Ergebnis-Sets erleichtert. Die Optimierung des Modells übernimmt dann im Bedarfsfall ein Data Scientist.
Anwendungsbeispiel aus dem Bereich Financial Services
Ein Wirtschaftszweig, der aktuell besonders von einer Smart Data Fabric profitiert, ist die Finanzdienstleistungsbranche, die sich in einer dynamischen Umbruchsphase mit zahlreichen neuen, innovativen und datengetriebenen Marktteilnehmern befindet. Mit einer geeigneten Datenplattform können die Unternehmen der Branche eine entsprechende IT-Infrastruktur einrichten, um den komplexen Herausforderungen der heutigen Finanzwelt erfolgreich zu begegnen. Viele Finanzinstitute auf der ganzen Welt haben das bereits getan – mit dem Ziel, ein zuverlässiges Datenmanagement zu schaffen. In der Finanzdienstleistungsbranche besteht stärker denn je ein Bedarf nach weiterer Digitalisierung, vor allem aufgrund der Volatilität des Marktes. Gemeint ist damit der Druck, sich zu verändern – Prozesse zu beschleunigen und zu modernisieren. Es kommt heute darauf an, in Echtzeit Daten zu übertragen beziehungsweise aus diversen Quellen zusammenzuführen und diese idealerweise gleichzeitig zu analysieren. Nur so gewinnen die Unternehmen und ihre Mitarbeiter verwertbare Informationen, die sie für die effiziente Erledigung ihrer Aufgaben benötigen. Der schnelle Zugriff auf umfassende, vertrauenswürdige Daten und deren direkte Auswertung – im Bedarfsfall mithilfe von künstlicher Intelligenz und maschinellem Lernen – erlaubt ihnen bessere Geschäftsentscheidungen zu treffen und einen wirksamen Umgang mit Krisensituationen. Zusätzlich erhalten sie einen umfassenden Überblick über die gegenwärtige Marktlage und neue Geschäftschancen, die sich aus aktuellen Entwicklungen auf Kundenseite und im Marktgeschehen ergeben. Außerdem können Unternehmen die Erkenntnisse auch externen Stakeholdern bereitstellen, wie zum Beispiel Kooperationspartnern, Aufsichtsbehörden und Kunden.
Die Smart Data Fabric dient als Grundlage einer Vielzahl an Geschäftsinitiativen in der Finanzbranche. Dazu gehören unter anderem die Planung von Zukunftsszenarien und die Unterstützung bei der Entscheidungsfindung, das Risiko- und Liquiditätsmanagement, die regulatorische Compliance sowie die Vermögensverwaltung.
Durch eine Investition in die neue IT-Infrastruktur haben Unternehmen der Finanzdienstleistungsbranche die Chance, sich in ihrem umkämpften Markt von der Konkurrenz abzuheben. Sie kommen schneller an neue Erkenntnisse und minimieren betriebliche Risiken. Darüber hinaus bieten sie Kunden einen zusätzlichen Nutzen und erfüllen alle Anforderungen aus dem Bereich Data Governance. Mit Blick in die Zukunft lässt sich der Geschäftsbetrieb auch geschickter für nachhaltiges Wachstum skalieren.
Smart Data Fabric – hier und jetzt
Daten sind das Öl des 21. Jahrhunderts. Doch um ihr Potenzial vollends zu nutzen, ist eine Lösung wie die Smart Data Fabric nötig. Die erfolgreiche und schnelle digitale Transformation eines Unternehmens ist eng an ein solides Datenfundament geknüpft. Branchenunabhängig gilt es für alle Unternehmen, in Bezug auf Daten für Interoperabilität und eine zeitnahe, umfassende Auswertung zu sorgen. Einige Organisationen schrecken noch davor zurück, die entsprechenden Investitionen zu tätigen. Zu aufwändig und kostenintensiv scheint für sie der Austausch von Legacy-Systemen. Mit der Smart Data Fabric verfügen Unternehmen jedoch über eine Lösung, die auf ihrer bestehenden IT-Infrastruktur aufbaut und diese weiter nutzt. Generell wird dadurch das Datenmanagement modernisiert und weitgehend automatisiert, so dass eventuelle Ineffizienzen eliminiert werden. Mithilfe einer Datenplattform lässt sich eine Smart Data Fabric ohne "Rip and Replace" einfach und schnell einrichten. Gerade jetzt, seit dem Beginn der COVID-19-Pandemie, hat die Digitalisierung noch mehr an Bedeutung gewonnen. Unternehmen stellen momentan vermehrt fest, dass sie ihr Datenmanagement optimieren müssen. Daher ist nun die Zeit, die nötigen Schritte einzuleiten und damit den zukünftigen Geschäftserfolg zu sichern – ganz egal, ob ein Unternehmen seine führende Position auf dem Markt behaupten oder sich weiter von der Konkurrenz absetzen will.