Q&As zur neuen MariaDB Platform X3
MariaDB hat jüngst die MariaDB Platform X3 vorgestellt, mit der die beiden Einzellösungen MariaDB TX für transaktionale Arbeitslasten und MariaDB AX für analytische Aufgaben zusammengeführt werden. Shane Johnson ist Senior Director Product Marketing bei der MariaDB Corp. Er beantwortet uns die drängendsten Fragen zur neuen Plattform.
Informatik Aktuell: Was steckt hinter der MariaDB Platform X3?
Shane Johnson: Aus der Datenbank-Perspektive unterscheiden sich transaktionale und analytische Arbeitslasten erheblich. Transaktionen arbeiten üblicherweise mit Datenzeilen, etwa Ihre persönlichen Daten mit Name, Anschrift und Kreditkartennummer. Analytische Arbeitslasten hingegen arbeiten meist spaltenbezogen, sie benötigen in der Regel aggregierte Daten einzelner Spalten wie zum Beispiel Lagerkosten über bestimmte Produktgruppen. Für beide Aufgaben kommen in den meisten Unternehmen in der Regel zwei getrennte Datenbankumgebungen zum Einsatz. Es ist allerdings nicht ganz trivial, wenn eine Anwendung beide Datenbestände nutzen soll. Aktuelle Anwendungen benötigen sowohl Transaktionen als auch Analysen, um auf der einen Seite den Kunden eine positive Erfahrung zu bieten und andererseits den Entscheidern im Unternehmen umfassende Einblicke zu gewähren. Normalerweise werden beide Merkmale in zwei getrennten Datenbanken implementiert. Bei der Entwicklung von MariaDB Platform war es unser Ziel, diese Lücke zu schließen und unseren Kunden die Möglichkeit zu geben, transaktionale und analytische Arbeitslasten zu konsolidieren.
Informatik Aktuell: Warum können Unternehmen nicht Transaktionen und Analysen auf einer Datenbank betreiben?
Shane Johnson: Man könnte es so beschreiben, dass Datenbank-Server ein akzeptables Leistungsfenster aufweisen: Solange Sie nur kleine Datenmengen speichern und verarbeiten, ist dieses Leistungsfenster groß genug für Transaktionen und Analysen. Das Leistungsfenster reicht für Ihren Bedarf aus, solange Sie keine Optimierungen benötigen, um die Daten innerhalb der gebotenen Zeit zu verarbeiten. Wachsen die Daten und der unternehmerische Bedarf, etwa weil Ihr Online-Shop sehr erfolgreich ist, müssen die Datenbanken optimiert werden. Steigen Ihre Anforderungen, deckt das Leistungsfenster des Datenbankmanagementsystems diese nicht mehr vollständig ab. An dieser Stelle müssen Sie entscheiden: Optimieren Sie die Datenbank für Transaktionen und aktuelle Daten, um Ihre Kunden zufriedenzustellen? Oder optimieren Sie für die Masse an historischen Daten und Analysen auf Spaltenbasis? Sie erhalten dann in der Folge zwei unterschiedliche und meist getrennte Datenbankumgebungen. Mit MariaDB Platform geben wir Ihnen die Möglichkeit, beide Datenbanktypen in einer einzigen Umgebung zu betreiben, die für Ihre Anwendung vollständig transparent ist.
Informatik Aktuell: Also stecken faktisch zwei Datenbanken unter der Haube, die für die Anwendungen darüber transparent arbeiten? Wie wird das umgesetzt?
Shane Johnson: Nur, um das klarzustellen: Es handelt sich nicht um zwei unterschiedliche Datenbanken. Es ist immer dieselbe: MariaDB, entweder mit zeilen- oder spaltenbasierendem Speicher. Durch unsere modulare Architektur können unterschiedliche Speicher-Engines für verschiedene Arbeitslasten eingesetzt werden, wobei das Datenbankmanagementsystem selbst unverändert bleibt.
Durch MariaDB MaxScale sind alle Datenbankinstanzen für die darüberliegenden Anwendungen transparent.
Es ist also die gleiche Datenbank mit der gleichen Technologie. Um die Datenbanken zu verbinden, nutzen wir unseren weit verbreiteten Datenbank-Proxy MariaDB MaxScale. MaxScale routet die transaktionalen Anfragen zur zeilenbasierten Instanz, die analytischen Anfragen zur Instanz mit spaltenbasierendem Speicher. Durch MaxScale sind alle Datenbankinstanzen für die darüberliegenden Anwendungen transparent. Die Anwendungen kommunizieren ausschließlich mit MaxScale, der sich gegenüber den Applikationen wie eine Standard-MariaDB-Datenbank verhält. Unabhängig davon, wie die Datenbanken skalieren. In diesem Fall fungiert MaxScale nicht nur als Load Balancer und Proxy, sondern auch als Verteiler für transaktionale und analytische Daten. In herkömmlichen Umgebungen mit zwei unterschiedlichen Datenbanken müssen Sie beide mit Ihrer Anwendung verbinden, um den Zugriff auf transaktionale und analytische Daten zu gewährleisten. Mit MariaDB Platform verbinden Sie nur MaxScale mit der Anwendung, die ein gewöhnlicher MariaDB-Server zu sein scheint. Das reduziert die Komplexität erheblich.
Informatik Aktuell: Bei MariaDB Platform gibt es immer zwei Datenspeicher für die unterschiedlichen Arbeitslasten. Was können die Anwender damit machen, was vorher mit zwei separaten Lösungen nicht möglich war?
Shane Johnson: Mit MariaDB Platform führen wir zwei Möglichkeiten zur hybriden transaktionalen/analytischen Verarbeitung (HTAP, hybride transactional/analytical processing) ein. Die erste ist Change Data Capture (CDC), die Änderungen an den Daten nachverfolgt: Alle Einfügungen, Aktualisierungen oder Löschungen im zeilenbasierten Speicher werden automatisch und fast in Echtzeit auf den spaltenbasierenden Speicher übertragen. Die zweite Möglichkeit ist das so genannte Query Routing: Eine Abfrage, die an die MariaDB Platform geschickt wird, kann entweder an die zeilenbasierenden Speicher geleitet werden oder an den spaltenbasierenden Speicher. Je nachdem, ob es eine transaktionale oder eine analytische Abfrage ist.
Informatik Aktuell: Welche Neuerungen bringt CDC für MariaDB Platform? Welche Daten werden synchronisiert und wie?
Shane Johnson: CDC stellt sicher, dass alle transaktionalen Daten auch für Analysen ohne Verzögerung zur Verfügung stehen. In der Regel ist das eine Sache von Sekunden. Das betrifft alle Einfügungen, Aktualisierungen oder Löschungen. Der DBA kann angeben, welche Daten zur Analyse an den spaltenbasierenden Speicher repliziert werden. In vielen Fällen wird es kaum sinnvoll sein, alle Tabellen zu replizieren – besonders bei Tabellen mit nur wenigen Zeilen. So kann der DBA festlegen, welche Tabellen auf den spaltenbasierenden Speicher repliziert werden sollen und welche nicht.
Informatik Aktuell: Wird für HTAP nicht ein einheitlicher Datenspeicher mit In-Memory-Speicher benötigt?
Shane Johnson: Nein, In-Memory-Speicher ist keinesfalls zwingend. Der Vorteil der MariaDB Platform ist, dass sowohl der zeilenbasierende Speicher für Transaktionen als auch der spaltenbasierende Speicher für Analysen auf herkömmlichen Festplatten liegt. Das ist effizient und spart Kosten. Allerdings wird der Arbeitsspeicher soweit möglich genutzt. Die spaltenbasierende Speicher-Engine hält so viele Daten wie möglich im Arbeitsspeicher vor. Das ist aber nicht unbedingt notwendig. Ist genügend Arbeitsspeicher vorhanden, um den kompletten Datenbestand darin vorzuhalten, werden die Daten sowohl auf Disk als auch In-Memory gespeichert.
Informatik Aktuell: Es gibt keine Cache-Schicht bei MariaDB Platform. Kann das nicht zu Problemen bei der Synchronisierung der beiden Instanzen führen?
Shane Johnson: Nein. Alle Daten werden asynchron vom zeilenbasierenden zum spaltenbasierenden Speicher repliziert – ganz ähnlich, wie auch die Replikation zwischen einem Master und weiteren Knoten für Hochverfügbarkeit oder Skalierung der Lesezugriffe funktioniert. Eine zusätzliche Cache-Schicht ist unnötig, da die spaltenbasierende Speicher-Engine so viele Daten wie möglich im Arbeitsspeicher bereithält.
Informatik Aktuell: Was wäre Ihrer Ansicht nach ein typisches Einsatzszenario für MariaDB Platform?
Shane Johnson: Jedes Szenario, in dem viele historische Daten und anspruchsvolle Analysen benötigt werden. Und das ist heute eigentlich bei immer mehr kundenorientierten Anwendungen nötig, um Wettbewerbsvorteile zu erzielen und ein personalisiertes Erlebnis zu bieten. Viele transaktionalen Datenbanken können nur die Daten weniger Monate speichern. Das gilt besonders für Datenbanken, die Spalten im Arbeitsspeicher vorhalten. Hier ist einfach nicht genügend Speicherkapazität vorhanden, um die Daten mehrerer Jahre verfügbar zu haben. Mit MariaDB Platform können Unternehmen diese historischen Daten in kundenorientierten Anwendungen für Analysen in Echtzeit nutzbar machen.
Informatik Aktuell: Vielen Dank für das Gespräch!
Über MariaDB
MariaDB befreit Unternehmen von den Schattenseiten proprietärer Datenbanken wie hohen Kosten, Einschränkungen und Komplexität. Sie können wieder in den Bereich investieren, der wirklich wichtig ist: die schnelle Entwicklung innovativer Anwendungen für die Kunden. MariaDB nutzt modulare, maßgeschneiderte Speicher-Engines. Damit kann MariaDB Arbeitslasten verarbeiten, die bislang eine ganze Reihe unterschiedlicher spezieller Datenbanken erforderten. Mit Wegfall von Komplexität und Einschränkungen können sich die Unternehmen nun auf eine einzige, umfassende Datenbank verlassen, die jeden Bedarf abdeckt. Und die auf Standard-Hardware ebenso läuft wie in der bevorzugten Cloud. MariaDB ist innerhalb weniger Minuten einsatzbereit, sowohl für analytische als auch für transaktionale Einsatzbereiche.
MariaDB bietet unerreichte operative Agilität, ohne dass die wichtigen Enterprise-Merkmale wie ACID-Konformität und vollständige SQL-Implementierung dabei auch der Strecke bleiben. Unternehmen wie Deutsche Bank, DBS Bank, Nasdaq, Red Hat, The Home Depot, ServiceNow und Verizon vertrauen auf MariaDB. Denn MariaDB liefert dieselben Kernfunktionen wie proprietäre Datenbanken. Und das zu einem Bruchteil der Kosten. Deshalb ist MariaDB auch die am schnellsten wachsende Open-Source-Datenbank.
Kontakt:
Frau Hana Hütter
Sales Manager DACH