JSON in der Oracle-Datenbank mit NoSQL-APIs und Datenbank-API für MongoDB
Sogenannte Document-Stores (auch Document-Databases) erfreuen sich großer Beliebtheit. MongoDB ist der wohl populärste Vertreter und wird insbesondere wegen der leichten Erlernbarkeit und der breiten Unterstützung von Programmiersprachen und Frameworks geschätzt. Mit der neuen Oracle Database API for MongoDB wird jetzt MongoDBs Wire-Protocol "verstanden", so dass sich MongoDB-Applikationen, -Tools und -Treiber direkt mit einer Oracle-Autonomous-Datenbank verbinden können.
Unterschiedliche Ansätze: Tabellen und Collections
Document-Store oder (object-)relationale Datenbank: wie unterscheiden sich die beiden Ansätze? Im Fall von (object-)relationalen Datenbanken spielt das Schema-Design eine wichtige Rolle: Objekte der Anwendung (z. B. Kunde oder Bestellung) werden normalisiert und so auf Tabellen und Spalten der Datenbank abgebildet, wobei ein Anwendungsobjekt (Entität) oft mehrere Tabellen benötigt. Die Verwendung von Schema-Design bedeutet nicht nur gutes (möglichst vollständiges) Wissen über die Attribute und Beziehungen aller Anwendungsobjekte, sondern auch Kenntnisse des relationalen Modells (z. B. Normalformen) und auch SQL-Kenntnisse, um die Datenbank-Objekte (Tabellen) anzulegen. Dieses relationale Schema bestimmt genau, wie die Anwendungs-Objekte später abgelegt, verändert oder geladen werden. Ein Entwickler benötigt deshalb in der Regel ein Minimum an SQL-Kenntnissen.
Auf der anderen Seite geht es aber auch ohne die Datenbank als Ausgangspunkt. Objekte der Anwendung können als eine Einheit (auch Document) in einem NoSQL-Document-Store gespeichert werden. Im Falle von MongoDB werden die Attribute des Objekts zu JSON (genauer BSON) konvertiert und in einer Collection gespeichert. Die Collection ist dabei nur durch einen Namen identifiziert, es gibt in der Regel kein Schema, welches die Struktur der JSON-Daten definiert oder einschränkt. Jedem JSON-Dokument wird ein eindeutiger Wert (ID) (automatisch oder durch den Benutzer) zugeordnet, mit dem das Dokument wieder gefunden werden kann. Ein Document-Store ist also auch ein Key-Value-Store. Darüber hinaus können Dokumente aber auch anhand von Suchkriterien selektiert werden – zum Beispiel, um alle Kunden in einer Stadt zu finden.
Natürlich besitzen auch Document-Stores ein Schema. Aber anstatt es vorab und zentral in der Datenbank zu deklarieren, ist das Schema durch die JSON-Dokumente und durch den Code, der sie generiert oder liest, definiert. Für den Entwickler ergeben sich in diesem Modell eine Reihe von Vorteilen: Es ist kein Schema-Design und kein fixes Schema vor dem Speichern von Daten notwendig – Data First! Ein neues Attribut kann einfach einem JSON-Dokument hinzugefügt werden ohne dass es erst per SQL-Befehl definiert werden muss. Die Daten werden auch nicht normalisiert (in mehreren Tabellen) gespeichert, sondern als ganzes Objekt – was sich auch positiv auf die Performance auswirken kann, insbesondere wenn viele Objekte gleichzeitig geladen, verändert oder hinzugefügt werden, wie es bei Web-Anwendungen der Fall ist.
Das Speichern, Laden, Auffinden und Ändern von Objekten wird durch einfache Befehle realisiert, die in der Regel direkt in den Programmcode eingefügt werden. Dies bedeutet auch eine Vereinfachung gegenüber SQL-Statements, die häufig als String im Programmcode definiert werden, bevor sie geparst und ausgeführt werden. Drei bis vier lange Zeilen schrumpfen dann zu einem kurzen und lesbaren get()- oder insert()-Befehl zusammen.
Interessanterweise sind die Vor- und Nachteile von (objekt-)relationalen Datenbanken und Document-Stores komplementär: während mit letzteren simple Operationen auf den gesamten Dokumenten sehr einfach sind, ist es ungleich schwieriger, Operationen durchzuführen, die Teildaten aus mehreren Dokumenten extrahieren und aggregieren, wie dies bei analytischen Anfragen oder Reports üblicherweise der Fall ist. Da in der Anwendungsentwicklung die analytischen Anfragen oft erst nachrangig betrachtet werden (man muss erst Kunden speichern können, bevor man die besten Kunden findet) sind die Defizite von reinen Document-Stores anfangs noch nicht so sichtbar.
NoSQL-Document-Store-APIs in der Oracle-Datenbank
Dass sich die Oracle-Datenbank sehr gut zum Speichern und Verarbeiten von heterogenen Daten und somit auch für JSON-Daten eignet, ist allgemein bekannt – jedoch ist nicht jeder Entwickler bereit, hierfür SQL zu nutzen. Hier hilft eine Document-Store-API, auch Simple Oracle Document Access (SODA), die einfache Datenbank-Operationen automatisch in äquivalentes SQL übersetzt und somit eine NoSQL-Schnittstelle zu einer relationalen Datenbank bereitstellt. Mit SODA kann man Collections in der Oracle-Datenbank erstellen und speichern, sie abrufen und abfragen, ohne SQL zu kennen oder zu wissen, wie die Dokumente in der Datenbank gespeichert sind. Dokumente können damit aus der Datenbank durch Key Lookup oder durch Query-by-Example (QBE) Pattern-Matching abgerufen werden. Oracle-SODA-Implementierungen sind in Node.js, Java, PL/SQL, Oracle Call Interface und auch über REST-Schnittstellen verfügbar – unabhängig davon, wie die Datenbank eingesetzt wird – on-premises oder in der Cloud. Sind spezifische Treiber zur Verwendung notwendig, wie zum Beispiel im Fall von Python oder Node.js, sollten diese vorab installiert werden. Alle Informationen hierzu finden sich auf der SODA-Website [1]. Kostenfreie Werkzeuge wie Oracle SQLcl und das graphische Werkzeug Database Actions komplementieren das Angebot.
Zu den Best Practices gehört, einen Datenbankbenutzer mit Speicherquotas, CREATE SESSION- und CREATE TABLE-Privilegien und EXECUTE-Privilegien auf das spezielle PL/SQL-Package DBMS_SODA anzulegen. Fortgeschrittene Benutzer, die Oracle-Sequences für Schlüssel verwenden, benötigen auch das CREATE SEQUENCE-Privileg. Und schon kann man loslegen.
Im ersten Beispiel verwenden wir das Linemode-Werkzeug Oracle SQLcl, um eine Collection mynewcollection zu erzeugen.
SQL> soda create mynewcollection;
Das Äquivalent mit einer typischen REST-Implementierung nutzt dazu das PUT-Verb mit URL
http://localhost:8080/ords/soe/soda/latest/mynewcollection. Mit diesem REST-Request wird dann eine Collection mynewcollection im Datenbankschema SOE erstellt. Generell werden Operationen wie Erstellen, Lesen, Aktualisieren und Löschen in SODA for REST auf HTTP-Verben POST, GET, PUT bzw. DELETE abgebildet.
Konzeptionell werden damit JSON-Collections auf Tabellen abgebildet, die eine JSON-Spalte und einige Metadaten besitzen. Ab Oracle Database 21c steht zur Speicherung ein optimierter JSON-Datentyp zur Verfügung, der JSON in einem Binärformat ablegt, welches für Datenbanken optimiert wurde. Das Schema der Tabelle, d. h. die Spalten und deren Datentypen ist dabei fest definiert und muss nicht vom Nutzer definiert werden. Der Befehl zum Erstellen der Collection wird automatisch in ein CREATE TABLE-Statement übersetzt, welches eine Tabelle mit den folgenden Spalten erzeugt.
SQL> describe mynewcollection
Name Null? Type
------------- -------- -------------
ID NOT NULL VARCHAR2(255)
CREATED_ON NOT NULL TIMESTAMP(6)
LAST_MODIFIED NOT NULL TIMESTAMP(6)
VERSION NOT NULL VARCHAR2(255)
JSON_DOCUMENT JSON
Möchte man einen Überblick über alle verfügbaren SODA-Kommandos erhalten, kann man das Kommando help verwenden.
SQL> soda help
SODA Help
------
…
docs.oracle.com/en/database/oracle/simple-oracle-document-access/
soda create <collection_name>
Create a new collection.
/* Example: create a collection named fruit */
soda create fruit
soda insert <collection_name> <json_str | filename>
Insert a JSON document into a collection.
/* Example: insert a JSON document into a collection named fruit */
soda insert fruit {"name" : "orange", "quantity" : 20}
soda get <collection_name> [-all | -f | -k | -klist] [{<key> | <k1> <k2> ... > | <qbe>}]
List documents the collection
Optional arguments:
-all list the keys of all docs in the collection
-k list docs matching the specific <key>
-klist list docs matching the list of keys
-f list docs matching the <qbe>
/* Example: Get all documents from the collection named fruit. */
soda get fruit
/* Example: Get the documents in the collection named fruit where the
"name" attribute is equal to "orange" */
soda get fruit -f {"name" : "orange"}
/* Example: Get the documents in the collection named fruit where the
"name" attribute is equal to "orange" */
soda get fruit -f {"quantity" : {"$lt" : 50}}
soda remove <collection_name> [-k | -klist |-f] {<key> | <k1> <k2> ... | <qbe>}
Remove documents from the collection.
...
Befehle zum Einfügen von JSON-Dokumenten werden gleichermaßen als ein SQL-INSERT ausgeführt. Ähnliches gilt für UPDATEs und DELETEs. Ein Einfügen mittels SODA sieht folgendermaßen aus.
soda insert mynewcollection {"name": "John", "address": {"city": "Georgetown", "street": "Alexa Place 40"}}
Eine wichtige Eigenschaft der Document-Store-APIs ist, nach einem oder mehreren Dokumenten suchen zu können, die definierten Suchkriterien entsprechen. Dabei wird die Anfrage selbst als ein JSON-Dokument dargestellt. Das folgende Beispiel selektiert alle Dokumente, bei denen der Name Matilda und im Adressfeld die Stadt Sydney vorkommt.
soda get mynewcollection -f {"name": "Matilda","address": {"city": "Sydney"}}
Einfacher geht der Zugriff über das graphische Werkzeug Database Actions {}JSON, das automatisch mit Oracle Autonomous Database Cloud Services bereitgestellt wird, aber auch über jede vom Kunden verwaltete ORDS (Oracle REST Data Services)-Installation und deren Oracle-Datenbanken zur Verfügung gestellt werden kann. Database Actions wird in ORDS ausgeführt – mit Zugriff über eine schema-basierte Authentifizierung. Um auf Database Actions zuzugreifen, muss man sich als Datenbankbenutzer anmelden, dessen Schema für Database Actions aktiviert wurde. In Oracle Autonomous Database ist der Benutzer ADMIN bereits aktiviert. Um das Schema eines anderen Datenbankbenutzers (hier z. B. SOE) zu aktivieren, kann man folgenden Code als privilegierter Benutzer wie z. B. ADMIN verwenden.
begin
ords_admin.enable_schema(p_enabled => TRUE,
p_schema => 'soe',
p_url_mapping_type => 'BASE_PATH',
p_url_mapping_pattern => 'SOE',
p_auto_rest_auth => NULL );
commit;
end;
/
Danach kann man sich über die Oberfläche mit SOE einloggen und eine Anfrage mit folgenden JSON-Informationen ausführen: { "name": "John", "address": {"city": "Georgetown"}}
Die Anfrage wird automatisch in ein SELECT-Statement übersetzt, in dem der SQL/JSON-Operator JSON_EXISTS die passenden Dokumente filtert.
select * from mynewcollection
where JSON_EXISTS (JSON_DOCUMENT, '$?(@.name == "John" && @.address.city == "Georgetown")')
Operationen einer Document-Store-API werden automatisch in äquivalente SQL-Operationen übersetzt. Ein angenehmer Nebeneffekt ist, dass der Query-Optimizer den effizientesten Plan erzeugen kann, zum Beispiel, wenn Indizes oder Materialized Views vorhanden sind oder die Tabelle (Collection) partitioniert, ge-sharded oder in-memory ist.
JSON und Converged Database: Mehr als CRUD-Operationen
SODA-Zugriffe sind einfach und decken das Arbeiten mit Basis-Operationen, auch CRUD-Operationen (Create, Read, Update, Delete) genannt, ab. Es geht dabei um das Ablegen, Lesen, Aktualisieren und Löschen von JSON-Informationen. Mit SQL-Kenntnissen lässt sich allerdings weit mehr mit JSON- Dokumenten bewerkstelligen. Neben einem JSON-Datentyp gibt es dedizierte SQL-Operatoren, die zum Beispiel erlauben, Werte aus JSON-Daten zu extrahieren oder JSON aus relationalen Daten zu erzeugen. Mit der JSON_VALUE oder der Dot-Notation kann einfach auf einzelne Teile im Dokument zugegriffen werden. Folgendes Beispiel extrahiert den Namen aus dem JSON-Dokument.
select m.json_document.name from mynewcollection m;
-- mit JSON_VALUE
select json_value(json_document, '$.name')
from mynewcollection;
Damit lässt sich auch ein funktionaler B*Index erzeugen. Sollen hingegen Ad-hoc-Suchen oder Volltextsuchen nach Textfeldern durchgeführt werden, eignet sich der JSON Search Index.
create search index mynewcoll_idx on mynewcollection (JSON_DOCUMENT) for json;
Eine Suche lässt sich dann mit SQL oder mit SODA durchführen.
select * from mynewcollection t
where json_textcontains(t.json_document, '$.address', 'place');
soda get mynewcollection -f {"address" : { "$contains" : "Place" } }
Zusätzlich können Cross-Model-Abfragen – zum Beispiel gemeinsam mit relational gespeicherten Daten aber auch in Kombination mit Spatial usw. – durchgeführt werden. Alle bekannten Konzepte und Techniken der Oracle-Datenbank sind damit nutzbar. Ein Beispiel mit der Oracle Flashback Query zeigt, wie einfach man in die Vergangenheit (z. B. 180 Minuten) zurückgehen kann.
select json_value(json_document, '$.name')
from mynewcollection
AS OF TIMESTAMP (SYSTIMESTAMP - INTERVAL '180' MINUTE);
Für eine ausführlichere Erklärung der SQL/JSON-Operatoren, der verwendeten JSON Path Syntax und weitere Themen wie JSON-Indizierung empfehlen wir den JSON Developer's Guide [2].
Oracle Database API for MongoDB
Nachdem wir einen Überblick über die Eigenschaften JSON-basierter Entwicklung gegeben haben, wollen wir die Oracle Database API for MongoDB genauer vorstellen – dies gestaltet sich erstaunlich unspektakulär: Zurzeit unterstützen die Autonomous JSON Database- und Autonomous Transaction Processing Cloud-Dienste die MongoDB-API, sie muss jedoch durch ACLs freigeschaltet werden (Details im Blog [3]). Danach sind die beiden Standard-MongoDB-Ports 27016 und 27017 geöffnet und die Connect-Strings werden in der Cloud-Konsole angezeigt (Port 27017 unterstützt Load-Balancing und sollte bevorzugt werden).
Was verbleibt, ist, den Connect-String der MongoDB-Applikation auszutauschen, so dass die Applikation die Oracle-Datenbank als Backend nutzt. Analog lassen sich Tools wie die MongoShell oder mongimport/mongorestore direkt mit der Oracle-Datenbank verbinden, z. B. um Daten in eine Collection zu importieren. Die Befehle, die die MongoDB-Anwendung versendet, werden von der MongoDB-API verstanden und wie oben beschrieben in äquivalente SQL-Statements übersetzt und ausgeführt. Die Ergebnisse werden dann wiederum in das Wire-Protocol übersetzt, welches MongoDB versteht. Der Austausch von MongoDB mit Oracle ist somit weitestgehend transparent – wenngleich einige Funktionalitäten, wie z. B. die Aggregation-Pipeline, noch nicht unterstützt werden.
MongoDB nutzt ein binäres JSON-Format (BSON), welches erweiterte Datentypen besitzt. Oracle nutzt ebenfalls ein Binärformat (OSON), welches auch erweiterte Datentypen (z. B. Timestamp) besitzt, so dass Daten von MongoDB verlustfrei zu Oracle migriert werden können. Im Gegensatz zu MongoDBs BSON-Format, das seriell gelesen werden muss, unterstützt Oracle's OSON-Format Sprung-Navigation und partielle Updates, so dass sowohl Anfragen als auch Updates effizienter durchgeführt werden können.
Fazit
Die Oracle Database API for MongoDB erlaubt es, die Oracle-Datenbank mit MongoDB-Treibern und Tools zu nutzen. Folglich können MongoDB-Entwickler:innen mit der Oracle-Datenbank arbeiten und existierende Skills weiterverwenden. Der SQL-Zugriff auf MongoDB-Collections ist sowohl lesend als auch schreibend möglich. Für analytische Anfragen und Reports kann auf SQL zurückgegriffen werden. Mittels SQL können auch aus existierenden relationalen Daten JSON erzeugt und MongoDB-Applikationen zur Verfügung gestellt werden. Dabei sollte man immer mit berücksichtigen, dass das Entwickeln in einer Oracle-Converged-Datenbank viele Vorteile bringen kann. Anforderungen an die Sicherheit, Anwendungsverfügbarkeit, Performance, einheitliche Administration und Monitoring werden dabei durch den Standardumfang abgedeckt. Mit und ohne SQL lässt sich damit arbeiten. Übrigens auch ohne Installation: Oracle Autonomous Database gewährleistet eine schnelle und einfache Verfügbarkeit. Sie ist nicht nur in wenigen Minuten provisioniert, sondern auch kostenfrei in den Always Cloud Free Services des Oracle Cloud Free Tiers verfügbar [4].
Möchte man Oracle Database API for MongoDB, JSON in der Datenbank, SODA usw. selbst ausprobieren, kann man auch dazu Oracle Livelabs verwenden, das mittlerweile zahlreiche Workshops zu den Themen anbietet und kostenfrei zur Verfügung steht [5].
Beispiele zu Workshops, weitere Blogeinträge zum Thema