99,9999 Prozent Verfügbarkeit und schnell wie SSD
Nimble Storage findet neben den großen Herstellern wie DELL|EMC, HPE und NetApp immer größere Verbreitung. Das Produktportfolio besteht aus All-Flash- und Adaptive-Flash-Speichersystemen, die auf einer selbst entwickelten Technologie auf Basis des Log-Structured-Filesystems den bekannten Legacy-Ansätzen den Rang ablaufen sollen. Patentierte Verfahren wie Triple+ Parity, eine Verfügbarkeit von gemessenen 99,9999 Prozent und die Aussage, mit einem auf herkömmlichen Festplatten und SSDs basierenden Hybrid-System die Leistung eines All-Flash-Systems zu erreichen, haben uns neugierig gemacht. Wir haben nachgefragt, wie dies intern realisiert wird.
Informatik Aktuell: Ihr Storage soll mit normalen Festplatten – und zu deren Preisen – Geschwindigkeiten wie SSDs erreichen. Wie ist das möglich?
Thomas Becker: Die Leistung eines Nimble Storage-Speichersystems wird nicht wie bei herkömmlichen Systemen über die Anzahl der Speichermedien – sprich drehender Festplatten – generiert. Diese Technologie ist überholt, da sie nicht von der Weiterentwicklung der CPU-Leistung über die vergangenen Jahre profitiert. Im Gegensatz dazu sind die Leistungen von Festplatten kaum gesteigert worden – wohl aber deren Kapazitäten. Unser Betriebssystem NimbleOS organisiert und sequentialisiert alle zu speichernden Daten vor dem Schreiben in das Filesystem und führt die dazu notwendigen Berechnungen auf den in den Controllern redundant vorhandenen Intel MultiCore CPUs durch. Sequentielles Schreiben und die damit verbundene Vermeidung jeglichen Random I/Os erlaubt eine erheblich höhere Schreibgeschwindigkeit auf Festplatten als jedes andere Verfahren im Markt.
Das Adaptive Flash-System CS7000 von Nimble Storage erreicht auf dieser Basis einen Durchsatz von mehr als 10.000 IOPS pro Festplatte (insgesamt bis zu 230.000 IOPS), während ein solches Bauteil rein hardwareseitig nur ca. 100-150 IOPS erreicht. Wir sprechen hier von Software Defined Performance, die unabhängig vom Füllgrad des Speichersystems konstant hohe Leistung bietet. Ein Algorithmus prüft im Adaptive Flash-System permanent, welche Daten mit hoher Wahrscheinlichkeit in Kürze von einer Applikation angefordert werden und speichert diese dann zusätzlich in einem SSD-Lesecache. Dieser Algorithmus erreicht eine Treffergenauigkeit von durchschnittlich mehr als 96 Prozent und liefert der Applikation die Daten in Flash-Geschwindigkeit. So kombinieren wir die hohe Leistung von Flash-Speichern mit dem Kostenvorteil drehender Festplatten und stellen eine Systemreihe zur Verfügung, die auf dieser Basis Schreib- und Lese-Latenzen von unter einer Millisekunde bietet und für jede Art von Mainstream-Applikationen wie z. B. E-Mail, Datenbanken, CRM- und ERP-Systeme sowie Virtualisierung geeignet ist. Auf Basis derselben Architektur erhalten unsere Kunden Adaptive-Flash (=Hybrid) und All-Flash-Systeme, die sich im Wesentlichen durch die verwendeten Speichermedien unterscheiden.
Informatik Aktuell: Was hat Prof. Mendel-Rosenblum mit Nimble zu tun?
Thomas Becker: Professor Rosenblum ist US-amerikanischer Informatiker und hält einen Lehrstuhl an der Stanford University. Er ist Mitbegründer von VMware, hat aber bereits vorher einen wesentlichen Beitrag in der Entwicklung von Filesystemen geleistet, von dem Nimble Storage heute profitiert. Wir sprechen hier vom Log-Structured Filesystem, auf dessen Grundlagen die Architektur CASL ("Cache Accelerated Sequential Layout") und damit NimbleOS von unseren Firmengründern entwickelt worden ist. Die Grundlagen dazu stammen aus den späten 1980er Jahren, waren damals aber aufgrund noch nicht für den Industrieeinsatz vorhandener Technologie nicht kommerziell nutzbar. Erst im Jahr 2007 waren die drei notwendigen Technologien Intel MultiCore CPUs, SSDs und hochkapazitive Festplatten mit mehr als 1TB Kapazität verfügbar.
Nimble Storage hat ab 2008 eine völlig neue Architektur entwickelt, die die Vorteile hoher Rechenleistung, hoher Speicherkapazität drehender Speichermedien und die hohe Lese- und Schreibgeschwindigkeit von Flash-Speichermedien optimal kombiniert.
Im Gegensatz zu den herkömmlichen und seit langen Jahren verwendeten Datenspeicherverfahren ist der Ansatz von Nimble Storage von Anfang an auf den Einsatz von Flash-Speichermedien hin ausgelegt, so daß die Markteinführung von All-Flash-Systemen auf Basis derselben Architektur im März dieses Jahres eine logische Konsequenz war.
Informatik Aktuell: Wie wird denn das Filesystem intern realisiert?
Thomas Becker: Das Log-Structured Filesystem (LFS) ist eine Weiterentwicklung des UNIX File Systems (UFS). Die durch das Betriebssystem veranlasste Organisation der zu schreibenden Daten in ein Nimble Storage-System hat zum Ergebnis, daß dieses Filesystem grundsätzlich mit identisch großen Datenblöcken sequentiell beschrieben wird. Damit wird jegliche Fragmentierung vermieden, die früher oder später zu Leistungseinbußen führen würde. Ein Nimble Storage-System arbeitet bei 5 Prozent Füllgrad genauso schnell wie bei 90 Prozent. Ein permanent im Hintergrund laufender sogenannter "Sweeping-Prozess" sorgt für die Reorganisation und Löschung nicht mehr benötigter Daten und erstellt aus den verbleibenden Daten laufend wieder neue, gleich große Segmente bzw. gleich große Leerstellen, die ein vollständig homogenes Filesystem ergeben.
Das System arbeitet mit variablen Blockgrößen, d. h. jede Applikation wird optimal eingebunden. Der User legt bei der Erstellung eines Volumes fest, mit welcher Applikation es betrieben werden soll. Damit überwinden wir die Einschränkungen klassischer Speichersysteme, die üblicherweise auf eine bestimmte Blockgröße (4KB, 8KB, 16KB etc.) voreingestellt sind und nutzen die zur Verfügung stehende Speicherkapazität so effizient wie möglich. Außerdem arbeitet Nimble Storage grundsätzlich mit einer RAID6-Konfiguration mit Triple Parity, d. h. drei Laufwerke können im laufenden Betrieb ausfallen, ohne daß die Datenintegrität gefährdet ist – das entspricht dem höchsten im Markt verfügbaren Datenschutz – sowohl bei All-Flash- wie auch bei Adaptive-Flash-Systemen.
Informatik Aktuell: Und welche Vorteile bringt das?
Thomas Becker: Das Speichersystem organisiert sich selbständig und liefert in Verbindung mit der CPU-Leistung des aktiven Controllers eine vorhersagbare und konstante Performance unabhängig vom Füllgrad und der angeschlossenen Kapazität. Es ermöglicht die unabhängige Skalierung von Leistung und Kapazität, da die Leistung nicht von der Anzahl der Speichermedien (=Spindeln) abhängt. Unsere Kunden erhalten von Tag 1 an die von der CPU-Leistung definierte IOPS-Performance und können jederzeit die Kapazität skalieren, d. h. weitere Disk-Shelves hinzufügen. Dies geschieht unterbrechungsfrei und dank vorkonfiguriertem RAID6 mit Triple Parity-Absicherung innerhalb weniger Minuten.
Die Leistung ist ebenso einfach skalierbar – durch einen unterbrechungsfreien Tausch der redundanten Controller ist ein Upgrade der Rechenleistung bis auf 230.000 IOPS beim Adaptive- und 300.000 IOPS beim All-Flash-System jederzeit möglich und erlaubt somit eine Betriebsdauer, die deutlich über den klassischen Abschreibungszeiträumen liegt.
Informatik Aktuell: Gibt es so etwas wie Snapshots? Und wenn ja, wie sieht das intern technisch aus?
Thomas Becker: Snapshots zählen zum Standardrepertoire der heutzutage verwendeten Absicherung von Daten. Nimble Storage bietet unseren Kunden die Möglichkeit, bis zu 150.000 Snapshots je Speichersystem zu erstellen und erlaubt einen wahlfreien Zugriff auf diese. Dank Einbindung unserer Technologie in die Backup-Lösungen führender Hersteller ist die Administration auch über deren Oberfläche möglich.
Snapshots haben in einigen Bereichen bereits das klassische Backup abgelöst, da mit ihrer Hilfe eine erheblich kürzere RPO- und RTO-Zeit erreicht werden kann. Besonders im Zusammenhang mit aktuellen Bedrohungen wie zum Beispiel Verschlüsselungstrojanern hat die Erzeugung von Snapshots einen hohen Praxisnutzen. Eine Wiederherstellzeit von wenigen Minuten ist mit einem klassischen Backup nicht zu schaffen. Die Einrichtung eines Snapshot-Zeitplans erfolgt einfach und dialoggeführt durch die Verwendung des Nimble Protection Managers. Die Erzeugung des Snapshots selbst dauert nur den Bruchteil einer Sekunde und ist applikationskonsistent. Er basiert auf dem "Redirect-on-write"-Verfahren, das nur sehr wenig Speicherplatz beansprucht. Dazu werden die Snapshots außerhalb des Volumes aufbewahrt, so daß kein für eine Applikation bereit gestellter Speicherplatz belegt wird.
Informatik Aktuell: Wie wird Verfügbarkeit und Hochverfügbarkeit realisiert?
Thomas Becker: Ein Nimble Storage-System ist vollständig redundant aufgebaut, um den höchstmöglichen Datenschutz zu gewährleisten. Jedes Speichersystem verfügt über zwei identische Controller, über die die Anbindung an das Netzwerk sowie die Lese- und Schreiboperationen erfolgen. Diese Controller werden im Active-/Standby-Verfahren betrieben, d. h. ein Controller liefert 100 Prozent der Systemleistung und übergibt im Störungsfall seine Aufgaben an den bereitstehenden zweiten Controller, der dann ebenfalls 100 Prozent der Systemleistung liefert. Im Gegensatz zu im Markt ebenfalls verwendeten Active-/Active-Konfigurationen anderer Hersteller muss sich der Anwender keine Gedanken über die Aufgabenverteilung – sprich die Verteilung der Applikationen auf die Controller – machen und im Störungsfall prinzipbedingt mit reduzierter Leistung rechnen. Die Umschaltung vom Active- auf den Standby-Controller erfolgt für die Applikationen transparent und ohne Beeinträchtigung der Anwendungsperformance.
Über ein patentiertes Verfahren ("Triple+ Parity") werden z. B. im All-Flash-System beim Ausfall einer SSD jeweils 5 Prozent der Reservebereiche der im RAID-Set verbleibenden SSDs unmittelbar nach Auftreten des Ausfalls mit dem Rebuilding-Prozess des RAID-Verbunds beginnen. Nach Einbau des Ersatzteils findet abschließend ein Kopierprozess der bereits erzeugten Replica der defekten SSD statt und das System ist RAID-seitig in kürzester Zeit wiederhergestellt.
Sicherheit und Datenschutz sind unsere höchste Priorität, was sich auch in der sogenannten Intra-Drive-Parity-Überwachung widerspiegelt, die Sektorfehler innerhalb eines Laufwerks automatisch korrigiert.
Abgesehen davon können Nimble Storage-Systeme im Cluster betrieben und/oder in entfernte Standorte repliziert werden. Auch dies trägt zur Erhöhung der Verfügbarkeit bei, die im Durchschnitt über alle weltweit installierten Systeme bei gemessenen 99,9999 Prozent liegt.
Informatik Aktuell: Was ist denn nötig, um Fehler und Probleme vorherzusagen?
Thomas Becker: Die Ausrüstung von Speichersystemen mit schneller SSD-Technologie ist eine gern gewählte Möglichkeit, um höhere Performance bereitstellen zu können. Diese Technologie allein reicht aber nicht aus, um die heutigen Anforderungen an Performance und Verfügbarkeit zu lösen. IT-Anwender auf der ganzen Welt stehen permanent vor der Herausforderung, die schnelle Bereitstellung von Daten für die Applikationen im Unternehmen sicherzustellen. Gelingt dies nicht, entsteht das sogenannte App-Data-Gap, das die Produktivität beeinträchtigt und Kosten verursacht, die je nach Anwendungsfall beträchtlich sein können. Denken Sie zum Beispiel an Transaktionen im Bankenumfeld, bei denen es auf Millisekunden ankommen kann.
Nimble Storage hat schon 2010 durch die Einführung von InfoSight als Support- und Managementplattform modernste Technologien im Umfeld von Big Data, Internet of Things und Cloud genutzt, um durch Datenkorrelation Probleme in der IT (und nicht nur im Speichersystem) ursächlich zu identifizieren. Jedes Nimble Storage-System überträgt regelmäßig Telemetriedaten in unsere Private Cloud. Pro Tag und pro System werden hier zwischen 20 und 70 Millionen Sensorinformationen verarbeitet. Die Korrelation der Daten in der Cloud ermöglicht es, Fehlersituationen zu erkennen, bevor sie zu einem tatsächlichen Problem führen. Die enorme Datenmenge, die dabei in der Cloud verarbeitet wird, liefert unseren Kunden damit nicht nur die Gewähr, jede potentielle Gefahr bzw. Störung rechtzeitig zu erkennen, sondern ermöglicht es Nimble Storage auch, den Support erheblich schneller und effizienter zu gestalten. Einen Level-1- und Level-2-Support finden Sie bei Nimble Storage nicht, da diese Stufen vollautomatisiert sind. Unsere Kunden sprechen bei Bedarf direkt mit dem Level-3-Support, der aufgrund der Datenkorrelation in InfoSight Zugriff auf alle Informationen des betroffenen Speichersystems hat und sofort bei der Problemlösung helfen kann. Die durchschnittliche Bearbeitungszeit eines Störungsfalls liegt bei 20 Minuten, die Wartezeit am Telefon auf einen Level-3-Engineer liegt bei unter einer Minute. Neun von zehn Support-Cases werden von InfoSight automatisch geöffnet, acht von zehn werden automatisch nach Behebung geschlossen.
Nimble Storage ist dem Wettbewerb um mindestens eine Generation voraus.
Unsere Kunden erhalten mit jedem Support-Fall eine E-Mail mit ausführlicher Beschreibung der Problemstellung nebst Lösung derselben. Hierbei wird auch die Netzwerk- und Server-Infrastruktur überwacht, mit der das Nimble Storage-System verbunden ist. Durch den hohen Automatisierungsgrad im Support gewährleisten wir nicht nur eine sehr hohe Kundenzufriedenheit (Net Promoter Score = 85!), sondern haben auch einen deutlichen Kostenvorteil gegenüber herkömmlichen Supportansätzen realisiert. Dabei wird das Prinzip des Datenschutzes genau beachtet, da lediglich Telemetriedaten verarbeitet werden.
Informatik Aktuell: Sie waren früher ja bei einem anderen Storage-Hersteller tätig. Was unterscheidet denn die verschiedenen Storage-Typen im Wesentlichen?
Thomas Becker: Im Storage-Markt sprechen wir seit ca. 25 Jahren mit demselben Vokabular, da sich die Technologien im Wesentlichen auch heute noch unverändert präsentieren. Flash-Technologie wird häufig als schneller Speicher-Tier "0" den drehenden Medien hinzugefügt und erfordert aufwändige und ineffiziente Methoden wie Data Tiering, die dazu führen, daß sich ein Speichersystem sehr gut mit sich selbst beschäftigen kann anstatt die gewünschte Performance zu liefern.
Die Entwicklung von Nimble Storage basiert auf einem sehr modernen Ansatz, der die heute verfügbare Technologie (Intel MultiCore CPUs, 3D-NAND-SSDs, Festplatten mit bis zu 10TB Kapazität) auf Basis einer einzigen Architektur und eines einzigen Betriebssystems sowohl als All-Flash- wie auch als Adaptive-Flash-Lösung realisiert. Wir mussten uns nicht mit dem Ballast einer "Legacy"-Architektur beschäftigen, sondern konnten davon unbeeinträchtigt ein Speichersystem entwickeln, das die Einschränkungen der drehenden Festplatte durch den Einsatz intelligenter Algorithmen überwindet und dank der von Anfang an auf den Einsatz von Flash hin entwickelten Architektur problemlos mit allen heutigen und zukünftigen Speichermedien umgeht. Alle technologischen Entwicklungen bei Nimble Storage entstammen dem eigenen Haus und wurden nicht durch Zukäufe realisiert. Die Produktpalette skaliert Leistung und Kapazität für alle Anwendungsbereiche unabhängig voneinander, so dass die im Markt häufig zu beobachtende Diversifizierung von Herstellern innerhalb der eigenen Produktpalette durch zugekaufte Firmen bei uns entfällt. Für unsere Kunden bedeutet das eine starke Vereinfachung im Evaluierungs- und Beschaffungsprozess.
Ich erlebe im täglichen Geschäft immer wieder die Situation, dass Kunden die Nimble-Story dankbar aufnehmen und umsetzen – nicht zuletzt durch "Timeless Storage", das u. a. den Kunden von den Kosten eines Software-Lizenzmodells befreit (bei Nimble Storage ist jegliche Funktionalität inklusive) und ihnen Konstanz bei den Support-Aufwendungen im Sinne einer Flat Rate bietet, was die Planungs- und Investititonssicherheit stark erhöht.
Nimble Storage ist aus meiner Sicht dem Wettbewerb um mindestens eine Generation voraus und wird diesem Anspruch durch die Einstufung von Gartner als "Leader" mit der höchsten "Completeness of Vision" im Magic Quadrant for General Purpose Disk Arrays gerecht [1].
Informatik Aktuell: Herr Becker, vielen Dank für das Gespräch!
Wer mehr erfahren möchte und sich für Details und Preise interessiert, kann Nimble Storage per E-Mail kontaktieren. Weitere Informationen gibt es auch auf den Webseiten von Nimble-Storage.