Kilobyte, Megabyte, Gigabyte, Terabyte und Petabyte – Was kommt danach?
Vorab für jene, die es eilig haben: Es folgen Exa-, Zetta-, Yottabyte, dann Xona-, Weka-, Vunda- und Udabyte. Weiter geht es mit dem Tredabyte, gefolgt von Sorta-, Rinta-, Quexa-, Pepta-, Ocha-, Nena-, Minga-, Luma-, Hana-, Ana- und Sopho-Byte. Am Ende des Artikels gibt es eine tabellarische Übersicht.
Etwas mehr als 4 MB speicherte der IBM 305 RAMAC. Er war der erste kommerziell erfolgreiche Rechner, der Daten auf Festspeicher nutzen konnte. Im Mai 1955 wurde er von IBM angekündigt und am 13. September 1956 der Öffentlichkeit präsentiert. Bis zu zwei Festplatten des Modells 350 Disk Storage Unit konnten eingebaut werden und Daten in Echtzeit speichern. Ein Wunder der Technik! Eine der Festplatten hatte eine Kapazität von 5 Millionen 7-Bit-Zeichen, also 4,375 Megabyte. Nicht nur was die Speichermenge betraf, war sie eine Wucht: Ihr Gewicht betrug eine Tonne und ihre Größe von 1,524×1,7272×0,635 Meter war ebenfalls beachtlich. Die Daten wurden auf 50 mit Eisenoxid beschichteten Platten gespeichert.
Meine erste Festplatte. "Bist Du wahnsinnig?!" fragte mich ein Freund kopfschüttelnd, nachdem ich meinen ersten Computer gekauft hatte. "Die kriegst Du doch niemals voll!" Die Verständnislosigkeit angesichts einer so sinnlosen Verschwendung war nicht zu übersehen. 40 Megabyte! Womit sollte man die auch füllen? Ich wusste es auch nicht recht.
Einige Jahre später, etwa ab Mitte der 1990er, gab es die ersten Gigabyte-Festplatten. Für High End Server wohlgemerkt. Gigantisch groß war nicht nur der Plattenplatz, sondern auch der Preis. Mehrere Tausend DM (Deutsche Mark) musste man dafür hinblättern. "Man", das waren Großunternehmen, die sich diesen Luxus leisten konnten. Heute bietet jeder viertklassige Elektronik-Markt Terabyte-Festplatten für ein paar Kröten und Tante Lore speichert ihre Familienfotos darauf. IBM PureSystems bietet 48 Terabyte, Oracle nennt sein Speicher-Flaggschiff vorsorglich schonmal Exadata und SAP steuert mit HANA offensichtlich auch größere Datenmengen an - und dies dann sogar im Arbeitsspeicher. Wo führt das hin?
Moores Gesetz
Die durchschnittliche Festplattenkapazität steigt annähernd exponentiell. Sie ist mit der Entwicklung der Rechenleistung vergleichbar und folgt dem Mooreschen Gesetz. Es besagt, dass sich die Komplexität integrierter Schaltkreise mit minimalen Komponentenkosten regelmäßig verdoppelt.
Gordon Moore, Mitbegründer von Intel und Visionär, beschrieb seine Beobachtung in einem Artikel, der am 19. April 1965 in der Zeitschrift Electronics erschien. Nur wenige Jahre zuvor wurden die ersten integrierten Schaltkreise entwickelt. Die Bezeichnung „Mooresches Gesetz“ wurde um 1970 von Carver Mead, einem US-amerikanischen Pionier der modernen Mikroelektronik geprägt. Heute geht man davon aus, dass sich alle 18 Monate die Datenmenge verdoppelt, die sich auf einem gängigen Festplattenlaufwerk speichern lässt. Ein Bit benötigte vor einigen Jahrzehnten noch die Fläche von einem Quadradtmillimeter zur Speicherung. Diese Fläche ist heute um mehr als den Faktor eine Milliarde kleiner. Seit etwa 2005 verringerte sich jedoch der Kapazitätszuwachs etwas.
Grenzen des Wachtums
Das Betriebssystem adressiert die Sektoren der Festplatte über das Logical Block Addressing (LBA). Der erste physikalische Festplattensektor wird mit dem logischen Block 0 angesprochen, der zweite mit LBA 1, der dritte LBA 2 und so weiter. Die Speicherkapazität einer Festplatte ergibt sich aus der Anzahl der logischen Blöcke multipliziert mit der Sektorgröße der Platte. Der logische Adressraum ist jedoch begrenzt. Aktuell kann er bis zu 48 Bit groß sein. Bei einer Sektorgröße von 512 Byte ergeben sich hieraus 512 * 2^48 Byte, also rund 144 Petabyte. Vergrößert man den Adressraum, vergrößert sich auch der adressierbare Speicher. Dasselbe gilt bei einer Vergrößerung der Sektorgröße. Damit allein ist jedoch noch nichts erreicht.
Um die Kapazität zu erhöhen, gibt es zwei Möglichkeiten: Entweder verbaut der Hersteller mehr Magnetscheiben oder er erhöht die Datendichte. Beides hat Nachteile. Der Platz für die Datenscheiben ist durch den Formfaktor eingeschränkt. Zudem erhöht sich mit der Anzahl der Komponenten auch das Risiko eines Ausfalls; auch der Stromverbrauch sowie die Lautstärke der Festplatten steigen. Bleibt die Möglichkeit der Erhöhung der Datendichte.
Aber: Je höher die Datendichte, desto weniger Fläche bleibt für die Speicherung eines Bytes. Und dies wiederum erhöht die Fehleranfälligkeit sowohl beim Schreiben als auch beim Lesen. Irgendwann kann der Schreib-Lesekopf Störsignale nicht mehr von der eigentlichen Information trennen. Das Signal-Rausch-Verhältnis, abgekürzt mit S/N oder SNR (englisch signal-to-noise ratio) wirkt sich hier aus. Es beschreibt die technische Qualität eines Nutzsignals, das von einem Rauschsignal überlagert wird. Um eine Information lesen zu können, muss sich das Nutzsignal deutlich vom Hintergrundrauschen abheben. Ist diese Rate zu niedrig, steigt bei Digitalübertragungen die Fehlerhäufigkeit.
Die Zukunft
Bei steigender Datendichte und ungünstigerem Signal-Rausch-Verhältnis wird deshalb ein Teil des Speichers für die Fehlererkennung belegt. Um Fehler feststellen zu können, wird zusätzlich ein sogenannter Error Correction Code (ECC) verwendet. In ihm werden vor der Datenspeicherung zusätzliche redundante Bits berechnet, die zur Erkennung von Fehlern und zur Wiederherstellung der Daten genutzt werden. Dies wiederum schränkt den verfügbaren Platz für die Nutzdaten ein.
Superparamagnetismus ist eine Eigenschaft sehr kleiner ferromagnetischer Teilchen, die auch bei Temperaturen unterhalb der Curie-Temperatur keine bleibende Magnetisierung dauerhaft halten können, wenn ein zuvor angelegtes Magnetfeld abgeschaltet wurde. Festplatten nähern sich langsam dieser physikalischen Grenze, die bei ungefähr 1 Tbit pro Quadratzoll liegt. Hersteller wie Western Digital versuchen daher mit Helium-gefüllten Laufwerken mehr Scheiben in einem Gerät unterzubringen. Seagate setzt auf Shingled Magnetic Recording (SMR). Hier überschneiden sich die Datenspuren und benötigen so weniger Platz. Doch besteht die Gefahr, dass beim Überschreiben von Daten auch benachbarte Spuren berührt werden. Seagate hat dieses Problem laut eigenen Angaben durch das Zusammenfassen mehrerer Datenspuren in Bänder gelöst. Bis 2020 könnte diese Technik Festplatten mit 20 TByte ermöglichen.
Was kommt nach Petabyte?
Nach Terabyte kommt Petabyte. Dem Petabyte folgt Exabyte, danach das Zettabyte. Nur ganz am Rande: Das Wort Terrabyte gibt es nicht. Terra (mit zwei r) kommt aus dem Lateinischen und heißt "Erde". Das Wort Tera (mit einem r) dagegen stammt aus dem Griechischen und bedeutet Ungeheuer. Von ihm leitet sich das Terabyte ab.
Fazit
Speichertechnologien werden sich in den nächsten Jahren grundlegend wandeln. Schon aus Performance-Gründen sind neue Wege gefragt. Denn die Steigerung der speicherbaren Datenmenge genügt nicht - Daten müssen auch in angemessener Zeit verarbeitet werden. Aktuell erobern Flash-Speicher die Rechenzentren. Eine Hard Disk hat mit etwa 205 bis 350 IOPS eine deutlich geringere I/O-Leistung als eine SSD mit rund 50.000 bis 100.000 IOPS. Solid State Disks sind also sehr interessant für künftige Storage-Konfigurationen.
Sollte sich Moores Gesetz bestätigen, werde ich noch Kapazitäten mit mehr als einem Zettabyte erleben. Dann bin ich 87 Jahre alt. Die Welt wird eine andere sein. Ich werde mich fragen, was man auf so großen Speichermedien wohl speichern soll. Mein Freund aus Studienzeiten wird verständnislos den Kopf schütteln, während er am Gehstock hängt.
Was kommt nach Petabyte? Übersicht der Präfixe für Metriken
Präfix | Symbol | Faktor | Wert |
---|---|---|---|
Lunto | l | 10-63 | 0,000000000000000000000000000000000000000000000000000000000000001 |
Mikto | mi | 10-60 | 0,000000000000000000000000000000000000000000000000000000000001 |
Nekto | nk | 10-57 | 0,000000000000000000000000000000000000000000000000000000001 |
Otro | o | 10-54 | 0,000000000000000000000000000000000000000000000000000001 |
Pekro | pk | 10-51 | 0,000000000000000000000000000000000000000000000000001 |
Quekto | q | 10-48 | 0,000000000000000000000000000000000000000000000001 |
Rimto | r | 10-45 | 0,000000000000000000000000000000000000000000001 |
Sotro | s | 10-42 | 0,000000000000000000000000000000000000000001 |
Trekto | td | 10-39 | 0,000000000000000000000000000000000000001 |
Unto | u | 10-36 | 0,000000000000000000000000000000000001 |
Vunkto | v | 10-33 | 0,000000000000000000000000000000001 |
Wekto | w | 10-30 | 0,000000000000000000000000000001 |
Xonto | x | 10-27 | 0,000000000000000000000000001 |
Yocto | y | 10-24 | 0,000000000000000000000001 |
Zepto | z | 10-21 | 0,000000000000000000001 |
Atto | a | 10-18 | 0,000000000000000001 |
Femto | f | 10-15 | 0,000000000000001 |
Pico | p | 10-12 | 0,000000000001 |
Nano | n | 10-9 | 0,000000001 |
Micro | µ | 10-6 | 0,000001 |
Milli | m | 10-3 | 0,001 |
Centi | c | 10-2 | 0,01 |
Deci | d | 10-1 | 0,1 |
100 | 1 | ||
Deka | DA | 101 | 10 |
Hecto | H | 102 | 100 |
Kilo | K | 103 | 1000 |
Mega | M | 106 | 1000000 |
Giga | G | 109 | 1000000000 |
Tera | T | 1012 | 1000000000000 |
Peta | P | 1015 | 1000000000000000 |
Exa | E | 1018 | 1000000000000000000 |
Zetta | Z | 1021 | 1000000000000000000000 |
Yotta | Y | 1024 | 1000000000000000000000000 |
Xona | X | 1027 | 1000000000000000000000000000 |
Weka | W | 1030 | 1000000000000000000000000000000 |
Vunda | V | 1033 | 1000000000000000000000000000000000 |
Uda | U | 1036 | 1000000000000000000000000000000000000 |
Treda | TD | 1039 | 1000000000000000000000000000000000000000 |
Sorta | S | 1042 | 1000000000000000000000000000000000000000000 |
Rinta | R | 1045 | 1000000000000000000000000000000000000000000000 |
Quexa | Q | 1048 | 1000000000000000000000000000000000000000000000000 |
Pepta | PP | 1051 | 1000000000000000000000000000000000000000000000000000 |
Ocha | O | 1054 | 1000000000000000000000000000000000000000000000000000000 |
Nena | N | 1057 | 1000000000000000000000000000000000000000000000000000000000 |
Minga | MI | 1060 | 1000000000000000000000000000000000000000000000000000000000000 |
Luma | L | 1063 | 1000000000000000000000000000000000000000000000000000000000000000 |
Hana | HA | 1066 | 1000000000000000000000000000000000000000000000000000000000000000000 |
Ana | A | 1069 | 1000000000000000000000000000000000000000000000000000000000000000000000 |
Sopho | SO | 1072 | 1000000000000000000000000000000000000000000000000000000000000000000000000 |
In der ursprünglichen Version des Artikels wurde behauptet, man habe Mitte bis Ende der Neunziger Jahre mehrere Tausend Euro für Gigabyte-Festplatten zahlen müssen. Das ist falsch. Es waren mehrere Tausend Deutsche Mark. Der Fehler wurde im vorliegenden Text behoben.
Publikationen
- Oracle 12c New Features: Inklusive Release 2
- Der Oracle DBA: Handbuch für die Administration der Oracle Database 12c
- Oracle 11g. Neue Features für Administratoren und Entwickler
- Oracle 10g Hochverfügbarkeit. Die ausfallsichere Datenbank mit RAC, Data Guard und Flashback Edition Oracle