Über unsMediaKontaktImpressum
Andrea Held 07. Mai 2014

Kilobyte, Megabyte, Gigabyte, Terabyte und Petabyte – Was kommt danach?

Vorab für jene, die es eilig haben: Es folgen Exa-, Zetta-, Yottabyte, dann Xona-, Weka-, Vunda- und Udabyte. Weiter geht es mit dem Tredabyte, gefolgt von Sorta-, Rinta-, Quexa-, Pepta-, Ocha-, Nena-, Minga-, Luma-, Hana-, Ana- und Sopho-Byte. Am Ende des Artikels gibt es eine tabellarische Übersicht.

Etwas mehr als 4 MB speicherte der IBM 305 RAMAC. Er war der erste kommerziell erfolgreiche Rechner, der Daten auf Festspeicher nutzen konnte. Im Mai 1955 wurde er von IBM angekündigt und am 13. September 1956 der Öffentlichkeit präsentiert. Bis zu zwei Festplatten des Modells 350 Disk Storage Unit konnten eingebaut werden und Daten in Echtzeit speichern. Ein Wunder der Technik! Eine der Festplatten hatte eine Kapazität von 5 Millionen 7-Bit-Zeichen, also 4,375 Megabyte. Nicht nur was die Speichermenge betraf, war sie eine Wucht: Ihr Gewicht betrug eine Tonne und ihre Größe von 1,524×1,7272×0,635 Meter war ebenfalls beachtlich. Die Daten wurden auf 50 mit Eisenoxid beschichteten Platten gespeichert.

Meine erste Festplatte. "Bist Du wahnsinnig?!" fragte mich ein Freund kopfschüttelnd, nachdem ich meinen ersten Computer gekauft hatte. "Die kriegst Du doch niemals voll!" Die Verständnislosigkeit angesichts einer so sinnlosen Verschwendung war nicht zu übersehen. 40 Megabyte! Womit sollte man die auch füllen? Ich wusste es auch nicht recht.

Einige Jahre später, etwa ab Mitte der 1990er, gab es die ersten Gigabyte-Festplatten. Für High End Server wohlgemerkt. Gigantisch groß war nicht nur der Plattenplatz, sondern auch der Preis. Mehrere Tausend DM (Deutsche Mark) musste man dafür hinblättern. "Man", das waren Großunternehmen, die sich diesen Luxus leisten konnten. Heute bietet jeder viertklassige Elektronik-Markt Terabyte-Festplatten für ein paar Kröten und Tante Lore speichert ihre Familienfotos darauf. IBM PureSystems bietet 48 Terabyte, Oracle nennt sein Speicher-Flaggschiff vorsorglich schonmal Exadata und SAP steuert mit HANA offensichtlich auch größere Datenmengen an - und dies dann sogar im Arbeitsspeicher. Wo führt das hin?

Moores Gesetz

Die durchschnittliche Festplattenkapazität steigt annähernd exponentiell. Sie ist mit der Entwicklung der Rechenleistung vergleichbar und folgt dem Mooreschen Gesetz. Es besagt, dass sich die Komplexität integrierter Schaltkreise mit minimalen Komponentenkosten regelmäßig verdoppelt.

Gordon Moore, Mitbegründer von Intel und Visionär, beschrieb seine Beobachtung in einem Artikel, der am 19. April 1965 in der Zeitschrift Electronics erschien. Nur wenige Jahre zuvor wurden die ersten integrierten Schaltkreise entwickelt. Die Bezeichnung „Mooresches Gesetz“ wurde um 1970 von Carver Mead, einem US-amerikanischen Pionier der modernen Mikroelektronik geprägt. Heute geht man davon aus, dass sich alle 18 Monate die Datenmenge verdoppelt, die sich auf einem gängigen Festplattenlaufwerk speichern lässt. Ein Bit benötigte vor einigen Jahrzehnten noch die Fläche von einem Quadradtmillimeter zur Speicherung. Diese Fläche ist heute um mehr als den Faktor eine Milliarde kleiner. Seit etwa 2005 verringerte sich jedoch der Kapazitätszuwachs etwas.

Grenzen des Wachtums

Das Betriebssystem adressiert die Sektoren der Festplatte über das Logical Block Addressing (LBA). Der erste physikalische Festplattensektor wird mit dem logischen Block 0 angesprochen, der zweite mit LBA 1, der dritte LBA 2 und so weiter. Die Speicherkapazität einer Festplatte ergibt sich aus der Anzahl der logischen Blöcke multipliziert mit der Sektorgröße der Platte. Der logische Adressraum ist jedoch begrenzt. Aktuell kann er bis zu 48 Bit groß sein. Bei einer Sektorgröße von 512 Byte ergeben sich hieraus 512 * 2^48 Byte, also rund 144 Petabyte. Vergrößert man den Adressraum, vergrößert sich auch der adressierbare Speicher. Dasselbe gilt bei einer Vergrößerung der Sektorgröße. Damit allein ist jedoch noch nichts erreicht.

Um die Kapazität zu erhöhen, gibt es zwei Möglichkeiten: Entweder verbaut der Hersteller mehr Magnetscheiben oder er erhöht die Datendichte. Beides hat Nachteile. Der Platz für die Datenscheiben ist durch den Formfaktor eingeschränkt. Zudem erhöht sich mit der Anzahl der Komponenten auch das Risiko eines Ausfalls; auch der Stromverbrauch sowie die Lautstärke der Festplatten steigen. Bleibt die Möglichkeit der Erhöhung der Datendichte.

Aber: Je höher die Datendichte, desto weniger Fläche bleibt für die Speicherung eines Bytes. Und dies wiederum erhöht die Fehleranfälligkeit sowohl beim Schreiben als auch beim Lesen. Irgendwann kann der Schreib-Lesekopf Störsignale nicht mehr von der eigentlichen Information trennen. Das Signal-Rausch-Verhältnis, abgekürzt mit S/N oder SNR (englisch signal-to-noise ratio) wirkt sich hier aus. Es beschreibt die technische Qualität eines Nutzsignals, das von einem Rauschsignal überlagert wird. Um eine Information lesen zu können, muss sich das Nutzsignal deutlich vom Hintergrundrauschen abheben. Ist diese Rate zu niedrig, steigt bei Digitalübertragungen die Fehlerhäufigkeit.

Die Zukunft

Bei steigender Datendichte und ungünstigerem Signal-Rausch-Verhältnis wird deshalb ein Teil des Speichers für die Fehlererkennung belegt. Um Fehler feststellen zu können, wird zusätzlich ein sogenannter Error Correction Code (ECC) verwendet. In ihm werden vor der Datenspeicherung zusätzliche redundante Bits berechnet, die zur Erkennung von Fehlern und zur Wiederherstellung der Daten genutzt werden. Dies wiederum schränkt den verfügbaren Platz für die Nutzdaten ein.

Superparamagnetismus ist eine Eigenschaft sehr kleiner ferromagnetischer Teilchen, die auch bei Temperaturen unterhalb der Curie-Temperatur keine bleibende Magnetisierung dauerhaft halten können, wenn ein zuvor angelegtes Magnetfeld abgeschaltet wurde. Festplatten nähern sich langsam dieser physikalischen Grenze, die bei ungefähr 1 Tbit pro Quadratzoll liegt. Hersteller wie Western Digital versuchen daher mit Helium-gefüllten Laufwerken mehr Scheiben in einem Gerät unterzubringen. Seagate setzt auf Shingled Magnetic Recording (SMR). Hier überschneiden sich die Datenspuren und benötigen so weniger Platz. Doch besteht die Gefahr, dass beim Überschreiben von Daten auch benachbarte Spuren berührt werden. Seagate hat dieses Problem laut eigenen Angaben durch das Zusammenfassen mehrerer Datenspuren in Bänder gelöst. Bis 2020 könnte diese Technik Festplatten mit 20 TByte ermöglichen.

Was kommt nach Petabyte?

Nach Terabyte kommt Petabyte. Dem Petabyte folgt Exabyte, danach das Zettabyte. Nur ganz am Rande: Das Wort Terrabyte gibt es nicht. Terra (mit zwei r) kommt aus dem Lateinischen und heißt "Erde". Das Wort Tera (mit einem r) dagegen stammt aus dem Griechischen und bedeutet Ungeheuer. Von ihm leitet sich das Terabyte ab. 

Fazit

Speichertechnologien werden sich in den nächsten Jahren grundlegend wandeln. Schon aus Performance-Gründen sind neue Wege gefragt. Denn die Steigerung der speicherbaren Datenmenge genügt nicht - Daten müssen auch in angemessener Zeit verarbeitet werden. Aktuell erobern Flash-Speicher die Rechenzentren. Eine Hard Disk hat mit etwa 205 bis 350 IOPS eine deutlich geringere I/O-Leistung als eine SSD mit rund 50.000 bis 100.000 IOPS. Solid State Disks sind also sehr interessant für künftige Storage-Konfigurationen.

Sollte sich Moores Gesetz bestätigen, werde ich noch Kapazitäten mit mehr als einem Zettabyte erleben. Dann bin ich 87 Jahre alt. Die Welt wird eine andere sein. Ich werde mich fragen, was man auf so großen Speichermedien wohl speichern soll. Mein Freund aus Studienzeiten wird verständnislos den Kopf schütteln, während er am Gehstock hängt.

Was kommt nach Petabyte? Übersicht der Präfixe für Metriken

Präfix Symbol Faktor Wert
Lunto l 10-63 0,000000000000000000000000000000000000000000000000000000000000001
Mikto mi 10-60 0,000000000000000000000000000000000000000000000000000000000001
Nekto nk 10-57 0,000000000000000000000000000000000000000000000000000000001
Otro o 10-54 0,000000000000000000000000000000000000000000000000000001
Pekro pk 10-51 0,000000000000000000000000000000000000000000000000001
Quekto q 10-48 0,000000000000000000000000000000000000000000000001
Rimto r 10-45 0,000000000000000000000000000000000000000000001
Sotro s 10-42 0,000000000000000000000000000000000000000001
Trekto td 10-39 0,000000000000000000000000000000000000001
Unto u 10-36 0,000000000000000000000000000000000001
Vunkto v 10-33 0,000000000000000000000000000000001
Wekto w 10-30 0,000000000000000000000000000001
Xonto x 10-27 0,000000000000000000000000001
Yocto y 10-24 0,000000000000000000000001
Zepto z 10-21 0,000000000000000000001
Atto a 10-18 0,000000000000000001
Femto f 10-15 0,000000000000001
Pico p 10-12 0,000000000001
Nano n 10-9 0,000000001
Micro µ 10-6 0,000001
Milli m 10-3 0,001
Centi c 10-2 0,01
Deci d 10-1 0,1
    100 1
Deka DA 101 10
Hecto H 102 100
Kilo K 103 1000
Mega M 106 1000000
Giga G 109 1000000000
Tera T 1012 1000000000000
Peta P 1015 1000000000000000
Exa E 1018 1000000000000000000
Zetta Z 1021 1000000000000000000000
Yotta Y 1024 1000000000000000000000000
Xona X 1027 1000000000000000000000000000
Weka W 1030 1000000000000000000000000000000
Vunda V 1033 1000000000000000000000000000000000
Uda U 1036 1000000000000000000000000000000000000
Treda TD 1039 1000000000000000000000000000000000000000
Sorta S 1042 1000000000000000000000000000000000000000000
Rinta R 1045 1000000000000000000000000000000000000000000000
Quexa Q 1048 1000000000000000000000000000000000000000000000000
Pepta PP 1051 1000000000000000000000000000000000000000000000000000
Ocha O 1054 1000000000000000000000000000000000000000000000000000000
Nena N 1057 1000000000000000000000000000000000000000000000000000000000
Minga MI 1060 1000000000000000000000000000000000000000000000000000000000000
Luma L 1063 1000000000000000000000000000000000000000000000000000000000000000
Hana HA 1066 1000000000000000000000000000000000000000000000000000000000000000000
Ana A 1069 1000000000000000000000000000000000000000000000000000000000000000000000
Sopho SO 1072 1000000000000000000000000000000000000000000000000000000000000000000000000
Update 18.02.2015

In der ursprünglichen Version des Artikels wurde behauptet, man habe Mitte bis Ende der Neunziger Jahre mehrere Tausend Euro für Gigabyte-Festplatten zahlen müssen. Das ist falsch. Es waren mehrere Tausend Deutsche Mark. Der Fehler wurde im vorliegenden Text behoben.

Autorin

Andrea Held

Andrea Held ist technische Architektin und Autorin von Fachartikeln und Büchern, darunter "Der Oracle DBA", "Oracle New Features" und "Oracle Hochverfügbarkeit". Ihr Schwerpunkt: Hochverfügbare Datenbanksysteme.
>> Weiterlesen

Publikationen

Das könnte Sie auch interessieren
Kommentare (0)

Neuen Kommentar schreiben