Listen:
HP's Projekt "The Machine" verfolge ich nun schon seit der ersten
Veröffentlichung. Bis 2020 soll das Projekt industriereif, ab 2018 sollen
erste Edge Devices verfügbar sein. Ob es die Welt der Informatik revolutioniert, bleibt abzuwarten. Extrem interessant ist der Ansatz von HP auf jeden Fall, vor allem im Hinblick auf BigData und die weitere Industrialisierung analytischer Ansätze.
Genutzt wird die Memristor-Technologie (http://en.wikipedia.org/wiki/Memristor).
Ein Memristor ist nicht flüchtig, bisher langsamer
als DRAM, aber bis zu 100 mal schneller als Flash. Und es kann in relativ
kleinen Rackfarmen extrem viel Speicherplatz bereitgestellt werden (4TB haben
derzeit den 3.5 Zoll Formfaktor, es könnten aber auch bis zu 100TB per 3.5 Zoll
machbar sein).
Das grundlegend neue dabei ist – ein Memristor kann bis zu 10 Zustände speichern (Trinity Memristor). Hierbei wird der Integer auf Basis von 10 berechnet, was im Gegensatz zur herkömmlichen Basis von 8 (64Bit) ein Speicherung auf 20 Bit ermöglicht (bisher 64bit). Folglich hätten die Speicher mit dieser Technologie und bei derzeitiger Fertigungstechnologie die dreifache Kapazität. Ein weiterer interessanter Ansatz ist auch flüchtige Caches in Prozessoren durch nicht flüchtige Speicher zu ersetzen – was wiederum das Computing revolutionieren könnte, etwa durch das Nutzen bereits berechneter Teilmengen in weiteren Verarbeitungsschritten, beispielsweise Mustererkennung in vorhandenen Daten und Übergabe der Muster an einem weiteren Thread zur MCMC Analyse.
Das grundlegend neue dabei ist – ein Memristor kann bis zu 10 Zustände speichern (Trinity Memristor). Hierbei wird der Integer auf Basis von 10 berechnet, was im Gegensatz zur herkömmlichen Basis von 8 (64Bit) ein Speicherung auf 20 Bit ermöglicht (bisher 64bit). Folglich hätten die Speicher mit dieser Technologie und bei derzeitiger Fertigungstechnologie die dreifache Kapazität. Ein weiterer interessanter Ansatz ist auch flüchtige Caches in Prozessoren durch nicht flüchtige Speicher zu ersetzen – was wiederum das Computing revolutionieren könnte, etwa durch das Nutzen bereits berechneter Teilmengen in weiteren Verarbeitungsschritten, beispielsweise Mustererkennung in vorhandenen Daten und Übergabe der Muster an einem weiteren Thread zur MCMC Analyse.
Denkt man an Spark, macht es The Machine durchaus
reizvoll – zumal mit Spark vorwiegend nur flüchtige Teilmengen berechnet werden
(und bei Bedarf auf ein Speichermedium geschrieben werden, um die berechneten
Spills zu persistieren). Und ein solches System wie The Machine würde auch verteilte Dateisysteme wie
HDFS oder Ceph größtenteils überflüssig machen, da das Gesamtsystem (also Speicher, RAM,
Persistenzlayer, Fast Caching) als ein homogener, nicht flüchtiger
Speicherblock funktioniert und jeden bereits berechneten Zustand per se
vorrätig halten kann. Diese Teilblöcke könnten dann beliebig wiederverwendet, integriert oder extrapoliert werden, ohne dabei Teile durch volatile caches zu verlieren.
Quellen:
Comments
Post a Comment