Die Deutsche Unternehmensgruppe CADAC gibt Installation und erfolgreiche Abnahme des Supercomputers „ALiCEnext“ an der Bergischen Universität Wupptertal bekannt. ALiCEnext
(Advanced Linux Cluster Engine – next
generation) besteht aus 1024 AMD-Opteron-Prozessoren in 64Bit-Technologie und wird mit 2,083
TeraFlop/s aus einem ersten LinPack Benchmark auf Platz 74 in der Juni-Ausgabe der TOP500, der Liste der weltweit schnellsten Computer, geführt. Der Supercomputer ist damit der größte universitäre Clustercomputer Europas, sowie auch das größte in der TOP500 gelistete Opteron-Cluster in Europa. Innerhalb Deutschlands ist ALiCEnext der fünftschnellste Supercomputer.
Der Cluster-Computer setzt auf die Verwendung von
preiswerten Massenkomponenten, sowie insbesondere Opteron Prozessoren von AMD,
eingesetzt auf Motherboards von Tyan. Die 512
Knoten (Einzelrechner) des Clusters, das von
Angstrom Microsystems Inc., Boston MA, gefertigt
wurde, sind sog. Superblades, die die hohe
Packungsdichte im System ermöglichen, wie sie
heutige Supercomputer benötigen, um raumsparend
aufgebaut werden zu können und die Verwendung hochperformanter
Cluster-Interkommunikationstechnologien zu unterstützen.
Bis zu 13 Knoten sind jeweils in
einem sog. Nest mit einer speziellen Geometrie zur
Optimierung der Kühlluftführung beherbergt,
während die Nester wie Lego-Bausteine
zu Türmen variabler Höhe und Tiefe
zusammengestellt werden, um sich den klimatischen
Gegebenheiten im Rechnerraum anpassen zu können.
Die Front-to-Back-Zentralkühlung der Angstrom
Nester sorgt für eine hohe Ausfallsicherheit der
Systemkomponenten, wobei die Prozessoren im Mittel
mit bis zu 4°C geringerer Temperatur gefahren
werden als in herkömmlichen 1U-basierten
Server-Komponenten.
Die für ALiCEnext gebildeten
Tower erlauben ca. 400 GigaFlop/s auf weniger als
einem Quadratmeter Grundfläche zur Verfügung
stellen zu können.
Die Knoten unter SuSE Linux 9 sind Dual-Opteron Systeme mit jeweils zwei
Opteron 244 Prozessoren, 1,8GHz, und 2GigaByte Arbeitsspeicher, womit
ALiCEnext eine theoretische Spitzenleistung von 3,69 TeraFlop/s, eine
Gesamtspeicherkapazität von über 1 TeraByte und 164 TeraByte
Plattenspeicherkapazität hat. Der Computer besteht im Weiteren aus einem
Athlon64-basierten Master-System mit Management-Komponenten, einem
513ten Knoten als Front-End sowie Spare
Blades.
ALiCEnext hat eine Gesamtleistungsaufnahme von 150KVA, die 172
geräuscharmen Lüfter der insgesamt 43 Nester wälzen mehr als 73000
Kubikmeter Kühlluft pro Stunde um, wobei die Knoten selbst ohne eigene
Lüfter betrieben werden können.
Cluster-Interconnect Medium von ALiCEnext ist
Gigabit Ethernet, verwendet werden Switches von
SMC. Innerhalb von 32 Subclustern wird außerdem jeweils ein sog. dreidimensionaler Torus mit Back-to-Back
Verbindungen der Knoten über Quad Gigabit Ethernet Interfaces gefahren. Jeder Knoten verfügt über
insgesamt 6 Gigabit Ethernet Anschlüsse. Mittels durchgängiger Verwendung eines Broadcom Ethernet
Chipsatzes unter einem einzigen Treiber, sowohl für die beiden Interfaces auf dem Motherboard Tyan
2880 als auch dem PCI-X Quad Ethernet Adapter von Silicom, konnte in Verbindung mit den SMC
Switches ein Durchsatz nahe am physischen Limit des Mediums erreicht werden.
AMD und Tyan erklärten ALiCEnext zu einer durch sie technisch direkt unterstützten Installation.
ALiCEnext ist so ausgelegt, dass es jederzeit erweitert oder zum Beispiel mit einem Hochgeschwindigkeitsnetzwerk
wie Infiniband ausgestattet werden kann.
ALiCEnext ist Nachfolger des Clustercomputers „ALICE“ (128 Prozessoren), den die Bergische Universität
Wuppertal 1999 anschaffte. ALiCEnext dient vor allem der Simulation physikalischer Prozesse im Bereich
der Vorhersagen um Eigenschaften von Elementarteilchen.
Weiterer Schwerpunkt ist die Beschäftigung mit dem Instrument „Clustercomputer“ an sich im Sinne
angepasster numerischer Verfahren und optimierter Kommunikationssoftware. Dazu ist geplant, dass die
BUW und CADAC zukünftig innovative Hard- und Software auf ALiCEnext gemeinsam testen, um somit
Vorleistungen für eine breitere Verwendung in Cluster-Lösungen zu erbringen und den produktiven
Einsatz von Clustercomputern weiter zu optimieren. Besondere Aufmerksamkeit werden z.B. auch
Middleware-Komponenten wie ein globales paralleles Filesystem und Checkpoint-Restart Mechanismen
haben.
Dieser Supercomputer ist die bisher größte Cluster-Installation von CADAC. Nach anderen
abgeschlossenen Installationen sind noch in diesem Jahr verschiedene weitere Projekte des High
Performance Computing geplant.
Die CADAC Gruppe ist ein führender Lösungsanbieter von
UNIX-basierten, Storage- und Hochverfügbarkeits- sowie
Netzwerksicherheitssystemen. Seit 2003 baut CADAC seinen Unternehmensbereich
HPC/Cluster-Computing konsequent aus,
strategisch ausgerichtet auf ganzheitliche Clusterlösungen durch Integration von Komponenten innovativer Hard- und
Softwarehersteller. Diesen „Eigenen Weg“ von Integration und Synergie hat CADAC auch in der diesjährigen International
Supercomputer Conference (ISC) in Heidelberg dargestellt, im Rahmen der traditionellen Hot Seat Session.
Mit Niederlassungen in Berlin, Cottbus, Hamburg, Magdeburg, Düsseldorf, Frankfurt/M und München ist CADAC
deutschlandweit präsent.
|