OCF liefert neue 600 Teraflop HPC-Maschine für die Universität Bristol
- Die neue "BlueCrystal 4"-Maschine in Bristol kommt den Forschungsgruppen der Universität zugute
- Dreimal schneller pro GPU als BlueCrystal Phase 3
- Entwickelt, integriert und konfiguriert von OCF in Zusammenarbeit mit Lenovo, DDN, IBM und VIRTUS Data Centres
Seit mehr als einem Jahrzehnt leistet die Universität Bristol mit Hilfe von High Performance Computing (HPC) einen Beitrag zur weltweit führenden und lebensverändernden wissenschaftlichen Forschung und hat über 16 Millionen Pfund in HPC und die Speicherung von Forschungsdaten investiert. Um den Anforderungen der Forscher, die mit komplexen und großen Datenmengen arbeiten, auch weiterhin gerecht zu werden, steht ihnen jetzt eine neue HPC-Maschine namens BlueCrystal 4 (BC4) zur Verfügung. BC4 wurde vom HPC-, Speicher- und Datenanalyse-Integrator OCF entwickelt, integriert und konfiguriert und ist mit mehr als 15 000 Rechenkernen das größte britische Universitätssystem, gemessen an der Anzahl der Rechenkerne, und hat eine theoretische Spitzenleistung von 600 Teraflops.
Über 1.000 Forscher aus Bereichen wie Paläobiologie, Geowissenschaften, Biochemie, Mathematik, Physik, Molekularmodellierung, Biowissenschaften und Luft- und Raumfahrttechnik werden das neue System nutzen. BC4 hilft bereits bei der Erforschung neuer Arzneimittel und der Aufnahme von Medikamenten durch den menschlichen Körper.
"Wir haben Forscher, die sich mit der Modellierung des gesamten Planeten befassen, um das Erdklima, den Klimawandel und dessen Entwicklung zu verstehen, sowie andere, die sich mit der Konstruktion von Rotorblättern für Hubschrauber, der Mutation von Genen, der Ausbreitung von Krankheiten und der Frage, woher Krankheiten kommen, befassen", so Dr. Christopher Woods, EPSRC Research Software Engineer Fellow an der University of Bristol. "Erste Benchmarking-Ergebnisse zeigen, dass das neue System dreimal schneller ist als unser vorheriger Cluster - Forschungsarbeiten, die früher einen Monat dauerten, dauern jetzt eine Woche, und was eine Woche dauerte, dauert jetzt nur noch ein paar Stunden. Das ist eine enorme Verbesserung, die für die Forschung an der Universität von großem Nutzen sein wird."
BC4 verwendet Lenovo NeXtScale Rechenknoten, die jeweils aus zwei 2,4-GHz-Intel-Broadwell-CPUs mit 14 Kernen und 128 GiB RAM bestehen. Es umfasst außerdem 32 Knoten mit zwei NVIDIA Pascal P100-Grafikprozessoren sowie einen GPU-Login-Knoten, die von Lenovos Ingenieurteam in das Rack integriert wurden, um die spezifischen Anforderungen der Universität zu erfüllen.
Der Cluster ist mit mehreren Hochgeschwindigkeitsnetzwerken verbunden, von denen das schnellste ein zweistufiges Intel Omni-Path Architecture-Netzwerk mit einer Geschwindigkeit von 100 Gb/s ist. Der Speicher von BC4 besteht aus einem PetaByte an Festplatten, die von GS7k- und IME-Systemen von DDN bereitgestellt werden, auf denen das parallele Dateisystem Spectrum Scale von IBM läuft.
Durch effektives Benchmarking und Optimierung mit Hilfe der Benchmarking-Fähigkeiten des HPC-Forschungszentrums von Lenovo in Stuttgart, dem ersten seiner Art, konnte sichergestellt werden, dass BC4 in Bezug auf den physischen Platzbedarf äußerst effizient ist und gleichzeitig das Energielimit von 30 KW pro Rack voll ausschöpft. Das Engagement von Lenovo für die Integration von Drittanbietern hat es der Universität ermöglicht, die Bindung an einen bestimmten Anbieter zu vermeiden und gleichzeitig neue Hardware zwischen den Aktualisierungszyklen problemlos hinzuzufügen.
Dr. Christopher Woods fährt fort: "Um die interaktive Nutzung des Clusters zu unterstützen, verfügt BC4 über einen Visualisierungsknoten, der mit NVIDIA Grid vGPUs ausgestattet ist und unseren Wissenschaftlern hilft, ihre Arbeit zu visualisieren, so dass Forscher das System auch dann nutzen können, wenn sie zuvor noch nie eine HPC-Maschine verwendet haben."
BC4 ist der erste Supercomputer der Universität Bristol, der in einer unabhängigen Einrichtung untergebracht ist, und zwar in LONDON4 von VIRTUS, dem ersten gemeinsamen Rechenzentrum für Forschung und Lehre in Slough. Das System ist über das Hochgeschwindigkeitsnetz Janet des JISC direkt mit dem Campus in Bristol verbunden. Kelly Scott, Account Director, Education bei VIRTUS Data Centres, sagte: "LONDON4 wurde speziell für die Aufnahme von Infrastrukturen mit extrem hoher Dichte und Hochleistungsrechnerplattformen konzipiert und ist damit eine ideale Umgebung für Systeme wie BC4. Die Universität von Bristol ist die 22. Organisation, die sich dem JISC Shared Data Centre in unserer Einrichtung anschließt, das es Institutionen ermöglicht, zusammenzuarbeiten und Infrastrukturressourcen gemeinsam zu nutzen, um echte Innovationen voranzutreiben, die sinnvolle Forschung fördern."
Die Hunderte von Anwendungen, die derzeit auf dem bisherigen Cluster der Universität laufen, werden auf das neue System repliziert, so dass die Forscher mehr Anwendungen und besser skalierbare Software entwickeln können. Die Anwendungen können direkt auf BC4 übertragen werden, ohne dass ein Re-Engineering erforderlich ist.
"Wir nutzen HPC nun schon seit zehn Jahren in unserer Einrichtung. Wir haben uns bemüht, BlueCrystal in jeder Phase größer und besser zu machen als in der vorangegangenen, indem wir neue Technologien zum Nutzen unserer Nutzer und Forscher eingeführt haben", so Caroline Gardiner, Academic Research Facilitator an der Universität Bristol.
Simon Burbidge, Direktor für fortgeschrittenes Rechnen, kommentiert: "Ich freue mich darauf, die ehrgeizigen Forschungsprogramme der Universität durch die Bereitstellung der neuesten Rechentechniken und Simulationen zu unterstützen."
BC4, das am24. Mai auf einer Veranstaltung an der Universität Bristol vorgestellt werden soll, wird mehr als 1.000 Systemnutzer beherbergen, die von BlueCrystal Phase 3 übernommen wurden.