NVIDIA DGX-1: Ein schlüsselfertiges Deep-Learning-System


Die Schwelle für die Entwicklung von Anwendungen Künstlicher Intelligenz ist noch allgemein hoch, nicht zuletzt weil es dafür extrem leistungsfähige Computersysteme braucht. Doch durch die Einführung des Deep-Learning-Systems DGX-1 senkt NVIDIA diese Schwelle drastisch.

Schon seit vielen Jahren leistet NVIDIA Pionierarbeit in Sachen Deep Learning und Künstliche Intelligenz. Seine Grafikprozessoren treiben High-Performance- und Supercomputer-Systeme an, zudem entwickelt das Unternehmen Software, Bibliotheken und Tools für maschinelles Lernen. Ohne NVIDIA-Grafikprozessoren sind heutige Deep-Learning-Lösungen kaum denkbar. Sie beschleunigen anspruchsvolle Anwendungen wie die Identifizierung von Abbildungen oder die Erkennung von Handschriften und Sprache.

Nun bringt NVIDIA sein erstes dedizierte Komplettsystem für Deep Learning mit Volta-Chips auf den Markt. DGX-1 ist eine vollständig integrierte Hard- und Softwarelösung in einem kompakten Gehäuse. Anwender bekommen die für Deep Learning benötigte Rechenpower quasi „out of the box“. Das schlüsselfertige System lässt sich per Plug&Play einrichten und ist nach dem Hochfahren in nur wenigen Minuten für den Deep-Learning-Einsatz bereit.

Reichlich Leistung

Quelle: NVIDIA

Das System ist mit 8 Grafikprozessoren bestückt, wahlweise mit Tesla P100 auf Basis der Pascal-Architektur oder mit Tesla V100 auf Basis der Volta-Architektur. Letztere wurde speziell mit Blick auf Anwendungen der Künstlichen Intelligenz entwickelt und ist deutlich leistungsfähiger: Ein auf Volta basierendes DGX-1-System erreicht 970 Teraflops, ein Pascal-System „lediglich“ 170. Mit NVLink hat NVIDIA seit einigen Jahren seinen eigenen Interconnect, um die GPU-Beschleuniger untereinander und mit weiteren Komponenten eines Servers, zum Beispiel Prozessoren, geschwindigkeitsoptimiert zu verbinden.

Die Grafikprozessor-Architektur NVIDIA Volta vereint die Leistung von 100 herkömmlichen CPUs in einer einzelnen Grafikeinheit. Dadurch können Datenwissenschaftler, Forscher und Techniker Herausforderungen angehen, die bis dato aufgrund der hohen Rechenzeiten als zu aufwändig galten. Verglichen mit einem Intel Dual-Xeon E5-2699v4 ist ein DGX-1 mit V100 nach Angaben von NVIDIA 100mal schneller. Versorgt werden die acht Tesla-V100-Karten im SXM2-Format. Die Speichergröße von 16 GByte pro Karte ist gegenüber Tesla P100 gleichgeblieben, ebenso der Hauptspeicher von 512 GByte (DDR4-2133). Ein DGX-1-System ist mit einem Energieverbrauch von 3200 Watt angegeben.

Auspacken und loslegen

Der eigentliche Wert des DGX-1 liegt jedoch darin, dass es ein schlüsselfertiges Komplettestem mit einem vollständigen Software-Stack für Deep Learning ist, der noch dazu für dieses System optimiert wurde. Die Software umfasst die wichtigsten Deep-Learning-Frameworks, das NVIDIA Deep Learning SDK, das Grafikprozessor-Trainingssystem DIGITS, verschiedene Treiber sowie CUDA (Compute Unified Device Architecture), eine Programmiertechnik und API, die Programmabläufe für die Verarbeitung durch Grafikprozessoren parallelisiert. CUDA dient beispielsweise zum schnellen Entwurf von Deep Neural Networks (DNN).

Zum Leistungsumfang der DGX-1 gehören außerdem der Zugriff auf Cloud-Management-Dienste zur Erstellung und Implementierung von Containern, System-Updates sowie ein Anwendungs-Repository. Anwender haben über den Hard- und Software-Support direkten Kontakt zu den NVIDIA-Spezialisten für Deep Learning. Dieser beinhaltet Grundlagen des Cloud-Managements, Software-Updates und -Upgrades und eine vorrangige Behebung Ihrer Probleme.

Nähere Infos & Webinar on demand

Sehen Sie auch auf YouTube: DGX-1: World’s First Deep Learning Supercomputer in Box

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.