NVIDIA stellt einen persönlichen KI-Supercomputer vor: NVIDIA Project DIGITS, der große Modelle mit 200 Milliarden Parametern ausführen kann

AI-NachrichtenAktualisiert vor 7 Monaten AI-Austauschkreis

1.3K 00

Kurz gesagt: ein persönlicher KI-Supercomputer, der auf Ihrem Schreibtisch stehen kann

NVIDIA präsentierte heute auf der CES 2025 die NVIDIA Projekt DIGITSein persönlicher KI-Supercomputer, der auf Ihrem Schreibtisch stehen kann.

Bringen Sie KI-Computing, für das traditionell große Rechenzentren erforderlich sind, auf den Desktop von jedermann.
Bietet kosteneffiziente Computerlösungen, die den gesamten Entwicklungsprozess unterstützen, von kleinen Experimenten bis hin zur Produktion im großen Maßstab.

英伟达发布个人AI超级计算机：NVIDIA Project DIGITS，能运行2000亿参数的大模型

Was macht dieses Ding?

Projekt DIGITS bietet ein hervorragendes KI-Computing-Tool, das von einem durchschnittlichen Benutzer auf seinem eigenen Computer ausgeführt werden kann:

Project DIGITS wird von dem neuen NVIDIA GB10 Grace Blackwell Superchip angetrieben, der 1 PFLOP (1,5 Gigaflop) an Daten liefern kann.Tausend Billionen Gleitkommaoperationen pro Sekunde.) KI-Rechenleistung.

Sie wurde für das Prototyping, die Feinabstimmung und die Ausführung großer KI-Modelle entwickelt und ermöglicht es Benutzern, Inferenzmodelle auf einem lokalen Desktop-System zu entwickeln und auszuführen und sie dann nahtlos in der Cloud oder im Rechenzentrum bereitzustellen.

Das heißt, sie kann überdimensionale KI-Modelle direkt in Ihrer Nähe ausführen.Große Sprachmodelle, die bis zu 200 Milliarden Parameter verarbeiten können(Zum Beispiel...) .

Und es gibt Unterstützung für die Entwicklung und das Testen von KI-Modellen auf lokalen Computern, die dann schnell in der Cloud oder im Rechenzentrum bereitgestellt werden können. Kurz und bündig.Es ist, als hätte jeder Entwickler einen KI-Supercomputer im Taschenformat!

Das ist alles, er ist kleiner als ein Mac mini.

Was ist ihre Kerntechnologie?

Das Herzstück von Project DIGITS ist ein Chip namens GB10 Superchip:

SoC-Entwurf:Basierend auf der NVIDIA Grace Blackwell Architektur integriert es NVIDIA Blackwell GPUs (mit der neuesten Generation von CUDA Cores und Tensor Cores der 5. Generation) mit leistungsstarken NVIDIA Grace CPUs, die für Deep Learning optimiert sind.

Effiziente Leistung:Erhältlich bei FP4 Genauigkeit 1 PFLOP (eintausend Billionen Gleitkommaoperationen pro Sekunde) RechenleistungDer jüngste Neuzugang in unserem Portfolio ist eine neue Generation der Arm®-Architektur. Er verfügt über 20 leistungsstarke Kerne, die auf der Arm-Architektur basieren und für einen niedrigen Stromverbrauch und hohe Leistung sorgen.

Energieverbrauch und Energiespeicherung:

Benötigt nur normale Steckdosenstromversorgung, keine besondere Ausrüstung erforderlich ist, um auszustatten
128 GB einheitlicher Speicher und 4 TB NVMe-Speicher

Die Leistung ist großartig:Kann sehr komplexe KI-Aufgaben ausführen, die mit 200 Milliarden Parametereines großen Sprachmodells.

Skalierbarkeit:Über das NVIDIA ConnectX Netzwerk.Zwei Project DIGITS-Supercomputer sind miteinander verbunden, um 405 Milliarden parametrische Modelle auszuführen..

Leistung der VerbindungHigh-Speed-Verbindung zwischen GPU und CPU über NVLink-C2C.

Was ist der Sinn und für wen?

Was soll das bringen?

Lokale Entwicklung und Tests: Ermöglicht es Entwicklern, schnell Prototypen zu erstellen und mit KI-Modellen in einer lokalen Umgebung zu experimentieren.

Cloud-Erweiterung: Lokal entwickelte Modelle können direkt in die Cloud migriert werden, um die Bereitstellung zu beschleunigen.

Effiziente Leistung im Verhältnis zu den Kosten: Bietet eine Rechenleistung, die mit der eines großen Rechenzentrums vergleichbar ist, jedoch zu einem Bruchteil der Kosten und des Energieverbrauchs.

Vielfältige Anwendungsszenarien: Unterstützung von KI-Anwendungen in verschiedenen Bereichen wie Deep Learning, Verarbeitung natürlicher Sprache, Computer Vision usw.

Für wen ist es gedacht?

Ideal für KI-Forscher, Datenwissenschaftler, Studenten und Start-ups.
Leichterer Einstieg: Für die Nutzung ist nur die Konfiguration eines normalen Computers erforderlich.
Flexibilität: Nahtloser Übergang von der lokalen Entwicklung zur Bereitstellung in der Cloud.

Typische Anwendungsszenarien

KI-Forschung und -Innovation

Entwicklung und Erprobung komplexer KI-Modelle, z. B. groß angelegte Sprachmodelle (LLM) oder generative KI-Anwendungen.

Entwicklung von Prototypen, Feinabstimmung von Modellen und Durchführung von Experimenten.

Datenwissenschaft

Nutzen Sie RAPIDS und andere Tools, um große Datensätze schnell zu verarbeiten und zu analysieren.

Beschleunigen Sie Datenbereinigung, Feature Engineering und Modellierung.

Lehren und Lernen

Erschwingliche KI-Computerressourcen für Universitäten und Studierende zur Unterstützung von KI-Lehr- und Lernpraktiken.

英伟达发布个人AI超级计算机：NVIDIA Project DIGITS，能运行2000亿参数的大模型

Software und ökologische Unterstützung

NVIDIA bietet ein umfangreiches Software-Ökosystem, mit dem Anwender schnell mit der Entwicklung und dem Einsatz von KI-Modellen beginnen können:

(1) Entwicklungswerkzeuge

NVIDIA NGC: Bietet eine umfassende Softwarebibliothek mit Entwicklungskits (SDKs), Frameworks und vortrainierten Modellen.

NVIDIA NeMo: ein Rahmen für die Feinabstimmung großer Sprachmodelle (LLMs).

NVIDIA RAPIDS: zur Beschleunigung von Data Science Workflows.

Kompatibel mit gängigen Frameworks: unterstützt gängige Tools wie PyTorch, Python und Jupyter Notebook.

(2) Unterstützung des Einsatzes

Benutzer können Modelle lokal entwickeln und sie später ohne Codeänderungen direkt in der NVIDIA DGX Cloud oder anderen beschleunigten Cloud- und Rechenzentrumsarchitekturen einsetzen.

(3) Unterstützung auf Unternehmensebene

Bietet NVIDIA AI Enterprise Software für Sicherheit, Support und Releases für Produktionsumgebungen.

Warum ist das wichtig?

KI-Rechenleistung, die früher nur für große Unternehmen oder Labore erschwinglich war, wird jetzt zu einem erschwinglichen Werkzeug für den durchschnittlichen Entwickler. Was das bedeutet:

Kleine Teams oder Einzelpersonen können ihre eigenen KI-Modelle entwickeln und testen.

Die Hürden für die KI-Forschung und -Innovation werden deutlich gesenkt.

KI-Computing für alle: Förderung der Akzeptanz von KI-Technologie durch Senkung der Hardwarekosten und des Schwierigkeitsgrads der Bereitstellung. Innovationsförderung: Einzelpersonen und kleinen Teams wird eine beispiellose Rechenleistung zur Verfügung gestellt, die zu mehr Innovation anregt. Ökosystem-Integration: Nahtlose Integration der Hardware- und Software-Ökosysteme von NVIDIA, um Anwendern eine Lösung aus einer Hand zu bieten.

Wie viel? Wann wird es verfügbar sein?

Datum der Veröffentlichung:Mai 2025

Verkaufspreis:Beginnend bei 3.000 Dollar.Das neue NVIDIA Cinema ist von NVIDIA in Zusammenarbeit mit erstklassigen Partnern erhältlich.

Melden Sie sich auf der NVIDIA Website für Benachrichtigungen an.

Inzwischen

NVIDIA hat eine vollständigeNeue GeForce RTX 50-SerieGrafikkarten und Laptops.

Diese Produkte basieren auf der Blackwell RTX-Architektur, die revolutionäre Leistungsverbesserungen und KI-gesteuerte neuronale Rendering-Technologie bietet.

Die RTX 50 Serie bietet eine bis zu 8-fache Leistungssteigerung (über DLSS 4) und eine bis zu 75% reduzierte Latenz (über Reflex 2) und eröffnet damit völlig neue Möglichkeiten für Gamer und Content-Ersteller.

Leistungsstarke Blackwell-Architektur

Er enthält 92 Milliarden Transistoren und verwendet den neuesten GDDR7-Speicher (bis zu 30 Gbps), um eine Speicherbandbreite von bis zu 1,8 TB/s zu erreichen.

Eine neue Generation von Tensor-Cores und Ray Tracing (RT)-Cores zur Unterstützung von Echtzeit-Rendering und effizienter KI-Modellverarbeitung.

Unterstützung von DLSS 4 und Reflex 2 zur Verbesserung von Spielfluss und Reaktionsfähigkeit.

GeForce RTX 5090

Spezifikation Parameter:

Anzahl der CUDA Kerne: 21.760

Speicher: 32GB GDDR7

Speicherbandbreite: 1792 GB/sTensor

Kern: 680 (5. Generation)

RT-Kern: 170 (4. Generation)

Wesentliche Leistungsverbesserungen:

Doppelt so viel Leistung wie die RTX 4090.

Unterstützt 4K-Auflösung, 240 FPS und Volllicht-Verfolgungsspiele mit DLSS 4 und Multi Frame Generation. Unterstützung für generative KI-Anwendungen mit bis zu 2x schnellerer Bilderzeugung und reduziertem Speicherbedarf (FP4-Modus).

Preis: Startpreis $1.999

Notierungsdatum: 30. Januar 2025

GeForce RTX 5080

Spezifikation Parameter:

Anzahl der CUDA Kerne: 16.384

Speicher: 16GB GDDR7

Speicherbandbreite: 960 GB/s

Wesentliche Leistungsverbesserungen:

Doppelt so viel Leistung wie die RTX 4080.

Spielen Sie Spiele, die optisches Tracking unterstützen (z. B. Cyberpunk 2077 und Alan Wake 2), Black Myth: Goku und mehr in 4K-Auflösung, um die hohe Nachfrage der Entwickler nach 3D-Rendering und Videobearbeitung zu erfüllen.

Preis: Startpreis $999

Notierungsdatum: 30. Januar 2025

GeForce RTX 5070Ti

Spezifikation Parameter:

Anzahl der CUDA Kerne: 12.288

Speicher: 16GB GDDR7

Speicherbandbreite: 896 GB/s (78% über RTX 4070 Ti)

Wesentliche Leistungsverbesserungen:

Doppelt so viel Leistung wie die RTX 4070 Ti.

Führt Light Chase-Spiele mit hohen Bildraten bei einer Auflösung von 2560x1440 aus.
Preis: Startpreis $749

Einführungsdatum: Februar 2025

GeForce RTX 5070

Spezifikation Parameter:

Anzahl der CUDA Kerne: 10.240

Speicher: 12GB GDDR7

Speicherbandbreite: 672 GB/s (deutliche Verbesserung gegenüber RTX 4070)

Wesentliche Leistungsverbesserungen:

Doppelt so viel Leistung wie die RTX 4070.

Führt Light-Tracing-Spiele mit hohen Bildraten bei einer Auflösung von 2560x1440 mit DLSS Multi Frame Generation-Unterstützung aus.
Preis: Startpreis $549

Einführungsdatum: Februar 2025

Innovative Technologien der nächsten Generation

DLSS 4 Neuronale Rendering-Technologie

DLSS 4 ist die neueste neuronale Rendering-Technologie von NVIDIA, die vom GeForce RTX Tensor-Kern angetrieben wird und erhebliche Verbesserungen der Bildwiederholrate bei gleichzeitig gestochen scharfer Bildqualität ermöglicht.

Generieren Sie bis zu 3 zusätzliche Frames pro herkömmlichem Rendering-Frame

Bis zu 8-fache Verbesserung der Bildrate

Unterstützt 4K 240FPS Full Ray Tracing Gaming

Das erste Mal in einem Spiel Transformator AI-Modell

Verbesserte Timing-Stabilität und Bewegungsdetails

Reflex-2-Rahmen-Morphing-Technologie

NVIDIA Reflex 2 reduziert die Latenzzeit um bis zu 75% mit der neuen Frame Morphing Technologie für ein noch flüssigeres Spielerlebnis.

Reduziert die Latenzzeit im Spiel um 75%

Synchronisierung von CPU- und GPU-Workflows

Aktualisierte Rendering-Frames basierend auf der letzten Mauseingabe

Wettbewerbsvorteil für Multiplayer-Spiele

Einzelspieler-Spiele reaktionsschneller machen

NVIDIA ACE AI-Rolle

NVIDIA ACE ist eine Suite von Technologien für digitale Charaktere, die Spielfiguren und digitalen Assistenten durch generative KI Leben einhauchen.

KI-gesteuertes Charakterverhalten in Spielen

Kontinuierlich lernende Feind-KI

Selbstständig agierendes NPC-System

Unterstützt eine Reihe von bekannten Spielen

Echtzeit-Reaktion auf Spielerverhalten

Projekt R2X PC Digital Man

Projekt R2X ist ein PC-Avatar, der den Nutzern bei alltäglichen Aufgaben hilft und KI-Unterstützung bietet.

R2X bietet einen Avatar, der als Desktop-Assistent für den Benutzer fungiert.

Es kann die Benutzer bei einer Vielzahl von Aufgaben unterstützen, z. B. beim Lesen und Zusammenfassen von Dokumenten, bei der Verwaltung von Anwendungen, bei Videokonferenzen und vielem mehr.

Unterstützung für Videokonferenzen

Unterstützendes Lesen und Zusammenfassen von Dokumenten

Verbindung von GPT4, Grok und anderen Cloud-basierten KIs

Unterstützt mehrere Entwicklungsframeworks

Unterstützung von Desktop-Anwendungen in Echtzeit

Roboterarmee

NVIDIA kündigte auch die NVIDIA Cosmos™ Plattform an, eine fortschrittliche Suite von Tools, die die Entwicklung von physischen KI-Systemen wie selbstfahrenden Fahrzeugen und Robotern beschleunigen soll.

Kosmos Dazu gehören generative World Foundation Models (WFMs), fortschrittliche Video-Tokenizer, Sicherheitsmechanismen und beschleunigte Videoverarbeitungs-Pipelines.

Die Plattform soll Entwicklern helfen, die Kosten für die Entwicklung physikalischer KI-Modelle durch die Generierung realistischer, physikalisch basierter synthetischer Daten drastisch zu senken.

Die kurze Antwort lautet:Cosmos wurde speziell für die Entwicklung von Robotik und autonomen Fahrsystemen entwickelt. Es generiert virtuelle Daten und simulierte Szenarien aus KI-Modellen, die es Entwicklern ermöglichen, ihre KI-Systeme schneller und kostengünstiger zu trainieren und zu testen, ohne viel Zeit und Geld für die Sammlung realer Daten aufwenden zu müssen.

Text-to-World und Video-to-World Generierung ist möglich.
Es werden drei Modelle angeboten: Nano (Edge Deployment mit niedriger Latenz), Super (Hochleistungs-Basismodell) und Ultra (High-Fidelity-Modell).
Through 18,000,000,000,000,000,000,000,000,000,000,000,000,000,000 Token der Ausbildung, die 20 Millionen Stunden realer und synthetischer Daten umfasst.
Tokenizer sind 8x effizienter bei der Komprimierung und 12x schneller bei der Verarbeitung.

Cosmos Schlüsselfähigkeiten

1. die Erzeugung von virtuellen Daten

Fahrbedingungen bei verschneitem Wetter
Komplexer Betrieb von Robotern in Lagern
So können beispielsweise ultrarealistische virtuelle Szenarien erstellt werden: Diese Daten können zum Training von KI-Systemen verwendet werden, wodurch die Abhängigkeit von realen Daten verringert wird.

2. schnelle Verarbeitung von Videodaten

Mit den Tools von Cosmos können große Videodaten mehr als 10 Mal schneller als mit herkömmlichen Methoden erfasst und gekennzeichnet werden, was Zeit und Geld spart.

3. die Simulation und Prüfung

Simulieren Sie verschiedene Wetter- und Straßenbedingungen (Regen, Nebel, Stau).
Testen Sie die Fähigkeit des Roboters, sich in einer Fabrik oder einem Lagerhaus zu bewegen.
So ist es beispielsweise möglich, Roboter oder autonome Fahrsysteme in virtuellen Umgebungen zu testen:

4. bei der Entwicklung von KI-Modellen helfen

Bietet Open-Source-Basismodelle, die Entwickler an ihre Bedürfnisse für Robotik oder autonome Fahrtechnik anpassen können.

5. mehrere Anwendungsszenarien

Für das Selbstfahrertraining: Uber und Waabi beispielsweise nutzen es, um virtuelle Fahrszenarien zu erstellen.
Für die Entwicklung von Robotern: Agility und XPENG nutzen es zum Trainieren und Optimieren des Roboterbetriebs.

Robotik-Unternehmen auf der Messe:

weltweit

ApptronikApollo Robotics: Apollo Robotics
Agilität Robotik: Digit Robotics
NEURA-Robotik4NE-1 Roboter
AbbildungAbbildung 02: Roboter
1XNEO Roboter
Mentee: MenteeBot Roboter
Zufluchtsort AIPhoenix Robotics: Phoenix Robotics

sino

Unitree Robotik: H1 Roboter
WiseGen RoboticsExpedition A2 Robotik
Star Trek (US-Fernsehserie): Star1 Roboter
Galaxie AllgemeinG1 Roboter
Fourier-Intelligenz (Fourier-Intelligenz)GR-2 Roboter
Xiaopeng Automobile Company (Autohersteller in der VR China): Eisenroboter

Zusammenfassungen

Diese NVIDIA-Version wird die Anwendung von KI weiter vorantreiben, Modelltraining und Feinabstimmung in den Consumer-Bereich bringen und die Explosion von KI-Anwendungen, intelligenter Hardware und Robotik fördern!

AI-Nachrichten

Der Artikel ist urheberrechtlich geschützt und darf nicht ohne Genehmigung vervielfältigt werden.

Was ist ein KI-"Weltmodell"? Warum investieren Fei-Fei Li, Google und OpenAI in dieses Modell?

AI-Nachrichten

vor 7 Monaten

01.8K

Microsoft führt ein Korrekturwerkzeug ein: Kann es die durch KI-Halluzinationen verursachte Vertrauenskrise beenden?

AI-Nachrichten

vor 11 Monaten

01.5K

Grok 3 基准测试数据“掺水”？ OpenAI 员工爆料 xAI 或虚报性能

Grok 3 Benchmark-Daten 'verwässert'? OpenAI-Mitarbeiter sagt, xAI könnte die Leistung falsch darstellen

AI-Nachrichten

vor 6 Monaten

01K

2024 Die 10 besten RAG-Frameworks von Github

AI-Nachrichten

vor 7 Monaten

02K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

NVIDIA stellt einen persönlichen KI-Supercomputer vor: NVIDIA Project DIGITS, der große Modelle mit 200 Milliarden Parametern ausführen kann

Was macht dieses Ding?

Was ist ihre Kerntechnologie?