Kurz gesagt: ein persönlicher KI-Supercomputer, der auf Ihrem Schreibtisch stehen kann
NVIDIA präsentierte heute auf der CES 2025 die NVIDIA Projekt DIGITSein persönlicher KI-Supercomputer, der auf Ihrem Schreibtisch stehen kann.
- Bringen Sie KI-Computing, für das traditionell große Rechenzentren erforderlich sind, auf den Desktop von jedermann.
- Bietet kosteneffiziente Computerlösungen, die den gesamten Entwicklungsprozess unterstützen, von kleinen Experimenten bis hin zur Produktion im großen Maßstab.
Was macht dieses Ding?
Projekt DIGITS bietet ein hervorragendes KI-Computing-Tool, das von einem durchschnittlichen Benutzer auf seinem eigenen Computer ausgeführt werden kann:
Project DIGITS wird von dem neuen NVIDIA GB10 Grace Blackwell Superchip angetrieben, der 1 PFLOP (1,5 Gigaflop) an Daten liefern kann.Tausend Billionen Gleitkommaoperationen pro Sekunde.) KI-Rechenleistung.
Sie wurde für das Prototyping, die Feinabstimmung und die Ausführung großer KI-Modelle entwickelt und ermöglicht es Benutzern, Inferenzmodelle auf einem lokalen Desktop-System zu entwickeln und auszuführen und sie dann nahtlos in der Cloud oder im Rechenzentrum bereitzustellen.
Das heißt, sie kann überdimensionale KI-Modelle direkt in Ihrer Nähe ausführen.Große Sprachmodelle, die bis zu 200 Milliarden Parameter verarbeiten können(Zum Beispiel...) .
Und es gibt Unterstützung für die Entwicklung und das Testen von KI-Modellen auf lokalen Computern, die dann schnell in der Cloud oder im Rechenzentrum bereitgestellt werden können. Kurz und bündig.Es ist, als hätte jeder Entwickler einen KI-Supercomputer im Taschenformat!
Was ist ihre Kerntechnologie?
Das Herzstück von Project DIGITS ist ein Chip namens GB10 Superchip:
SoC-Entwurf:Basierend auf der NVIDIA Grace Blackwell Architektur integriert es NVIDIA Blackwell GPUs (mit der neuesten Generation von CUDA Cores und Tensor Cores der 5. Generation) mit leistungsstarken NVIDIA Grace CPUs, die für Deep Learning optimiert sind.
Effiziente Leistung:Erhältlich bei FP4 Genauigkeit 1 PFLOP (eintausend Billionen Gleitkommaoperationen pro Sekunde) RechenleistungDer jüngste Neuzugang in unserem Portfolio ist eine neue Generation der Arm®-Architektur. Sie verfügt über 20 leistungsstarke Kerne, die auf der Arm-Architektur basieren und für einen niedrigen Stromverbrauch und hohe Leistung sorgen.
Energieverbrauch und Energiespeicherung:
- Benötigt nur normale Steckdosenstromversorgung, keine besondere Ausrüstung erforderlich ist, um auszustatten
- 128 GB einheitlicher Speicher und 4 TB NVMe-Speicher
Die Leistung ist großartig:Kann sehr komplexe KI-Aufgaben ausführen, die mit 200 Milliarden Parametereines großen Sprachmodells.
Skalierbarkeit:Über das NVIDIA ConnectX Netzwerk.Zwei Project DIGITS-Supercomputer sind miteinander verbunden, um 405 Milliarden parametrische Modelle auszuführen..
Leistung der VerbindungHigh-Speed-Verbindung zwischen GPU und CPU über NVLink-C2C.
Was ist der Sinn und für wen?
Was soll das bringen?
Lokale Entwicklung und Tests: Ermöglicht es Entwicklern, schnell Prototypen zu erstellen und mit KI-Modellen in einer lokalen Umgebung zu experimentieren.
Cloud-Erweiterung: Lokal entwickelte Modelle können direkt in die Cloud migriert werden, um die Bereitstellung zu beschleunigen.
Effiziente Leistung im Verhältnis zu den Kosten: Bietet eine Rechenleistung, die mit der eines großen Rechenzentrums vergleichbar ist, jedoch zu einem Bruchteil der Kosten und des Energieverbrauchs.
Vielfältige Anwendungsszenarien: Unterstützung von KI-Anwendungen in verschiedenen Bereichen wie Deep Learning, Verarbeitung natürlicher Sprache, Computer Vision usw.
Für wen ist es gedacht?
- Ideal für KI-Forscher, Datenwissenschaftler, Studenten und Start-ups.
- Leichterer Einstieg: Für die Nutzung ist nur die Konfiguration eines normalen Computers erforderlich.
- Flexibilität: Nahtloser Übergang von der lokalen Entwicklung zur Bereitstellung in der Cloud.
Typische Anwendungsszenarien
KI-Forschung und -Innovation
Entwicklung und Erprobung komplexer KI-Modelle, z. B. groß angelegte Sprachmodelle (LLM) oder generative KI-Anwendungen.
Entwicklung von Prototypen, Feinabstimmung von Modellen und Durchführung von Experimenten.
Datenwissenschaft
Nutzen Sie RAPIDS und andere Tools, um große Datensätze schnell zu verarbeiten und zu analysieren.
Beschleunigen Sie Datenbereinigung, Feature Engineering und Modellierung.
Lehren und Lernen
Erschwingliche KI-Computerressourcen für Universitäten und Studierende zur Unterstützung von KI-Lehr- und Lernpraktiken.
Software und ökologische Unterstützung
NVIDIA bietet ein umfangreiches Software-Ökosystem, mit dem Anwender schnell mit der Entwicklung und dem Einsatz von KI-Modellen beginnen können:
(1) Entwicklungswerkzeuge
NVIDIA NGC: Bietet eine umfassende Softwarebibliothek mit Entwicklungskits (SDKs), Frameworks und vortrainierten Modellen.
NVIDIA NeMo: ein Rahmen für die Feinabstimmung großer Sprachmodelle (LLMs).
NVIDIA RAPIDS: zur Beschleunigung von Data Science Workflows.
Kompatibel mit gängigen Frameworks: unterstützt gängige Tools wie PyTorch, Python und Jupyter Notebook.
(2) Unterstützung des Einsatzes
Benutzer können Modelle lokal entwickeln und sie später ohne Codeänderungen direkt in der NVIDIA DGX Cloud oder anderen beschleunigten Cloud- und Rechenzentrumsarchitekturen einsetzen.
(3) Unterstützung auf Unternehmensebene
Bietet NVIDIA AI Enterprise Software für Sicherheit, Support und Releases für Produktionsumgebungen.
Warum ist das wichtig?
KI-Rechenleistung, die früher nur für große Unternehmen oder Labore erschwinglich war, wird jetzt zu einem erschwinglichen Werkzeug für den durchschnittlichen Entwickler. Was das bedeutet:
Kleine Teams oder Einzelpersonen können ihre eigenen KI-Modelle entwickeln und testen.
Die Hürden für die KI-Forschung und -Innovation werden deutlich gesenkt.
KI-Computing für alle: Förderung der Akzeptanz von KI-Technologien durch Senkung der Hardwarekosten und des Schwierigkeitsgrads der Bereitstellung. Innovationsförderung: Einzelpersonen und kleinen Teams wird eine beispiellose Rechenleistung zur Verfügung gestellt, die zu mehr Innovation anregt. Ökosystem-Integration: Nahtlose Integration der Hardware- und Software-Ökosysteme von NVIDIA, um Anwendern eine Lösung aus einer Hand zu bieten.
Wie viel? Wann wird es verfügbar sein?
Datum der Veröffentlichung:Mai 2025
Verkaufspreis:Beginnend bei 3.000 Dollar.Das neue NVIDIA Cinema ist von NVIDIA in Zusammenarbeit mit erstklassigen Partnern erhältlich.
Melden Sie sich auf der NVIDIA Website für Benachrichtigungen an.
Inzwischen
NVIDIA hat eine vollständigeNeue GeForce RTX 50-SerieGrafikkarten und Laptops.
Diese Produkte basieren auf der Blackwell RTX-Architektur, die revolutionäre Leistungsverbesserungen und KI-gesteuerte neuronale Rendering-Technologie bietet.
Die RTX 50 Serie bietet eine bis zu 8-fache Leistungssteigerung (über DLSS 4) und eine bis zu 75% reduzierte Latenz (über Reflex 2) und eröffnet damit völlig neue Möglichkeiten für Gamer und Content-Ersteller.
Leistungsstarke Blackwell-Architektur
Er enthält 92 Milliarden Transistoren und verwendet den neuesten GDDR7-Speicher (bis zu 30 Gbps), um eine Speicherbandbreite von bis zu 1,8 TB/s zu erreichen.
Eine neue Generation von Tensor-Cores und Ray Tracing (RT)-Cores zur Unterstützung von Echtzeit-Rendering und effizienter KI-Modellverarbeitung.
Unterstützung von DLSS 4 und Reflex 2 zur Verbesserung von Spielfluss und Reaktionsfähigkeit.
GeForce RTX 5090
Spezifikation Parameter:
Anzahl der CUDA Kerne: 21.760
Speicher: 32GB GDDR7
Speicherbandbreite: 1792 GB/sTensor
Kern: 680 (5. Generation)
RT-Kern: 170 (4. Generation)
Wesentliche Leistungsverbesserungen:
Doppelt so viel Leistung wie die RTX 4090.
Unterstützt 4K-Auflösung, 240 FPS und Volllicht-Verfolgungsspiele mit DLSS 4 und Multi Frame Generation. Unterstützung für generative KI-Anwendungen mit bis zu 2x schnellerer Bilderzeugung und reduziertem Speicherbedarf (FP4-Modus).
Preis: Startpreis $1.999
Notierungsdatum: 30. Januar 2025
GeForce RTX 5080
Spezifikation Parameter:
Anzahl der CUDA Kerne: 16.384
Speicher: 16GB GDDR7
Speicherbandbreite: 960 GB/s
Wesentliche Leistungsverbesserungen:
Doppelt so viel Leistung wie die RTX 4080.
Spielen Sie Spiele, die optisches Tracking unterstützen (z. B. Cyberpunk 2077 und Alan Wake 2), in 4K und Titel wie Black Myth: Goku, um die hohe Nachfrage von Entwicklern nach 3D-Rendering und Videobearbeitung zu erfüllen.
Preis: Startpreis $999
Notierungsdatum: 30. Januar 2025
GeForce RTX 5070Ti
Spezifikation Parameter:
Anzahl der CUDA Kerne: 12.288
Speicher: 16GB GDDR7
Speicherbandbreite: 896 GB/s (78% über RTX 4070 Ti)
Wesentliche Leistungsverbesserungen:
Doppelt so viel Leistung wie die RTX 4070 Ti.
Führt Light Chase-Spiele mit hohen Bildraten bei einer Auflösung von 2560x1440 aus.
Preis: Startpreis $749
Einführungsdatum: Februar 2025
GeForce RTX 5070
Spezifikation Parameter:
Anzahl der CUDA Kerne: 10.240
Speicher: 12GB GDDR7
Speicherbandbreite: 672 GB/s (deutliche Verbesserung gegenüber RTX 4070)
Wesentliche Leistungsverbesserungen:
Doppelt so viel Leistung wie die RTX 4070.
Führt Light-Tracing-Spiele mit hohen Bildraten bei einer Auflösung von 2560x1440 mit DLSS Multi Frame Generation-Unterstützung aus.
Preis: Startpreis $549
Einführungsdatum: Februar 2025
Innovative Technologien der nächsten Generation
DLSS 4 Neuronale Rendering-Technologie
DLSS 4 ist die neueste neuronale Rendering-Technologie von NVIDIA, die vom GeForce RTX Tensor-Kern angetrieben wird und erhebliche Verbesserungen der Bildwiederholrate bei gleichzeitig gestochen scharfer Bildqualität ermöglicht.
Generieren Sie bis zu 3 zusätzliche Frames pro herkömmlichem Rendering-Frame
Bis zu 8-fache Verbesserung der Bildrate
Unterstützt 4K 240FPS Full Ray Tracing Gaming
Erste Anwendung des Transformer-KI-Modells in einem Spiel
Verbesserte Timing-Stabilität und Bewegungsdetails
Reflex-2-Rahmen-Morphing-Technologie
NVIDIA Reflex 2 reduziert die Latenzzeit um bis zu 75% mit der neuen Frame Morphing Technologie für ein noch flüssigeres Spielerlebnis.
Reduziert die Latenzzeit im Spiel um 75%
Synchronisierung von CPU- und GPU-Workflows
Aktualisierte Rendering-Frames basierend auf der letzten Mauseingabe
Wettbewerbsvorteil für Multiplayer-Spiele
Einzelspieler-Spiele reaktionsschneller machen
NVIDIA ACE AI-Rolle
NVIDIA ACE ist eine Suite von Technologien für digitale Charaktere, die Spielfiguren und digitalen Assistenten durch generative KI Leben einhauchen.
KI-gesteuertes Charakterverhalten in Spielen
Kontinuierlich lernende Feind-KI
Selbstständig agierendes NPC-System
Unterstützt eine Reihe von bekannten Spielen
Echtzeit-Reaktion auf Spielerverhalten
Projekt R2X PC Digital Man
Projekt R2X ist ein PC-Avatar, der den Nutzern bei alltäglichen Aufgaben hilft und KI-Unterstützung bietet.
R2X bietet einen Avatar, der als Desktop-Assistent für den Benutzer fungiert.
Es kann die Benutzer bei einer Vielzahl von Aufgaben unterstützen, z. B. beim Lesen und Zusammenfassen von Dokumenten, bei der Verwaltung von Anwendungen, bei Videokonferenzen und vielem mehr.
Unterstützung für Videokonferenzen
Unterstützendes Lesen und Zusammenfassen von Dokumenten
Verbindung von GPT4, Grok und anderen Cloud-basierten KIs
Unterstützt mehrere Entwicklungsframeworks
Unterstützung von Desktop-Anwendungen in Echtzeit
Roboterarmee
NVIDIA kündigte auch die NVIDIA Cosmos™ Plattform an, eine fortschrittliche Suite von Tools, die die Entwicklung von physischen KI-Systemen wie selbstfahrenden Fahrzeugen und Robotern beschleunigen soll.
Kosmos Dazu gehören generative World Foundation Models (WFMs), fortschrittliche Video-Tokenizer, Sicherheitsmechanismen und beschleunigte Videoverarbeitungs-Pipelines.
Die Plattform soll Entwicklern helfen, die Kosten für die Entwicklung physikalischer KI-Modelle durch die Generierung realistischer, physikalisch basierter synthetischer Daten drastisch zu senken.
Die kurze Antwort lautet:Cosmos wurde speziell für die Entwicklung von Robotik und autonomen Fahrsystemen entwickelt. Es generiert virtuelle Daten und simulierte Szenarien aus KI-Modellen, die es Entwicklern ermöglichen, ihre KI-Systeme schneller und kostengünstiger zu trainieren und zu testen, ohne viel Zeit und Geld für die Sammlung realer Daten aufwenden zu müssen.
- Text-to-World und Video-to-World Generierung ist möglich.
- Es werden drei Modelle angeboten: Nano (Edge Deployment mit niedriger Latenz), Super (Hochleistungs-Basismodell) und Ultra (High-Fidelity-Modell).
- Through 18,000,000,000,000,000,000,000,000,000,000,000,000,000,000 Token der Ausbildung, die 20 Millionen Stunden realer und synthetischer Daten umfasst.
- Tokenizer sind 8x effizienter bei der Komprimierung und 12x schneller bei der Verarbeitung.
Cosmos Schlüsselfähigkeiten
1. die Erzeugung von virtuellen Daten
- Fahrbedingungen bei verschneitem Wetter
- Komplexer Betrieb von Robotern in Lagern
- So können beispielsweise ultrarealistische virtuelle Szenarien erstellt werden: Diese Daten können zum Training von KI-Systemen verwendet werden, wodurch die Abhängigkeit von realen Daten verringert wird.
2. schnelle Verarbeitung von Videodaten
- Mit den Tools von Cosmos können große Videodaten mehr als 10 Mal schneller als mit herkömmlichen Methoden erfasst und gekennzeichnet werden, was Zeit und Geld spart.
3. die Simulation und Prüfung
- Simulieren Sie verschiedene Wetter- und Straßenbedingungen (Regen, Nebel, Stau).
- Testen Sie die Fähigkeit des Roboters, sich in einer Fabrik oder einem Lagerhaus zu bewegen.
- So ist es beispielsweise möglich, Roboter oder autonome Fahrsysteme in virtuellen Umgebungen zu testen:
4. bei der Entwicklung von KI-Modellen helfen
- Bietet Open-Source-Basismodelle, die Entwickler an ihre Bedürfnisse für Robotik oder autonome Fahrtechnik anpassen können.
5. mehrere Anwendungsszenarien
- Für das Selbstfahrertraining: Uber und Waabi beispielsweise nutzen es, um virtuelle Fahrszenarien zu erstellen.
- Für die Entwicklung von Robotern: Agility und XPENG nutzen es zum Trainieren und Optimieren des Roboterbetriebs.
Robotik-Unternehmen auf der Messe:
weltweit
- ApptronikApollo Robotics: Apollo Robotics
- Agilität Robotik: Digit Robotics
- NEURA-Robotik4NE-1 Roboter
- AbbildungAbbildung 02: Roboter
- 1XNEO Roboter
- Mentee: MenteeBot Roboter
- Zufluchtsort AIPhoenix Robotics: Phoenix Robotics
sino
- Unitree Robotik: H1 Roboter
- WiseGen RoboticsExpedition A2 Robotik
- Star Trek (US-Fernsehserie): Star1 Roboter
- Galaxie AllgemeinG1 Roboter
- Fourier-Intelligenz (Fourier-Intelligenz)GR-2 Roboter
- Xiaopeng Automobile Company (Autohersteller in der VR China): Eisenroboter
Zusammenfassungen
Diese NVIDIA-Version wird die Anwendung von KI weiter vorantreiben, Modelltraining und Feinabstimmung in den Consumer-Bereich bringen und die Explosion von KI-Anwendungen, intelligenter Hardware und Robotik fördern!