NVIDIA dévoile son supercalculateur personnel d'IA : NVIDIA Project DIGITS, capable de faire tourner de grands modèles avec 200 milliards de paramètres.

Nouvelles de l'IAMise à jour il y a 7 mois Cercle de partage de l'IA

8.5K 00

En bref : un supercalculateur personnel d'IA qui peut être installé sur votre bureau

NVIDIA a dévoilé aujourd'hui au CES 2025 la Projet DIGITS de NVIDIAIl s'agit d'un superordinateur personnel d'IA qui peut être installé sur votre bureau.

Mettre l'informatique de l'IA, qui nécessite traditionnellement de grands centres de données, à la portée de tous.
Fournit des solutions informatiques rentables qui soutiennent l'ensemble du processus de développement, depuis les expériences à petite échelle jusqu'à la production à grande échelle.

英伟达发布个人AI超级计算机：NVIDIA Project DIGITS，能运行2000亿参数的大模型

Que fait cette chose ?

Le projet DIGITS fournit un superbe outil de calcul de l'IA qui peut être réalisé par l'utilisateur moyen sur son propre ordinateur :

Le projet DIGITS est équipé de la nouvelle puce NVIDIA GB10 Grace Blackwell Superchip, capable de fournir 1 PFLOP (1,5 gigaflop) de données.Mille billions d'opérations en virgule flottante par seconde.) les performances informatiques de l'IA.

Conçu pour le prototypage, la mise au point et l'exécution de grands modèles d'IA, il permet aux utilisateurs de développer et d'exécuter des modèles d'inférence sur un système de bureau local, puis de les déployer de manière transparente dans le nuage ou le centre de données.

En d'autres termes, il peut faire fonctionner des modèles d'intelligence artificielle de très grande taille dans votre région.Grands modèles linguistiques capables d'exécuter jusqu'à 200 milliards de paramètres(Par exemple...) .

Il est également possible de développer et de tester des modèles d'IA sur des ordinateurs locaux, puis de les déployer rapidement dans le nuage ou le centre de données. En bref.C'est comme si chaque développeur disposait d'un superordinateur d'IA de poche !

C'est ce truc, plus petit qu'un Mac mini.

Quelle est sa technologie de base ?

Au cœur du projet DIGITS se trouve une puce appelée GB10 Superchip :

Conception du SoC :Basé sur l'architecture NVIDIA Grace Blackwell, il intègre des GPU NVIDIA Blackwell (avec la dernière génération de cœurs CUDA et des cœurs Tensor de 5ème génération) avec des CPU NVIDIA Grace de haute performance optimisés pour l'apprentissage en profondeur.

Une performance efficace :Disponible à la précision FP4 1 PFLOP (mille trillions d'opérations en virgule flottante par seconde) performance de calculLe dernier-né de notre portefeuille est une nouvelle génération de l'architecture Arm®. Il comprend également 20 cœurs de haute performance basés sur l'architecture Arm pour une faible consommation d'énergie et des performances élevées.

Consommation et stockage d'énergie :

Il suffit d'une prise de courant normale, aucun équipement spécial n'est nécessaire pour l'équiper.
128 Go de mémoire unifiée et 4 To de stockage NVMe

Les performances sont excellentes :Peut exécuter des tâches d'intelligence artificielle très complexes, capables de gérer 200 milliards Paramètresd'un grand modèle linguistique.

Évolutivité :Par le biais du réseau NVIDIA ConnectX.Deux superordinateurs du projet DIGITS connectés pour exécuter 405 milliards de modèles paramétriques..

Performance de la connexionLa technologie NVLink-C2C permet l'interconnexion à grande vitesse du GPU et du CPU.

À quoi sert-il et à qui s'adresse-t-il ?

Quel est l'intérêt ?

Développement et essais locaux : permet aux développeurs de prototyper et d'expérimenter rapidement des modèles d'IA dans un environnement local.

Extension vers le nuage : les modèles développés localement peuvent être migrés directement vers le nuage afin d'accélérer le déploiement.

Performance efficace par rapport au coût : fournit une puissance de calcul comparable à celle d'un grand centre de données, mais à une fraction du coût et de la consommation d'énergie.

Scénarios d'application diversifiés : prenez en charge les applications d'IA dans de multiples domaines tels que l'apprentissage profond, le traitement du langage naturel, la vision par ordinateur, etc.

À qui s'adresse-t-il ?

Idéal pour les chercheurs en IA, les scientifiques des données, les étudiants et les startups.
Plus facile à démarrer : seule la configuration d'un ordinateur ordinaire est nécessaire pour l'utiliser.
Flexibilité : du développement local au déploiement dans le nuage, en toute transparence.

Scénarios d'application typiques

Recherche et innovation en matière d'IA

Développer et tester des modèles d'IA complexes tels que des modèles de langage à grande échelle (LLM) ou des applications d'IA générative.

Développer des prototypes, affiner les modèles et expérimenter.

science des données

Utiliser RAPIDS et d'autres outils pour traiter et analyser rapidement de grands ensembles de données.

Accélérer le nettoyage des données, l'ingénierie des caractéristiques et la modélisation.

Enseignement et apprentissage

Ressources informatiques abordables en matière d'IA pour les universités et les étudiants afin de soutenir les pratiques d'enseignement et d'apprentissage de l'IA.

英伟达发布个人AI超级计算机：NVIDIA Project DIGITS，能运行2000亿参数的大模型

Logiciel et soutien écologique

NVIDIA propose un riche écosystème logiciel qui permet aux utilisateurs de commencer rapidement à développer et à déployer des modèles d'IA :

(1) Outils de développement

NVIDIA NGC : fournit une bibliothèque logicielle complète de kits de développement (SDK), de cadres et de modèles pré-entraînés.

NVIDIA NeMo : un cadre pour le réglage fin des grands modèles de langage (LLM).

NVIDIA RAPIDS : pour accélérer les flux de travail en science des données.

Compatible avec les cadres de travail les plus courants : prend en charge les outils les plus courants tels que PyTorch, Python et Jupyter Notebook.

(2) Soutien au déploiement

Les utilisateurs peuvent développer des modèles localement et les déployer ensuite directement dans le NVIDIA DGX Cloud ou dans d'autres architectures accélérées de cloud et de centres de données sans modifier le code.

(3) Soutien au niveau de l'entreprise

Fournit le logiciel NVIDIA AI Enterprise pour la sécurité de niveau entreprise, le support et les versions de l'environnement de production.

Pourquoi est-ce important ?

La puissance de calcul de l'IA, qui n'était auparavant accessible qu'aux grandes entreprises ou aux laboratoires, devient aujourd'hui un outil abordable pour le développeur moyen. Ce que cela signifie :

De petites équipes ou des individus peuvent développer et tester leurs propres modèles d'IA.

Les obstacles à la recherche et à l'innovation en matière d'IA sont considérablement réduits.

L'informatique de l'IA pour tous : favoriser l'adoption de la technologie de l'IA en réduisant le coût du matériel et la difficulté du déploiement. Stimuler l'innovation : fournir aux individus et aux petites équipes une puissance de calcul sans précédent pour stimuler l'innovation. Intégration de l'écosystème : Intégrer de manière transparente les écosystèmes matériels et logiciels de NVIDIA pour fournir aux utilisateurs une solution unique.

Quel en est le montant ? Quand sera-t-il disponible ?

Date de sortie :Mai 2025

Prix de vente :À partir de 3 000 $.Le nouveau NVIDIA Cinema est disponible auprès de NVIDIA en collaboration avec des partenaires de premier plan.

Inscrivez-vous pour recevoir des notifications sur le site web de NVIDIA.

entre-temps

NVIDIA a lancé unNouvelle série GeForce RTX 50Cartes graphiques et ordinateurs portables.

Ces produits sont basés sur l'architecture Blackwell RTX, qui offre des améliorations de performance révolutionnaires et une technologie de rendu neuronal pilotée par l'IA.

La série RTX 50 offre une augmentation des performances jusqu'à 8 fois (via DLSS 4) et une réduction de la latence jusqu'à 75% (via Reflex 2), ouvrant ainsi de nouvelles possibilités aux joueurs et aux créateurs de contenu.

Puissant Blackwell Architecture

Contenant 92 milliards de transistors, elle utilise la dernière mémoire GDDR7 (jusqu'à 30 Gbps) pour offrir une bande passante de mémoire pouvant atteindre 1,8 To/s.

Une nouvelle génération de cœurs Tensor et de cœurs Ray Tracing (RT) pour prendre en charge le rendu en temps réel et un traitement plus efficace des modèles d'IA.

Prise en charge de DLSS 4 et Reflex 2 pour améliorer la fluidité et la réactivité du jeu.

GeForce RTX 5090

Paramètres de spécification :

Nombre de cœurs CUDA : 21 760

Mémoire : 32 Go GDDR7

Bande passante de la mémoire : 1792 GB/sTenseur

Cœur : 680 (5e génération)

RT core : 170 (4ème génération)

Améliorations majeures des performances :

Deux fois plus de performances que la RTX 4090.

Prise en charge de la résolution 4K, du 240 FPS et des jeux de poursuite en pleine lumière avec DLSS 4 et Multi Frame Generation. Prise en charge des applications d'IA générative avec une génération d'images jusqu'à deux fois plus rapide et une empreinte mémoire réduite (mode FP4).

Prix : Prix de départ $1,999

Date d'inscription : 30 janvier 2025

GeForce RTX 5080

Paramètres de spécification :

Nombre de cœurs CUDA : 16 384

Mémoire : 16 Go GDDR7

Bande passante de la mémoire : 960 Go/s

Améliorations majeures des performances :

Deux fois plus de performances que la RTX 4080.

Jouez à des jeux qui prennent en charge le suivi optique (tels que Cyberpunk 2077 et Alan Wake 2) en 4K, et à des titres tels que Black Myth : Goku pour répondre à la forte demande des créateurs en matière de rendu 3D et d'édition vidéo.

Prix : Prix de départ $999

Date d'inscription : 30 janvier 2025

GeForce RTX 5070Ti

Paramètres de spécification :

Nombre de cœurs CUDA : 12 288

Mémoire : 16 Go GDDR7

Bande passante mémoire : 896 Go/s (78% par rapport à la RTX 4070 Ti)

Améliorations majeures des performances :

Deux fois plus de performances que la RTX 4070 Ti.

Exécute les jeux Light Chase à des taux d'images élevés à une résolution de 2560x1440.
Prix : Prix de départ $749

Date de lancement : février 2025

GeForce RTX 5070

Paramètres de spécification :

Nombre de cœurs CUDA : 10 240

Mémoire : 12GB GDDR7

Bande passante mémoire : 672 GB/s (amélioration significative par rapport à la RTX 4070)

Améliorations majeures des performances :

Deux fois plus de performances que la RTX 4070.

Exécute les jeux de traçage de lumière à des taux d'images élevés à une résolution de 2560x1440 avec la prise en charge DLSS Multi Frame Generation.
Prix : Prix de départ $549

Date de lancement : février 2025

Technologies innovantes de la prochaine génération

DLSS 4 Technologie de rendu neuronal

DLSS 4 est la dernière technologie de rendu neuronal de NVIDIA, alimentée par le cœur GeForce RTX Tensor, qui apporte des améliorations significatives du taux de trame tout en maintenant une qualité d'image irréprochable.

Générer jusqu'à 3 images supplémentaires par image de rendu traditionnel

Amélioration jusqu'à 8 fois du taux de rafraîchissement

Prise en charge des jeux 4K 240FPS à traçage de rayon complet

Première fois dans un match Transformateur Modèle d'IA

Amélioration de la stabilité de la synchronisation et des détails des mouvements

Technologie de morphing du cadre Reflex 2

NVIDIA Reflex 2 réduit la latence des jeux jusqu'à 75% grâce à une nouvelle technologie de frame morphing pour une expérience de jeu plus fluide.

Réduit la latence du jeu de 75%

Synchronisation des flux de travail CPU et GPU

Mise à jour des images de rendu en fonction de la dernière entrée de la souris

Fournir un avantage compétitif pour les jeux multijoueurs

Rendre les jeux à un seul joueur plus réactifs

NVIDIA ACE AI Role

NVIDIA ACE est une suite de technologies de personnages numériques qui donnent vie aux personnages de jeux et aux assistants numériques grâce à l'IA générative.

Comportement des personnages piloté par l'IA dans les jeux

Apprentissage continu IA ennemie

Système de PNJ autonomes

Prise en charge d'un certain nombre de jeux connus

Réponse en temps réel au comportement des joueurs

Projet R2X PC Digital Man

Le projet R2X est un avatar PC basé sur la vision qui aide les utilisateurs dans leurs tâches quotidiennes et leur fournit une assistance en matière d'intelligence artificielle.

R2X fournit un avatar basé sur la vision qui agit comme un assistant de bureau pour les utilisateurs.

Il assiste les utilisateurs dans diverses tâches telles que la lecture et le résumé de documents, la gestion d'applications, la vidéoconférence, etc.

Prise en charge des vidéoconférences

Lecture et synthèse de documents d'appui

Connecter GPT4, Grok et d'autres IA basées sur le cloud computing

Prise en charge de plusieurs cadres de développement

Assistance en temps réel pour les applications de bureau

armée de robots

NVIDIA a également annoncé la plateforme NVIDIA Cosmos™, une suite d'outils avancés conçus pour accélérer le développement de systèmes d'IA physiques tels que les véhicules autopilotés et les robots.

Cosmos Il comprend des modèles génératifs de fondation du monde (WFM), des systèmes avancés de codage vidéo, des mécanismes d'assurance de la sécurité et des pipelines de traitement vidéo accélérés.

La plateforme vise à aider les développeurs à réduire considérablement le coût du développement de modèles physiques d'IA en générant des données synthétiques réalistes basées sur la physique.

En bref, la réponse est la suivante :Cosmos est spécialement conçu pour aider au développement de la robotique et des systèmes de conduite autonome. Il génère des données virtuelles et des scénarios simulés à partir de modèles d'IA, ce qui permet aux développeurs d'entraîner et de tester leurs systèmes d'IA plus rapidement et à moindre coût, sans avoir à consacrer beaucoup de temps et d'argent à la collecte de données réelles.

La génération de textes et de vidéos dans le monde entier est possible.
Trois modèles sont proposés : Nano (déploiement périphérique à faible latence), Super (modèle de base à haute performance) et Ultra (modèle à haute fidélité).
Through 18,000,000,000,000,000,000,000,000,000,000,000,000,000,000 jetons de formation, couvrant 20 millions d'heures de données réelles et synthétiques.
Les tokenizers sont 8 fois plus efficaces en termes de compression et 12 fois plus rapides en termes de traitement.

Principales capacités de Cosmos

1. génération de données virtuelles

Conditions de conduite par temps de neige
Fonctionnement complexe des robots dans les entrepôts
Des scénarios virtuels ultra-réalistes peuvent être créés, par exemple : ces données peuvent être utilisées pour former des systèmes d'intelligence artificielle, réduisant ainsi la dépendance à l'égard des données du monde réel.

2. traitement rapide des données vidéo

Les outils de Cosmos permettent de rassembler et d'étiqueter des données vidéo à grande échelle plus de 10 fois plus rapidement que les méthodes traditionnelles, ce qui permet d'économiser du temps et de l'argent.

3. simulation et essais

Simuler différentes conditions météorologiques et routières (pluie, brouillard, embouteillages).
Testez la capacité du robot à se déplacer dans une usine ou un entrepôt.
Il est possible de tester des robots ou des systèmes de conduite autonome dans des environnements virtuels, par exemple :

4. contribuer à l'élaboration de modèles d'IA

Fournit des modèles de base open source que les développeurs peuvent adapter à leurs besoins en matière de robotique ou de technologie de conduite autonome.

5. plusieurs scénarios d'application

Pour la formation à la conduite autonome : Uber et Waabi, par exemple, l'utilisent pour créer des scénarios d'essais de conduite virtuels.
Pour le développement de la robotique : Agility et XPENG l'utilisent pour former et optimiser le fonctionnement des robots.

Entreprises de robotique en démonstration :

mondial

ApptronikApollo Robotics : Apollo Robotics
Agility Robotics: Digit Robotics
NEURA RoboticsRobot 4NE-1
chiffreFigure 02 Robots
1XRobot NEO : NEO Robot
MentoréMenteeBot : Robot MenteeBot
Sanctuaire AIPhoenix Robotics : Phoenix Robotics

sino

Unitree RoboticsH1 Robot
WiseGen RoboticsExpedition A2 Robotics : Expedition A2 Robotics
Star Trek (série télévisée et cinématographique américaine): Star1 Robot
Galaxy GeneralRobot G1 : G1 Robot
Intelligence de Fourier (Intelligence de Fourier)Robot GR-2
Xiaopeng Automobile Company (constructeur automobile de la RPC)Robot de fer : Iron Robot

résumés

Cette version de NVIDIA permettra de mieux appliquer l'IA, de faire entrer la formation et le réglage fin des modèles dans le domaine de la consommation, et de faire exploser les applications de l'IA, du matériel intelligent et de la robotique !

Nouvelles de l'IA

Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.

Articles connexes

L'intelligence artificielle en classe : de la gestion des risques à l'autonomisation pédagogique

Nouvelles de l'IA

il y a 5 mois

010.2K

AI Website Building Dark Horse Lovable : 0 to $17M ARR in Three Months (en anglais seulement)

Nouvelles de l'IA

il y a 5 mois

08.8K

Qwen2.5-Max basé sur l'architecture MoE surpasse complètement DeepSeek V3

Nouvelles de l'IA

Il y a 7 mois

016.8K

Lancement de Doubao-1.5-pro : un nouveau modèle de base multimodal pour l'équilibre ultime

Nouvelles de l'IA

Il y a 7 mois

016.1K

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !

S'inscrire maintenant

Pas de commentaires...

NVIDIA dévoile son supercalculateur personnel d'IA : NVIDIA Project DIGITS, capable de faire tourner de grands modèles avec 200 milliards de paramètres.

Que fait cette chose ?

Quelle est sa technologie de base ?