NVIDIA presenta un superordenador personal de IA: NVIDIA Project DIGITS, capaz de ejecutar grandes modelos con 200.000 millones de parámetros.
En pocas palabras: un superordenador personal de inteligencia artificial que puede instalarse en su escritorio.
NVIDIA ha presentado hoy en CES 2025 el Proyecto DIGITS de NVIDIAque es un superordenador personal de inteligencia artificial que puede instalarse en su escritorio.
- Llevar la informática de IA, que tradicionalmente requiere grandes centros de datos, al escritorio de todos.
- Proporciona soluciones informáticas rentables que apoyan todo el proceso de desarrollo, desde los experimentos a pequeña escala hasta la producción a gran escala.

¿Qué hace esta cosa?
El Proyecto DIGITS proporciona una magnífica herramienta informática de IA que puede realizar el usuario medio en su propio ordenador:
El Proyecto DIGITS está impulsado por el nuevo superchip GB10 Grace Blackwell de NVIDIA, capaz de proporcionar 1 PFLOP (1,5 Gigaflops) de datos.Mil billones de operaciones en coma flotante por segundo.) Rendimiento informático de la IA.
Diseñado para la creación de prototipos, la puesta a punto y la ejecución de grandes modelos de IA, permite a los usuarios desarrollar y ejecutar modelos de inferencia en un sistema de escritorio local y, a continuación, desplegarlos sin problemas en la nube o en el centro de datos.
Es decir, puede ejecutar modelos de IA superdimensionados justo en tu área local.Grandes modelos lingüísticos capaces de ejecutar hasta 200.000 millones de parámetros(Por ejemplo...) .
Y hay soporte para desarrollar y probar modelos de IA en ordenadores locales y luego desplegarlos rápidamente en la nube o en el centro de datos. En pocas palabras.Es como tener un superordenador de IA de bolsillo para cada desarrollador.

Es esta cosa. Es más pequeña que un Mac mini.
¿Cuál es su tecnología principal?
El corazón del Proyecto DIGITS es un chip llamado GB10 Superchip:
Diseño de SoC:Basado en la arquitectura NVIDIA Grace Blackwell, integra GPUs NVIDIA Blackwell (con la última generación de núcleos CUDA y Tensor Cores de 5ª generación) con CPUs NVIDIA Grace de alto rendimiento optimizadas para deep learning.
Rendimiento eficiente:Disponible en precisión FP4 1 PFLOP (mil billones de operaciones en coma flotante por segundo) de rendimiento informáticoSe trata de una nueva generación de la arquitectura Arm®. Además, incorpora 20 núcleos de alto rendimiento basados en la arquitectura Arm para un bajo consumo y un alto rendimiento.
Consumo y almacenamiento de energía:
- Sólo necesita una toma de corriente normal, no es necesario ningún equipo especial para equiparlo
- 128 GB de memoria unificada y 4 TB de almacenamiento NVMe
El rendimiento es excelente:Puede ejecutar tareas de IA muy complejas que 200.000 millones Parámetrosde un gran modelo lingüístico.
Escalabilidad:A través de la red NVIDIA ConnectX.Dos superordenadores del Proyecto DIGITS conectados para ejecutar 405.000 millones de modelos paramétricos..
Rendimiento de la conexiónInterconexión de alta velocidad de la GPU y la CPU a través de NVLink-C2C.

¿Qué sentido tiene y para quién?
¿Qué sentido tiene?
Desarrollo y pruebas locales: permite a los desarrolladores crear rápidamente prototipos y experimentar con modelos de IA en un entorno local.
Extensión a la nube: los modelos desarrollados localmente pueden migrarse directamente a la nube para acelerar la implantación.
Rendimiento eficiente frente a coste: proporciona una potencia de cálculo comparable a la de un gran centro de datos, pero a una fracción del coste y el consumo de energía.
Escenarios de aplicación diversificados: admiten aplicaciones de IA en múltiples campos, como el aprendizaje profundo, el procesamiento del lenguaje natural, la visión por ordenador, etc.
¿A quién va dirigido?
- Ideal para investigadores de IA, científicos de datos, estudiantes y nuevas empresas.
- Más fácil de poner en marcha: sólo se necesita la configuración de un ordenador normal para utilizarlo.
- Flexibilidad: desde el desarrollo local hasta la implantación en la nube.
Escenarios típicos de aplicación
Investigación e innovación en IA
Desarrollar y probar modelos de IA complejos, como modelos lingüísticos a gran escala (LLM) o aplicaciones de IA generativa.
Desarrollo de prototipos, puesta a punto de modelos y experimentación.
ciencia de datos
Utilice RAPIDS y otras herramientas para procesar y analizar rápidamente grandes conjuntos de datos.
Acelere la limpieza de datos, la ingeniería de características y la modelización.
Enseñanza y aprendizaje
Recursos informáticos de IA asequibles para que universidades y estudiantes apoyen las prácticas de enseñanza y aprendizaje de la IA.
Soporte informático y ecológico
NVIDIA ofrece un rico ecosistema de software que permite a los usuarios empezar rápidamente a desarrollar e implantar modelos de IA:
(1) Herramientas de desarrollo
NVIDIA NGC: proporciona una completa biblioteca de software compuesta por kits de desarrollo (SDK), frameworks y modelos preentrenados.
NVIDIA NeMo: un marco para el ajuste fino de grandes modelos lingüísticos (LLM).
NVIDIA RAPIDS: para acelerar los flujos de trabajo de la ciencia de datos.
Compatible con marcos populares: soporta herramientas populares como PyTorch, Python y Jupyter Notebook.
(2) Apoyo al despliegue
Los usuarios pueden desarrollar modelos localmente e implantarlos después directamente en NVIDIA DGX Cloud u otras arquitecturas aceleradas de nube y centros de datos sin necesidad de cambiar el código.
(3) Asistencia a nivel de empresa
Proporciona software NVIDIA AI Enterprise para seguridad de nivel empresarial, soporte y versiones para entornos de producción.

¿Por qué es importante?
La potencia de cálculo de la IA, que antes sólo estaba al alcance de grandes empresas o laboratorios, se está convirtiendo en una herramienta asequible para el desarrollador medio. Lo que esto significa:
Pequeños equipos o individuos pueden desarrollar y probar sus propios modelos de IA.
Las barreras a la investigación y la innovación en IA se reducen considerablemente.
Informática de IA para todos: impulsar la adopción de la tecnología de IA reduciendo el coste del hardware y la dificultad de implantación. Impulso de la innovación: proporcionar a los individuos y a los equipos pequeños una potencia de cálculo sin precedentes para inspirar más innovación. Integración en el ecosistema: integrar a la perfección los ecosistemas de hardware y software de NVIDIA para ofrecer a los usuarios una solución integral.

¿Cuánto costará? ¿Cuándo estará disponible?
Fecha de publicación:Mayo de 2025
Precio de venta:A partir de 3.000 dólares.El nuevo NVIDIA Cinema está disponible a través de NVIDIA en colaboración con partners de primer nivel.
Regístrate para recibir notificaciones en el sitio web de NVIDIA.
mientras tanto
NVIDIA ha lanzado unaNueva serie GeForce RTX 50Tarjetas gráficas y ordenadores portátiles.
Estos productos se basan en la arquitectura Blackwell RTX, que ofrece revolucionarias mejoras de rendimiento y tecnología de renderizado neuronal basada en IA.
La serie RTX 50 ofrece un aumento del rendimiento de hasta 8 veces (mediante DLSS 4) y una reducción de la latencia de hasta 75% (mediante Reflex 2), lo que abre un nuevo abanico de posibilidades para jugadores y creadores de contenidos.

Potente arquitectura Blackwell
Con 92.000 millones de transistores, utiliza la última memoria GDDR7 (hasta 30 Gbps) para ofrecer hasta 1,8 TB/s de ancho de banda de memoria.
Una nueva generación de núcleos Tensor y núcleos Ray Tracing (RT) para soportar el renderizado en tiempo real y un procesamiento más eficiente de los modelos de IA.
Compatibilidad con DLSS 4 y Reflex 2 para mejorar la fluidez del juego y la capacidad de respuesta.

GeForce RTX 5090
Parámetros de especificación:
Número de núcleos CUDA: 21.760
Memoria: 32 GB GDDR7
Ancho de banda de memoria: 1792 GB/sTensor
Núcleo: 680 (5ª generación)
Núcleo RT: 170 (4ª generación)
Importantes mejoras de rendimiento:
El doble de rendimiento que la RTX 4090.
Admite resolución 4K, 240 FPS y juegos de persecución a plena luz con DLSS 4 y Multi Frame Generation. Compatible con aplicaciones de IA generativa con una generación de imágenes hasta 2 veces más rápida y una huella de memoria reducida (modo FP4).
Precio: A partir de $1.999
Fecha de inscripción: 30 de enero de 2025

GeForce RTX 5080
Parámetros de especificación:
Número de núcleos CUDA: 16.384
Memoria: 16 GB GDDR7
Ancho de banda de memoria: 960 GB/s
Importantes mejoras de rendimiento:
El doble de rendimiento que la RTX 4080.
Juega a juegos compatibles con seguimiento óptico (como Cyberpunk 2077 y Alan Wake 2), Black Myth: Goku y muchos más en resolución 4K para satisfacer la gran demanda de renderizado 3D y edición de vídeo de los creadores.
Precio: A partir de $999
Fecha de inscripción: 30 de enero de 2025

GeForce RTX 5070Ti
Parámetros de especificación:
Número de núcleos CUDA: 12.288
Memoria: 16 GB GDDR7
Ancho de banda de memoria: 896 GB/s (78% sobre RTX 4070 Ti)
Importantes mejoras de rendimiento:
El doble de rendimiento que la RTX 4070 Ti.
Ejecuta juegos Light Chase a altas frecuencias de cuadro con una resolución de 2560x1440.
Precio: A partir de $749
Fecha de lanzamiento: febrero de 2025

GeForce RTX 5070
Parámetros de especificación:
Número de núcleos CUDA: 10.240
Memoria: 12 GB GDDR7
Ancho de banda de memoria: 672 GB/s (mejora significativa respecto a RTX 4070)
Importantes mejoras de rendimiento:
El doble de rendimiento que la RTX 4070.
Ejecuta juegos de trazado de luz a altas frecuencias de cuadro con una resolución de 2560 x 1440 y compatibilidad con DLSS Multi Frame Generation.
Precio: A partir de $549
Fecha de lanzamiento: febrero de 2025

Tecnologías innovadoras de próxima generación
DLSS 4 Tecnología de renderizado neuronal
DLSS 4 es la última tecnología de renderizado neural de NVIDIA, impulsada por el núcleo GeForce RTX Tensor, que proporciona mejoras significativas en la velocidad de fotogramas al tiempo que mantiene una calidad de imagen nítida.
Genera hasta 3 fotogramas adicionales por cada fotograma de renderizado tradicional
Mejora de hasta 8 veces la frecuencia de imagen
Admite juegos 4K a 240 FPS con trazado de rayos completo
Primera vez en un partido Transformador Modelo de IA
Mejora de la estabilidad temporal y los detalles de movimiento
Tecnología de transformación de cuadros Reflex 2
NVIDIA Reflex 2 reduce la latencia de los juegos hasta 75% con la nueva tecnología de transformación de fotogramas para ofrecer una experiencia de juego más fluida.
Reduce la latencia del juego en 75%
Sincronización de flujos de trabajo de CPU y GPU
Marcos de renderizado actualizados en función de la última entrada del ratón
Una ventaja competitiva para los juegos multijugador
Hacer que los juegos para un jugador respondan mejor
El papel de NVIDIA ACE AI
NVIDIA ACE es un conjunto de tecnologías de personajes digitales que dan vida a personajes de juegos y asistentes digitales mediante IA generativa.
Comportamiento de los personajes en los juegos basado en la IA
Aprendizaje continuo IA enemiga
Sistema de PNJ autónomo
Compatible con numerosos juegos conocidos
Respuesta en tiempo real al comportamiento de los jugadores
Proyecto R2X PC Digital Man
El Proyecto R2X es un avatar para PC basado en la visión que ayuda a los usuarios con las tareas cotidianas y proporciona asistencia de IA.
R2X proporciona un avatar basado en la visión que actúa como asistente de escritorio para los usuarios.
Puede ayudar a los usuarios en diversas tareas, como leer y resumir documentos, gestionar aplicaciones o realizar videoconferencias, entre otras.
Soporte para videoconferencias
Lectura y resumen de documentos de apoyo
Conexión de GPT4, Grok y otras IA basadas en la nube
Compatible con múltiples marcos de desarrollo
Asistencia en tiempo real para aplicaciones de escritorio
ejército de robots
NVIDIA también ha dado a conocer la plataforma NVIDIA Cosmos™, un avanzado conjunto de herramientas diseñadas para acelerar el desarrollo de sistemas físicos de IA como vehículos de conducción autónoma y robots.
Cosmos Incluye modelos generativos World Foundation Models (WFM), tokenizadores avanzados de vídeo, mecanismos de garantía de seguridad y canales acelerados de procesamiento de vídeo.
El objetivo de la plataforma es ayudar a los desarrolladores a reducir drásticamente el coste del desarrollo de modelos físicos de IA mediante la generación de datos sintéticos realistas y basados en datos físicos.
La respuesta corta es:Cosmos está diseñado específicamente para ayudar a desarrollar sistemas de robótica y conducción autónoma. Genera datos virtuales y escenarios simulados a partir de modelos de IA, lo que permite a los desarrolladores entrenar y probar sus sistemas de IA de forma más rápida y barata sin tener que dedicar mucho tiempo y dinero a recopilar datos reales.
- Es posible la generación de texto a mundo y vídeo a mundo.
- Se ofrecen tres modelos: Nano (despliegue en el borde de baja latencia), Super (modelo básico de alto rendimiento) y Ultra (modelo de alta fidelidad).
- Through 18,000,000,000,000,000,000,000,000,000,000,000,000,000,000 fichas de formación, que abarcan 20 millones de horas de datos reales y sintéticos.
- Los tokenizadores son 8 veces más eficientes en compresión y 12 veces más rápidos en procesamiento.

Funciones clave de Cosmos
1. Generación de datos virtuales
- Condiciones de conducción con nieve
- Funcionamiento complejo de robots en almacenes
- Por ejemplo, pueden crearse escenarios virtuales ultrarrealistas: estos datos pueden utilizarse para entrenar sistemas de IA, reduciendo la dependencia de los datos del mundo real.
2. Procesamiento rápido de datos de vídeo
- Las herramientas de Cosmos pueden cotejar y etiquetar rápidamente datos de vídeo a gran escala más de 10 veces más rápido que los métodos tradicionales, ahorrando tiempo y costes.
3. Simulación y pruebas
- Simule diferentes condiciones meteorológicas y de la carretera (lluvia, niebla, atascos).
- Pruebe la capacidad del robot para desplazarse por una fábrica o un almacén.
- Por ejemplo, es posible probar robots o sistemas de conducción autónoma en entornos virtuales:
4. Ayudar a desarrollar modelos de IA
- Proporciona modelos base de código abierto que los desarrolladores pueden adaptar a sus necesidades para la robótica o la tecnología de conducción autónoma.
5. Múltiples escenarios de aplicación
- Para la formación en conducción autónoma: Uber y Waabi, por ejemplo, lo utilizan para crear escenarios virtuales de pruebas de conducción.
- Para el desarrollo de la robótica: Agility y XPENG lo utilizan para entrenar y optimizar el funcionamiento de los robots.

Empresas de robótica en exposición:
global
- Apptronik: Apollo Robotics
- Agility Robotics: Digit Robotics
- Robótica NEURA: Robot 4NE-1
- FiguraFigura 02 Robots
- 1X: Robot NEO
- MenteeRobot MenteeBot
- Santuario AI: Phoenix Robotics
sino
- Robótica Unitree: Robot H1
- WiseGen Robotics: Expedición A2 Robótica
- Star Trek (serie de televisión y cine estadounidense): Robot Star1
- Galaxia General: G1 Robot
- Inteligencia de Fourier (Fourier Intelligence): Robot GR-2
- Xiaopeng Automobile Company (fabricante de automóviles chino)Robot de hierro
resúmenes
Este lanzamiento de NVIDIA hará que la IA se aplique en mayor medida, que el entrenamiento y el perfeccionamiento de modelos entren en el campo del consumo y que las aplicaciones de IA, el hardware inteligente y la robótica se disparen.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...