NVIDIA presenta un superordenador personal de IA: NVIDIA Project DIGITS, capaz de ejecutar grandes modelos con 200.000 millones de parámetros.

Noticias AIActualizado hace 12 meses Círculo de intercambio de inteligencia artificial

33.8K 00

En pocas palabras: un superordenador personal de inteligencia artificial que puede instalarse en su escritorio.

NVIDIA ha presentado hoy en CES 2025 el Proyecto DIGITS de NVIDIAque es un superordenador personal de inteligencia artificial que puede instalarse en su escritorio.

Llevar la informática de IA, que tradicionalmente requiere grandes centros de datos, al escritorio de todos.
Proporciona soluciones informáticas rentables que apoyan todo el proceso de desarrollo, desde los experimentos a pequeña escala hasta la producción a gran escala.

英伟达发布个人AI超级计算机：NVIDIA Project DIGITS，能运行2000亿参数的大模型

¿Qué hace esta cosa?

El Proyecto DIGITS proporciona una magnífica herramienta informática de IA que puede realizar el usuario medio en su propio ordenador:

El Proyecto DIGITS está impulsado por el nuevo superchip GB10 Grace Blackwell de NVIDIA, capaz de proporcionar 1 PFLOP (1,5 Gigaflops) de datos.Mil billones de operaciones en coma flotante por segundo.) Rendimiento informático de la IA.

Diseñado para la creación de prototipos, la puesta a punto y la ejecución de grandes modelos de IA, permite a los usuarios desarrollar y ejecutar modelos de inferencia en un sistema de escritorio local y, a continuación, desplegarlos sin problemas en la nube o en el centro de datos.

Es decir, puede ejecutar modelos de IA superdimensionados justo en tu área local.Grandes modelos lingüísticos capaces de ejecutar hasta 200.000 millones de parámetros(Por ejemplo...) .

Y hay soporte para desarrollar y probar modelos de IA en ordenadores locales y luego desplegarlos rápidamente en la nube o en el centro de datos. En pocas palabras.Es como tener un superordenador de IA de bolsillo para cada desarrollador.

Es esta cosa. Es más pequeña que un Mac mini.

¿Cuál es su tecnología principal?

El corazón del Proyecto DIGITS es un chip llamado GB10 Superchip:

Diseño de SoC:Basado en la arquitectura NVIDIA Grace Blackwell, integra GPUs NVIDIA Blackwell (con la última generación de núcleos CUDA y Tensor Cores de 5ª generación) con CPUs NVIDIA Grace de alto rendimiento optimizadas para deep learning.

Rendimiento eficiente:Disponible en precisión FP4 1 PFLOP (mil billones de operaciones en coma flotante por segundo) de rendimiento informáticoSe trata de una nueva generación de la arquitectura Arm®. Además, incorpora 20 núcleos de alto rendimiento basados en la arquitectura Arm para un bajo consumo y un alto rendimiento.

Consumo y almacenamiento de energía:

Sólo necesita una toma de corriente normal, no es necesario ningún equipo especial para equiparlo
128 GB de memoria unificada y 4 TB de almacenamiento NVMe

El rendimiento es excelente:Puede ejecutar tareas de IA muy complejas que 200.000 millones Parámetrosde un gran modelo lingüístico.

Escalabilidad:A través de la red NVIDIA ConnectX.Dos superordenadores del Proyecto DIGITS conectados para ejecutar 405.000 millones de modelos paramétricos..

Rendimiento de la conexiónInterconexión de alta velocidad de la GPU y la CPU a través de NVLink-C2C.

¿Qué sentido tiene y para quién?

¿Qué sentido tiene?

Desarrollo y pruebas locales: permite a los desarrolladores crear rápidamente prototipos y experimentar con modelos de IA en un entorno local.

Extensión a la nube: los modelos desarrollados localmente pueden migrarse directamente a la nube para acelerar la implantación.

Rendimiento eficiente frente a coste: proporciona una potencia de cálculo comparable a la de un gran centro de datos, pero a una fracción del coste y el consumo de energía.

Escenarios de aplicación diversificados: admiten aplicaciones de IA en múltiples campos, como el aprendizaje profundo, el procesamiento del lenguaje natural, la visión por ordenador, etc.

¿A quién va dirigido?

Ideal para investigadores de IA, científicos de datos, estudiantes y nuevas empresas.
Más fácil de poner en marcha: sólo se necesita la configuración de un ordenador normal para utilizarlo.
Flexibilidad: desde el desarrollo local hasta la implantación en la nube.

Escenarios típicos de aplicación

Investigación e innovación en IA

Desarrollar y probar modelos de IA complejos, como modelos lingüísticos a gran escala (LLM) o aplicaciones de IA generativa.

Desarrollo de prototipos, puesta a punto de modelos y experimentación.

ciencia de datos

Utilice RAPIDS y otras herramientas para procesar y analizar rápidamente grandes conjuntos de datos.

Acelere la limpieza de datos, la ingeniería de características y la modelización.

Enseñanza y aprendizaje

Recursos informáticos de IA asequibles para que universidades y estudiantes apoyen las prácticas de enseñanza y aprendizaje de la IA.

英伟达发布个人AI超级计算机：NVIDIA Project DIGITS，能运行2000亿参数的大模型

Soporte informático y ecológico

NVIDIA ofrece un rico ecosistema de software que permite a los usuarios empezar rápidamente a desarrollar e implantar modelos de IA:

(1) Herramientas de desarrollo

NVIDIA NGC: proporciona una completa biblioteca de software compuesta por kits de desarrollo (SDK), frameworks y modelos preentrenados.

NVIDIA NeMo: un marco para el ajuste fino de grandes modelos lingüísticos (LLM).

NVIDIA RAPIDS: para acelerar los flujos de trabajo de la ciencia de datos.

Compatible con marcos populares: soporta herramientas populares como PyTorch, Python y Jupyter Notebook.

(2) Apoyo al despliegue

Los usuarios pueden desarrollar modelos localmente e implantarlos después directamente en NVIDIA DGX Cloud u otras arquitecturas aceleradas de nube y centros de datos sin necesidad de cambiar el código.

(3) Asistencia a nivel de empresa

Proporciona software NVIDIA AI Enterprise para seguridad de nivel empresarial, soporte y versiones para entornos de producción.

¿Por qué es importante?

La potencia de cálculo de la IA, que antes sólo estaba al alcance de grandes empresas o laboratorios, se está convirtiendo en una herramienta asequible para el desarrollador medio. Lo que esto significa:

Pequeños equipos o individuos pueden desarrollar y probar sus propios modelos de IA.

Las barreras a la investigación y la innovación en IA se reducen considerablemente.

Informática de IA para todos: impulsar la adopción de la tecnología de IA reduciendo el coste del hardware y la dificultad de implantación. Impulso de la innovación: proporcionar a los individuos y a los equipos pequeños una potencia de cálculo sin precedentes para inspirar más innovación. Integración en el ecosistema: integrar a la perfección los ecosistemas de hardware y software de NVIDIA para ofrecer a los usuarios una solución integral.

¿Cuánto costará? ¿Cuándo estará disponible?

Fecha de publicación:Mayo de 2025

Precio de venta:A partir de 3.000 dólares.El nuevo NVIDIA Cinema está disponible a través de NVIDIA en colaboración con partners de primer nivel.

Regístrate para recibir notificaciones en el sitio web de NVIDIA.

mientras tanto

NVIDIA ha lanzado unaNueva serie GeForce RTX 50Tarjetas gráficas y ordenadores portátiles.

Estos productos se basan en la arquitectura Blackwell RTX, que ofrece revolucionarias mejoras de rendimiento y tecnología de renderizado neuronal basada en IA.

La serie RTX 50 ofrece un aumento del rendimiento de hasta 8 veces (mediante DLSS 4) y una reducción de la latencia de hasta 75% (mediante Reflex 2), lo que abre un nuevo abanico de posibilidades para jugadores y creadores de contenidos.

Potente arquitectura Blackwell

Con 92.000 millones de transistores, utiliza la última memoria GDDR7 (hasta 30 Gbps) para ofrecer hasta 1,8 TB/s de ancho de banda de memoria.

Una nueva generación de núcleos Tensor y núcleos Ray Tracing (RT) para soportar el renderizado en tiempo real y un procesamiento más eficiente de los modelos de IA.

Compatibilidad con DLSS 4 y Reflex 2 para mejorar la fluidez del juego y la capacidad de respuesta.

GeForce RTX 5090

Parámetros de especificación:

Número de núcleos CUDA: 21.760

Memoria: 32 GB GDDR7

Ancho de banda de memoria: 1792 GB/sTensor

Núcleo: 680 (5ª generación)

Núcleo RT: 170 (4ª generación)

Importantes mejoras de rendimiento:

El doble de rendimiento que la RTX 4090.

Admite resolución 4K, 240 FPS y juegos de persecución a plena luz con DLSS 4 y Multi Frame Generation. Compatible con aplicaciones de IA generativa con una generación de imágenes hasta 2 veces más rápida y una huella de memoria reducida (modo FP4).

Precio: A partir de $1.999

Fecha de inscripción: 30 de enero de 2025

GeForce RTX 5080

Parámetros de especificación:

Número de núcleos CUDA: 16.384

Memoria: 16 GB GDDR7

Ancho de banda de memoria: 960 GB/s

Importantes mejoras de rendimiento:

El doble de rendimiento que la RTX 4080.

Juega a juegos compatibles con seguimiento óptico (como Cyberpunk 2077 y Alan Wake 2), Black Myth: Goku y muchos más en resolución 4K para satisfacer la gran demanda de renderizado 3D y edición de vídeo de los creadores.

Precio: A partir de $999

Fecha de inscripción: 30 de enero de 2025

GeForce RTX 5070Ti

Parámetros de especificación:

Número de núcleos CUDA: 12.288

Memoria: 16 GB GDDR7

Ancho de banda de memoria: 896 GB/s (78% sobre RTX 4070 Ti)

Importantes mejoras de rendimiento:

El doble de rendimiento que la RTX 4070 Ti.

Ejecuta juegos Light Chase a altas frecuencias de cuadro con una resolución de 2560x1440.
Precio: A partir de $749

Fecha de lanzamiento: febrero de 2025

GeForce RTX 5070

Parámetros de especificación:

Número de núcleos CUDA: 10.240

Memoria: 12 GB GDDR7

Ancho de banda de memoria: 672 GB/s (mejora significativa respecto a RTX 4070)

Importantes mejoras de rendimiento:

El doble de rendimiento que la RTX 4070.

Ejecuta juegos de trazado de luz a altas frecuencias de cuadro con una resolución de 2560 x 1440 y compatibilidad con DLSS Multi Frame Generation.
Precio: A partir de $549

Fecha de lanzamiento: febrero de 2025

Tecnologías innovadoras de próxima generación

DLSS 4 Tecnología de renderizado neuronal

DLSS 4 es la última tecnología de renderizado neural de NVIDIA, impulsada por el núcleo GeForce RTX Tensor, que proporciona mejoras significativas en la velocidad de fotogramas al tiempo que mantiene una calidad de imagen nítida.

Genera hasta 3 fotogramas adicionales por cada fotograma de renderizado tradicional

Mejora de hasta 8 veces la frecuencia de imagen

Admite juegos 4K a 240 FPS con trazado de rayos completo

Primera vez en un partido Transformador Modelo de IA

Mejora de la estabilidad temporal y los detalles de movimiento

Tecnología de transformación de cuadros Reflex 2

NVIDIA Reflex 2 reduce la latencia de los juegos hasta 75% con la nueva tecnología de transformación de fotogramas para ofrecer una experiencia de juego más fluida.

Reduce la latencia del juego en 75%

Sincronización de flujos de trabajo de CPU y GPU

Marcos de renderizado actualizados en función de la última entrada del ratón

Una ventaja competitiva para los juegos multijugador

Hacer que los juegos para un jugador respondan mejor

El papel de NVIDIA ACE AI

NVIDIA ACE es un conjunto de tecnologías de personajes digitales que dan vida a personajes de juegos y asistentes digitales mediante IA generativa.

Comportamiento de los personajes en los juegos basado en la IA

Aprendizaje continuo IA enemiga

Sistema de PNJ autónomo

Compatible con numerosos juegos conocidos

Respuesta en tiempo real al comportamiento de los jugadores

Proyecto R2X PC Digital Man

El Proyecto R2X es un avatar para PC basado en la visión que ayuda a los usuarios con las tareas cotidianas y proporciona asistencia de IA.

R2X proporciona un avatar basado en la visión que actúa como asistente de escritorio para los usuarios.

Puede ayudar a los usuarios en diversas tareas, como leer y resumir documentos, gestionar aplicaciones o realizar videoconferencias, entre otras.

Soporte para videoconferencias

Lectura y resumen de documentos de apoyo

Conexión de GPT4, Grok y otras IA basadas en la nube

Compatible con múltiples marcos de desarrollo

Asistencia en tiempo real para aplicaciones de escritorio

ejército de robots

NVIDIA también ha dado a conocer la plataforma NVIDIA Cosmos™, un avanzado conjunto de herramientas diseñadas para acelerar el desarrollo de sistemas físicos de IA como vehículos de conducción autónoma y robots.

Cosmos Incluye modelos generativos World Foundation Models (WFM), tokenizadores avanzados de vídeo, mecanismos de garantía de seguridad y canales acelerados de procesamiento de vídeo.

El objetivo de la plataforma es ayudar a los desarrolladores a reducir drásticamente el coste del desarrollo de modelos físicos de IA mediante la generación de datos sintéticos realistas y basados en datos físicos.

La respuesta corta es:Cosmos está diseñado específicamente para ayudar a desarrollar sistemas de robótica y conducción autónoma. Genera datos virtuales y escenarios simulados a partir de modelos de IA, lo que permite a los desarrolladores entrenar y probar sus sistemas de IA de forma más rápida y barata sin tener que dedicar mucho tiempo y dinero a recopilar datos reales.

Es posible la generación de texto a mundo y vídeo a mundo.
Se ofrecen tres modelos: Nano (despliegue en el borde de baja latencia), Super (modelo básico de alto rendimiento) y Ultra (modelo de alta fidelidad).
Through 18,000,000,000,000,000,000,000,000,000,000,000,000,000,000 fichas de formación, que abarcan 20 millones de horas de datos reales y sintéticos.
Los tokenizadores son 8 veces más eficientes en compresión y 12 veces más rápidos en procesamiento.

Funciones clave de Cosmos

1. Generación de datos virtuales

Condiciones de conducción con nieve
Funcionamiento complejo de robots en almacenes
Por ejemplo, pueden crearse escenarios virtuales ultrarrealistas: estos datos pueden utilizarse para entrenar sistemas de IA, reduciendo la dependencia de los datos del mundo real.

2. Procesamiento rápido de datos de vídeo

Las herramientas de Cosmos pueden cotejar y etiquetar rápidamente datos de vídeo a gran escala más de 10 veces más rápido que los métodos tradicionales, ahorrando tiempo y costes.

3. Simulación y pruebas

Simule diferentes condiciones meteorológicas y de la carretera (lluvia, niebla, atascos).
Pruebe la capacidad del robot para desplazarse por una fábrica o un almacén.
Por ejemplo, es posible probar robots o sistemas de conducción autónoma en entornos virtuales:

4. Ayudar a desarrollar modelos de IA

Proporciona modelos base de código abierto que los desarrolladores pueden adaptar a sus necesidades para la robótica o la tecnología de conducción autónoma.

5. Múltiples escenarios de aplicación

Para la formación en conducción autónoma: Uber y Waabi, por ejemplo, lo utilizan para crear escenarios virtuales de pruebas de conducción.
Para el desarrollo de la robótica: Agility y XPENG lo utilizan para entrenar y optimizar el funcionamiento de los robots.

Empresas de robótica en exposición:

global

Apptronik: Apollo Robotics
Agility Robotics: Digit Robotics
Robótica NEURA: Robot 4NE-1
FiguraFigura 02 Robots
1X: Robot NEO
MenteeRobot MenteeBot
Santuario AI: Phoenix Robotics

sino

Robótica Unitree: Robot H1
WiseGen Robotics: Expedición A2 Robótica
Star Trek (serie de televisión y cine estadounidense): Robot Star1
Galaxia General: G1 Robot
Inteligencia de Fourier (Fourier Intelligence): Robot GR-2
Xiaopeng Automobile Company (fabricante de automóviles chino)Robot de hierro

resúmenes

Este lanzamiento de NVIDIA hará que la IA se aplique en mayor medida, que el entrenamiento y el perfeccionamiento de modelos entren en el campo del consumo y que las aplicaciones de IA, el hardware inteligente y la robótica se disparen.

Noticias AI

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Motor de inferencia de búsqueda inteligente basada en el cuerpo con SimpleQA de hasta 88,31 TP3T de precisión.

Noticias AI

hace 9 meses

028.3K

Copilot for PowerPoint发生重大变化，这些要点不得不看：重写、翻译、插图、注释

Copilot para PowerPoint experimenta cambios importantes, estos son los puntos clave que hay que ver: reescribir, traducir, ilustrar, anotar

Noticias AI

hace 1 año

034.2K

Noticias de hoy: OpenAI marca con agua las imágenes de DALL-E 3 para garantizar su autenticidad

Noticias AI

hace 2 años

033.2K

El autor del núcleo de OpenManus comparte: ¡Cómo completar el marco del Agente en tres horas!

Noticias AI

hace 10 meses

040.3K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

NVIDIA presenta un superordenador personal de IA: NVIDIA Project DIGITS, capaz de ejecutar grandes modelos con 200.000 millones de parámetros.

¿Qué hace esta cosa?

¿Cuál es su tecnología principal?