NVIDIA lança supercomputador pessoal de IA: NVIDIA Project DIGITS, capaz de executar grandes modelos com 200 bilhões de parâmetros

🚀 Convite para experimentar: o primeiro software de programação inteligente AI IDE da China Download da versão chinesa do TraeO DeepSeek-R1 e o Doubao-pro estão disponíveis em uma base ilimitada!

Em poucas palavras: um supercomputador pessoal de IA que pode ser instalado em sua área de trabalho

A NVIDIA apresentou hoje, na CES 2025, a Projeto NVIDIA DIGITSque é um supercomputador pessoal de IA que pode ser instalado em sua área de trabalho.

Leve a computação de IA, que tradicionalmente requer grandes data centers, para o desktop de todos.
Oferece soluções de computação econômicas que dão suporte a todo o processo de desenvolvimento, desde experimentos em pequena escala até a produção em larga escala.

O que essa coisa faz?

O Projeto DIGITS oferece uma excelente ferramenta de computação de IA que pode ser usada por um usuário comum em seu próprio computador:

O Project DIGITS é alimentado pelo novo superchip NVIDIA GB10 Grace Blackwell, que é capaz de fornecer 1 PFLOP (1,5 Gigabit por segundo).Mil trilhões de operações de ponto flutuante por segundo.) Desempenho de computação de IA.

Projetado para prototipagem, ajuste fino e execução de grandes modelos de IA, ele permite que os usuários desenvolvam e executem modelos de inferência em um sistema de desktop local e, em seguida, implementem-nos perfeitamente na nuvem ou no data center.

Ou seja, ele pode executar modelos de IA superdimensionados diretamente em sua área local.Grandes modelos de linguagem capazes de executar até 200 bilhões de parâmetros(Por exemplo...) .

E há suporte para desenvolver e testar modelos de IA em computadores locais e, em seguida, implantá-los rapidamente na nuvem ou no data center. Em resumo.É como ter um supercomputador de IA de bolso para cada desenvolvedor!

É uma coisa menor que um Mac mini.

Qual é sua tecnologia principal?

No centro do Projeto DIGITS está um chip chamado Superchip GB10:

Projeto de SoC:Baseado na arquitetura NVIDIA Grace Blackwell, ele integra GPUs NVIDIA Blackwell (com a última geração de núcleos CUDA e núcleos Tensor de 5ª geração) com CPUs NVIDIA Grace de alto desempenho otimizadas para aprendizagem profunda.

Desempenho eficiente:Disponível na precisão do FP4 Desempenho de computação de 1 PFLOP (mil trilhões de operações de ponto flutuante por segundo)A mais nova adição ao nosso portfólio é uma nova geração da arquitetura Arm®. Ele também apresenta 20 núcleos de alto desempenho baseados na arquitetura Arm para baixo consumo de energia e alto desempenho.

Consumo e armazenamento de energia:

Requer apenas uma tomada elétrica normal para a alimentação de energia, sem necessidade de equipamentos especiais
128 GB de memória unificada e 4 TB de armazenamento NVMe

O desempenho é excelente:Pode executar tarefas de IA muito complexas que podem lidar com 200 bilhões Parâmetrosde um grande modelo de linguagem.

Escalabilidade:Por meio da rede NVIDIA ConnectX.Dois supercomputadores do Projeto DIGITS conectados para executar 405 bilhões de modelos paramétricos..

Desempenho da conexãoInterconexão de alta velocidade da GPU e da CPU via NVLink-C2C.

Qual é o objetivo e para quem?

Qual é o objetivo?

Desenvolvimento e testes locais: permite que os desenvolvedores criem rapidamente protótipos e experimentem modelos de IA em um ambiente local.

Extensão para a nuvem: os modelos desenvolvidos localmente podem ser migrados diretamente para a nuvem para acelerar a implementação.

Desempenho eficiente em relação ao custo: fornece potência de computação comparável à de um grande data center, mas com uma fração do custo e do consumo de energia.

Cenários de aplicativos diversificados: suporte a aplicativos de IA em vários campos, como aprendizagem profunda, processamento de linguagem natural, visão computacional e assim por diante.

A quem se destina?

Ideal para pesquisadores de IA, cientistas de dados, estudantes e startups.
Mais fácil de começar: apenas a configuração de um computador comum é necessária para usá-lo.
Flexibilidade: sem interrupções, desde o desenvolvimento local até a implantação na nuvem.

Cenários típicos de aplicativos

Pesquisa e inovação em IA

Desenvolva e teste modelos complexos de IA, como modelos de linguagem em grande escala (LLM) ou aplicativos de IA generativa.

Realizar o desenvolvimento do protótipo, o ajuste fino do modelo e a experimentação.

ciência de dados

Use o RAPIDS e outras ferramentas para processar e analisar rapidamente grandes conjuntos de dados.

Acelere a limpeza de dados, a engenharia de recursos e a modelagem.

Ensino e aprendizagem

Recursos de computação de IA acessíveis para universidades e estudantes para apoiar práticas de ensino e aprendizado de IA.

Software e suporte ecológico

A NVIDIA oferece um rico ecossistema de software que permite aos usuários começar rapidamente a desenvolver e implantar modelos de IA:

(1) Ferramentas de desenvolvimento

NVIDIA NGC: fornece uma biblioteca de software abrangente de kits de desenvolvimento (SDKs), estruturas e modelos pré-treinados.

NVIDIA NeMo: uma estrutura para ajuste fino de grandes modelos de linguagem (LLMs).

NVIDIA RAPIDS: para acelerar os fluxos de trabalho da ciência de dados.

Compatível com estruturas populares: suporta ferramentas populares, como PyTorch, Python e Jupyter Notebook.

(2) Suporte de implantação

Os usuários podem desenvolver modelos localmente e, posteriormente, implantá-los diretamente no NVIDIA DGX Cloud ou em outras arquiteturas aceleradas de nuvem e datacenter sem alterações no código.

(3) Suporte em nível empresarial

Fornece o software NVIDIA AI Enterprise para segurança de nível empresarial, suporte e versões de ambiente de produção.

Por que isso é importante?

O poder de computação da IA, que costumava ser acessível apenas para grandes empresas ou laboratórios, agora está se tornando uma ferramenta acessível para o desenvolvedor comum. O que isso significa:

Pequenas equipes ou indivíduos podem desenvolver e testar seus próprios modelos de IA.

As barreiras à pesquisa e à inovação em IA são bastante reduzidas.

Computação de IA para todos: impulsionando a adoção da tecnologia de IA ao reduzir o custo do hardware e a dificuldade de implementação. Impulsionando a inovação: fornecendo a indivíduos e pequenas equipes um poder de computação sem precedentes para inspirar mais inovação. Integração do ecossistema: integrar perfeitamente os ecossistemas de hardware e software da NVIDIA para fornecer aos usuários uma solução completa.

Quanto custa? Quando estará disponível?

Data de lançamento:Maio de 2025

Preço de venda:A partir de US$ 3.000.A nova Plataforma de Jogos NVIDIA está disponível na NVIDIA e nos principais parceiros.

Registre-se para receber notificações no site da NVIDIA.

enquanto isso

A NVIDIA lançou uma versão completa doNova série GeForce RTX 50Placas gráficas e laptops.

Esses produtos são baseados na arquitetura Blackwell RTX, que oferece melhorias revolucionárias de desempenho e tecnologia de renderização neural orientada por IA.

A série RTX 50 oferece um aumento de desempenho de até 8x (via DLSS 4) e uma redução de latência de até 75% (via Reflex 2), abrindo um conjunto totalmente novo de possibilidades para jogadores e criadores de conteúdo.

Arquitetura poderosa da Blackwell

Com 92 bilhões de transistores, ele usa a mais recente memória GDDR7 (até 30 Gbps) para fornecer até 1,8 TB/s de largura de banda de memória.

Uma nova geração de núcleos Tensor e núcleos Ray Tracing (RT) para dar suporte à renderização em tempo real e ao processamento mais eficiente de modelos de IA.

Suporte a DLSS 4 e Reflex 2 para melhorar a suavidade e a capacidade de resposta do jogo.

GeForce RTX 5090

Parâmetros de especificação:

Número de núcleos CUDA: 21.760

Memória: 32 GB GDDR7

Largura de banda da memória: 1792 GB/sTensor

Núcleo: 680 (5ª geração)

Núcleo RT: 170 (4ª geração)

Principais aprimoramentos de desempenho:

Duas vezes o desempenho da RTX 4090.

Suporta resolução 4K, 240 FPS e jogos de perseguição com luz total com DLSS 4 e Multi Frame Generation. Suporte para aplicativos de IA generativa com geração de imagens até duas vezes mais rápida e espaço de memória reduzido (modo FP4).

Preço: Preço inicial $1.999

Data da listagem: 30 de janeiro de 2025

GeForce RTX 5080

Parâmetros de especificação:

Número de núcleos CUDA: 16.384

Memória: 16 GB GDDR7

Largura de banda da memória: 960 GB/s

Principais aprimoramentos de desempenho:

Duas vezes o desempenho da RTX 4080.

Jogue jogos que suportam rastreamento óptico (como Cyberpunk 2077 e Alan Wake 2) em 4K e títulos como Black Myth: Goku para atender à alta demanda dos criadores por renderização 3D e edição de vídeo.

Preço: Preço inicial $999

Data da listagem: 30 de janeiro de 2025

GeForce RTX 5070Ti

Parâmetros de especificação:

Número de núcleos CUDA: 12.288

Memória: 16 GB GDDR7

Largura de banda da memória: 896 GB/s (78% em relação à RTX 4070 Ti)

Principais aprimoramentos de desempenho:

Duas vezes o desempenho da RTX 4070 Ti.

Executa jogos Light Chase com altas taxas de quadros e resolução de 2560x1440.
Preço: Preço inicial $749

Data de lançamento: fevereiro de 2025

GeForce RTX 5070

Parâmetros de especificação:

Número de núcleos CUDA: 10.240

Memória: 12 GB GDDR7

Largura de banda da memória: 672 GB/s (melhoria significativa em relação à RTX 4070)

Principais aprimoramentos de desempenho:

Duas vezes o desempenho da RTX 4070.

Executa jogos de rastreamento de luz com altas taxas de quadros na resolução de 2560x1440 com suporte a DLSS Multi Frame Generation.
Preço: Preço inicial $549

Data de lançamento: fevereiro de 2025

Tecnologias inovadoras de última geração

DLSS 4 Tecnologia de renderização neural

O DLSS 4 é a mais recente tecnologia de renderização neural da NVIDIA, com o núcleo Tensor GeForce RTX, que proporciona melhorias significativas na taxa de quadros, mantendo a qualidade de imagem nítida.

Gerar até 3 quadros adicionais por quadro de renderização tradicional

Melhoria de até 8x na taxa de quadros

Suporta jogos com traçado de raio total de 4K 240FPS

Primeira vez em um jogo Transformador Modelo de IA

Melhoria da estabilidade do tempo e dos detalhes de movimento

Tecnologia de transformação de quadro Reflex 2

O NVIDIA Reflex 2 reduz a latência dos jogos em até 75% com a nova tecnologia de transformação de quadros para uma experiência de jogo mais suave.

Reduz a latência do jogo em 75%

Sincronização de fluxos de trabalho de CPU e GPU

Atualização dos quadros de renderização com base na última entrada do mouse

Proporcionando uma vantagem competitiva para jogos multijogador

Tornar os jogos para um único jogador mais responsivos

Papel da NVIDIA ACE AI

O NVIDIA ACE é um conjunto de tecnologias de personagens digitais que dão vida a personagens de jogos e assistentes digitais por meio de IA generativa.

Comportamento de personagens orientado por IA em jogos

Aprendizado contínuo IA do inimigo

Sistema de NPC com ação própria

Suporta vários jogos conhecidos

Resposta em tempo real ao comportamento do jogador

Projeto R2X PC Digital Man

O Project R2X é um avatar de PC baseado em visão que ajuda os usuários nas tarefas diárias e fornece assistência de IA.

O R2X fornece um avatar baseado em visão que atua como um assistente de desktop para os usuários.

Ele pode auxiliar os usuários em diversas tarefas, como leitura e resumo de documentos, gerenciamento de aplicativos, videoconferência e muito mais.

Suporte para videoconferência

Leitura e resumo de documentos de apoio

Conectando GPT4, Grok e outras IAs baseadas em nuvem

Suporte a várias estruturas de desenvolvimento

Assistência em tempo real para aplicativos de desktop

exército de robôs

A NVIDIA também anunciou a plataforma NVIDIA Cosmos™, um conjunto avançado de ferramentas projetado para acelerar o desenvolvimento de sistemas físicos de IA, como veículos autônomos e robôs.

Cosmos Inclui World Foundation Models (WFMs) generativos, tokenizadores de vídeo avançados, mecanismos de garantia de segurança e pipelines de processamento de vídeo acelerados.

A plataforma tem como objetivo ajudar os desenvolvedores a reduzir drasticamente o custo do desenvolvimento de modelos físicos de IA, gerando dados sintéticos realistas e baseados em física.

A resposta curta é:O Cosmos foi projetado especificamente para ajudar a desenvolver sistemas de robótica e de direção autônoma. Ele gera dados virtuais e cenários simulados a partir de modelos de IA, permitindo que os desenvolvedores treinem e testem seus sistemas de IA de forma mais rápida e econômica, sem precisar gastar muito tempo e dinheiro coletando dados reais.

É possível gerar texto para o mundo e vídeo para o mundo.
São oferecidos três modelos: Nano (implantação de borda de baixa latência), Super (modelo de linha de base de alto desempenho) e Ultra (modelo de alta fidelidade).
Through 18,000,000,000,000,000,000,000,000,000,000,000,000,000,000 tokens de treinamento, abrangendo 20 milhões de horas de dados reais e sintéticos.
Os tokenizadores são 8 vezes mais eficientes na compactação e 12 vezes mais rápidos no processamento.

Principais recursos do Cosmos

1. geração de dados virtuais

Condições de direção em clima de neve
Operação complexa de robôs em armazéns
Cenários virtuais ultrarrealistas podem ser criados, por exemplo: esses dados podem ser usados para treinar sistemas de IA, reduzindo a dependência de dados do mundo real.

2. processamento rápido de dados de vídeo

As ferramentas da Cosmos podem coletar e marcar rapidamente dados de vídeo em grande escala, mais de 10 vezes mais rápido do que os métodos tradicionais, economizando tempo e dinheiro.

3. simulação e teste

Simule diferentes condições climáticas e de estrada (chuva, neblina, congestionamento).
Teste a capacidade do robô de se movimentar em uma fábrica ou depósito.
É possível testar robôs ou sistemas de direção autônoma em ambientes virtuais, por exemplo:

4. ajude a desenvolver modelos de IA

Fornece modelos básicos de código aberto que os desenvolvedores podem personalizar de acordo com suas necessidades de robótica ou tecnologia de direção autônoma.

5. vários cenários de aplicativos

Para treinamento de direção autônoma: Uber e Waabi, por exemplo, usam-no para criar cenários de teste de direção virtual.
Para o desenvolvimento de robótica: Agility e XPENG o utilizam para treinar e otimizar a operação de robôs.

Empresas de robótica em exposição:

global

ApptronikApollo Robotics: Apollo Robotics
Agility RoboticsDigit Robotics
Robótica NEURARobô 4NE-1
figuraFigura 02 Robôs
1XRobô NEO
MenteeRobô MenteeBot
AI do SantuárioPhoenix Robotics : Phoenix Robotics

sino

Unitree Robotics: Robô H1
Robótica WiseGenExpedição A2: Robótica
Star Trek (série de TV e filmes dos EUA)Robô Star1
Galaxy GeneralRobô G1
Inteligência de Fourier (Inteligência de Fourier)Robô GR-2
Xiaopeng Automobile Company (fabricante de automóveis da RPC)Robô de ferro

resumos

Esse lançamento da NVIDIA fará com que a IA seja mais aplicada, fazendo com que o treinamento e o ajuste fino de modelos entrem no campo do consumidor, além de promover a explosão de aplicativos de IA, hardware inteligente e robótica!

A NVIDIA revela o supercomputador pessoal de IA: NVIDIA Project DIGITS, capaz de executar grandes modelos com 200 bilhões de parâmetros

O que essa coisa faz?

Qual é sua tecnologia principal?

Qual é o objetivo e para quem?

A quem se destina?

Cenários típicos de aplicativos

Pesquisa e inovação em IA

ciência de dados

Ensino e aprendizagem

Software e suporte ecológico

(1) Ferramentas de desenvolvimento

(2) Suporte de implantação

(3) Suporte em nível empresarial

Por que isso é importante?

Quanto custa? Quando estará disponível?

enquanto isso

Arquitetura poderosa da Blackwell

GeForce RTX 5090

GeForce RTX 5080

GeForce RTX 5070Ti

GeForce RTX 5070

Tecnologias inovadoras de última geração

DLSS 4 Tecnologia de renderização neural

Tecnologia de transformação de quadro Reflex 2

Papel da NVIDIA ACE AI

Projeto R2X PC Digital Man

exército de robôs

Principais recursos do Cosmos

Empresas de robótica em exposição:

resumos

Artigos relacionados

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Gerador de imagens FLUX.1 (suporta entrada em chinês)

Hotspots de IA recentes

Recomendações de ferramentas de IA

Classificação das ferramentas de IA