Em poucas palavras: um supercomputador pessoal de IA que pode ser instalado em sua área de trabalho
A NVIDIA apresentou hoje, na CES 2025, a Projeto NVIDIA DIGITSque é um supercomputador pessoal de IA que pode ser instalado em sua área de trabalho.
- Leve a computação de IA, que tradicionalmente requer grandes data centers, para o desktop de todos.
- Oferece soluções de computação econômicas que dão suporte a todo o processo de desenvolvimento, desde experimentos em pequena escala até a produção em larga escala.
O que essa coisa faz?
O Projeto DIGITS oferece uma excelente ferramenta de computação de IA que pode ser usada por um usuário comum em seu próprio computador:
O Project DIGITS é alimentado pelo novo superchip NVIDIA GB10 Grace Blackwell, que é capaz de fornecer 1 PFLOP (1,5 Gigabit por segundo).Mil trilhões de operações de ponto flutuante por segundo.) Desempenho de computação de IA.
Projetado para prototipagem, ajuste fino e execução de grandes modelos de IA, ele permite que os usuários desenvolvam e executem modelos de inferência em um sistema de desktop local e, em seguida, implementem-nos perfeitamente na nuvem ou no data center.
Ou seja, ele pode executar modelos de IA superdimensionados diretamente em sua área local.Grandes modelos de linguagem capazes de executar até 200 bilhões de parâmetros(Por exemplo...) .
E há suporte para desenvolver e testar modelos de IA em computadores locais e, em seguida, implantá-los rapidamente na nuvem ou no data center. Em resumo.É como ter um supercomputador de IA de bolso para cada desenvolvedor!
Qual é sua tecnologia principal?
No centro do Projeto DIGITS está um chip chamado Superchip GB10:
Projeto de SoC:Baseado na arquitetura NVIDIA Grace Blackwell, ele integra GPUs NVIDIA Blackwell (com a última geração de núcleos CUDA e núcleos Tensor de 5ª geração) com CPUs NVIDIA Grace de alto desempenho otimizadas para aprendizagem profunda.
Desempenho eficiente:Disponível na precisão do FP4 Desempenho de computação de 1 PFLOP (mil trilhões de operações de ponto flutuante por segundo)A mais nova adição ao nosso portfólio é uma nova geração da arquitetura Arm®. Ele também apresenta 20 núcleos de alto desempenho baseados na arquitetura Arm para baixo consumo de energia e alto desempenho.
Consumo e armazenamento de energia:
- Requer apenas uma tomada elétrica normal para a alimentação de energia, sem necessidade de equipamentos especiais
- 128 GB de memória unificada e 4 TB de armazenamento NVMe
O desempenho é excelente:Pode executar tarefas de IA muito complexas que podem lidar com 200 bilhões Parâmetrosde um grande modelo de linguagem.
Escalabilidade:Por meio da rede NVIDIA ConnectX.Dois supercomputadores do Projeto DIGITS conectados para executar 405 bilhões de modelos paramétricos..
Desempenho da conexãoInterconexão de alta velocidade da GPU e da CPU via NVLink-C2C.
Qual é o objetivo e para quem?
Qual é o objetivo?
Desenvolvimento e testes locais: permite que os desenvolvedores criem rapidamente protótipos e experimentem modelos de IA em um ambiente local.
Extensão para a nuvem: os modelos desenvolvidos localmente podem ser migrados diretamente para a nuvem para acelerar a implementação.
Desempenho eficiente em relação ao custo: fornece potência de computação comparável à de um grande data center, mas com uma fração do custo e do consumo de energia.
Cenários de aplicativos diversificados: suporte a aplicativos de IA em vários campos, como aprendizagem profunda, processamento de linguagem natural, visão computacional e assim por diante.
A quem se destina?
- Ideal para pesquisadores de IA, cientistas de dados, estudantes e startups.
- Mais fácil de começar: apenas a configuração de um computador comum é necessária para usá-lo.
- Flexibilidade: sem interrupções, desde o desenvolvimento local até a implantação na nuvem.
Cenários típicos de aplicativos
Pesquisa e inovação em IA
Desenvolva e teste modelos complexos de IA, como modelos de linguagem em grande escala (LLM) ou aplicativos de IA generativa.
Realizar o desenvolvimento do protótipo, o ajuste fino do modelo e a experimentação.
ciência de dados
Use o RAPIDS e outras ferramentas para processar e analisar rapidamente grandes conjuntos de dados.
Acelere a limpeza de dados, a engenharia de recursos e a modelagem.
Ensino e aprendizagem
Recursos de computação de IA acessíveis para universidades e estudantes para apoiar práticas de ensino e aprendizado de IA.
Software e suporte ecológico
A NVIDIA oferece um rico ecossistema de software que permite aos usuários começar rapidamente a desenvolver e implantar modelos de IA:
(1) Ferramentas de desenvolvimento
NVIDIA NGC: fornece uma biblioteca de software abrangente de kits de desenvolvimento (SDKs), estruturas e modelos pré-treinados.
NVIDIA NeMo: uma estrutura para ajuste fino de grandes modelos de linguagem (LLMs).
NVIDIA RAPIDS: para acelerar os fluxos de trabalho da ciência de dados.
Compatível com estruturas populares: suporta ferramentas populares, como PyTorch, Python e Jupyter Notebook.
(2) Suporte de implantação
Os usuários podem desenvolver modelos localmente e, posteriormente, implantá-los diretamente no NVIDIA DGX Cloud ou em outras arquiteturas aceleradas de nuvem e datacenter sem alterações no código.
(3) Suporte em nível empresarial
Fornece o software NVIDIA AI Enterprise para segurança de nível empresarial, suporte e versões de ambiente de produção.
Por que isso é importante?
O poder de computação da IA, que costumava ser acessível apenas para grandes empresas ou laboratórios, agora está se tornando uma ferramenta acessível para o desenvolvedor comum. O que isso significa:
Pequenas equipes ou indivíduos podem desenvolver e testar seus próprios modelos de IA.
As barreiras à pesquisa e à inovação em IA são bastante reduzidas.
Computação de IA para todos: impulsionando a adoção da tecnologia de IA ao reduzir o custo do hardware e a dificuldade de implementação. Impulsionando a inovação: fornecendo a indivíduos e pequenas equipes um poder de computação sem precedentes para inspirar mais inovação. Integração do ecossistema: integrar perfeitamente os ecossistemas de hardware e software da NVIDIA para fornecer aos usuários uma solução completa.
Quanto custa? Quando estará disponível?
Data de lançamento:Maio de 2025
Preço de venda:A partir de US$ 3.000.A nova Plataforma de Jogos NVIDIA está disponível na NVIDIA e nos principais parceiros.
Registre-se para receber notificações no site da NVIDIA.
enquanto isso
A NVIDIA lançou uma versão completa doNova série GeForce RTX 50Placas gráficas e laptops.
Esses produtos são baseados na arquitetura Blackwell RTX, que oferece melhorias revolucionárias de desempenho e tecnologia de renderização neural orientada por IA.
A série RTX 50 oferece um aumento de desempenho de até 8x (via DLSS 4) e uma redução de latência de até 75% (via Reflex 2), abrindo um conjunto totalmente novo de possibilidades para jogadores e criadores de conteúdo.
Arquitetura poderosa da Blackwell
Com 92 bilhões de transistores, ele usa a mais recente memória GDDR7 (até 30 Gbps) para fornecer até 1,8 TB/s de largura de banda de memória.
Uma nova geração de núcleos Tensor e núcleos Ray Tracing (RT) para dar suporte à renderização em tempo real e ao processamento mais eficiente de modelos de IA.
Suporte a DLSS 4 e Reflex 2 para melhorar a suavidade e a capacidade de resposta do jogo.
GeForce RTX 5090
Parâmetros de especificação:
Número de núcleos CUDA: 21.760
Memória: 32 GB GDDR7
Largura de banda da memória: 1792 GB/sTensor
Núcleo: 680 (5ª geração)
Núcleo RT: 170 (4ª geração)
Principais aprimoramentos de desempenho:
Duas vezes o desempenho da RTX 4090.
Suporta resolução 4K, 240 FPS e jogos de perseguição com luz total com DLSS 4 e Multi Frame Generation. Suporte para aplicativos de IA generativa com geração de imagens até duas vezes mais rápida e espaço de memória reduzido (modo FP4).
Preço: Preço inicial $1.999
Data da listagem: 30 de janeiro de 2025
GeForce RTX 5080
Parâmetros de especificação:
Número de núcleos CUDA: 16.384
Memória: 16 GB GDDR7
Largura de banda da memória: 960 GB/s
Principais aprimoramentos de desempenho:
Duas vezes o desempenho da RTX 4080.
Jogue jogos que suportam rastreamento óptico (como Cyberpunk 2077 e Alan Wake 2) em 4K e títulos como Black Myth: Goku para atender à alta demanda dos criadores por renderização 3D e edição de vídeo.
Preço: Preço inicial $999
Data da listagem: 30 de janeiro de 2025
GeForce RTX 5070Ti
Parâmetros de especificação:
Número de núcleos CUDA: 12.288
Memória: 16 GB GDDR7
Largura de banda da memória: 896 GB/s (78% em relação à RTX 4070 Ti)
Principais aprimoramentos de desempenho:
Duas vezes o desempenho da RTX 4070 Ti.
Executa jogos Light Chase com altas taxas de quadros e resolução de 2560x1440.
Preço: Preço inicial $749
Data de lançamento: fevereiro de 2025
GeForce RTX 5070
Parâmetros de especificação:
Número de núcleos CUDA: 10.240
Memória: 12 GB GDDR7
Largura de banda da memória: 672 GB/s (melhoria significativa em relação à RTX 4070)
Principais aprimoramentos de desempenho:
Duas vezes o desempenho da RTX 4070.
Executa jogos de rastreamento de luz com altas taxas de quadros na resolução de 2560x1440 com suporte a DLSS Multi Frame Generation.
Preço: Preço inicial $549
Data de lançamento: fevereiro de 2025
Tecnologias inovadoras de última geração
DLSS 4 Tecnologia de renderização neural
O DLSS 4 é a mais recente tecnologia de renderização neural da NVIDIA, com o núcleo Tensor GeForce RTX, que proporciona melhorias significativas na taxa de quadros, mantendo a qualidade de imagem nítida.
Gerar até 3 quadros adicionais por quadro de renderização tradicional
Melhoria de até 8x na taxa de quadros
Suporta jogos com traçado de raio total de 4K 240FPS
Primeira aplicação do modelo de IA do Transformer em um jogo
Melhoria da estabilidade do tempo e dos detalhes de movimento
Tecnologia de transformação de quadro Reflex 2
O NVIDIA Reflex 2 reduz a latência dos jogos em até 75% com a nova tecnologia de transformação de quadros para uma experiência de jogo mais suave.
Reduz a latência do jogo em 75%
Sincronização de fluxos de trabalho de CPU e GPU
Atualização dos quadros de renderização com base na última entrada do mouse
Proporcionando uma vantagem competitiva para jogos multijogador
Tornar os jogos para um único jogador mais responsivos
Papel da NVIDIA ACE AI
O NVIDIA ACE é um conjunto de tecnologias de personagens digitais que dão vida a personagens de jogos e assistentes digitais por meio de IA generativa.
Comportamento de personagens orientado por IA em jogos
Aprendizado contínuo IA do inimigo
Sistema de NPC com ação própria
Suporta vários jogos conhecidos
Resposta em tempo real ao comportamento do jogador
Projeto R2X PC Digital Man
O Project R2X é um avatar de PC baseado em visão que ajuda os usuários nas tarefas diárias e fornece assistência de IA.
O R2X fornece um avatar baseado em visão que atua como um assistente de desktop para os usuários.
Ele pode auxiliar os usuários em diversas tarefas, como leitura e resumo de documentos, gerenciamento de aplicativos, videoconferência e muito mais.
Suporte para videoconferência
Leitura e resumo de documentos de apoio
Conectando GPT4, Grok e outras IAs baseadas em nuvem
Suporte a várias estruturas de desenvolvimento
Assistência em tempo real para aplicativos de desktop
exército de robôs
A NVIDIA também anunciou a plataforma NVIDIA Cosmos™, um conjunto avançado de ferramentas projetado para acelerar o desenvolvimento de sistemas físicos de IA, como veículos autônomos e robôs.
Cosmos Inclui World Foundation Models (WFMs) generativos, tokenizadores de vídeo avançados, mecanismos de garantia de segurança e pipelines de processamento de vídeo acelerados.
A plataforma tem como objetivo ajudar os desenvolvedores a reduzir drasticamente o custo do desenvolvimento de modelos físicos de IA, gerando dados sintéticos realistas e baseados em física.
A resposta curta é:O Cosmos foi projetado especificamente para ajudar a desenvolver sistemas de robótica e de direção autônoma. Ele gera dados virtuais e cenários simulados a partir de modelos de IA, permitindo que os desenvolvedores treinem e testem seus sistemas de IA de forma mais rápida e econômica, sem precisar gastar muito tempo e dinheiro coletando dados reais.
- É possível gerar texto para o mundo e vídeo para o mundo.
- São oferecidos três modelos: Nano (implantação de borda de baixa latência), Super (modelo de linha de base de alto desempenho) e Ultra (modelo de alta fidelidade).
- Through 18,000,000,000,000,000,000,000,000,000,000,000,000,000,000 tokens de treinamento, abrangendo 20 milhões de horas de dados reais e sintéticos.
- Os tokenizadores são 8 vezes mais eficientes na compactação e 12 vezes mais rápidos no processamento.
Principais recursos do Cosmos
1. geração de dados virtuais
- Condições de direção em clima de neve
- Operação complexa de robôs em armazéns
- Cenários virtuais ultrarrealistas podem ser criados, por exemplo: esses dados podem ser usados para treinar sistemas de IA, reduzindo a dependência de dados do mundo real.
2. processamento rápido de dados de vídeo
- As ferramentas da Cosmos podem coletar e marcar rapidamente dados de vídeo em grande escala, mais de 10 vezes mais rápido do que os métodos tradicionais, economizando tempo e dinheiro.
3. simulação e teste
- Simule diferentes condições climáticas e de estrada (chuva, neblina, congestionamento).
- Teste a capacidade do robô de se movimentar em uma fábrica ou depósito.
- É possível testar robôs ou sistemas de direção autônoma em ambientes virtuais, por exemplo:
4. ajude a desenvolver modelos de IA
- Fornece modelos básicos de código aberto que os desenvolvedores podem personalizar de acordo com suas necessidades de robótica ou tecnologia de direção autônoma.
5. vários cenários de aplicativos
- Para treinamento de direção autônoma: Uber e Waabi, por exemplo, usam-no para criar cenários de teste de direção virtual.
- Para o desenvolvimento de robótica: Agility e XPENG o utilizam para treinar e otimizar a operação de robôs.
Empresas de robótica em exposição:
global
- ApptronikApollo Robotics: Apollo Robotics
- Agility RoboticsDigit Robotics
- Robótica NEURARobô 4NE-1
- figuraFigura 02 Robôs
- 1XRobô NEO
- MenteeRobô MenteeBot
- AI do SantuárioPhoenix Robotics : Phoenix Robotics
sino
- Unitree Robotics: Robô H1
- Robótica WiseGenExpedição A2: Robótica
- Star Trek (série de TV e filmes dos EUA)Robô Star1
- Galaxy GeneralRobô G1
- Inteligência de Fourier (Inteligência de Fourier)Robô GR-2
- Xiaopeng Automobile Company (fabricante de automóveis da RPC)Robô de ferro
resumos
Esse lançamento da NVIDIA fará com que a IA seja mais aplicada, fazendo com que o treinamento e o ajuste fino de modelos entrem no campo do consumidor, além de promover a explosão de aplicativos de IA, hardware inteligente e robótica!