NVIDIA, empresa de placas de vídeo para computadores (NVDA), a Alphabet's google A NVIDIA Inc. (GOOGL) e a popular startup OpenAI estão recorrendo a fábricas de "dados sintéticos" para atender aos enormes requisitos de dados para treinar algoritmos de inteligência artificial de aprendizagem profunda. Na Consumer Electronics Show desta semana, o CEO da fabricante de chips elogiou a capacidade de sintetizar dados, o que pode ser bom para as ações da NVIDIA.
A mudança para dados sintéticos ocorre em meio a relatos de que as empresas de IA estão ficando sem os dados do mundo real necessários para treinar modelos avançados de IA.
"Os dados sintéticos oferecem uma solução essencial para atender às necessidades de dados escassos ou confidenciais. Essa tendência está se acelerando à medida que as principais empresas de IA esgotam os dados disponíveis na Internet que podem ser usados para treinamento", disse o cientista de dados Ben Lorica no relatório 2025 Outlook.
"As equipes já podem gerar dados sintéticos para casos de uso específicos usando modelos básicos, enquanto as organizações maiores podem combinar dados sintéticos com seus conjuntos de dados proprietários", acrescentou Lorica, que edita o boletim informativo sobre IA da Gradient Flow. "Espere o surgimento de ferramentas aprimoradas de geração de dados sintéticos nos principais laboratórios de IA para tornar essa tecnologia mais acessível aos profissionais."
Na CES 2025, o CEO da NVIDIA, Jen-Hsun Huang, destacou o futuro papel da IA em aplicativos automotivos e de robótica. Os dados sintéticos ajudarão, disse ele.
Ações da NVIDIA: a "fábrica de dados"
"A NVIDIA está coletando e organizando dados tradicionais e usando-os para criar dados sintéticos", disse o economista Ed Yardeni em um relatório sobre o progresso na CES. "Tanto os dados tradicionais quanto os sintéticos serão usados para treinar agentes e bots de IA nas fábricas de dados da NVIDIA."
Yardeni acrescentou: "[A fabricante de chips] fez uma grande diferença ao permitir que a Nvidia Cosmos Assistir a 20 milhões de horas de vídeo sobre a natureza, os seres humanos e qualquer coisa relacionada ao mundo físico desenvolveu o Nvidia Cosmos. Com base nesses cenários do mundo real, ele também pode criar dados sintéticos para criar ainda mais cenários. Em seguida, ela pode usar seus dados reais e sintéticos para treinar robôs que precisam navegar pelo mundo, seja trabalhando em um armazém ou dirigindo um carro autônomo."
O braço de computação em nuvem do Google também está dando um grande impulso aos dados sintéticos para aplicativos empresariais. Além disso, o modelo básico mais recente da OpenAI, com recursos de raciocínio aprimorados, usa técnicas de geração de dados sintéticos.
Um grande debate para 2025 é se os modelos de IA começaram a se estabilizar devido à dificuldade de acessar dados de treinamento de alta qualidade produzidos artificialmente. Além disso, empresas como Google e Plataformas Meta (META) Gigantes da tecnologia, como a META, têm dados internos proprietários do YouTube, Maps, Instagram e Facebook que podem ser usados para criar modelos maiores.
Enquanto isso, as ações da NVIDIA subiram 41 TP3T em 2025. Depois de subir 2.391 TP3T em 2023, as ações da NVIDIA subiram 1.711 TP3T em 2024.