엔비디아, 컴퓨터 그래픽 카드 회사 (NVDA), 알파벳의 구글 (GOOGL)과 인기 스타트업 OpenAI는 딥러닝 인공 지능 알고리즘을 훈련하기 위한 방대한 데이터 요구 사항을 충족하기 위해 "합성 데이터" 공장으로 눈을 돌리고 있습니다. 이번 주 소비자 가전 전시회에서 이 칩 제조업체의 CEO는 데이터를 합성할 수 있는 능력을 선전했으며, 이는 NVIDIA 주식에 호재가 될 수 있습니다.

합성 데이터로의 전환은 AI 기업들이 강력한 AI 모델을 학습시키는 데 필요한 실제 데이터가 부족하다는 보고가 잇따르는 가운데 나온 것입니다.
"합성 데이터는 희소하거나 민감한 데이터 요구를 해결하는 데 중요한 솔루션을 제공합니다. 주요 AI 기업들이 학습에 사용할 수 있는 인터넷 데이터를 고갈시키면서 이러한 추세가 가속화되고 있습니다."라고 데이터 과학자 벤 로리카는 2025 전망 보고서에서 말합니다.
"팀에서는 이미 기본 모델을 사용해 특정 사용 사례에 대한 합성 데이터를 생성할 수 있으며, 대규모 조직에서는 합성 데이터를 독점 데이터 세트와 결합할 수 있습니다."라고 Gradient Flow AI 뉴스레터를 편집하는 로리카는 덧붙입니다. "실무자들이 이 기술에 더 쉽게 접근할 수 있도록 주요 AI 연구소에서 개선된 합성 데이터 생성 도구가 등장할 것으로 기대합니다."
CES 2025에서 엔비디아의 CEO 젠슨 황은 자동차 및 로봇 애플리케이션에서 AI의 미래 역할에 대해 설명했습니다. 그는 합성 데이터가 도움이 될 것이라고 말했습니다.
NVIDIA 주식: "데이터 공장"
경제학자 에드 야데니는 CES에서 진행 상황에 대한 보고서를 통해 "NVIDIA는 기존 데이터를 수집 및 정리하여 합성 데이터를 생성하는 데 사용하고 있습니다."라고 말했습니다. "기존 데이터와 합성 데이터 모두 NVIDIA의 데이터 팩토리에서 AI 에이전트와 봇을 훈련하는 데 사용됩니다."
야데니는 "[칩 제조업체인] 엔비디아가 큰 변화를 가져왔습니다. 코스모스 자연, 인간 및 물리적 세계와 관련된 모든 것에 대한 2천만 시간의 비디오를 시청하여 Nvidia Cosmos를 개발했습니다. 이러한 실제 시나리오를 기반으로 합성 데이터를 생성하여 더 많은 시나리오를 생성할 수도 있습니다. 그런 다음 실제 데이터와 합성 데이터를 사용하여 창고에서 작업하거나 자율 주행 자동차를 운전하는 등 세상을 탐색해야 하는 로봇을 훈련할 수 있습니다."
Google의 클라우드 컴퓨팅 부문에서도 기업용 애플리케이션을 위한 합성 데이터에 큰 힘을 쏟고 있습니다. 또한 추론 기능이 강화된 OpenAI의 최신 기본 모델은 합성 데이터 생성 기술을 사용합니다.
2025년에 접어들면서 가장 큰 논쟁은 인위적으로 생산된 고품질의 학습 데이터에 접근하기 어렵기 때문에 AI 모델이 정체기에 접어든 것은 아닌지 여부입니다. 또한, 구글과 메타 플랫폼 (메타) 메타 같은 거대 기술 기업은 더 큰 모델을 구축하는 데 사용할 수 있는 유튜브, 지도, 인스타그램, 페이스북의 내부 독점 데이터를 보유하고 있습니다.
한편, 2023년 2,391조 원까지 치솟았던 NVIDIA 주식은 2024년 1,711조 원으로 상승했습니다.
© 저작권 정책
기사 저작권 AI 공유 서클 모두 무단 복제하지 마세요.
관련 문서
댓글 없음...