엔비디아, 구글, OpenAI, AI 모델 학습을 위해 '합성 데이터' 공장으로 전환

AI 뉴스9개월 전에 게시 됨 AI 공유 서클
12.8K 00
堆友AI

엔비디아, 컴퓨터 그래픽 카드 회사 (NVDA), 알파벳의 구글 (GOOGL)과 인기 스타트업 OpenAI는 딥러닝 인공 지능 알고리즘을 훈련하기 위한 방대한 데이터 요구 사항을 충족하기 위해 "합성 데이터" 공장으로 눈을 돌리고 있습니다. 이번 주 소비자 가전 전시회에서 이 칩 제조업체의 CEO는 데이터를 합성할 수 있는 능력을 선전했으며, 이는 NVIDIA 주식에 호재가 될 수 있습니다.

英伟达、谷歌、OpenAI 转向“合成数据”工厂以训练 AI 模型

합성 데이터로의 전환은 AI 기업들이 강력한 AI 모델을 학습시키는 데 필요한 실제 데이터가 부족하다는 보고가 잇따르는 가운데 나온 것입니다.

"합성 데이터는 희소하거나 민감한 데이터 요구를 해결하는 데 중요한 솔루션을 제공합니다. 주요 AI 기업들이 학습에 사용할 수 있는 인터넷 데이터를 고갈시키면서 이러한 추세가 가속화되고 있습니다."라고 데이터 과학자 벤 로리카는 2025 전망 보고서에서 말합니다.

 

"팀에서는 이미 기본 모델을 사용해 특정 사용 사례에 대한 합성 데이터를 생성할 수 있으며, 대규모 조직에서는 합성 데이터를 독점 데이터 세트와 결합할 수 있습니다."라고 Gradient Flow AI 뉴스레터를 편집하는 로리카는 덧붙입니다. "실무자들이 이 기술에 더 쉽게 접근할 수 있도록 주요 AI 연구소에서 개선된 합성 데이터 생성 도구가 등장할 것으로 기대합니다."

CES 2025에서 엔비디아의 CEO 젠슨 황은 자동차 및 로봇 애플리케이션에서 AI의 미래 역할에 대해 설명했습니다. 그는 합성 데이터가 도움이 될 것이라고 말했습니다.

 

NVIDIA 주식: "데이터 공장"

경제학자 에드 야데니는 CES에서 진행 상황에 대한 보고서를 통해 "NVIDIA는 기존 데이터를 수집 및 정리하여 합성 데이터를 생성하는 데 사용하고 있습니다."라고 말했습니다. "기존 데이터와 합성 데이터 모두 NVIDIA의 데이터 팩토리에서 AI 에이전트와 봇을 훈련하는 데 사용됩니다."

야데니는 "[칩 제조업체인] 엔비디아가 큰 변화를 가져왔습니다. 코스모스 자연, 인간 및 물리적 세계와 관련된 모든 것에 대한 2천만 시간의 비디오를 시청하여 Nvidia Cosmos를 개발했습니다. 이러한 실제 시나리오를 기반으로 합성 데이터를 생성하여 더 많은 시나리오를 생성할 수도 있습니다. 그런 다음 실제 데이터와 합성 데이터를 사용하여 창고에서 작업하거나 자율 주행 자동차를 운전하는 등 세상을 탐색해야 하는 로봇을 훈련할 수 있습니다."

Google의 클라우드 컴퓨팅 부문에서도 기업용 애플리케이션을 위한 합성 데이터에 큰 힘을 쏟고 있습니다. 또한 추론 기능이 강화된 OpenAI의 최신 기본 모델은 합성 데이터 생성 기술을 사용합니다.

2025년에 접어들면서 가장 큰 논쟁은 인위적으로 생산된 고품질의 학습 데이터에 접근하기 어렵기 때문에 AI 모델이 정체기에 접어든 것은 아닌지 여부입니다. 또한, 구글과 메타 플랫폼 (메타) 메타 같은 거대 기술 기업은 더 큰 모델을 구축하는 데 사용할 수 있는 유튜브, 지도, 인스타그램, 페이스북의 내부 독점 데이터를 보유하고 있습니다.

한편, 2023년 2,391조 원까지 치솟았던 NVIDIA 주식은 2024년 1,711조 원으로 상승했습니다.

© 저작권 정책

관련 문서

댓글 없음

댓글에 참여하려면 로그인해야 합니다!
지금 로그인
없음
댓글 없음...