스탠포드 2025 AI 보고서 발표: 전체 PDF 다운로드

62.4K 00

스탠포드 대학교의 인간 중심 인공 지능 연구소(HAI)가 8번째 에디션을 발표했습니다.인공 지능 지수 보고서 (2025)". 이 보고서는 지난 한 해 동안 AI 연구 개발, 애플리케이션 및 투자가 크게 가속화되었음을 보여주는 동시에 책임감 있는 AI 관행, 대중의 신뢰, 기술 개발의 불균등한 글로벌 분포 등의 측면에서 여전히 남아 있는 과제를 지적합니다.

AI 성능이 급증하고 기술 환경이 빠르게 변화하고 있습니다.

2025 보고서에 따르면 다양한 고난도 벤치마크에서 AI의 성능은 계속해서 빠르게 향상되고 있습니다. MMMU, GPQA, SWE 벤치와 같이 새로 도입된 고난이도 테스트에서 AI 시스템은 이전보다 훨씬 빠르게 이 테스트들을 통과하고 있습니다. 이 보고서는 또한 AI 모델이 고품질 비디오를 생성하는 데 큰 진전을 보이고 있으며(예: OpenAI의 SORA 및 Google의 Veo 2), 제한된 시간 내에 특정 프로그래밍 작업에서 인간 프로그래머를 능가할 수 있다고 언급하고 있습니다.

기술 측면에서는 상황이 빠르게 변화하고 있습니다. 지난 1년 동안 챗봇 아레나 플랫폼에서 상위 클로즈드 소스 모델과 오픈 소스 모델 간의 성능 격차는 8.01 TP3T에서 1.71 TP3T로 상당히 좁혀졌으며, 마찬가지로 순위표에서 상위 10개 모델 간의 성능 차이도 11.91에서 5.41 TP3T로 좁혀져 고품질 모델이 점점 더 인기를 얻고 있습니다. Microsoft의 Phi-3-mini와 같은 소형 모델도 이전에는 100배 이상 큰 모델이 필요했던 수준에 도달하며 우수한 성능을 보여 알고리즘의 향상된 효율성을 입증했습니다.

효율성 향상도 분명합니다. AI 모델의 사용 비용(추론 비용)이 급격히 하락했으며, 예를 들어 MMLU 벤치마크에서 GPT-3.5 수준을 달성한 모델은 2022년 말 이후 사용 비용이 280배 이상 감소했습니다. 하드웨어 비용은 연간 약 301 TP3T 감소하고 에너지 효율은 연간 약 401 TP3T 개선되었지만 보고서는 복잡한 논리적 추론과 계획 능력이 오늘날 AI 시스템이 직면한 주요 과제로 남아 있다고 경고합니다.

투자 붐과 경제 통합 심화

2024년 전 세계 기업의 AI 투자액은 2,523억 달러로 사상 최대치를 기록했습니다. 민간 투자는 44.51조 달러로 2021년 이후 처음으로 전년 대비 증가세를 보였습니다. 특히 제너레이티브 AI는 339억 달러의 민간 투자를 유치하며 전체 AI 투자의 201조 3,000억 달러 이상을 차지했습니다.

미국은 중국의 약 12배, 영국의 24배에 달하는 1,091억 달러를 투자하여 AI에 대한 민간 투자에서 선두 자리를 더욱 넓혔습니다. 심지어 생성 AI 분야에서는 미국이 중국, EU, 영국을 합친 것보다 더 많은 투자를 했습니다.

기업의 AI 도입도 급격히 증가했습니다. 맥킨지 조사 데이터에 따르면 2024년 781개 기업이 비즈니스의 한 부분 이상에서 AI를 사용하고 있으며, 이는 2023년의 551개 기업보다 훨씬 높은 수치입니다. 생성형 AI의 사용은 711개 기업으로 두 배 이상 증가했으며, 기업들은 AI의 재정적 혜택을 보기 시작했지만 대부분은 아직 초기 단계에 있습니다(비용 절감 또는 매출 증가는 일반적으로 아래 101 TP3T). AI가 생산성을 향상시키고 많은 경우 고숙련 직원과 저숙련 직원 간의 격차를 줄이는 데 도움이 된다는 사실은 연구를 통해 계속 확인되고 있습니다.

책임감 있는 AI가 고르지 않게 진행됨에 따라 여전히 남아있는 과제

빠른 기술 발전에도 불구하고 책임감 있는 AI(RAI) 생태계는 고르지 않게 성장하고 있습니다. AI 사고 데이터베이스에 따르면 부정적인 AI 관련 사고는 2024년에 56.41건에서 사상 최고치인 233건으로 급격히 증가할 것으로 예상됩니다. 그러나 HELM Safety 및 AIR-Bench와 같은 새로운 벤치마크가 등장하고 있지만, 대형 모델에 대한 책임 있는 AI 평가 기준의 조화는 여전히 부족합니다.

기본 모델 투명성 지수에 따르면 모델 개발의 투명성은 개선되었지만(평균 점수는 2023년 10월 371 TP3T에서 2024년 5월 581 TP3T로 상승), 여전히 개선의 여지가 많이 남아있습니다. 보고서는 조직이 데이터 부정확성 및 사이버 보안과 같은 RAI 위험을 인식하고 있지만, 위험에 대한 인식과 실제 완화 조치 채택 사이에는 여전히 큰 격차가 있다고 지적합니다.

대중의 신뢰도 도전받고 있습니다. 전 세계적으로 AI 기업의 개인 데이터 보호에 대한 신뢰도는 하락했으며, AI 시스템에 편견이나 차별이 없다고 믿는 사람은 작년보다 더 적었습니다. 이 연구는 또한 명시적으로 편견이 없도록 설계된 모델도 여전히 잠재적인 사회적 편견을 나타낼 수 있다는 사실을 발견했습니다. 또한, 점점 더 많은 웹사이트가 AI 학습을 위해 데이터 크롤링을 제한함에 따라 '데이터 공유' 리소스가 줄어들고 있으며, 이는 향후 모델의 다양성과 기능에 영향을 미칠 수 있습니다.

지정학, 거버넌스 및 글로벌 정서

지정학적 측면에서는 2024년에도 미국이 중국(15개)과 유럽(3개)을 훨씬 앞서는 40개로 가장 많은 상위 AI 모델을 생산하는 국가로 남을 것으로 예상됩니다. 그러나 보고서는 주요 벤치마크에서 중국 모델 간의 성능 격차가 빠르게 좁혀져 2024년 말에는 미국 모델과 거의 같아질 것이라고 강조합니다. 중국은 총 AI 논문 및 특허 수에서 선두를 달리고 있으며, 미국 기관들은 가장 많이 인용되는 연구에 기여하고 있습니다.

캐나다, 중국, 프랑스, 인도, 사우디아라비아 등 전 세계 각국 정부는 대규모 투자 프로그램뿐만 아니라 규제 활동도 강화하는 등 AI 경쟁에 박차를 가하고 있습니다. 이 보고서에 따르면 전 세계 75개국의 입법 의제에서 AI에 대한 언급이 21.31 TP3T 증가했으며, 미국에서는 2023년에 비해 2024년에 연방 AI 관련 규정의 수가 두 배 이상 늘어날 것으로 예상됩니다. 미국 각 주에서도 특히 딥페이크(딥페이크) 기술을 규제하는 데 매우 적극적으로 나서고 있습니다. 경제협력개발기구(OECD), 유럽연합(EU), 유엔, 아프리카연합(AU) 등의 기관에서 책임 있는 AI를 위한 프레임워크를 발표하고, 국제적인 AI 보안 기관 네트워크가 구축되는 등 국제 협력도 강화되고 있습니다.

전 세계적으로, 특히 독일과 프랑스처럼 과거에 회의적이었던 국가들에서 신중한 낙관론이 확산되고 있는 추세입니다. 그러나 중국과 인도네시아 같은 국가에서는 대다수의 사람들이 AI에 대해 매우 낙관적인 반면, 캐나다, 미국, 네덜란드와 같은 국가에서는 낙관론이 훨씬 낮게 나타나는 등 지역적 차이가 여전히 크게 나타나고 있습니다.

과학과 일상 생활에서 점점 더 커지는 AI의 역할

이 보고서는 AI가 일상 생활에 점점 더 많이 통합되고 있으며 과학계에 미치는 혁신적인 영향을 강조합니다.2023년 미국 식품의약국(FDA)은 2015년 6개에 불과했던 AI 지원 의료 기기를 223개 승인했는데, 이는 2015년보다 크게 증가한 수치입니다. 자율주행차도 시범 운행 단계를 벗어나 미국 여러 도시에서 웨이모가 광범위하게 운행되고 있고, 중국에서는 바이두의 아폴로 고가 빠르게 확장되고 있습니다.

노벨상에서는 딥러닝과 단백질 접기(알파폴드)와 관련된 업적으로 각각 물리학상과 화학상을, 강화 학습 분야의 창시자에게 튜링상을 수여하는 등 AI가 과학에 미치는 영향력을 인정받았으며, 단백질 시퀀싱 모델(예: ESM3, AlphaFold 3)의 발전과 기본 모델이 의료 분야에 적용되기 시작하면서 AI는 계속해서 과학적 발견을 이끌고 있습니다. 의학 분야에서

요약하자면, 스탠포드 2025 AI 인덱스 보고서는 빠르게 성장하는 AI 분야의 모습을 보여줍니다. 가시적인 혜택을 제공하고 전례 없는 투자를 유치하는 동시에 깊은 윤리적 문제, 거버넌스 문제, 광범위한 대중의 신뢰를 구축하고 공평한 발전을 보장해야 하는 시급한 과제에 직면해 있는 AI 분야의 모습을 그려내고 있습니다.