딥서치 폭풍의 이면: 개방형 모델 경쟁이 미국과 중국의 AI 가치 지형을 재편할 것이라고 경고하는 응의 이야기

41.8K 00

친애하는 친구 여러분.

이번 주 DeepSeek (i) 중국이 제너레이티브 AI 분야에서 미국을 따라잡으며 AI 공급망에 큰 영향을 미치고 있다는 점, (ii) 개방형 가중치 모델이 기본 모델 계층을 상품화하여 애플리케이션 개발자에게 기회를 창출하고 있다는 점, (iii) 확장만이 AI가 발전하는 유일한 방법은 아니라는 점 등 몇 가지 중요한 트렌드가 많은 사람들에게 분명해졌습니다. 업계에서 연산 능력에 대한 높은 관심과 과대 광고에도 불구하고 알고리즘 혁신은 학습 비용을 빠르게 절감하고 있습니다.

약 일주일 전, 중국 기업 딥시크릿은 DeepSeek-R1 벤치마크에서 OpenAI o1과 비슷한 성능을 보이는 이 모델은 MIT 라이선스에 따라 가중치를 개방합니다. 지난주 다보스에서 비기술적인 배경을 가진 많은 비즈니스 리더들이 이에 대해 저에게 질문했습니다. 월요일에 주식 시장에서 '딥서치 매도'가 있었는데, NVIDIA를 비롯한 여러 미국 기술 기업의 주가가 폭락했습니다(현재 일부 회복된 상태입니다).

저는 DeepSeek가 다음과 같은 점을 강조한다고 생각합니다:

중국, 미국과의 격차를 좁혀가는 제너레이티브 AI.. 2022년 11월 ChatGPT가 출시되면 미국은 생성형 AI 분야에서 중국보다 훨씬 앞서게 됩니다. 사람들의 인식 변화는 느리기 때문에 최근 중국과 미국에는 여전히 중국이 뒤처지고 있다고 생각하는 친구들이 있습니다. 하지만 사실 이 격차는 지난 2년 동안 빠르게 좁혀지고 있습니다. via lit. 일반 원칙(관용구)에 관한 만 가지 질문; 그림. 긴 질문과 답변 목록 (저희 팀에서는 몇 달 동안 사용하고 있습니다), Kimi InternVL 및 DeepSeek와 같은 중국 모델을 통해 중국이 격차를 좁히고 있으며, 심지어 동영상 생성 등의 분야에서 일시적으로 우위를 점하고 있는 것은 분명합니다.

딥서치-R1이 상세한 기술 보고서와 함께 오픈 소스로 공개되는 것에 대해 매우 기쁘게 생각합니다. 이와 대조적으로 몇몇 미국 기업들은 'AI 멸종'과 같은 가상의 위험을 과장하여 오픈소스를 제한하는 정책을 추진하기도 했습니다. 이제 오픈 소스/오픈 가중치 모델이 AI 공급망의 핵심이 된 것은 분명하며, 많은 기업이 이를 채택할 것입니다. 미국이 오픈소스를 계속 차단한다면 중국이 공급망을 장악하고 궁극적으로 대부분의 기업이 미국 가치보다 중국 가치를 더 많이 반영하는 모델을 사용하게 될 것입니다.

개방형 가중치 모델은 기본 모델 레이어를 상품화합니다.. 앞서 언급했듯이 대규모 언어 모델 토큰 가격은 빠르게 하락하고 있으며, 오픈 가중치는 이러한 추세를 가속화하고 개발자에게 더 많은 옵션을 제공합니다. 오픈AI o1은 출력 토큰 백만 개당 60달러를 청구합니다.그리고 DeepSeek R1은 단 $2.19입니다.30배에 가까운 가격 차이로 인해 가격 인하 추세에 대한 우려가 널리 퍼졌습니다. 30배에 가까운 가격 차이는 가격 인하 추세에 대한 광범위한 관심을 불러일으켰습니다.

기본 모델을 교육하고 API 액세스를 판매하는 비즈니스는 많은 어려움으로 가득 차 있습니다. 이 분야의 많은 기업은 여전히 높은 학습 비용을 회수할 방법을 찾고 있습니다. "인공지능의 6천억 달러 수수께끼"라는 기사에서 이 문제를 설득력 있게 설명하고 있습니다(하지만 분명히 말씀드리자면, 저는 기본 모델 회사들이 훌륭한 일을 하고 있다고 생각하며 그들의 성공을 기대합니다). 반대로 기본 모델을 기반으로 앱을 구축하는 데에는 엄청난 비즈니스 기회가 있습니다. 다른 회사들이 학습 모델에 수십억 달러를 투자했기 때문에 고객 서비스 챗봇, 이메일 요약기, AI 의사, 법률 문서 비서 등과 같은 애플리케이션을 개발하는 데 몇 달러만 투자하면 됩니다.

AI의 발전은 확장에만 의존하지 않습니다... 모델 확장이 발전을 이끈다는 주장은 만연해 있습니다. 공정하게 말하자면 저는 일찍이 규모 논증의 옹호자였습니다. 기업들은 더 많은 자본이 (1) 규모를 확장하고 (2) 꾸준히 성과를 개선할 것이라는 이야기를 홍보하여 수십억 달러를 모금했습니다. 이로 인해 다른 여러 발전의 길을 희생하면서까지 규모 확대에 지나치게 집중하게 되었습니다. 미국의 AI 칩 금지 조치로 인해 DeepSeek 팀은 성능이 약한 H800 GPU에서 많은 최적화를 혁신해야 했고, 그 결과 모델 훈련 비용(연구 투자 제외)을 600만 달러 미만으로 유지할 수 있었습니다.

이것이 실제로 산술적 수요를 줄일 수 있을지는 아직 지켜봐야 합니다. 때로는 상품 단가의 하락이 오히려 총 지출의 증가로 이어지는 경우도 있습니다. 장기적으로는 인간의 지능과 산술 능력에 대한 수요에는 상한선이 거의 없기 때문에 비용이 감소하더라도 인간은 여전히 더 많은 지능 자원을 소비할 것이라고 생각합니다.

소셜 미디어에서는 딥시크의 진행 상황에 대한 상반된 해석으로 가득 차 있으며, 마치 로르샤흐 잉크 얼룩 테스트처럼 서로 다른 입장을 내놓고 있습니다. 아직 DeepSeek-R1의 지정학적 영향이 완전히 실현되었다고 생각하지는 않지만, AI 애플리케이션 개발자에게는 큰 도움이 될 것입니다. 저희 팀은 이미 개방형 고급 추론 모델의 도움으로만 실현할 수 있는 새로운 아이디어를 브레인스토밍하기 시작했습니다. 지금이야말로 AI 애플리케이션을 개발하기에 가장 좋은 시기입니다!