미래는 여기에 있다: '제품으로서의 모델' 시대를 심층적으로 살펴보기

45.9K 00

지난 몇 년 동안 AI 개발의 다음 단계인 에이전트화에 대한 논의가 끊임없이 이어져 왔습니다. 더 강력한 추론 능력? 아니면 진정한 멀티모달 융합? 온갖 추측이 쏟아져 나오며 AI 분야의 새로운 변화를 예고하고 있습니다.

이제 확실한 판단을 내릴 때가 된 것 같습니다:'제품으로서의 모델'의 시대가 도래했습니다. 이는 단순한 트렌드가 아니라 현재 AI 개발 환경에 대한 깊은 인사이트입니다.

학술 연구의 최첨단이든 상업 시장의 실제 방향이든, 모든 징후가 이러한 변화의 방향을 분명히 가리키고 있습니다.

일반 모델 확장에 병목 현상이 발생하고 있습니다: 일반적인 대형 모델의 '큰 것이 좋다'는 개발 모델은 점차 그 한계를 드러내고 있습니다. 이는 기술적인 문제일 뿐만 아니라 비용적인 측면에서도 고려해야 할 사항입니다. GPT-4 이후 업계의 논의에서 드러났듯이, 모델 용량 증가와 산술적 비용 증가 사이의 관계는 단순히 선형적인 것이 아니라 가위 격차가 확대되고 있습니다. 모델 파워는 선형적인 속도로만 증가할 수 있지만, 이러한 거대 모델을 훈련하고 운영하는 데 드는 비용은 기하급수적으로 증가합니다. 다른 벤더는 말할 것도 없고 OpenAI만큼 많은 기술과 리소스를 보유한 기업조차도 막대한 투자를 감당할 수 있는 비즈니스 모델을 찾기 위해 고심하고 있습니다. 이는 AI 기능을 무한히 향상시키기 위해 모델 매개변수 크기 확장에만 의존하던 시대가 끝났음을 의미합니다. 우리는 보다 효율적이고 비용 효율적이며 지속 가능한 AI 개발 경로를 찾아야 합니다.
오리엔테이션 교육은 기대 이상의 성과를 거두며 새로운 강자로 떠올랐습니다: 일반 모델 개발이 더딘 것과는 대조적으로"의견 수렴 교육." 접근 방식은 놀라운 잠재력을 보여줍니다. 이 훈련 패러다임은 특정 작업과 애플리케이션 시나리오에 맞는 모델의 미세 조정과 훈련을 강조합니다. 강화 학습과 추론 기법의 융합은 타깃 트레이닝에 활기를 불어넣었습니다. 단순히 '데이터 학습'에 그치지 않고 모델이 실제로 '작업 학습'을 시작하는 것을 목격하고 있습니다. 이는 AI에 대한 사고방식의 전환을 의미하는 질적 도약입니다. 수학에서 소형 모델의 놀라운 성능, 코드 생성기에서 코드 베이스의 자율 관리자로의 코드 모델의 진화, 또는 Claude 정보 입력이 거의 없는 상태에서 복잡한 게임을 플레이하는 사례는 오리엔테이션 훈련의 힘을 증명합니다. 이러한 '작지만 정교하고' '전문적이면서도 강력한' 모델 개발 방식은 향후 AI 애플리케이션의 주류가 될 수 있습니다.
모델 추론 비용은 절벽 아래로 떨어집니다: AI 도입의 '걸림돌'로 여겨지던 추론 비용도 크게 완화되었습니다. 덕분에 DeepSeek AI와 같은 기업들의 모델 최적화 및 추론 가속화의 획기적인 발전으로 AI 모델의 배포 및 채택에 대한 문턱이 크게 낮아졌습니다. 딥시크의 최신 연구에 따르면 기존의 GPU 컴퓨팅 성능은 이론적으로 전 세계 수십억 명의 사람들이 각각 최첨단 모델을 사용해 하루에 10,000개의 AI 모델을 처리할 수 있습니다. 토큰 필요로 합니다. 이는 산술이 더 이상 AI의 대중성을 제한하는 핵심 요소가 아니며, AI의 대규모 적용 시대가 가속화되고 있음을 의미합니다. 모델 제공자의 경우, 단순히 토큰을 판매하는 '사용량 기반' 비즈니스 모델에 의존하는 것만으로는 AI 모델의 가치를 충분히 활용하기에 충분하지 않습니다. 보다 수직적이고 전문화된 모델 서비스 및 솔루션을 제공하는 등 가치 사슬의 상위 단계로 눈을 돌려야 합니다.

이러한 모든 징후는 AI 산업 발전의 초점이 '일반 모델'에서 '제품으로서의 모델'이라는 새로운 패러다임으로 이동하고 있음을 나타냅니다. 이는 기술적 조정일 뿐만 아니라 비즈니스 모델과 산업 패턴의 근본적인 변화이기도 합니다. 기존의 "앱이 왕이다"라는 철학은 다시 생각해 볼 필요가 있습니다. 오랫동안 투자자와 기업가들은 애플리케이션 혁신이 AI 상용화의 핵심이라고 믿으며 AI 애플리케이션 레이어에 집중해 왔습니다. 그러나 '제품형 모델' 시대에는 애플리케이션 계층이 가장 먼저 자동화되고 혁신될 수 있습니다. 향후 경쟁의 초점은 모델 자체에 맞춰질 것이며, 더 발전되고 더 효율적이며 더 전문적인 모델을 보유하는 사람이 AI 경쟁에서 우위를 점할 수 있을 것입니다.

미래 모델의 형태: 전문화, 수직화, 서비스화

지난 몇 주 동안 '제품으로서의 모델' 패러다임에서 두 가지 상징적인 제품이 등장했는데, 바로 OpenAI의 DeepResearch와 인류학 클로드 3.7 소네트 이 두 제품은 차세대 모델의 트렌드를 반영하며 미래 모델의 모습을 보여주는 선구자입니다.

출시 이후 많은 관심을 불러일으킨 OpenAI의 딥리서치는 많은 오해를 불러일으켰습니다. 많은 사람들이 단순히 GPT-4의 '셸' 응용 프로그램 또는 GPT-4 기반의 검색 향상 도구로 해석했습니다. 하지만 이는 사실과 거리가 멀다. OpenAI는 실제로 연구 및 정보 검색 작업을 위해 완전히 새로운 모델을 학습시킵니다. DeepResearch는 외부 검색 엔진이나 도구 호출에 의존하는 '워크플로우'가 아니라 진정한 "연구 언어 모델."외부의 개입 없이 엔드투엔드 자율 검색, 탐색, 정보 통합 및 보고서 생성 기능을 제공합니다. 외부의 개입 없이 엔드투엔드 자율 검색, 탐색, 정보 통합 및 보고서 생성 기능을 제공합니다. DeepResearch를 사용해 본 사람이라면 누구나 기존 LLM이나 챗봇과의 차이를 분명히 느낄 수 있습니다. 생성되는 보고서는 명확하게 구조화되고 엄격하게 논증되며 안정적으로 추적할 수 있어 기존 검색 도구와 LLM을 훨씬 능가하는 전문성과 깊이를 반영합니다.

반면, 다음과 같이 '심층 검색'을 표방하는 다른 제품들은 시중에 나와 있습니다. 당혹감 구글과 구글의 기능에 비해 왜소하게 느껴지는 구글의 기능도 마찬가지입니다. 이한충이 지적한 것처럼, 이들 제품은 여전히 간단한 미세 조정과 기능 오버레이가 포함된 일반적인 모델을 기반으로 하고 있으며, 검색 작업에 대한 심층적인 최적화와 체계적인 설계가 부족합니다. 딥리서치의 등장은 '제품으로서의 모델'이라는 개념의 초기 상륙을 의미하며, 전문화되고 수직화된 모델의 발전 방향을 보여줍니다.

앤트로픽은 또한 '제품으로서의 모델' 전략을 적극적으로 추구하고 있으며 에이전트 모델에 대한 인사이트를 제공하고 있습니다. 작년 12월에 다음과 같은 기사를 발표했습니다.연구 보고서앤트로픽은 에이전트 모델을 재정의했습니다. Anthropic에 따르면 진정한 에이전트 모델에는 다음이 포함되어야 합니다. "자율성."워크플로우의 링크 역할이 아닌 독립적으로 목표 작업을 완료할 수 있는 에이전트 모델입니다. 딥리서치와 마찬가지로, 앤트로픽은 에이전트 모델이 다음과 같아야 한다고 강조합니다. "내부적으로" 사전 정의된 코드 경로와 외부 오케스트레이션에 의존하지 않고 작업 흐름의 동적 계획, 도구의 자율적 선택 및 호출 등 작업 실행의 전체 프로세스를 완료하세요.

오늘날 수많은 에이전트 스타트업이 시장에 등장하고 있지만, 이들이 구축하는 대부분의 '에이전트'는 여전히 "워크플로" 레벨. 이러한 '에이전트'는 기본적으로 LLM과 다양한 도구를 서로 연결하여 정해진 수의 단계로 작업을 수행하는 일련의 사전 정의된 코드 흐름입니다. 이러한 "의사 에이전트" 접근 방식은 특정 업종에서는 어느 정도 가치가 있을 수 있지만, Anthropic 및 OpenAI에서 정의하는 "실제 에이전트" 접근 방식과는 거리가 멉니다. 진정한 자율 시스템은 질적 도약을 위해 모델 수준에서 재구성되고 혁신되어야 합니다.

Anthropic Claude 3.7의 출시는 '제품으로서의 모델' 트렌드의 또 다른 증거입니다. Claude 3.7은 복잡한 코드 시나리오에 심도 있게 최적화된 모델입니다. Claude 3.7은 코드 생성, 코드 이해 및 코드 편집에서 뛰어난 성능을 보여줍니다. 특히 주목할 만한 점은 다음과 같은 모델도 Devin 이처럼 고도로 복잡하고 지능적인 'AI 프로그래머' 워크플로는 Claude 3.7을 통해 SWE 벤치마크에서도 상당한 개선을 달성할 수 있었습니다. 이는 훌륭한 애플리케이션을 구축하는 데 있어 중요한 것은 모델 자체의 힘이라는 것을 시사합니다. 복잡한 워크플로와 외부 도구를 설계하는 데 많은 노력을 기울이는 대신 모델 자체의 개발과 최적화에 리소스를 투자해야 합니다.

플레아스 팀은 RAG 검색 증강 세대(RAG) 영역에 대한 탐구 역시 '제품으로서의 모델'이라는 개념을 반영합니다. 기존의 RAG 시스템은 일반적으로 데이터 라우팅, 텍스트 청킹, 결과 재정렬, 쿼리 이해, 쿼리 확장, 컨텍스트 융합, 검색 최적화 등과 같은 여러 독립적이고 결합된 워크플로우로 구성됩니다. 이러한 링크 간의 유기적인 통합이 부족하면 취약성이 높고 유지보수 및 최적화 비용이 높아집니다. 이러한 링크 간의 유기적인 통합이 부족하면 시스템 취약성이 높아지고 유지보수 및 최적화 비용이 높아집니다. 플레아스 팀은 최신 교육 기법을 사용하여 RAG 시스템의 다양한 측면을 통합하려고 노력하고 있습니다. "모델링"RAG에는 데이터 전처리 및 지식 기반 구축을 위한 모델과 정보 검색, 콘텐츠 생성 및 보고서 출력을 위한 모델이라는 두 가지 핵심 모델이 있습니다. 이 두 모델은 서로 협력하여 RAG의 전체 프로세스 작업을 완료합니다. 새로운 모델 아키텍처 설계, 정교한 합성 데이터 파이프라인, 맞춤형 강화 학습 보상 기능을 필요로 하는 이 솔루션은 진정한 기술 혁신이자 연구의 돌파구입니다. RAG 시스템을 '모델링'하면 시스템 아키텍처를 크게 단순화하고, 시스템 성능과 안정성을 개선하며, 배포 및 유지보수 비용을 절감하고, RAG 기술의 확장된 적용을 실현할 수 있습니다.

'제품으로서의 모델'의 핵심 개념을 간단히 요약하면 다음과 같습니다. "복잡성 해소". 원래 애플리케이션 계층에서 해결해야 하는 복잡한 문제를 모델 학습을 통해 모델 수준에서 미리 처리하고 소화합니다. 모델은 훈련 단계에서 다양하고 복잡한 시나리오와 극한 상황을 미리 학습하고 적응하기 때문에 모델 배포 및 적용이 더 간단하고 효율적입니다. 앞으로 AI 제품의 핵심 가치는 애플리케이션 계층의 화려한 기능이나 복잡한 워크플로우보다 모델 자체에 더 집중될 것입니다. 모델 트레이너는 가치 창출과 가치 포착의 주역이 될 것입니다. Anthropic Claude의 목표는 LlamaIndex에서 제공하는 기본 에이전트 프레임워크와 같은 현재의 워크플로 기반 '의사 에이전트' 시스템을 혁신하고 대체하는 것입니다. 더 강력한 모델을 통해 더 스마트하고 자율적이며 사용하기 쉬운 AI 애플리케이션을 구현하고자 합니다.

未来已来：深度解读 “模型即产品” 时代
는 아래에 설명된 대로 고급 모델링 아키텍처로 대체됩니다:

'상품으로서의 모델' 시대에서 살아남기: 자신만의 모델을 개발할 것인가, 아니면 그 모델에 삼켜질 것인가?

다시 말하지만, 대규모 AI 연구소를 전략적으로 배치하는 것은 '비밀 작전'이 아니라 명확하고 공개적인 것입니다. 어떤 면에서는 그들의 전략이 투명하지 않은 것처럼 보일 수 있지만, 핵심 의도는 분명합니다: 이들은 모델 계층에서 시작하여 애플리케이션 계층까지 침투하여 엔드투엔드 AI 제품 및 서비스를 구축하고 가치 사슬을 지배하려고 할 것입니다. 이러한 트렌드가 비즈니스에 미치는 영향은 광범위합니다. 데이터브릭스의 Gen AI 부문 부사장인 나빈 라오의 말이 정곡을 찌릅니다:

향후 2~3년 내에 모든 클로즈드 소스 AI 모델 제공업체는 API 인터페이스 직접 판매를 점차 중단할 것입니다. 오픈 소스 모델만 API를 통해 서비스를 계속 제공할 것입니다. 클로즈드 소스 모델 제공업체의 목표는 독특하고 경쟁력 있는 일반적이지 않은 AI 기능을 구축하는 것이며, 이러한 기능을 제공하기 위해서는 최고의 사용자 경험과 애플리케이션 인터페이스를 만들어야 합니다. 미래의 AI 제품은 더 이상 모델 그 자체가 아니라 모델, 애플리케이션 인터페이스, 특정 기능을 통합한 완전한 애플리케이션이 될 것입니다.

즉, 모델 제공자와 앱 개발자 간의 '분업'의 허니문 기간이 끝났다는 의미입니다. 애플리케이션 개발자, 특히 타사 모델 API에 의존하여 애플리케이션을 구축하는 '래퍼' 기업은 생존에 전례 없는 도전에 직면해 있습니다. 앞으로 AI 산업의 경쟁 환경은 다음과 같은 방향으로 진화할 수 있습니다:

모델 제공업체는 시장 점유율을 확보하기 위해 자체 애플리케이션을 개발합니다: 클로드 코드 와 DeepSearch는 모델 제공업체들이 적용 영역을 적극적으로 확장하고 있다는 신호를 보냈습니다. 딥서치는 오픈 API 인터페이스는 없지만 OpenAI의 프리미엄 구독 서비스에 통합되어 서비스의 가치를 높여주는 핵심 기능으로 활용되고 있습니다. 클로드 코드는 개발자가 코드 에디터에서 바로 클로드 3.7 모델을 사용할 수 있는 경량 엔드포인트 통합 툴입니다. 이러한 움직임은 모델 제공업체들이 사용자에게 직접 서비스를 제공하고 시장 점유율을 확보하기 위해 자체 애플리케이션 생태계 구축에 박차를 가하고 있음을 나타냅니다. Cursor와 같은 일부 애플리케이션 래퍼는 Claude 3.7 모델에 연결했을 때 성능 저하와 사용자 이탈이 발생했다는 점에 주목할 필요가 있습니다. 이는 모델이 곧 제품이라는 생각을 더욱 뒷받침합니다: 진정한 AI 에이전트는 기존 워크플로우를 수용하고 적응하는 것이 아니라 모델 자체의 역량을 극대화하는 데 중점을 둡니다.
애플리케이션 래퍼 변환, 모델 자체 연구에 집중하세요: 모델 제공업체의 '하강 타격'에 직면한 일부 헤드 애플리케이션 래퍼들은 자체 모델 트레이닝 역량을 구축하기 위해 적극적으로 변화를 모색하기 시작했습니다. 이들 기업은 늦은 출발과 상대적으로 취약한 모델 트레이닝 역량에도 불구하고 적극적으로 기반을 다지고 있습니다. 예를 들어 Cursor는 소규모 코드 자동 완성 모델의 가치를 강조합니다; 윈드서핑 는 자체 개발한 저비용 코드 모델인 Codium을 보유하고 있으며, Perplexity는 트래픽 라우팅을 위해 오랫동안 자체 개발한 분류기에 의존해 왔으며 검색 향상을 위해 자체 변형된 DeepSeek를 학습하기 시작했습니다. 이러한 움직임은 애플리케이션 래퍼가 미래 경쟁에서 발판을 마련하기 위해 'API 호출' 모델에만 의존하기 어렵고, 경쟁력을 유지하기 위해 특정 모델 자체 개발 역량을 습득해야 한다는 것을 깨달았음을 보여줍니다.
소규모 패키지는 어디로 가야 할까요? UI 혁신이 돌파구의 열쇠가 될 수 있습니다: 수많은 중소규모 애플리케이션 래퍼의 경우 앞으로 생존의 여지가 더욱 좁아질 것입니다. 대형 모델 랩이 API 서비스를 전반적으로 축소하면 이러한 소규모 래퍼는 보다 중립적인 제3자 추론 서비스 제공업체로 눈을 돌릴 수밖에 없을 것입니다. 모델 기능의 융합으로 UI(사용자 인터페이스)와 사용자 경험의 혁신이 소규모 패키지가 돌파구를 마련할 수 있는 열쇠가 될 수 있습니다. AI 분야에서 UI의 가치는 오랫동안 심각하게 과소평가되어 왔습니다. 일반 모델이 더욱 강력해지고 모델 배포 및 애플리케이션 프로세스가 점점 더 간소화됨에 따라, UI의 중요성이 점점 더 커지고 있습니다.뛰어난 사용자 인터페이스는 제품의 경쟁력을 높이고 사용자를 끌어들이는 핵심 요소가 될 것입니다. 특히 RAG와 같은 애플리케이션 시나리오에서는 모델 기능이 더 이상 결정적인 요소가 아닐 수 있으며, 사용 편의성, 상호 작용 및 사용자 경험이 더욱 중요해질 것입니다.

요컨대, 대부분의 애플리케이션 래퍼에게 미래는 '둘 중 하나'의 딜레마를 안고 있습니다: 모델 트레이너로 변신하거나(트레이닝), 모델 주인에게 삼켜지거나(트레이닝 중) 둘 중 하나를 선택할 수 있습니다. 현재 이러한 애플리케이션 래퍼가 수행하는 모든 작업은 어떤 의미에서 대형 모델 랩의 '무료 시장 조사'이자 '무료 데이터 라벨링'이 되었습니다. 모든 사용자 상호작용 데이터와 피드백이 궁극적으로 모델 제공업체로 흘러들어가 모델을 개선하고 제품을 최적화하며 시장 입지를 더욱 강화하는 데 도움이 되기 때문입니다.

애플리케이션 래퍼의 향후 방향은 투자자들의 태도와 인식에 따라 크게 달라질 수 있습니다. 걱정스러운 것은 현재의 투자 환경이 모델 교육 분야에 다소 '편향된' 것 같다는 점입니다. 많은 투자자들은 여전히 "애플리케이션이 왕이다"라는 전통적인 개념을 고수하며 모델 학습의 가치와 잠재력을 인식하지 못하고 있습니다. 이러한 투자 '불일치'는 AI 기술의 건전한 발전을 저해하고 심지어 서구 AI 산업이 미래 경쟁에서 뒤처지게 할 수도 있습니다. 결과적으로 일부 애플리케이션 래퍼는 투자자의 오해를 받지 않기 위해 모델 학습에 대한 노력을 '숨겨야' 할 수도 있습니다. 예를 들어, 커서의 미니어처와 코디움은 지금까지 적절한 홍보와 프로모션이 부족했습니다. '모델이 아닌 애플리케이션에 집중'하는 투자 방향은 업계에 깊은 성찰과 경각심을 불러일으킬 필요가 있습니다.

과소평가된 강화 학습: AI의 미래 경쟁의 열쇠

현재 AI 투자 분야에는 다음과 같은 것들이 널리 퍼져 있습니다. "강화 학습은 가격이 책정되지 않았습니다." 현상입니다. 이러한 현상의 이면에는 AI 기술의 발전 추세에 대한 투자 커뮤니티의 인지적 편향과 강화 학습 기술의 전략적 중요성을 간과한 것이 있습니다.

VC의 AI 투자 결정은 일반적으로 몇 가지 가정을 바탕으로 이루어집니다:

애플리케이션 계층은 가치 포켓이고 모델 계층은 인프라에 불과합니다: 투자자들은 일반적으로 AI의 진정한 가치는 애플리케이션 계층에 반영되어 있으며 애플리케이션 혁신이 기존 시장을 파괴할 수 있는 핵심이라고 생각합니다. 모델 계층은 API 인터페이스를 제공하는 인프라에 불과하며 핵심 경쟁력이 없습니다.
모델 API 가격은 계속 하락할 것이며 애플리케이션 래퍼는 계속 혜택을 받을 것입니다: 투자자들은 모델 제공업체들이 시장 점유율을 높이기 위해 API 호출 가격을 계속 낮춰 애플리케이션 래퍼의 수익성을 높일 것으로 예상합니다.
비공개 소스 모델 API는 모든 애플리케이션에 충분합니다: 투자자들은 데이터 보안과 자율성에 대한 요구 사항이 높은 민감한 산업에서도 비공개 소스 모델 API를 기반으로 구축된 애플리케이션이 광범위한 시나리오의 요구를 충족할 수 있다고 생각합니다.
모델 트레이닝은 큰 투자, 긴 주기, 높은 위험이 따르므로 API를 직접 구매하는 것이 좋습니다: 투자자들은 일반적으로 모델 트레이닝 역량을 구축하는 것이 '쓸데없는' 투자라고 생각합니다. 모델 트레이닝에는 막대한 자본과 긴 주기, 높은 기술적 한계가 필요하며, 모델 API를 직접 구매하여 애플리케이션을 빠르게 개발하는 것보다 리스크가 훨씬 높습니다.

그러나 '제품으로서의 모델' 시대에는 이러한 가정이 점점 더 유지될 수 없는 상황이 되고 있습니다. 투자 커뮤니티가 이러한 낡은 관념을 계속 고수한다면 AI 개발을 위한 전략적 기회를 놓치고 심지어 시장 자원의 잘못된 배분으로 이어질 수 있다고 우려합니다. 현재의 AI 투자 붐은 "위험한 도박", 즉 "최신 기술 개발(특히 강화 학습)을 정확하게 평가하지 못하는 시장 실패"로 변질될 수 있습니다.

벤처 캐피탈(VC) 펀드는 다음과 같은 포트폴리오에 대한 투자를 찾고 있습니다. "상관 없음"VC의 목표는 S&P500 지수를 능가하는 것이 아닙니다. VC의 목표는 S&P500 지수를 능가하는 것이 아니라 전반적인 리스크를 줄이고 일부 투자가 하락 사이클에서도 수익을 낼 수 있도록 다각화된 포트폴리오를 구축하는 것입니다. "비 상관관계" 투자의 프로필에 맞는 모델 트레이닝. 서구 주요 경제의 경기 침체 리스크를 배경으로 혁신과 성장의 잠재력이 큰 AI 모델 학습 분야는 거시경제 사이클과 상관관계가 약합니다. 그러나 모범 교육 기업들은 일반적으로 자금 조달에 어려움을 겪고 있으며, 이는 벤처 캐피탈의 본질적인 논리에 반하는 것입니다. 프라임 인텔리전스는 최첨단 AI 연구소로 성장할 수 있는 잠재력을 갖춘 몇 안 되는 서구 AI 모델 트레이닝 스타트업 중 하나입니다. 최초의 탈중앙화 LLM을 교육하는 등 기술적으로 획기적인 성과를 거두었지만, 자금 규모는 일반 '셸' 앱 회사와 비슷한 수준입니다. '나쁜 돈이 좋은 돈을 쫓아내는' 이 현상은 생각을 자극합니다.

몇몇 대형 연구소를 제외하고는 현재 AI 모델 학습을 위한 생태계는 매우 취약하고 한계가 있습니다. 전 세계적으로 모델 교육에 집중하는 혁신적인 기업은 소수에 불과합니다. 프라임 인텔리전트, 문드림, 아르시, 누스, 플레아스, 지나, 허깅페이스 사전 훈련팀(매우 소규모) 등이 오픈 소스 AI 모델 훈련 분야의 거의 모든 것을 구성하고 있습니다. 이들은 Allen AI, EleutherAI 등 소수의 학술 기관과 함께 현재 오픈 소스 AI 학습 인프라의 초석을 구축하고 유지 관리하고 있습니다. 유럽에서는 플레아스 팀이 개발한 공통 말뭉치와 사전 훈련 도구를 기반으로 모델을 훈련할 계획인 7~8개의 LLM 프로젝트가 있는 것으로 알고 있습니다. 번성하는 오픈소스 커뮤니티는 상업적 투자 부족을 어느 정도 보완하기 위해 노력했지만, 모델 교육 생태계가 직면한 문제의 근원을 파악하는 데 어려움을 겪기도 했습니다.

OpenAI도 '수직적 RL'의 중요성을 잘 알고 있는 것 같습니다. 최근 OpenAI 경영진이 "RL에는 가볍고 애플리케이션에는 무거운" 실리콘밸리 스타트업 업계에 대해 불만을 표출했다는 보도가 있었습니다. 아마도 이 메시지는 샘 알트먼이 직접 전한 것으로 추정되며, 다음 YC 스타트업 캠프에 반영될 것으로 보입니다. 이는 OpenAI의 협업 전략에 변화가 있을 수 있다는 신호입니다. 앞으로 OpenAI가 선택하는 파트너는 단순한 API 고객이 아니라 모델의 초기 트레이닝 단계에 참여하는 '공동 계약자'가 될 수 있습니다. 무대 뒤에서 무대 앞으로 나아가는 모델 트레이닝은 AI 경쟁의 핵심 요소로 자리 잡을 것입니다.

'제품으로서의 모델' 시대는 AI 혁신의 패러다임 전환을 의미합니다. 혼자서 싸우는 시대는 끝났고, 개방형 협력과 협업 혁신이 대세가 될 것입니다. 검색과 코드 영역은 이 두 영역에서 애플리케이션 시나리오의 상대적 성숙도, 명확한 시장 수요, 명확한 기술 경로로 인해 '제품으로서의 모델'을 가장 먼저 달성한 영역으로, 이는 대부분 '낮은 열매를 빨리 따기'가 용이하기 때문입니다. Like 커서 이러한 혁신적인 제품은 단 몇 달 만에 빠르게 반복하여 출시할 수 있습니다. 그러나 규칙 기반 시스템의 지능적인 업그레이드와 같이 미래를 위한 고부가가치 AI 애플리케이션 시나리오는 아직 초기 탐색 단계에 있으며, 기술적 난제와 불확실한 시장 수요로 인해 '단기간, 중기, 신속하게' 획기적인 성과를 달성하기 어렵습니다. 이러한 분야는 학제 간 배경을 가진 소규모 팀과 장기적이고 심도 있는 R&D 투자를 위한 고도의 집중력이 필요한 분야입니다. 이러한 '작고 아름다운' 혁신 팀은 향후 AI 산업에서 중요한 세력이 될 수 있으며, 초기 기술 축적을 완료한 후 대형 기술 기업에 인수되어 그 가치를 실현할 수도 있습니다. 사용자 인터페이스(UI) 분야에서도 유사한 협업 모델이 등장할 수 있습니다. UI 혁신에 집중하는 일부 기업은 대규모 모델 랩과 전략적 파트너십을 맺어 클로즈드 소스 전문 모델에 대한 독점 API 액세스 권한을 확보함으로써 차별화되고 경쟁력 있는 AI 제품을 개발할 수 있습니다.

딥시크릿의 전략적 레이아웃은 의심할 여지 없이 '모델이 곧 제품'이라는 트렌드에서 보다 미래지향적이고 야심찬 전략입니다. DeepSeek의 목표는 "제품으로서의 모델"이 아니라 "공통 인프라 계층으로서의 모델"입니다. OpenAI 및 Anthropic과 마찬가지로, DeepSeek의 설립자 Wenfeng Lian은 공개적으로 DeepSeek의 비전을 밝혔습니다:

현재 단계는 다음과 같습니다. 애플리케이션의 폭발적 증가가 아닌 기술 혁신의 폭발적 증가첫 번째 단계는 문제에 대한 최상의 솔루션을 확보하는 것입니다. 완전한 AI 업스트림 및 다운스트림 산업 생태계가 구축되어야만 딥시크가 애플리케이션 자체를 수행할 필요가 없습니다. 물론 필요한 경우 딥시크도 애플리케이션을 수행할 수 있지만, 이는 우선순위가 아닙니다. 딥시크의 핵심 전략은 항상 기술 혁신을 고수하고 강력한 AI 공통 인프라 플랫폼을 구축하는 것이었습니다.

'제품으로서의 모델' 시대에 애플리케이션 레이어에만 집중하는 것은 다음과 같은 결과를 초래합니다. "지난 전쟁의 장군들을 활용해 다음 세대의 전쟁을 지휘하세요."걱정스러운 점은 서구의 AI 업계가 여전히 '애플리케이션이 왕'이라는 낡은 사고방식에 빠져 있는 것 같다는 점입니다. 걱정스러운 것은 서구의 AI 업계가 여전히 "애플리케이션이 왕이다"라는 낡은 사고방식에 매몰되어 AI 개발의 새로운 트렌드에 대한 충분한 지식과 준비가 부족해 보인다는 점입니다. 아마도 많은 사람들이 아직 인공지능 분야의 '전쟁'이 조용히 새로운 국면에 접어들었다는 사실을 깨닫지 못했을 것입니다. '제품으로서의 모델'이라는 새로운 패러다임을 가장 먼저 수용하는 기업이 미래의 AI 경쟁에서 유리한 고지를 선점할 수 있습니다.