OpenAI, GPT-4.5 출시: '미묘한 업그레이드'인가, 아니면 '설득력 있는' 가격인가?

44.7K 00

유명 AI 기업인 OpenAI는 최근 최신 플래그십 언어 모델인 GPT-4.5의 연구용 프리뷰를 발표하여 다시 한 번 기술 커뮤니티의 많은 관심을 불러일으켰습니다. 많은 기대를 모으고 있는 이 새로운 모델은 처음에는 소프트웨어 개발자와 ChatGPT 프로 구독자 오픈은 새로운 AI 기술 경쟁의 시작을 알리는 신호탄입니다.

GPT-4.5: 더 강력한 대화 용량과 더 높은 리소스 요구 사항

공식 블로그 게시물에 따르면, OpenAI는 지금까지 도입한 언어 모델 중 가장 규모가 크고 비용이 많이 드는 GPT-4.5를 출시했습니다. 대화 기능이 크게 향상되었으며 보다 유동적이고 자연스러운 상호 작용 경험을 제공하는 것을 목표로 합니다. 그러나 더 나은 성능은 더 많은 리소스 소비를 의미하며, GPT-4.5를 실행하려면 더 많은 GPU 리소스가 필요하므로 컴퓨팅 인프라에 대한 요구가 높아진다는 점에 유의할 필요가 있습니다.

OpenAI는 초기 테스트 결과, GPT-4.5와 상호작용하는 경험이 인간의 자연스러운 대화와 더 비슷하다고 주장합니다. 이는 광범위한 지식 기반, 사용자 의도에 대한 보다 정확한 이해, 이른바 '더 높은 감성 지능' 덕분입니다. OpenAI는 이러한 개선 사항을 통해 GPT-4.5가 글쓰기, 코드 편집, 실제 문제 해결과 같은 작업에서 더 나은 성능을 발휘할 수 있을 것으로 기대하고 있습니다. 또한 OpenAI는 GPT-4.5가 착각률 테스트에서 이전 GPT-4o 및 o1 모델보다 성능이 뛰어나 정확한 정보를 생성하는 데 개선된 모습을 보였다고 강조합니다.

OpenAI의 공동 창립자이자 CEO인 샘 알트먼(Sam Altman)도 소셜 미디어 플랫폼 X에 GPT-4.5에 대한 긍정적인 리뷰를 올렸습니다. 그는 GPT-4.5를 사용한 경험이 처음으로 "사려 깊은 사람"과 대화하는 듯한 느낌을 받았다며 귀중한 조언을 제공하고 심지어 "놀라울 정도로 훌륭한" 조언을 해주기도 했다고 말했습니다. 그는 GPT-4.5에 대한 경험을 통해 처음으로 귀중한 조언을 해주고 심지어 "놀랍도록 훌륭한" 답변을 해줄 수 있는 "사려 깊은 사람"과 대화하는 듯한 느낌을 받았다고 말했습니다. 하지만 알트만은 GPT-4.5가 추론 능력으로 유명한 것은 아니며, 벤치마킹에서 다른 모델을 능가하는 것이 목표가 아니라는 점도 분명히 했습니다.

GPT-4.5의 지능 향상은 주로 "비지도 학습"(즉, 대규모 데이터로부터 자율적으로 학습)에 의한 것으로, 추론 능력에 초점을 맞춘 OpenAI GPT-4o 또는 GPT-4o와는 다른 것으로 이해됩니다. DeepSeek R1 모델은 다릅니다. 기능적인 측면에서 보면 GPT-4.5는 웹 검색을 지원하고, 문서 및 이미지 업로드를 처리할 수 있으며, 글쓰기 및 프로그래밍에 Canvas를 사용할 수 있습니다. 그러나 GPT-4.5는 아직 음성 모드, 오디오/비디오 및 화면 공유와 같은 멀티모달 기능을 지원하지 않습니다.

공개 사용자 프로그램의 경우, GPT-4.5는 소프트웨어 개발자와 ChatGPT Pro 가입자에게 먼저 공개됩니다. 그 다음 주에는 플러스 및 팀 사용자에게, 그 다음 주에는 엔터프라이즈 및 에듀 사용자에게 점진적으로 공개될 예정입니다.

GPT-4.5 가격 책정 전략이 논란을 일으키다

그러나 OpenAI 관계자들은 GPT-4.5의 성능 향상을 적극적으로 홍보하고 있지만, 업계에서는 또 다른 목소리도 있습니다. 한 평론가는 GPT-4.5의 출시가 아마도 AI 역사상 "지루하고 사악한" "가장 이상한 주요 업데이트"일 것이라고 제안했습니다. 이 의견은 GPT-4.5의 가격 책정 전략에 초점을 맞춘 것입니다.

리뷰에서는 OpenAI의 가격이 "미친 듯이 비싸다"고 표현했습니다: 입력 토큰은 백만 달러당 75달러, 출력 토큰은 백만 달러당 최대 150달러입니다. 즉, GPT-4.5는 GPT-4o보다 30배 더 비쌉니다. Claude 3.7 소네트는 25배 더 비쌉니다! 심지어 GPT-4.5는 시중의 다른 유사 모델보다 10~100배 더 비싸다는 의견도 있습니다!

이렇게 높은 가격표를 보면 '넉다운 가격'이라고 해도 과언이 아닙니다. OpenAI 자체도 GPT-4.5의 운영 비용이 너무 높아 장기적으로 API를 공개할지 여부를 재고해야 할 수도 있다고 인정했습니다. 이러한 과장된 표현은 GPT-4.5의 가격 전략에 대한 업계의 우려를 반영한 것입니다.

'미묘한' 성능 향상? 기존 사전 훈련 모델의 병목 현상

이렇게 비싼 모델에 직면한 사람들은 당연히 그 성능에 대한 기대치가 높습니다. 그러나 GPT-4.5의 실제 성능은 "놀라운" 놀라움을 선사하지는 않는 것 같습니다. GPT-4.5의 출시는 기존의 사전 훈련 모델이 개발에서 병목 현상에 도달했을 수 있다는 힌트에 가깝다는 지적이 있습니다.

GPT-4.5는 GPT-4보다 10배 더 많은 사전 훈련 계산을 수행한다고 알려져 있지만, 벤치마크에 따르면 GPT-4o에 비해 성능 향상은 "불쌍한 5%"에 불과합니다. 코드 테스트에서 GPT-4.5는 Claude 3.5보다 성능이 뛰어나지만 Claude 3.7에는 미치지 못합니다.

"극도로 당황스럽습니다! 비싸고, 느리고, 충분하지 않습니다." 한 리뷰에서는 이 세 단어로 GPT-4.5의 전반적인 성능을 요약했습니다. 샘 알트먼은 GPT-4.5가 "미묘한 개선"을 가져왔으며, 수학이나 코드와 같은 하드코어 추론 영역에서는 평범하지만 인간의 의도와 감정 반응을 이해하는 데 있어서는 새로운 차원에 도달했다고 설명합니다.

"우리는 엄청난 연산 능력을 사용했지만, 더 '공감'하는 AI를 만들었을 뿐입니다." 이 해석은 다소 우스꽝스러울 수 있지만, GPT-4.5의 성능 특성을 잘 드러내는 말이기도 합니다. 내부 테스터들의 피드백에 따르면, GPT-4.5는 "더 따뜻하고 직관적이며 자연스러우며" "미적 직관과 창의성이 더 강하다"고 합니다. 즉, GPT-4.5는 인간의 감정을 이해하고 반응하는 데는 더 뛰어날 수 있지만 실제 문제 해결 능력은 상대적으로 제한적일 수 있습니다.

"마지막 비사고 체인 모델"? OpenAI의 전략적 전환과 잠재적 리스크

GPT-4.5의 진짜 '악'은 모델 자체가 아니라 이 모델이 예고하는 OpenAI의 미래입니다. 알트만은 GPT-4.5가 "마지막 비체인 모델이 될 것"이라고 주장했습니다. 이 말은 별것 아닌 것처럼 보일 수 있지만, 전체 AI 생태계에 큰 영향을 미칠 수 있습니다.

현재 AI 분야의 선두주자인 OpenAI의 전략적 선택은 업계 전체에 시범 효과를 가져올 것입니다. 연쇄 사고 모델에는 분명 장점이 있지만 모든 애플리케이션 시나리오가 이 모델에 적합한 것은 아닙니다. 연쇄 사고 모델은 속도가 느리고 비용이 높으며 효율성이 상대적으로 낮다는 단점이 있습니다. 현실에서 기업과 일반 사용자들은 모든 질문에 대해 몇 분 안에 답을 내놓기 위해 '사고'를 모델링해야 하는 것보다 더 효율적이고 실용적인 API 서비스를 필요로 할 수 있습니다. 생각의 사슬은 유일한 경로가 아니라 하나의 옵션이어야 합니다.

"모든 작업에 연쇄 추론 라운드 로빈이 필요한 것은 아닙니다. 길을 물어보는 사람에게 지각판의 형성부터 도시 계획에 이르기까지 모든 이야기를 들려달라고 하는 것만큼이나 터무니없는 일입니다." 이 리뷰는 생생한 은유를 사용하여 "전체 추론"의 잠재적인 문제점을 지적합니다. 이러한 추세를 맹목적으로 따를 경우 API 비용 급증, 중소기업의 시장 배제, 응답 시간 연장, 사용자 경험 저하, 단순 작업의 복잡성, 자원 낭비 등 여러 가지 문제가 발생할 수 있습니다. 더욱 우려스러운 것은 이러한 개발 과정이 막대한 컴퓨팅 비용을 감당할 수 있는 대기업에 AI 기술이 더욱 집중되는 결과를 초래할 수 있다는 점입니다.

대체로 OpenAI의 GPT-4.5 출시는 성능 향상 측면에서는 "미묘한" 차이가 있을 수 있지만, 높은 가격 전략과 "마지막 비사고 모델"이라는 선언은 의심할 여지없이 업계에서 AI 개발 경로에 대해 깊은 생각을 불러 일으켰습니다. 첫 번째는 'AI'입니다. GPT-4.5의 출시는 앞으로 AI 기술이 나아갈 방향의 시작에 불과할 수 있습니다.