注目のAI大手OpenAIは先日、最新の主力言語モデル「GPT-4.5」の研究プレビュー版のリリースを発表し、再び技術コミュニティから大きな注目を集めた。この待望の新モデルは、当初はソフトウェア開発者や チャットGPT プロ契約者の募集開始は、AI技術競争の新たなラウンドの幕開けを告げるものだ。
GPT-4.5:強力な対話能力と高いリソース要件
OpenAIの公式ブログ記事によると、GPT-4.5は同社がこれまでに発表した言語モデルの中で最大かつ最も高価なものだという。対話機能の大幅な向上を達成し、より流動的で自然な対話体験を提供することを目的としている。GPT-4.5の実行にはより多くのGPUリソースが必要となり、コンピューティングインフラへの要求が高くなることは間違いない。
OpenAIは、初期のテストではGPT-4.5との対話体験がより自然な人間の対話に近いことを示していると主張している。これは、GPT-4.5の幅広い知識ベース、ユーザーの意図のより正確な理解、そしていわゆる「より高い感情知能」によるところが大きい。 OpenAIは、これらの改善により、GPT-4.5が文章作成、コード編集、実世界の問題解決などのタスクでより優れたパフォーマンスを発揮できるようになると考えている。 さらに、OpenAIは、錯覚率テストにおいて、GPT-4.5が以前のGPT-4oおよびo1モデルを上回り、正確な情報を生成する能力が向上していることを強調しています。
OpenAIの共同設立者兼CEOであるサム・アルトマン氏も、ソーシャルメディア・プラットフォーム「X」にGPT-4.5の好意的なレビューを投稿している。同氏は、GPT-4.5を使用した経験により、初めて「思慮深い人」と話しているような気分になり、貴重なアドバイスを提供し、「素晴らしいものから驚くような」アドバイスまでくれたと述べている。GPT-4.5での経験は、初めて "思慮深い人 "と話しているような気分にさせ、貴重なアドバイスをくれ、"驚くほど良い "答えまで与えてくれたという。 しかし、アルトマンはGPT-4.5が推論能力で知られているわけではなく、ベンチマークで他のモデルを凌駕することが目的ではないとも言い切った。
GPT-4.5の知能向上は、主に「教師なし学習」(膨大なデータからの自律学習)によるものであり、推論能力を重視するOpenAI GPT-4oやGPT-4oとは異なることが理解できる。 ディープシーク R1モデルは異なります。 機能面では、GPT-4.5はウェブ検索に対応し、文書や画像のアップロードに対応し、Canvasを使って文章を書いたりプログラミングをしたりできる。 しかし、GPT-4.5は、音声モード、オーディオ/ビデオ、画面共有などのマルチモーダル機能にはまだ対応していません。
ユーザー開放プログラムに関して、GPT-4.5はまずソフトウェア開発者とChatGPT Pro加入者に開放されます。 その後、翌週にはPlusとTeamのユーザーに、さらにその翌週にはEnterpriseとEduのユーザーに順次開放されます。
GPT-4.5 物議を醸した価格戦略
しかし、OpenAIの関係者がGPT-4.5のパフォーマンス向上を積極的にアピールする一方で、業界には別の声もある。 あるコメンテーターは、GPT-4.5のリリースはおそらくAI史上「最も奇妙なメジャーアップデート」であり、「退屈で邪悪なもの」だと指摘した。 このコメントの中心はGPT-4.5の価格戦略である。
レビューでは、OpenAIの価格設定は「非常識」と評されている: インプット・トークンのコストは100万ドルあたり75ドル、アウトプット・トークンのコストは100万ドルあたり150ドルにもなる。 つまり、GPT-4.5のコストはGPT-4oの30倍である。 クロード 3.7ソネットは25倍高い! GPT-4.5は、市場に出回っている他の類似モデルの10倍から100倍も高価だとさえ言われている!
これだけ高額だと、「叩き売り価格」と言っても過言ではない。 OpenAI自身も、GPT-4.5のランニングコストがあまりに高いため、長期的にはAPIを公開するかどうかを再考する必要があるかもしれないと認めている。 このような誇張は、GPT-4.5の価格戦略に対する業界の不安を反映している。
パフォーマンス向上は「微妙」?従来の事前学習モデルのボトルネック
このような高価なモデルを前にすると、人々は当然その性能に大きな期待を抱く。 しかし、GPT-4.5の実際の性能は、「息をのむような」驚きをもたらすものではないようだ。 GPT-4.5の登場は、むしろ従来のプレトレーニングモデルが開発のボトルネックに達している可能性を示唆するものなのかもしれないと指摘されている。
GPT-4.5はGPT-4の10倍の事前学習計算を行うと言われているが、ベンチマークではGPT-4oに対して「哀れな5%」の性能向上しか示していない。 コードテストでは、GPT-4.5はクロード3.5を上回るが、クロード3.7には及ばない。
「恥ずかしいことこの上ない!高いし、遅いし、十分じゃない。" あるレビューでは、GPT-4.5の全体的なパフォーマンスをこの3つの言葉でまとめている。 サム・アルトマンは、GPT-4.5が「微妙な機能強化」をもたらし、数学やコードのようなハードコアな推論の分野では平凡だが、人間の意図や感情的反応の理解では新たな高みに達していると説明しようとしている。
「この解釈は少し皮肉っぽいかもしれないが、GPT-4.5の性能の特徴も指摘している。 社内テスターからのフィードバックによると、GPT-4.5は "より暖かく、より直感的で、より自然 "で、"より強い美的直感と創造性 "を持っているという。 言い換えれば、GPT-4.5は人間の感情を理解し、それに応えることに長けているかもしれないが、実用的な問題を解決する上での改善は比較的限定的かもしれない。
"最後の非思考チェーンモデル"? OpenAIの戦略転換と潜在リスク
GPT-4.5の本当の "悪 "は、モデルそのものよりも、それが予感させるOpenAIの未来にある。 アルトマンはGPT-4.5が「最後の非チェーン・オブ・マインド・モデル」になると主張した。 この発言は無害に見えるかもしれないが、AIのエコシステム全体に大きな影響を与える可能性がある。
AI分野の現在のリーダーであるOpenAIの戦略的選択は、業界全体にデモンストレーション効果をもたらすだろう。 思考連鎖モデルには確かに利点があるが、すべての応用シナリオに適合するわけではない。 思考連鎖モデルには、スピードが遅い、コストが高い、効率が比較的低いといった欠点がある。 現実の世界では、企業や一般ユーザーは、より効率的かつ実用的なAPIサービスを必要とする可能性があり、むしろすべての問題は、答えを与えるために数分 "思考 "モデルをする必要があります。 思考の連鎖は、唯一のパスではなく、オプションにする必要があります。
"すべての仕事に推論の連鎖的なラウンドロビンが必要なわけではない。道を尋ねたら、地球のプレートの形成から都市計画までの全貌を話さなければならないのと同じくらい不合理なことだ。" この論評は、鮮やかな比喩を使って "総合推論 "の潜在的な問題点を指摘している。 この傾向に盲目的に従えば、APIコストの高騰、中小企業の市場排除、応答時間の長期化、ユーザー体験の低下、単純作業の複雑化、資源の浪費など、多くの問題を引き起こす可能性がある。 さらに懸念されるのは、このような莫大な計算コストを負担できるのはメガ企業だけであるため、このような発展の流れは、AI技術のメガ企業へのさらなる集中につながる可能性があることだ。
総じて、OpenAIのGPT-4.5のリリースは、性能向上という点では「微妙」かもしれないが、その高価格戦略や「最後の非連鎖思考モデル」の宣言が、AI開発の路線について業界に深い思索を呼び起こしたことは間違いない。まず「AI」である。 GPT-4.5のリリースは、今後のAI技術の行く末の序章に過ぎないのかもしれない。