中項Meeseeks - 模範的な指示に従う能力を評価するためのMeeseeksオープンソース評価セット
Meeseeksは、MeituanのM17チームがモデルの指示に従う能力を評価するために使用しているオープンソースの大規模モデル評価セットです。Meeseeksは、モデルがマクロレベルからミクロレベルまでユーザーの指示に厳密に従った回答を生成できるかどうかを総合的に測定するために3段階の評価フレームワークを使用しており、回答内容の知識をプラス評価することはありません...
中項gpt-realtime - OpenAIの最新AIスピーチモデル
gpt-realtimeはOpenAIの高度な音声モデルで、自然で滑らかな音声を生成するための直接音声処理をサポートしています。このモデルは複数の言語とスタイルをサポートし、笑いなどの非言語的な合図を理解し、言語を切り替えることができます。
中項Youtu-agent - Tencentオープンソースの効率的な知的ボディフレームワーク
Youtu-agentは、Tencent Youtu Labsが提供する自律型インテリジェンスを構築・実行するためのオープンソースフレームワークです。このフレームワークはWebWalkerQAとGAIAのベンチマークでそれぞれ71.47%と72.8%の精度を出しています。
中項HunyuanVideo-フォーリー - テンセントのオープンソース動画音源生成モデル
HunyuanVideo-Foleyは、TencentのMixed Yuanチームによるオープンソースのビデオサウンド生成モデルで、無音ビデオに正確にマッチした効果音を追加することをサポートします。このモデルは、大規模なデータセットのトレーニングに基づいており、マルチモーダル拡散コンバータアーキテクチャと、アライメント損失関数の表現とオーディオVAE最適化技術を組み合わせています...
中項PixVerse V5 - アイシ・テクノロジーズが自社開発のAI動画モデルを発表
PixVerse V5は、アイシ・テクノロジーが発表したAI動画生成の大型モデルである。ユーザーが入力したテキスト説明文や画像をもとに、高品質な動画コンテンツを生成できるモデルで、アニメ、SF、国民的など様々なスタイルに対応している。
中項アスク・ホワイト5 - アスク・ホワイトのオールインワンAIモデル
アスクホワイト5は、非常に高い知性を備えた「オール・イン・ワン」のフラッグシップモデルである。AA-Index総合評価スコア64.7点、STEM能力評価スコア86点など、多くの評価で好成績を収め、世界トップクラスのGPT-5に迫る。
Gemini 2.5 Flash Image - Googleによる最も強力な画像生成・編集モデル
ジェミニ2.5フラッシュイメージ(コードネームnano banana)は、Googleが提供する最先端の画像生成・編集モデルであり、シーン間の文字の一貫性を維持し、背景をぼかしたり、汚れを除去したりといった自然言語による精密な画像編集をサポートする。
Wan2.2-S2V - Ali Tongyi オープンソース音声駆動ビデオ生成モデル
Wan2.2-S2VはAli Tongyiのオープンソースのマルチモーダルビデオ生成モデルであり、静止画像と音声のみで、高品質のデジタルヒューマンビデオを生成することができ、様々な画像タイプとフレームをサポートしています。
アーネスト・ンによる開発者のためのChatGPTチップエンジニアリング無料コース
ChatGPT Tip Engineering for Developersは、開発者向けにデザインされたDeepLearning.AIとOpenAIの共同コースで、Isa Fulford、Andrew Ngを講師に迎え、大規模言語モデル(LLM)の使い方を学びます。
Ask o4 - Ask o4が導入した、8つの思考経路を同時に開くパラレル思考モデル
Ask White o4は、8つの思考経路を同時に開き、問題を多角的に分析し、最適解を自動的にフィルタリングする革新的な並列思考モデルです。このモデルには、高度なLong-CoT強化学習とプロセス報酬学習技術が組み込まれており、強力な深層推論機能を持ち、複雑なタスクで優れたパフォーマンスを発揮します。