GPT2以降、OpenAIは新しいオープンソースの重み付けモデルをリリースする予定である。
4月1日、OpenAIのCEOであるサム・アルトマンはソーシャルメディアを通じて、強力な推論機能を備えた新しいオープンウェイト言語モデルを数ヶ月以内にリリースする予定であることを発表した。
EQ-Bench 大規模言語モデルにおける感情的知性と創造性の評価方法
ラージ・ランゲージ・モデル(LLM)の能力が急速に進化する中、MMLUのような従来のベンチマーク・テストでは、トップ・モデルを見分けることに限界が見えてきています。知識クイズや標準化されたテストに頼るだけでは、実世界でのやり取りにおいて重要なモデルのニュアンスに富んだ能力を完全に測定することは難しくなっています。
DeepGemini: タスクのマルチモデルオーケストレーションとAPIインターフェースへのカプセル化
概論 DeepGeminiは、開発者Thomas Sligterによって作成されたオープンソースプロジェクトである。マルチモデルオーケストレーションをサポートするAI管理ツールであり、様々なAIモデルを柔軟に組み合わせることができるのが主な特徴である。
Avcado AI:食品ラベルをスキャンして成分を分析する健康アシスタント
概要 Avcado AIは、ユーザーが食品の内容を理解するのに役立つスマートなツールである。その中心的な機能は、食品ラベルを撮影してスキャンすることで、原材料、栄養成分、添加物を素早く特定することである。ユーザーは携帯電話でパッケージのラベルを撮影するだけで、ウェブサイトが食品の詳細を分析・表示します。
Graphiti MCP、カーソルに永続的なメモリを提供
AIによるソフトウェア開発の人気が高まるにつれて、重要な課題が浮上している。それは、AIコーディングアシスタントが人間の開発者のようにセッションを横断する「記憶」を持ち、プロジェクトのコーディング仕様、嗜好、特定のプロセス、さらには要件の詳細まで記憶して適用できるようにするにはどうすればいいか、ということだ。現在、人気のある...
Optexity:人間の実演を見ながらウェブ操作を行うAIを訓練するオープンソースプロジェクト
概論 OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの核心は、人間のデモ・データを使って、コンピュータ・タスク、特にウェブ・ページ操作をこなすAIを訓練することである。このプロジェクトには3つのコードライブラリが含まれている。
II-Researcher: 複雑な問題に答えるための深層探索と段階的推論
概要 II-Researcherは、Intelligent-Internetチームによって開発され、GitHubでホストされているオープンソースのAI研究ツールです。インテリジェントなウェブページやマルチステップサブ...
大きな言語モデルによる推論:「アンダーシンキング」と「オーバーシンキング」のバランス
大規模言語モデル(LLM)は急速に進化しており、その推論能力は知能レベルを示す重要な指標となっている。特に、OpenAIのo1、DeepSeek-R1、QwQ-32B、Kimi K1.5のような長い推論能力を持つモデル...
Cua: AIエージェントがmacOS/Linuxサンドボックスで安全にアプリケーションを実行できるようにする
一般的な紹介 Cuaは "Computer-Use Agent "と呼ばれるオープンソースプロジェクトで、"クーア "と発音します。Apple Siliconデバイスのために設計され、高性能なmacOS OSを作成し、実行することができます。
vdspeak:YouTube動画用の多言語ボイスオーバーを生成する
概要 vdspeakは、YouTube動画の多言語翻訳・ダビングサービスを提供するオンラインツールです。高度なAI技術を活用し、動画コンテンツを150以上の言語に自動翻訳・吹き替えすることで、世界中の視聴者に簡単にリーチすることができます。操作は簡単で、ユーザーは...