Hunyuan-MT-7B - Tencent Mixed Metaオープンソース軽量翻訳モデル
Hunyuan-MT-7Bは、テンセントのMixed Meta Teamが導入した軽量翻訳モデルで、70億の参照数を持ち、33の言語と広東語、ウイグル語、チベット語を含む5つの中国語の民間言語/方言の相互翻訳をサポートする。国際計算言語学会(ACL)のWMT2025コンペティションで...
Step-Audio 2 mini - Step-Star オープンソース音声マクロモデリング
Step-Audio 2 miniは、Step-Audioによるオープンソースのエンドツーエンド音声マクロモデルです。従来の音声モデル構造を打破し、真のエンド・ツー・エンド・マルチモーダルアーキテクチャを採用しており、生の音声入力をより低遅延で音声応答出力に直接変換し、パラ言語情報と非音声信号を理解します。
MobileCLIP2 - アップルのオープンソースによる効率的なエンドサイド・マルチモーダルモデル
MobileCLIP2は、Appleの研究者によって導入された効率的なエンドサイド・マルチモーダルモデルであるMobileCLIPのアップグレード版です。マルチモーダル強化トレーニング用に最適化され、DFNデータセットでより良いパフォーマンスをトレーニングすることでCLIP教師モデルを統合し、グラフィカルな生成機能を改善しました。
InternVL3.5 - 上海AIラボ オープンソース マルチモーダル大規模モデル
InternVL3.5(Shusheng-Wanxiang3.5)は、上海人工知能研究所のオープンソース・マルチモーダル大型モデルであり、一般的な能力、推論能力、展開効率の面で完全にアップグレードされ、10億から2410億パラメータまでの9つのサイズのバージョンを提供し、厚さを含むさまざまなリソース需要シナリオをカバーする。
FastVLM - Appleのビジュアル言語モデリング
FastVLM(Fast Vision Language Model)は、アップルが導入した効率的な視覚言語モデルである。FastViTHDハイブリッド視覚コーダーをコアとし、畳み込みとトランスフォーマーアーキテクチャを組み込むことで、視覚言語を大幅に...
MiniCPM-V 4.5 - ファセット・インテリジェント・オープンソース8Bパラメータ・マルチモーダルモデル
MiniCPM-V 4.5は、Qwen3-8BとSigLIP2-400Mをベースに構築された、画像や動画を効率的に処理できるオープンソースのファサードインテリジェンス用8Bパラメトリックマルチモーダルモデルです。ビジュアル・トークンの消費量や処理速度に優れたパフォーマンスを発揮します。
Aivilization - HKUSTが立ち上げたマルチエージェント社会シミュレーションプラットフォーム
Aivilizationは、香港科学技術大学が開発した世界初のAI多知能体社会シミュレーション・プラットフォームである。ユーザーが何千ものAI知能を作成・誘導し、未来の人間とAI共存の社会進化を観察できるビジュアルデジタルサンドボックスを構築する。このプラットフォームがサポートするのは...
Grok 2.5 - マスクのxAIオープンソースAIモデル
Grok 2.5は、イーロン・マスクのxAIによるオープンソースのAIモデルである。2,690億のパラメータを持ち、強力なパフォーマンスと推論のためのMixed Expertise(MoE)アーキテクチャに基づいています。このモデルは、大学院レベルの科学知識(GPQA)、汎用知識(MMLU、MM...
魚を描く - 無料オンラインAI魚描画ウェブサイト、共有仮想水槽
Draw A Fishは、シンプルで楽しいオンラインAI魚のお絵かきサイトです。ユーザーは、グローバルに共有された仮想水槽に配置する魚を描くことができます。Draw A Fishは登録不要で、簡単に使用でき、作成と共有にかかる時間はわずか数秒です。
ToonComposer - テンセントのオープンソースAIアニメーションツール
ToonComposerは、香港中文大学、Tencent PCG ARC Lab、北京大学が共同で発表したジェネレーティブAIアニメーションツールです。ジェネレイティブ・ポスト・キーフレーム技術により、中間フレームの生成と色付けプロセスが自動化され、スケッチと...