LLaVA-OneVision-1.5 - 高性能マルチモーダル理解のためのフリーでオープンソースのマルチモーダルモデル
LLaVA-OneVision-1.5は、EvolvingLMMS-Labチームによるオープンソースのマルチモーダルモデルで、8Bパラメータスケールを使用し、128 A800上でコンパクトな3段階のトレーニングプロセス(言語-イメージのアライメント、概念の平衡化と知識の注入、命令の微調整)を通じて...
Paper2Video - 論文のデモビデオを自動生成するNUSのオープンソースプロジェクト
Paper2Videoは、シンガポール国立大学のShow Labで行われている、学術論文のプレゼンテーションビデオを自動生成するオープンソースプロジェクトです。PaperTalkerマルチインテリジェンスフレームワークを使用し、論文はスライド、字幕、ナレーション、スピーカーアバターを含む完全なプレゼンテーションビデオに変換されます。
NeuTTS Air - オフラインCPU実行をサポートしたフリーで軽量な音声合成モデル
NeuTTS Airは、Neuphonicチームによって開発されたオープンソースの軽量音声合成モデルで、クラウドに依存することなく、ローカルデバイス(携帯電話、ラップトップ、Raspberry Piなど)上でリアルタイムに実行できる。0.5BパラメータのQwenアーキテクチャと自社開発のNeuCodecコーデックを使用しています。
KAT-Dev-72B-Exp - レーサー・オープンソース・フリーのプログラミング専用モデル
KAT-Dev-72B-Expは、強化学習技術に基づいて最適化された、Racerチームによって発表されたオープンソースのプログラミング専用大規模言語モデルであり、SWE-Bench Verifiedベンチマークテストで74.6%の精度を達成した。このモデルは革新的な...
Jamba Reasoning 3B - イスラエルAI21ラボのオープンソース軽量推論モデル
Jamba Reasoning 3Bは、イスラエルのAIスタートアップAI21 Labsによってオープンソース化された軽量推論モデルで、強力なパフォーマンスと幅広いアプリケーションへの応用が期待されている。SSMとTransformerのハイブリッド・アーキテクチャを採用し、Trans...
エルンスト・ウーによるAgentic AIから最新のインテリジェンスを学ぶ無料コース
Agentic AIは、アーネスト・ングが開始した知的身体に関する最新のコースです。このコースでは、知的身体の設計と構築に焦点を当て、4つの主要な設計モードである反射、ツールの使用、計画、および複数の知的身体のコラボレーションをカバーします。学習者は、理論的な説明と実践的なコードを通して、インテリジェント・ボディが出力をチェックし、自律的に調整する方法を習得します。
OpenAgents - AIエージェントネットワーク構築のためのオープンソース・フリー・オープンコラボレーションプロジェクト
OpenAgentsは、AIエージェントのネットワークを構築し、エージェント間のオープンなコラボレーションを促進するオープンソースプロジェクトです。AIエージェントがシームレスに接続し、コラボレーションできるように、基本的なネットワークインフラが提供されています。ユーザーは、独自のエージェントネットワークを迅速に開始し、モジュラーアーキテクチャによって機能を拡張し、...
Androidify - Google、Android上でAIアプリを構築する方法に関するリソースを無償でオープンソース化
AndroidifyはGoogleのオープンソースプロジェクトであり、開発者がAndroid上でAI主導のアプリケーションを構築する方法を学ぶことを支援する。このプロジェクトでは、Jetpack Compose、Gemini API(via Fire...
Ling-1T - アント・グループのオープンソース万能言語モデル。
Ling-1Tは、アント・グループによってオープンソース化された1兆パラメータユニバーサル言語モデルで、Bering社の大型モデルLing2.0シリーズのフラッグシップ製品に属します。このモデルは、非常に効率的なMoEアーキテクチャを採用し、128Kのコンテキストウィンドウをサポートし、コード生成、数学的推論、論理テストを含む7つのベンチマークでGPTを上回っています。
エコーケア - 香港科学院オープンソース超音波ベース大型モデル
EchoCareは、中国科学院香港創新研究院(CAS)の人工知能・ロボットイノベーションセンター(CAIR)によって開発された超音波ベースの大規模モデルであり、多施設、多地域、多民族、50人以上の個人をカバーする世界最大の超音波画像データセット(450万枚以上)で学習される。









