AIシェアリングサークル

AIは世界を変えようとしている！

Open-o3 Video - 北京大学がオープンソース化したビデオ推論モデル United Bytes

Open-o3 Videoは、北京大学とByteDanceが共同開発したオープンソースのビデオ推論モデルであり、時間的・空間的証拠によるビデオ推論の強化に焦点を当てている。重要な証拠にタイムスタンプとバウンディングボックスを明示的にラベル付けすることで、モデルが動画コンテンツをより良く理解し解釈するのに役立つ。

最新のAIリソース

9ヶ月前

038.7K

Handy - オープンソースの無料ネイティブAI音声テキスト変換ツール

Handyは、RustとReactによって開発された、Windows、MacOS、Linuxシステムをサポートするオープンソースで無料のローカル音声テキスト変換ツールです。クラウドにアップロードすることなくローカルで音声データを処理することで、プライバシーとセキュリティを保証し、高速な書き起こしやテキスト入力に適しています。

最新のAIリソース

9ヶ月前

086.2K

FG-CLIP 2 - 360 オープンソース・クロスモーダルグラフィックス視覚言語モデル

FG-CLIP 2は、360人工知能研究所が発表した世界有数のグラフィカル・クロスモーダル視覚言語モデル（VL-M）であり、29の権威あるベンチマークでGoogleやMetaの類似モデルを上回り、現在最も強力なVL-Mとなっている。

最新のAIリソース

9ヶ月前

039.8K

Micro Opinion BettaFish - オープンソースマルチインテリジェンス意見分析システム

BettaFishは、オープンソースのマルチインテリジェンス・オピニオン分析システムです。マルチ・インテリジェント・ボディ・アーキテクチャを採用し、クエリ、メディア、インサイト、レポート、その他のエージェントが連携して、検索、抽出、レポートのクローズドループを実現します。このシステムは、AI主導の完全な...

最新のAIリソース

9ヶ月前

078.8K

Ouro - ByteHopper Seedチームがオープンソース化した新しい循環言語モデル

Ouroは、ByteDance Seedチームによって開発された新しいタイプのループ言語モデル（LLM）であり、パラメータ共有型のリカレント計算構造によって、事前学習段階で推論機能を直接構築するという革新的なコアを持つ。このモデルは、24層を基本ブロックとし、...

最新のAIリソース

9ヶ月前

053.2K

ChronoEdit - NVIDIAとトロント大学がオープンソース化したAI画像編集フレームワーク

NVIDIAとトロント大学が共同開発したオープンソースのAI画像編集フレームワーク「ChronoEdit」は、画像編集タスクを動画生成タスクとして再定義し、編集結果の時間的・物理的整合性を保証する。14Bのパラメータを持つ事前に訓練された動画生成モデルを...

最新のAIリソース

9ヶ月前

046.2K

LongCat-Flash-Omni - 明潭オープンソースのための完全モード大規模言語モデル

LongCat-Flash-Omniは、MeituanのLongCatチームによってリリースされたオープンソースの完全モーダルビッグ言語モデルです。5,600億のパラメータスケール（270億のアクティブ化されたパラメータ）を持ち、多数のパラメータを維持しながら、ミリ秒レベルのリアルタイムの音声と映像のインタラクション機能を実現している。

最新のAIリソース

9ヶ月前

043.5K

Petri - AnthropicのオープンソースAIセキュリティ監査フレームワーク

Petriは、Anthropic社によって開発されたオープンソースのAIセキュリティ監査フレームワークであり、AIモデルのセキュリティと振る舞いの整合性を体系的に評価する。実世界のシナリオをシミュレートすることで、自動監査人が対象モデルと複数回の対話を行い、その後、判定エージェントがモデルの...

最新のAIリソース

9ヶ月前

040.7K

キミ・リニア - 月の裏側でオープンソース化された新しいハイブリッド・リニア・アテンション・アーキテクチャ

キミ・リニアは、ダークサイド・オブ・ザ・ムーンがオープンソース化した新しいハイブリッド・リニア・アテンション・アーキテクチャで、キミ・デルタ・アテンション（KDA）を中核とし、従来のアテンション・モデルをよりきめ細かいゲーティング・メカニズムによって最適化し、ハードウェア効率とメモリ制御能力を大幅に向上させている。

最新のAIリソース

9ヶ月前

053.8K

FIBO - 世界初のオープンソースでネイティブにサポートされたJSONテキストから画像モデルを生成

FIBOは、Bria AIによって開発された、ネイティブJSONをサポートする世界初のオープンソーステキスト生成画像モデルです。8Bのパラメータを持つDiT（Diffusion Transformer）アーキテクチャに基づき、フローマッチング学習法を採用しています。

最新のAIリソース

9ヶ月前

046.4K