最新のAIリソース

共 3048 篇文章

コース情報最新のAIリソース AI知識ベース AIニュース

順番に並べる

目を通すブックマーク

SurfSense - 开源的AI研究与知识管理工具，NotebookLM最强平替

SurfSense - オープンソースのAI研究・知識管理ツール、NotebookLMの最強ピント

SurfSenseはオープンソースのAIリサーチ・ナレッジマネジメントツールです。高度なカスタマイズが可能で、検索エンジン、Slack、Jira、Notion、YouTube、GitHub、その他多くの外部データソースに接続し、情報の統合を促進することができる。ユーザーは様々なデータをアップロードできる。

最新のAIリソース

4ヶ月前

029.8K

GLM-4.6V - 智谱AI开源的多模态大语言模型系列

GLM-4.6V - Wisdom Spectrum AI オープンソース多言語ラージ言語モデルシリーズ

GLM-4.6Vは、Smart Spectrum AIによってオープンソース化されたマルチモーダル大規模言語モデルのシリーズです。このシリーズには2つのバージョンがあります：GLM-4.6V (106B-A12B)は、クラウドおよび高性能クラスタシナリオ用の基本バージョンで、Mixed Expert (MoE)アーキテクチャ、合計約1060億参照、および活性化...

最新のAIリソース

4ヶ月前

027K

InkSight - Google开源的AI手写识别工具

InkSight - GoogleのオープンソースAI手書き文字認識ツール

InkSightはGoogleのオープンソースAI手書き認識ツールで、紙の手書きメモを編集可能なデジタルインクファイル（SVG形式など）に変換します。従来のOCRとは異なり、テキストコンテンツを認識し、手書きスタイル、段落構造、フォーカスマークを復元することができます。

最新のAIリソース

4ヶ月前

025.9K

NewBie-image-Exp0.1 - NewBieAI-Lab开源的实验性动漫文生图模型

NewBie-image-Exp0.1 - NewBieAI-Lab オープンソース実験的アニメリテラートグラフィカルモデル

NewBie-image-Exp0.1は、NewBieAI-Labチームによってオープンソース化された最初の実験的なアニメテキスト生まれのグラフィックモデルです。このモデルは、デュアルテキストエンコーダー（GEMMA3-4B...

最新のAIリソース

4ヶ月前

029.4K

LongCat-Image - 美团LongCat团队开源的图像生成与编辑模型

LongCat-Image - LongCat チーム、アメリカングループのオープンソース画像生成・編集モデル

LongCat-Imageは、MeituanのLongCatチームによってリリースされたオープンソースの画像生成・編集モデルです。ハイブリッドバックボーンアーキテクチャ(MM-DiT+Single-DiT)と視覚言語モデル(VLM)条件付きエンコーダを組み合わせることで、テキスト生成画像と複数ラウンドの画像編集を実現している。

最新のAIリソース

4ヶ月前

024.9K

VibeVoice-Realtime - 微软开源的轻量级实时文本转语音模型

VibeVoice-Realtime - マイクロソフトのオープンソース軽量リアルタイム音声合成モデル

VibeVoice-Realtimeは、低遅延とリアルタイムインタラクションのために設計されたマイクロソフトのオープンソースの軽量リアルタイム音声合成（TTS）モデルです。ストリーミングテキスト入力をサポートし、最初のテキストトークンから音声入力することができます。

最新のAIリソース

4ヶ月前

025.8K

Flowra - 魔搭联合呜哩WULI团队开源的AI工作流开发工具

Flowra - Magic HitchとWooli WULIチームがオープンソース化したAIワークフロー開発ツール

Flowraは、ModelScope共同ウーマイルWULIチームのオープンソースグラフ実行エンジンとノードパッケージ開発ツールであり、FlowBenchのコアコンポーネントです。有向非循環グラフ（DAG）組織ワークフローを通じ、インテリジェントなキャッシュ、並列スケジューリング、分散サポート...

最新のAIリソース

4ヶ月前

025.2K

RoboCOIN - 智源联合多所高校开源的双臂机器人真机数据集

RoboCOIN - Wisdom Sourceが複数の大学と共同でオープンソース化した双腕ロボットの実ロボットデータセット

RoboCOINは、北京紫源人工知能研究院が多くの企業や大学と共同でオープンソース化した世界初の大規模双腕ロボット実機データセットで、15種類のロボットプラットフォーム、18万件の実動作軌跡、421種類のタスクシナリオが含まれている。最大の特徴は、階層的アノテーションシステムを採用し、タスクを分解...

最新のAIリソース

4ヶ月前

025.6K

TalkCody - 免费开源的AI编程桌面助手，支持复杂任务

TalkCody - 複雑なタスクをサポートするフリーでオープンソースのAIプログラミングデスクトップアシスタント

TalkCodyはフリーでオープンソースのAIプログラミングアシスタントデスクトップアプリケーションで、Rust + Tauri 2で構築され、Windows、macOS、Linuxの3つのプラットフォームをサポートし、ネイティブパフォーマンス、高速起動、低リソース使用の利点を備えています。50以上のメインストリームA...

最新のAIリソース

4ヶ月前

029.3K

MemMachine - MemVerge推出的开源AI记忆系统

MemMachine - MemVergeによるオープンソースAIメモリシステム

MemMachineは、MemVerge社によって開発されたオープンソースのAIメモリシステムで、AIモデルや知能のために設計され、人間の脳のように相互作用データを保存して呼び出すことができ、AIの「無状態記憶喪失」の問題を解決する。レイヤー構造（短期記憶、長期記憶、ユーザー画像...）を採用している。

最新のAIリソース

4ヶ月前

029.5K

PartCrafter - 北大联合字节开源的单图3D生成模型

PartCrafter - NU United Bytes オープンソース単体3D生成モデル

PartCrafterは、北京大学、ByteDance、カーネギーメロン大学が共同で提案した先進的な3D生成モデルです。単一のRGB画像から、複数の意味的に明示的で幾何学的に多様な3Dメッシュパーツを一度に生成することができる。このモデルは、組み合わせ可能なポテンシャル空間を通してモデル化され...

最新のAIリソース

4ヶ月前

027K

GigaWorld-0 - 极佳视界开源的世界模型框架

GigaWorld-0 - GigaVision オープンソース世界モデリングフレームワーク

GigaWorld-0は、国内のEmbodied IntelligenceスタートアップGigaAIのオープンソース世界モデルフレームワークであり、主にEmbodied Intelligence (Embodied AI)分野のデータボトルネック問題を解決するために使用される。高品質で多様かつ物理的にリアルな学習データを効率的に生成し、プッシュ...

最新のAIリソース

4ヶ月前

025.6K

Mistral 3 - Mistral AI发布开源的最新多模态大模型系列

Mistral 3 - Mistral AI、マルチモーダル大型モデルの最新シリーズをオープンソースでリリース

Mistral 3は、Mistral AIがオープンソースとしてリリースした最新のマルチモーダル大型モデルシリーズで、フラッグシップモデルのMistral Large 3（総パラメータ675B）と、Ministralシリーズの軽量版（3B/8B/14B）があり、いずれも画像理解に対応している。

最新のAIリソース

4ヶ月前

024.1K

Vidi2 - 字节跳动开源的多模态视频理解与生成大模型

Vidi2 - ByteHopのオープンソース・マルチモーダルビデオ理解と大規模モデルの生成

Vidi2は、ByteDanceによってオープンソース化された第2世代のマルチモーダルビデオ理解・生成ビッグモデルであり、ビデオコンテンツの理解、分析、作成に焦点を当てている。テキスト、ビデオ、オーディオモダリティの共同入力をサポートし、画像コンテンツ、音声情報、自然言語コマンドを同時に理解することで、クロスモーダルなインタラクションを実現し、...

最新のAIリソース

4ヶ月前

027.4K

Alpamayo-R1 - 英伟达开源的带推理能力的视觉-语言-行动模型

Alpamayo-R1 - NVIDIAのオープンソース推論機能付き視覚言語アクションモデル

Alpamayo-R1は、NVIDIAが開発した推論機能付きVLA（Vision-Language-Action）モデルであり、複雑なシナリオにおける自律走行の意思決定能力を強化するために設計されている。因果連鎖の推論メカニズムを導入することで、シナリオの因果関係（例えば、「前...

最新のAIリソース

4ヶ月前

035.9K

Ovis-Image - 阿里AIDC-AI团队开源的文生图模型

Ovis-Image - Ali AIDC-AIチームによるオープンソース・ベンチャーグラフモデル

Ovis-Imageは、Alibaba International Digital Commerce GroupのAIDC-AIチームによってオープンソース化された70億パラメータのテキスト生成グラフモデルで、高品質のテキストレンダリングに焦点を当てています。Ovis-U1アーキテクチャに基づき、高度なビジュアルデコーダーと双方向トークン精製機能を継承しています。

最新のAIリソース

4ヶ月前

023.5K

悟界·Emu3.5 - 智源研究院开源的多模态世界大模型

Wujie-Emu3.5 - 知恵源研究所オープンソース・マルチモーダル世界ビッグモデル

Wujie-Emu3.5は、北京Zhiyuan人工知能研究所のオープンソースのマルチモーダル世界マクロモデルであり、340億の参照とネイティブの世界モデリング機能を備えています。10兆個のマルチモーダル・トークン（790年分のビデオデータを含む）によって訓練され、物理法則をシミュレートし、グラフィック生成、視覚誘導を実現することができる。

最新のAIリソース

4ヶ月前

026.8K

GELab-Zero - 阶跃团队开源的端侧多模态GUI Agent模型

GELab-Zero - StepsチームによるオープンソースのエンドサイドマルチモーダルGUIエージェントモデル

GELab-Zeroは、Step Leapチームによるオープンソースのエンドサイド・マルチモーダルGUIエージェントモデルで、Qwen3-VL-4B-Instructをベースに4Bパラメータで構築されています。UI要素を認識し、クリックやスライドなどの操作を実行することができ、アプリケーション間のタスク処理をサポートしています。

最新のAIリソース

4ヶ月前

034.6K

Depth Anything 3 - 字节跳动Seed开源的3D视觉重建模型

深さ何でも3 - ByteHopシードオープンソース用3Dビジュアル再構築モデル

Depth Anything 3（DA3）は、Byte Jump Seedチームによって開発され、オープンソース化された3D視覚再構成モデルです。単一のトランスフォーマーアーキテクチャを通して、どのような視点でも空間的なジオメトリの再構築を実現し、深度マップとレイマップを予測するだけで3Dシーンを復元することができます。

最新のAIリソース

4ヶ月前

036.3K

DeepSeek-Math-V2 - DeepSeek开源的数学推理模型

DeepSeek-Math-V2 - DeepSeek オープンソース数理推論モデル

DeepSeek-Math-V2は、ファントムキューブ傘下のAI企業であるDeepSeek社のオープンソース数理推論モデルで、最新バージョンはDeepSeek-V3.2-Exp-Baseの改良をベースにしており、Gemini DeepThinkを上回るパフォーマンスで国際的なナンバーワンに達している。

最新のAIリソース

4ヶ月前

028.9K

Z-Image - 阿里通义实验室开源的图像生成模型

Z-Image - Ali Tongyi Labs オープンソース画像生成モデル

Z-Imageは、Ali Tongyi Labsによるオープンソースの画像生成モデルで、効率的で高速かつ強力な画像生成機能を備えています。シングルストリーム拡散トランスフォーマーアーキテクチャ（S3-DiT）を使用し、テキスト、ビジュアルセマンティクス、画像VAEトークンを統一された入力ストリームに統合します。

最新のAIリソース

4ヶ月前

050.7K

ROCK - 阿里巴巴开源的智能体训练环境沙箱

ROCK - アリババがオープンソースのサンドボックスで提供するインテリジェントな身体トレーニング環境

ROCK（Reinforcement Open Construction Kit）は、アリババのオープンソースサンドボックスで、インテリジェンスのトレーニング環境のためのもので、実環境ではインテリジェンスを大規模にトレーニングできないという問題を解決する。

最新のAIリソース

4ヶ月前

027.4K

ViMax - 香港大学开源的多智能体视频生成框架

ViMax - 香港大学のオープンソースマルチインテリジェントボディビデオ生成フレームワーク

ViMaxは、香港大学のデータサイエンス研究所が開発したオープンソースのマルチインテリジェンス・ボディ・ビデオ生成フレームワークで、クリエイティブな入力からビデオ出力までの全プロセスを自動化することができます。スクリプト生成、シーンデザイン、ショットプランニング、ビデオレンダリング機能を統合し、自然言語記述による首尾一貫した映画・テレビグレードのビデオ生成をサポートします。

最新のAIリソース

4ヶ月前

045.3K

FLUX.2 - 黑森林开源的图像生成与编辑模型

FLUX.2 - Black Forest オープンソース画像生成・編集モデル

FLUX.2は、Black Forest Labsが公開したオープンソースの画像生成・編集モデルで、テキストによる生画像、複数画像の参照、より豊かなディテール、鮮明なテクスチャ、安定したライティングによる画像編集をサポートしています。4つのバージョンがあります：FLUX.2 [pro]（クローズドソースのトップと同等...

最新のAIリソース

4ヶ月前

026.7K

Fara-7B - 微软开源的计算机操作Agent助手模型

Fara-7B - マイクロソフトのオープンソース・コンピュータ操作アシスタント・モデル

Fara-7Bは、Qwen 2.5-VL-7Bアーキテクチャに基づいた70億パラメータ規模のコンピュータ操作エージェント（CUA）モデルのマイクロソフトオープンソースリリースです。ウェブページのスクリーンショットを視覚的に解析し、画面上でクリックや入力などを実行することで、追加のアクセシビリティツリーや複数の大規模モデルに依存する必要がありません...

最新のAIリソース

4ヶ月前

032.6K

HunyuanOCR - 腾讯混元开源的光学字符识别专家模型

HunyuanOCR - テンセント混合元オープンソース光学式文字認識エキスパートモデル

HunyuanOCRは、Tencentハイブリッドチームによってオープンソース化された高性能な光学式文字認識モデルであり、わずか10億件の参照しかない。ハイブリッドマルチモーダルアーキテクチャに基づいて開発され、エンドツーエンドの設計を採用し、テキスト検出、認識、文書解析タスクを効率的に処理することができます。このモデルは複雑な文書のテストで94.1点を獲得し、...

最新のAIリソース

5ヶ月前

033.9K

Supertonic - 开源的高性能AI 文本转语音系统，极速离线运行

Supertonic - オフラインで猛スピードで動作するオープンソースの高性能AI音声合成システム。

Supertonicは、オープンソースの高性能音声合成（TTS）システムで、ローカルデバイスでの迅速な音声生成に重点を置いている。ONNXランタイム・テクノロジーを使用しているため、携帯電話、コンピュータ、Raspberry Piなどのデバイスで動作し、23の言語と音声クローンをサポートし、ネットワークを必要としません。

最新のAIリソース

5ヶ月前

028.2K

MiMo-Embodied - 小米开源的跨领域具身智能基座模型

MiMo-Embodied - シャオミのオープンソース・クロスドメイン具現化知能台座モデル

MiMo-Embodiedは、シャオミグループがオープンソース化した世界初のクロスエンボディベースモデルであり、エンボディドAIと自律走行の統合に成功している。エンボディドAIと自律走行間の知識移行問題を解決し、2つの領域におけるタスクの統一的なモデリングを実現する。

最新のAIリソース

5ヶ月前

033.4K

MOSS-Speech - 复旦大学开源的语音到语音大模型

MOSS-Speech - 復旦大学オープンソース音声合成ビッグモデル

MOSS-Speechは復旦大学の邱西鵬教授のチームによるオープンソースの音声合成（Speech-to-Speech）ビッグモデルです。従来の音声処理の常識を打ち破り、テキストガイダンスを必要とせず、直接音声を理解・生成し、イントネーションや感情などの非テキスト要素を取り込み、...

最新のAIリソース

5ヶ月前

028.8K

Parallax - Gradient开源的全球首个全自主AI操作系统

Parallax - Gradientがオープンソース化した世界初の完全自律型AIオペレーティング・システム

Parallaxは、分散型AIラボのGradientがオープンソース化した、世界初の「完全自律型AIオペレーティング・システム」である。Mac、Windows、その他の異種デバイス上での大規模モデルのクロスプラットフォーム展開をサポートし、ユーザーはモデル、データ、AIメモリを完全に制御することができる。このシステムは、ネットワークを意識したビルトイン ...

最新のAIリソース

5ヶ月前

084.3K

HunyuanVideo 1.5 - 腾讯混元免费开源的轻量级视频生成模型

HunyuanVideo 1.5 - Tencent混合元フリーオープンソース軽量ビデオ生成モデル

HunyuanVideo 1.5は、Tencentハイブリッドビッグモデルチームオープンソースの軽量ビデオ生成モデルであり、拡散トランスフォーマー（DiT）アーキテクチャに基づいて、パラメータの数は8.3Bです。

最新のAIリソース

5ヶ月前

034.9K

Awex - 蚂蚁集团开源的高性能权重交换框架

Awex - Antグループのオープンソース高性能ウェイト交換フレームワーク

Awexは、Ant Groupのオープンソース高性能重み交換フレームワークであり、強化学習における大規模なパラメータ同期のために設計されています。Awexは、テラバイトのパラメータ交換を数秒で完了させることができ、学習と推論の効率を大幅に向上させます。Awexの同期性能は非常に高速で、1,000枚のカードクラスタでは、1兆個のパラメータモデルを、全パラメータ量の6秒以内に完了させることができます。

最新のAIリソース

5ヶ月前

082.4K

Seekdb - 蚂蚁OceanBase开源的AI原生混合搜索数据库

Seekdb - Ant OceanBase オープンソースAIネイティブハイブリッド検索データベース

Seekdb (OceanBase Seekdb) はAnt OceanBaseのオープンソースAIネイティブハイブリッド検索データベースで、ベクトル、フルテキスト、スカラー、地理空間データの統合ハイブリッド検索をサポートし、多段検索メカニズムを使用して、低レイテンシで高精度な検索を実現します。

最新のAIリソース

5ヶ月前

028K

LoopTool - 上海交大联合小红书开源的自动化工具调用数据进化框架

LoopTool - 上海交通大学とLittle Red Bookのデータ進化フレームワークを呼び出すオープンソース自動化ツール

LoopToolは、上海交通大学とLittle Red Bookチームによってオープンソース化された自動ツールコールデータ進化フレームワークであり、大規模言語モデルのツールコール機能を強化するために設計されている。オープンソースのモデル（Qwen3-32Bなど）をデータ生成に使用し、クローズドループの繰り返しによってデータ生成とモデル学習を最適化します。

最新のAIリソース

5ヶ月前

083.7K

SAM 3D - Meta开源的3D重建模型系列

SAM 3D - メタ・オープンソース3D再構築モデルシリーズ

SAM 3Dは、Meta社のSAMシリーズをベースにした3D再構築モデルで、SAM 3D ObjectsとSAM 3D Bodyの2つのブランチがあります。SAM 3D Objectsは、1枚の写真からインタラクティブな3Dオブジェクトモデルを生成することができます。

最新のAIリソース

5ヶ月前

031.8K

AgentEvolver - 阿里通义实验室开源的智能体进化系统

AgentEvolver - アリ・トンイ研究所の進化する知性のためのオープンソースシステム

AgentEvolverはAlibaba Tongyi Labが開発したオープンソースの知能進化システムです。AgentEvolverはサービス指向アーキテクチャを採用しており、環境サンドボックス、LLM、Sc...

最新のAIリソース

5ヶ月前

089.8K

MemOS - 开源的AI记忆管理与调度平台，共享长期记忆

MemOS - 長期記憶を共有するためのオープンソースAIメモリ管理・スケジューリングプラットフォーム

MemOSは、MemTensorのような大規模言語モデル（LLM）のためのオープンソースのメモリ管理とスケジューリングのフレームワークです。メモリを演算能力と同様に重要なリソースと考え、標準化されたMemCubeメモリユニットによって、プレーンテキスト、活性化状態、パラメータメモリの管理を一元化します。

最新のAIリソース

5ヶ月前

085.6K

WithAnyone - 复旦联合阶跃星辰开源的AI合照生成模型

WithAnyone-復旦共同ステップスター・オープンソースAI写真生成モデル

WithAnyoneは復旦大学とStepStarが共同開発したAI写真生成モデルで、従来のAI画像生成によくある「コピー＆ペースト」問題を解決し、より自然で制御可能な多人数画像生成を実現する。このモデルは、大規模データセットMultiID-2M ...

最新のAIリソース

5ヶ月前

084.4K

ChatTutor - 开源的AI教学辅助工具，可视化互动学习

ChatTutor - 双方向学習を可視化するオープンソースAI教材

ChatTutorは、STEM科目のビジュアルインタラクティブ学習に焦点を当てたオープンソースのAI教材です。対話Q&Aや動的描画機能を実現するためのマルチインテリジェントなボディアーキテクチャを介して、ユーザーが直感的に抽象的な一般的な理解を支援するために、リアルタイムでホワイトボード上の数学的なグラフィックス、物理回路やマインドマップを描くことができます...

最新のAIリソース

5ヶ月前

023.7K

DPAI Arena - JetBrains开源的AI编程基准测试平台

DPAI Arena - AIプログラミングのためのJetBrainsオープンソースベンチマーキングプラットフォーム

DPAI Arena（Developer Productivity AI Arena）は、JetBrainsが作成したオープンなベンチマーク・プラットフォームで、実世界のソフトウェア・エンジニアリング・タスクにおけるAI支援開発ツールの有効性を測定する。透明性の高い評価ストリームを通じて...

最新のAIリソース

5ヶ月前

029.5K

EverMemOS - 盛大团队推出的开源长期记忆操作系统

EverMemOS - チームシャンダによるオープンソース長期メモリオペレーティングシステム

EverMemOSは、陳天樵が率いるシャンダチームが立ち上げたオープンソースの長期記憶オペレーティングシステムであり、AI知能のために設計され、大規模言語モデルの固定コンテキストウィンドウに起因するメモリ破壊の問題を解決する。このシステムは人間の脳の記憶メカニズムに基づいており、4層アーキテクチャ（エージェント層、メモリ層、インデックス層...）を採用している。

最新のAIリソース

5ヶ月前

035.7K

Astron Agent - 科大讯飞开源的企业级智能工作流开发平台

アストロンエージェント - KDDIオープンソースエンタープライズクラスインテリジェントワークフロー開発プラットフォーム

アストロンエージェントは、KDDIのオープンソースエンタープライズグレードのインテリジェントワークフロー開発プラットフォームです。Java + Spring Boot技術スタックを使用し、軽量なプライベートデプロイメント（最小2コア4G構成）をサポートし、ビルトイン...

最新のAIリソース

5ヶ月前

030.1K

Bee - 腾讯混元联合清华开源的全栈多模态大模型项目

ビー - テンセント・ミックスメタ・清華オープンソース・フルスタック・マルチモーダル・ラージモデル・プロジェクト

Beeは、Tencent Mixed Elementチームと清華大学が共同で立ち上げたフルスタックのオープンソース・マルチモーダルビッグモデル・ソリューションであり、データ品質を向上させることで、オープンソースとクローズドソースのモデル間のパフォーマンスギャップを縮めることを目的としている。このプロジェクトには3つの核となる成果が含まれている：1,500万スケールの高品質2層CoTデータセットHoney-Data...

最新のAIリソース

5ヶ月前

026.7K

InfinityStar - 字节开源的统一时空自回归视频生成框架

InfinityStar - Byteオープンソース時空間自己回帰ビデオ生成フレームワーク

InfinityStarは、ByteDance社によってオープンソース化された、高解像度の画像とビデオ生成用に設計された、統一された時空間自己回帰フレームワークです。離散自己回帰的なアプローチを用いることで、テキストから画像、テキストから動画、画像から動画のタスクを単一のモデルで同時に扱うことができる。このフレームワークのベンチマークはVBench ...

最新のAIリソース

5ヶ月前

028.3K

Koina - 慕尼黑工大联合密歇根大开源的去中心化机器学习平台

ミュンヘン工科大学がミシガン大学と共同でオープンソース化した分散型機械学習プラットフォーム「Koina

Koinaは、プロテオミクス・データ解析を簡素化することに焦点を当てた、オープンソースの分散型機械学習プラットフォームである。ドイツのミュンヘン工科大学とアメリカのミシガン大学のチームによって開発されました。このプラットフォームは、標準化されたインターフェースを介して30以上の主流モデル（ProSIT、MS²PIPなど）を統合し、ペプチド質量...

最新のAIリソース

5ヶ月前

028.7K

VibeThinker-1.5B - 微博AI开源的15亿参数大型语言模型

VibeThinker-1.5B - 15億パラメータの大規模言語モデルをWeibo AIがオープンソース化

VibeThinker-1.5Bは、Weibo AIがオープンソース化した15億パラメータの大規模言語モデルです。アリババのQwen2.5-Math-1.5Bをベースに微調整されたこのモデルは、数学とコーディングのタスクに最適化されており、業界トップクラスの推論性能を発揮します。

最新のAIリソース

5ヶ月前

031.5K

BestBlogs - 开源的AI内容聚合平台，精选优质技术内容

BestBlogs - 質の高い技術コンテンツを集めたオープンソースのAIコンテンツアグリゲーションプラットフォーム

BestBlogsは、テクノロジー実務者、起業家、プロダクトマネージャーなどのための高品質コンテンツの提供に焦点を当てたプラットフォームです。RSSフィードとクローラー技術を通じて、400以上の高品質なブログから記事、ポッドキャスト、ビデオ、その他のマルチフォーマットコンテンツを収集している。核となる強みは、AIビッグランゲージの活用にある。

最新のAIリソース

5ヶ月前

025.3K

Egocentric-10K - Build AI开源的第一人称视角机器人数据集

Egocentric-10K - ビルドAIのオープンソース一人称視点ロボットデータセット

Egocentric-10Kは、build.aiチームによってオープンソース化された大規模な一人称視点（エゴセントリック）工場作業ビデオデータセットです。このデータセットには10,000時間、合計10.8億フレーム、2...

最新のAIリソース

5ヶ月前

030.5K

LazyCraft - 开源AI Agent应用开发与管理平台，基于LazyLLM构建

LazyCraft - LazyLLM上に構築されたオープンソースのAIエージェントアプリケーション開発・管理プラットフォーム

LazyCraftは、オープンソースフレームワークLazyLLMに基づいてShangtangによって構築されたオープンソースのAIエージェントアプリケーション開発および管理プラットフォームであり、企業と開発者にワンストップのAIアプリケーション開発ソリューションを提供します。開発者が敷居が低く、低コストで大規模なモデルアプリケーションを迅速に構築し、リリースすることを支援します。

最新のAIリソース

5ヶ月前

034.2K

Kosong - Moonshot AI开源的全新AI Agent开发框架

Kosong - ムーンショットAIの新しいオープンソースAIエージェント開発フレームワーク

Kosongは、Moonshot AIによってオープンソース化された新しいAIエージェント開発フレームワークで、次世代のインテリジェント・ボディ・アプリケーションを構築するための、軽量で柔軟かつ拡張性の高い基盤サポートを開発者に提供します。複数のツールを効率的にスケジューリングする非同期ツールスケジューリングエンジン...

最新のAIリソース

5ヶ月前

028.6K

SenseNova-SI - 商汤科技开源的空间智能大模型系列

SenseNova-SI - ShangTang Technologyのオープンソース空間知能ラージモデルファミリー

SenseNova-SIは、ShangTech社がリリースしたオープンソースの空間知能グランドモデルであり、空間理解と推論におけるAIの能力向上に焦点を当てている。このモデルは、空間計測、再構築、関係判定、遠近変換、変形分析、空間推論を含む6つのコア次元に優れており、他のモデルを大幅に凌駕しています。

最新のAIリソース

5ヶ月前

024.7K

Omnilingual ASR - Meta推出的多语言语音识别框架

多言語ASR - Metaの多言語音声認識フレームワーク

オムニリンガルASRは、Metaによって導入された多言語音声認識フレームワークで、1600以上の言語をカバーし、78%の言語文字エラーレートは10%より低いです。

最新のAIリソース

5ヶ月前

028.6K

Frappe Builder - 开源的AI低代码网站构建工具，拖拽组件快速搭建

Frappe Builder - オープンソースのAIローコードウェブサイトビルダー。

Frappe Builderは、Frappeによって開発されたオープンソースのローコードウェブサイトビルダーです。中心的な機能は、ウェブサイトを素早く構築するためのドラッグ＆ドロップコンポーネントをサポートするFigmaライクなビジュアルエディタを提供することです。Frappeのエコロジー（Frappeverse）の一部です。

最新のAIリソース

5ヶ月前

031.7K

DeepOCR - 基于DeepSeek-OCR模型的开源复刻项目

DeepOCR - DeepSeek-OCRモデルに基づくオープンソース・レプリカ・プロジェクト

DeepOCRは、DeepSeek-OCRのコアアーキテクチャを実装したオープンソースの複製プロジェクトであり、光圧縮技術によってテキスト情報を効率的に処理する。コアはDeepEncoderで、SAM-base（高解像度画像の処理）、16×畳み込み圧縮器...で構成されている。

最新のAIリソース

5ヶ月前

028.2K

Glow - 开源的命令行工具，支持在终端渲染Markdown文件

Glow - ターミナルでMarkdownファイルのレンダリングをサポートするオープンソースのコマンドラインツール

GlowはターミナルでMarkdownファイルをエレガントにレンダリングするオープンソースのコマンドラインツールです。このツールはコードブロック、数式、その他の複雑な要素のハイライトをサポートし、カスタムスタイル、ページング表示、マウスサポートなどの豊富な機能を提供します。

最新のAIリソース

5ヶ月前

032.5K

NocoBase - 免费开源的AI无代码开发平台，可视化构建应用

NocoBase - アプリケーションを視覚的に構築するためのフリーでオープンソースのAIノーコード開発プラットフォーム

NocoBaseは、AI駆動のオープンソースのノーコード開発プラットフォームに基づいており、ビジネスシステムの迅速な構築をサポートし、プログラミングは、アプリケーション開発の構成を介して完了することができます。このプロジェクトは、Apache-2.0プロトコルを使用し、プライベートな展開と柔軟なスケーラビリティを提供し、企業管理、コラボレーションプラットフォームやその他の分野に適しています。

最新のAIリソース

5ヶ月前

028.8K

UniWorld V2 - 兔展智能联合北大推出的新一代图像编辑模型

UniWorld V2 - RabbitShow Intelligenceと北京大学が発表した新世代の画像編集モデル

UniWorld V2は、RabbitZhan Intelligenceと北京大学のUniWorldチームが共同で発表した新世代の画像編集モデルです。画像編集の分野、特に中国語の理解や複雑なコマンドの実行において大きな優位性を持っている。このモデルは、芸術的な中国語フォントを正確にレンダリングすることができ、細かい...

最新のAIリソース

5ヶ月前

030.4K

SmartResume - 阿里巴巴开源的AI简历解析与优化工具

SmartResume - アリババのオープンソースAI履歴書解析・最適化ツール

SmartResumeは、PDF、画像、Office文書から基本情報、学歴、職歴などの構造化された情報を効率的に抽出する、アリババのオープンソースのインテリジェントな履歴書解析・最適化ツールです。OCRテクノロジーとPDFメタデータを統合することで、履歴書や職務経歴書の基本情報や学歴、職歴などの構造化された情報を効率的に抽出します。

最新のAIリソース

5ヶ月前

032K

Step-Audio-EditX - 阶跃星辰开源的首个LLM级音频编辑大模型

Step-Audio-EditX - Step-Star初のオープンソースLLMレベルオーディオ編集ラージモデル

Step-Audio-EditXは、Step-Starチームによって開発されたオープンソースのオーディオ編集マクロモデルで、人工知能技術によるオーディオコンテンツのきめ細かな操作に焦点を当てています。このモデルは、オーディオのムード、話し方（小心者、老人アクセントなど）、パラ言語的要素（笑い、ため息など）を動的に調整することができます。

最新のAIリソース

5ヶ月前

031K

Open-o3 Video - 北大联合字节开源的视频推理模型

Open-o3 Video - 北京大学がオープンソース化したビデオ推論モデル United Bytes

Open-o3 Videoは、北京大学とByteDanceが共同開発したオープンソースのビデオ推論モデルであり、時間的・空間的証拠によるビデオ推論の強化に焦点を当てている。重要な証拠にタイムスタンプとバウンディングボックスを明示的にラベル付けすることで、モデルが動画コンテンツをより良く理解し解釈するのに役立つ。

最新のAIリソース

5ヶ月前

027.7K

Handy - 开源免费的本地AI语音转文字工具

Handy - オープンソースの無料ネイティブAI音声テキスト変換ツール

Handyは、RustとReactによって開発された、Windows、MacOS、Linuxシステムをサポートするオープンソースで無料のローカル音声テキスト変換ツールです。クラウドにアップロードすることなくローカルで音声データを処理することで、プライバシーとセキュリティを保証し、高速な書き起こしやテキスト入力に適しています。

最新のAIリソース

5ヶ月前

060.4K

FG-CLIP 2 - 360开源的图文跨模态视觉语言模型

FG-CLIP 2 - 360 オープンソース・クロスモーダルグラフィックス視覚言語モデル

FG-CLIP 2は、360人工知能研究所が発表した世界有数のグラフィカル・クロスモーダル視覚言語モデル（VL-M）であり、29の権威あるベンチマークでGoogleやMetaの類似モデルを上回り、現在最も強力なVL-Mとなっている。

最新のAIリソース

5ヶ月前

028.3K

微舆BettaFish - 开源的多智能体舆情分析系统

Micro Opinion BettaFish - オープンソースマルチインテリジェンス意見分析システム

BettaFishは、オープンソースのマルチインテリジェンス・オピニオン分析システムです。マルチ・インテリジェント・ボディ・アーキテクチャを採用し、クエリ、メディア、インサイト、レポート、その他のエージェントが連携して、検索、抽出、レポートのクローズドループを実現します。このシステムは、AI主導の完全な...

最新のAIリソース

5ヶ月前

061.8K

Ouro - 字节跳动Seed团队开源的新型循环语言模型

Ouro - ByteHopper Seedチームがオープンソース化した新しい循環言語モデル

Ouroは、ByteDance Seedチームによって開発された新しいタイプのループ言語モデル（LLM）であり、パラメータ共有型のリカレント計算構造によって、事前学習段階で推論機能を直接構築するという革新的なコアを持つ。このモデルは、24層を基本ブロックとし、...

最新のAIリソース

5ヶ月前

037.6K

ChronoEdit - 英伟达与多伦多大学联合开源的AI图像编辑框架

ChronoEdit - NVIDIAとトロント大学がオープンソース化したAI画像編集フレームワーク

NVIDIAとトロント大学が共同開発したオープンソースのAI画像編集フレームワーク「ChronoEdit」は、画像編集タスクを動画生成タスクとして再定義し、編集結果の時間的・物理的整合性を保証する。14Bのパラメータを持つ事前に訓練された動画生成モデルを...

最新のAIリソース

5ヶ月前

032.4K

LongCat-Flash-Omni - 美团开源的全模态大语言模型

LongCat-Flash-Omni - 明潭オープンソースのための完全モード大規模言語モデル

LongCat-Flash-Omniは、MeituanのLongCatチームによってリリースされたオープンソースの完全モーダルビッグ言語モデルです。5,600億のパラメータスケール（270億のアクティブ化されたパラメータ）を持ち、多数のパラメータを維持しながら、ミリ秒レベルのリアルタイムの音声と映像のインタラクション機能を実現している。

最新のAIリソース

5ヶ月前

030.5K

Petri - Anthropic开源的 AI 安全审计框架

Petri - AnthropicのオープンソースAIセキュリティ監査フレームワーク

Petriは、Anthropic社によって開発されたオープンソースのAIセキュリティ監査フレームワークであり、AIモデルのセキュリティと振る舞いの整合性を体系的に評価する。実世界のシナリオをシミュレートすることで、自動監査人が対象モデルと複数回の対話を行い、その後、判定エージェントがモデルの...

最新のAIリソース

5ヶ月前

026.9K

Kimi Linear - 月之暗面开源的新型混合线性注意力架构

キミ・リニア - 月の裏側でオープンソース化された新しいハイブリッド・リニア・アテンション・アーキテクチャ

キミ・リニアは、ダークサイド・オブ・ザ・ムーンがオープンソース化した新しいハイブリッド・リニア・アテンション・アーキテクチャで、キミ・デルタ・アテンション（KDA）を中核とし、従来のアテンション・モデルをよりきめ細かいゲーティング・メカニズムによって最適化し、ハードウェア効率とメモリ制御能力を大幅に向上させている。

最新のAIリソース

5ヶ月前

038.9K

FIBO - 全球首个开源原生支持JSON的文本生成图像模型

FIBO - 世界初のオープンソースでネイティブにサポートされたJSONテキストから画像モデルを生成

FIBOは、Bria AIによって開発された、ネイティブJSONをサポートする世界初のオープンソーステキスト生成画像モデルです。8Bのパラメータを持つDiT（Diffusion Transformer）アーキテクチャに基づき、フローマッチング学習法を採用しています。

最新のAIリソース

5ヶ月前

031.4K

SoulX-Podcast - Soul AI Lab开源的对话式语音合成模型

SoulX-Podcast - Soul AI Labのオープンソース会話音声合成モデル

SoulX-Podcastは、高品質のポッドキャストコンテンツを生成するために設計された、Soul AI Labのオープンソースの先進的な複数話者会話音声合成モデルです。SoulX-Podcastは複数ラウンドのダイアログを生成する機能を持ち、実際のポッドキャスティングシナリオでスムーズなダイアログをシミュレートできます。

最新のAIリソース

5ヶ月前

040.1K

GigaBrain-0 - 开源的具身基础模型，由世界模型生成数据驱动

GigaBrain-0 - 世界モデル生成データによって駆動されるオープンソースの具現化ベースモデル

GigaBrain-0は、実機汎化を実現するために世界のモデル生成データを使用する中国初のエンドツーエンドのVLA（Vision-Language-Action）具現化ベースモデルであり、GigaVisionと湖北ヒューマノイドロボティクスイノベーションセンターが共同でオープンソースとして公開しています。ハイブリッドTransformerアーキテクチャを採用し、...

最新のAIリソース

5ヶ月前

027.5K

Ming-flash-omni-Preview - 蚂蚁集团开源的全模态大模型

Ming-flash-omni-Preview - Antグループのオープンソースフルモーダルマクロモデル

Ming-flash-omni-Previewは、Ant Group inclusionAIによって公開されたオープンソースのフルモーダル・マクロモデルです。Ling 2.0のスパースMoEアーキテクチャに基づき、パラメータ規模は数千億、総パラメータは103B、アクティブ度は9Bです。

最新のAIリソース

5ヶ月前

032.3K

OmniVinci - NVIDIA开源的全模态大语言模型

オムニヴィンチ - NVIDIAのオープンソース全方位大規模言語モデル

OmniVinciは、NVIDIAによって開発されたオープンソースのフルモーダル大規模言語モデルであり、アーキテクチャの革新とデータの最適化を通じて、マルチモーダルモデルにおけるモーダルの断片化の問題を解決します。視覚と音声のエンベッディングのアライメントは、時間的に埋め込まれたグループキャプチャを利用するOmniAlignNetによって強化されます...

最新のAIリソース

5ヶ月前

032K

olmOCR 2 - AI2开源的多模态文档解析模型

olmOCR 2 - AI2 オープンソース・マルチモーダル文書解析モデル

olmOCR 2は、Allen Institute for Artificial Intelligence (AI2)によるオープンソースのマルチモーダル文書解析モデルで、olmOCRのアップグレード版である。デジタル化された印刷文書（PDFなど）を高...

最新のAIリソース

5ヶ月前

038.1K

ValueCell - 开源的多智能体金融平台，多个Agent分工协作

ValueCell - 複数のエージェントが連携するオープンソースのマルチインテリジェンス金融プラットフォーム

ValueCellは、AI技術によって金融分析と投資管理の効率を向上させるオープンソースのマルチインテリジェント体金融アプリケーションプラットフォームです。プロの投資チームをシミュレートし、複数のAI知能が連携して、市場分析、センチメント分析、ファンダメンタルズ調査、自動売買などの機能をカバーし、ユーザーに包括的な...

最新のAIリソース

5ヶ月前

057.3K

Dexbotic - 原力灵机开源的具身智能VLA模型一站式科研服务平台

Dexbotic-フォース・スピリット・マシンのオープンソースVLAモデル具現化知能ワンストップ研究サービス・プラットフォーム

Dexboticは、DexmalのオープンソースVisual-Linguistic-Action(VLA)モデルの具現化知能ワンストップ研究サービスプラットフォームであり、具現化知能分野の研究の断片化と低効率の問題を解決します。PyTorchをベースとしたDexboticは、具現化知能分野における研究の断片化と低効率の問題を解決するためのワンストップ研究サービスプラットフォームです...

最新のAIリソース

5ヶ月前

029.4K

LongCat-Video - 美团LongCat开源的视频生成模型

LongCat-Video - ミッションのLongCatオープンソースビデオ生成モデル

LongCat-Videoは、LongCatチームによる13.6億パラメータのビデオ生成モデルで、MITオープンソースプロトコルを使用し、テキスト生成ビデオ、グラフ生成ビデオ、ビデオ継続の3つの主要なタスクをサポートしています。このモデルは、"粗いものから細かいものへ "という生成戦略とブロック・スパース・アテンション・メカニズムにより、何分...

最新のAIリソース

5ヶ月前

051.1K

DreamOmni2 - 港科大开源的多模态AI图像编辑与生成模型

DreamOmni2 - HKUSTオープンソース・マルチモーダルAI画像編集・生成モデル

DreamOmni2は、HKUSTのJiajiaチームによるオープンソースのマルチモーダルAI画像編集・生成モデルである。テキストと画像のコマンドを同時に処理することができ、複数の参照画像をサポートし、クリエイターにより柔軟な創作方法を提供する。このモデルは、3段階のデータ合成プロセスを使用して学習され、共同学習生成/編集...

最新のAIリソース

6ヶ月前

036.2K

混元世界模型1.1 - 腾讯混元发布的开源3D重建大模型

混成世界モデル1.1 - テンセント混成世界オープンソース3D復元大型モデルリリース

WorldMirror 1.1（WorldMirror）は、TencentのWorldMirrorチームによってリリースされたオープンソースの大規模モデルの3D再構築であり、WorldMirrorシリーズのアップグレード版である。マルチビュー画像、動画、カメラ位置、内部参照、深度マップなどのマルチモーダル先験的入力をサポートしています。

最新のAIリソース

6ヶ月前

035.3K

DeepSeek-OCR - DeepSeek开源的光学字符识别模型

DeepSeek-OCR - DeepSeekオープンソース光学式文字認識モデル

DeepSeek-OCRは、DeepSeekチームによってオープンソース化された高度な光学式文字認識（OCR）モデルであり、「文脈光学圧縮」技術によってテキストを画像に変換し、圧縮と復号に視覚的トークンを使用することで、効率的な長文テキスト処理を実現する。

最新のAIリソース

6ヶ月前

040.4K

VitaBench - 美团LongCat开源的交互式Agent评测基准

VitaBench - MMT LongCatオープンソースインタラクティブエージェントレビューベンチマーク

VitaBenchは、MeituanのLongCatチームによってリリースされた、複雑な生活シナリオのための初の対話型エージェント評価ベンチマークであり、実際の生活シナリオにおける大規模なモデル知能の総合的な能力を評価する。テイクアウト注文、レストランでの食事、旅行という高頻度の3つの生活シナリオをキャリアとして、パッケージを構築する...

最新のAIリソース

6ヶ月前

032K

MinerU2.5 - 上海AI Lab联合北大开源的文档解析模型

MinerU2.5 - 上海AI研究所と北京大学のオープンソース文書解析モデル

MinerU2.5は、上海人工知能研究所と北京大学のチームによって共同開発された、高解像度の文書画像解析を効率的に処理することを主眼とした非連成視覚言語モデルである。核となる革新的な点は、「大局的なレイアウト検出と局所的な内容認識」という2段階の設計にある。

最新のAIリソース

6ヶ月前

046.2K

LongCat-Audio-Codec - 美团LongCat开源的语音编解码方案

LongCat-Audio-Codec - Meituan LongCatオープンソーススピーチコーデックソリューション

LongCat-Audio-Codecは、MeituanのLongCatチームによるオープンソースの音声コーデックソリューションです。このソリューションは、Speech Large Language Model (Speech LLM)のために設計されており、意味的・音響的な二重トークン並列抽出メカニズムによって、音声の意味的・音響的特徴を考慮に入れています。

最新のAIリソース

6ヶ月前

029.9K

PaddleOCR-VL - 百度开源的超轻量级视觉-语言模型

PaddleOCR-VL - 百度オープンソース超軽量視覚言語モデル

PaddleOCR-VLはBaiduのオープンソースの超軽量視覚言語モデルで、文書解析シナリオに最適化されています。動的高解像度視覚コーダーと軽量ERNIE言語モデルの融合により、高精度を維持しながら、計算オーバーヘッドを大幅に削減し、0.9Bのパラメータしか含んでいません。

最新のAIリソース

6ヶ月前

047.1K

UniPixel - 香港理工、腾讯、中科院等开源的像素级多模态模型

UniPixel - ピクセルレベルのマルチモーダルモデル、香港理工大学、Tencent、CASなどがオープンソース化

UniPixelは、香港理工大学、テンセント、中国科学院、Vivoが共同で提案した、ピクセルレベルの視覚言語理解を実現するための新しいマルチモーダルモデルである。オブジェクト参照とセグメンテーション機能を統合することで、画像セグメンテーション、ビデオセグメンテーション、領域理解、ピ...

最新のAIリソース

6ヶ月前

035.4K

DiaMoE-TTS - 清华联合巨人网络开源的多方言语音合成框架

DiaMoE-TTS - 清華とジャイアントネットワークのオープンソース多言語音声合成フレームワーク

DiaMoE-TTSは、清華大学とGiant Networkが共同でオープンソース化した多方言音声合成フレームワークで、国際音声記号（IPA）に基づき、方言データの不足、正書法の不統一、複雑な音韻変化の問題を解決します。統一されたIPAフロントエンドの標準化された音素表現により、方言間の差異を排除し、方言の音韻の変化...

最新のAIリソース

6ヶ月前

037.3K

Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列

カンディンスキー5.0 - ロシアのAIチームがオープンソースの映像生成モデルシリーズを公開

Kandinsky 5.0は、ロシアのAIチームによって開発された最新のビデオジェネレーションモデルシリーズで、軽量設計と高性能に重点を置いている。シリーズ最初のモデルであるKandinsky 5.0 Video Liteは、パラメータはわずか20億だが、類似の14Bモデルを凌駕しており、特に...

最新のAIリソース

6ヶ月前

045.3K

SongBloom - 腾讯联合港中文、南大开源的歌曲生成模型

SongBloom-テンセントがHKCSとNTUと共同開発したオープンソースの楽曲生成モデル

SongBloomは、テンセントAIラボが香港中文大学（深圳）、南京大学と共同で開発したオープンソースの楽曲生成モデルで、AIによる楽曲生成における「可塑性」の問題を解決し、高品質で構造的に完全な楽曲生成を実現している。10秒間の参考音声と対応する歌詞を入力するだけで、...

最新のAIリソース

6ヶ月前

036.3K

Pyscn - 专为Python开发者开源的免费AI代码质量分析工具

Pyscn - フリーのAIコード品質分析ツール、Python開発者向けオープンソース

PyscnはPython開発者向けに設計されたインテリジェントなコード品質分析ツールで、コードの潜在的な問題を検出して保守性を向上させます。制御フロー図を通してデッドコードを分析し、APTED+LSHアルゴリズムを使って重複コードを特定し、モジュールの結合やサークルの複雑さなどのメトリクスを計算します。

最新のAIリソース

6ヶ月前

029.1K

Youtu-Embedding - 腾讯优图开源的通用文本表示模型

Youtu-Embedding - Tencent Youtuオープンソースの汎用テキスト表現モデル

Youtu-Embeddingは、TencentのYoutu Labsによるオープンソースのユニバーサルテキスト表現モデルで、エンタープライズレベルのアプリケーション向けに設計されている。テキストはディープニューラルネットワークによって高次元のベクトル空間にマッピングされ、その空間では意味的に類似した文章がより近くに配置され、正確な意味検索が実現される。

最新のAIリソース

6ヶ月前

034.2K

SAIL-VL2 - 字节跳动开源的多模态视觉语言模型

SAIL-VL2 - ByteHopのオープンソース・マルチモーダル視覚言語モデル

SAIL-VL2は、Byte Jumpチームによるオープンソースのマルチモーダル視覚言語モデルで、画像やテキストなどのマルチモーダル入力の共同モデリングに焦点を当てています。スパース混合エキスパート（MoE）アーキテクチャと漸進的な学習ストラテジーを用いて、2Bから8Bのパラメータスケールで、特に図形理解、数学的...

最新のAIリソース

6ヶ月前

027.3K

MineContext - 字节开源的主动式上下文感知AI伙伴

MineContext - バイト・オープンソース・アクティブ・コンテキスト・アウェアAIパートナー

MineContextは、ByteDance Vikingチームによってオープンソース化されたアクティブなコンテキスト認識AIパートナーで、ユーザーが大量の情報を効率的に管理し、知識作業の効率を向上させることを支援します。スクリーンショットとコンテンツ理解技術により、ユーザーの日常操作（ウェブ閲覧、文書編集など）を自動的に記録し、...

最新のAIリソース

6ヶ月前

048.3K

nanochat - Karpathy免费开源的低成本模型训练项目

nanochat - カルパシーによるフリーでオープンソースの低コストモデル・トレーニング・プロジェクト

nanochatは、AIのレジェンドであり元テスラAIディレクターのアンドレイ・カルパシーが公開したオープンソースプロジェクトで、個人が非常に低コストかつシンプルに、小規模なChatGPTのような言語モデルを素早く学習することを可能にする。プロジェクト全体で使用されているのは、わずか約800...

最新のAIリソース

6ヶ月前

033.8K

LLaVA-OneVision-1.5 - 免费开源的多模态模型，高性能多模态理解

LLaVA-OneVision-1.5 - 高性能マルチモーダル理解のためのフリーでオープンソースのマルチモーダルモデル

LLaVA-OneVision-1.5は、EvolvingLMMS-Labチームによるオープンソースのマルチモーダルモデルで、8Bパラメータスケールを使用し、128 A800上でコンパクトな3段階のトレーニングプロセス（言語-イメージのアライメント、概念の平衡化と知識の注入、命令の微調整）を通じて...

最新のAIリソース

6ヶ月前

032.3K

Paper2Video - 新加坡国立开源的学术论文自动生成演示视频项目

Paper2Video - 論文のデモビデオを自動生成するNUSのオープンソースプロジェクト

Paper2Videoは、シンガポール国立大学のShow Labで行われている、学術論文のプレゼンテーションビデオを自動生成するオープンソースプロジェクトです。PaperTalkerマルチインテリジェンスフレームワークを使用し、論文はスライド、字幕、ナレーション、スピーカーアバターを含む完全なプレゼンテーションビデオに変換されます。

最新のAIリソース

6ヶ月前

034.8K

NeuTTS Air - 支持离线CPU运行的免费轻量级语音合成模型

NeuTTS Air - オフラインCPU実行をサポートしたフリーで軽量な音声合成モデル

NeuTTS Airは、Neuphonicチームによって開発されたオープンソースの軽量音声合成モデルで、クラウドに依存することなく、ローカルデバイス（携帯電話、ラップトップ、Raspberry Piなど）上でリアルタイムに実行できる。0.5BパラメータのQwenアーキテクチャと自社開発のNeuCodecコーデックを使用しています。

最新のAIリソース

6ヶ月前

040.6K

KAT-Dev-72B-Exp - 快手开源的免费编程专用模型

KAT-Dev-72B-Exp - レーサー・オープンソース・フリーのプログラミング専用モデル

KAT-Dev-72B-Expは、強化学習技術に基づいて最適化された、Racerチームによって発表されたオープンソースのプログラミング専用大規模言語モデルであり、SWE-Bench Verifiedベンチマークテストで74.6%の精度を達成した。このモデルは革新的な...

最新のAIリソース

6ヶ月前

031.7K

Jamba Reasoning 3B - 以色列AI21 Labs开源的轻量级推理模型

Jamba Reasoning 3B - イスラエルAI21ラボのオープンソース軽量推論モデル

Jamba Reasoning 3Bは、イスラエルのAIスタートアップAI21 Labsによってオープンソース化された軽量推論モデルで、強力なパフォーマンスと幅広いアプリケーションへの応用が期待されている。SSMとTransformerのハイブリッド・アーキテクチャを採用し、Trans...

最新のAIリソース

6ヶ月前

029K

吴恩达的《Agentic AI》最新智能体免费课程

エルンスト・ウーによるAgentic AIから最新のインテリジェンスを学ぶ無料コース

Agentic AIは、アーネスト・ングが開始した知的身体に関する最新のコースです。このコースでは、知的身体の設計と構築に焦点を当て、4つの主要な設計モードである反射、ツールの使用、計画、および複数の知的身体のコラボレーションをカバーします。学習者は、理論的な説明と実践的なコードを通して、インテリジェント・ボディが出力をチェックし、自律的に調整する方法を習得します。

最新のAIリソースコース情報

6ヶ月前

054.2K

もっと読む