最新のAIリソース

合計2875記事
XTuner V1 - 上海AI Lab开源的大模型训练引擎

XTuner V1 - Shanghai AI Lab オープンソース大規模モデルトレーニングエンジン

XTuner V1は、上海人工知能研究所によってオープンソース化された新世代の大規模モデル学習エンジンであり、超大規模スパース混合エキスパート(MoE)モデル学習用に設計されている。PyTorch FSDPをベースに開発され、メモリ、通信、負荷の多次元最適化により高性能を実現しています。
3ヶ月前
021.4K
Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview - Tongyi Qianqianのフラッグシップ・ビッグ言語モデル

Qwen3-Max-Previewは、Tongyi Qianwenがリリースした最新のフラッグシップ大規模言語モデルです。Qwen3ファミリーの中で最大のパラメータ数を持つモデルであり、パラメータサイズは1兆を超える。推論、命令追従、多言語サポート、ロングテール知識カバレッジが大幅に改善されています。
3ヶ月前
026.5K
OneCAT - 美团联合上海交大开源的多模态模型

OneCAT - Meituanと上海交通大学のオープンソース・マルチモーダルモデル

OneCATは、Meituanが上海交通大学と共同で発表した新しい統一マルチモーダルモデルで、マルチモーダル理解、テキスト画像生成、画像編集機能をシームレスに統合した純粋なデコーダーアーキテクチャを採用している。このモデルは、外部の視覚コーダーや曖昧性解消器に依存する従来のマルチモーダルモデルの設計を放棄し、モダリティに特化した...
3ヶ月前
022.3K
InfinityHuman - 字节联合浙大推出的长视频数字人生成模型

InfinityHuman(インフィニティ・ヒューマン):バイトがZJUと共同で立ち上げた長編ビデオ・デジタル・ヒューマン・ジェネレーション・モデル

InfinityHumanは、ByteDanceと浙江大学が共同で発表した商用レベルの長時間音声駆動型キャラクター動画生成モデルである。このモデルは音声駆動型であり、高解像度、長時間、視覚的に一貫性のあるキャラクター動画を生成することができる。
3ヶ月前
022.3K
Kimi K2-0905 - 月之暗面推出的最新模型版本

Kimi K2-0905 - Dark Side of Moonの最新モデル!

Kimi K2-0905は、Dark Side of the Moon Technologies Ltd.の先進的なAIモデルであり、プログラミング支援に優れ、効率的にコードを生成し、フロントエンド開発において整然とした標準化されたコードの生成をサポートします。モデルのコンテキスト長は256Kまで拡張され、複雑なタスクにも対応します。
3ヶ月前
045.7K
HunyuanWorld-Voyager - 腾讯开源的超长漫游世界模型

HunyuanWorld-Voyager-テンセントオープンソースの超長距離ローミングワールドモデル

HunyuanWorld-Voyager(略してHunyuan Voyager)は、テンセントがリリースした業界初のネイティブ3D再構成をサポートする超長距離ローミングワールドモデルである。1枚の画像からユーザーが定義したカメラパスの3D点群シーケンスを生成する新しいビデオ拡散フレームワークであり、...
4ヶ月前
025.6K
Step-Audio 2 mini - 阶跃星辰开源的语音大模型

Step-Audio 2 mini - Step-Star オープンソース音声マクロモデリング

Step-Audio 2 miniは、Step-Audioによるオープンソースのエンドツーエンド音声マクロモデルです。従来の音声モデル構造を打破し、真のエンド・ツー・エンド・マルチモーダルアーキテクチャを採用しており、生の音声入力をより低遅延で音声応答出力に直接変換し、パラ言語情報と非音声信号を理解します。
4ヶ月前
031.5K
MobileCLIP2 - 苹果公司开源的高效端侧多模态模型

MobileCLIP2 - アップルのオープンソースによる効率的なエンドサイド・マルチモーダルモデル

MobileCLIP2は、Appleの研究者によって導入された効率的なエンドサイド・マルチモーダルモデルであるMobileCLIPのアップグレード版です。マルチモーダル強化トレーニング用に最適化され、DFNデータセットでより良いパフォーマンスをトレーニングすることでCLIP教師モデルを統合し、グラフィカルな生成機能を改善しました。
4ヶ月前
030K
InternVL3.5 - 上海AI实验室开源的多模态大模型

InternVL3.5 - 上海AIラボ オープンソース マルチモーダル大規模モデル

InternVL3.5(Shusheng-Wanxiang3.5)は、上海人工知能研究所のオープンソース・マルチモーダル大型モデルであり、一般的な能力、推論能力、展開効率の面で完全にアップグレードされ、10億から2410億パラメータまでの9つのサイズのバージョンを提供し、厚さを含むさまざまなリソース需要シナリオをカバーする。
4ヶ月前
032.6K
FastVLM - 苹果公司推出的视觉语言模型

FastVLM - Appleのビジュアル言語モデリング

FastVLM(Fast Vision Language Model)は、アップルが導入した効率的な視覚言語モデルである。FastViTHDハイブリッド視覚コーダーをコアとし、畳み込みとトランスフォーマーアーキテクチャを組み込むことで、視覚言語を大幅に...
4ヶ月前
028.3K
Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - 模範的な指示に従う能力を評価するためのMeeseeksオープンソース評価セット

Meeseeksは、MeituanのM17チームがモデルの指示に従う能力を評価するために使用しているオープンソースの大規模モデル評価セットです。Meeseeksは、モデルがマクロレベルからミクロレベルまでユーザーの指示に厳密に従った回答を生成できるかどうかを総合的に測定するために3段階の評価フレームワークを使用しており、回答内容の知識をプラス評価することはありません...
4ヶ月前
026.9K
gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime - OpenAIの最新AIスピーチモデル

gpt-realtimeはOpenAIの高度な音声モデルで、自然で滑らかな音声を生成するための直接音声処理をサポートしています。このモデルは複数の言語とスタイルをサポートし、笑いなどの非言語的な合図を理解し、言語を切り替えることができます。
4ヶ月前
029.4K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

HunyuanVideo-フォーリー - テンセントのオープンソース動画音源生成モデル

HunyuanVideo-Foleyは、TencentのMixed Yuanチームによるオープンソースのビデオサウンド生成モデルで、無音ビデオに正確にマッチした効果音を追加することをサポートします。このモデルは、大規模なデータセットのトレーニングに基づいており、マルチモーダル拡散コンバータアーキテクチャと、アライメント損失関数の表現とオーディオVAE最適化技術を組み合わせています...
4ヶ月前
036.2K
MiniCPM-V 4.5 - 面壁智能开源的8B参数多模态模型

MiniCPM-V 4.5 - ファセット・インテリジェント・オープンソース8Bパラメータ・マルチモーダルモデル

MiniCPM-V 4.5は、Qwen3-8BとSigLIP2-400Mをベースに構築された、画像や動画を効率的に処理できるオープンソースのファサードインテリジェンス用8Bパラメトリックマルチモーダルモデルです。ビジュアル・トークンの消費量や処理速度に優れたパフォーマンスを発揮します。
4ヶ月前
035.4K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - Ask o4が導入した、8つの思考経路を同時に開くパラレル思考モデル

Ask White o4は、8つの思考経路を同時に開き、問題を多角的に分析し、最適解を自動的にフィルタリングする革新的な並列思考モデルです。このモデルには、高度なLong-CoT強化学習とプロセス報酬学習技術が組み込まれており、強力な深層推論機能を持ち、複雑なタスクで優れたパフォーマンスを発揮します。
4ヶ月前
027.3K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Qunar Technologiesのオープンソース3Dシーン生成モデル

SpatialGenはQunar Technologyのオープンソース3Dシーン生成モデルであり、拡散モデルアーキテクチャに基づき、テキスト記述、参照画像、3D空間レイアウトに基づいて時空間的に一貫性のあるマルチビュー画像の生成をサポートし、さらに3Dガウスシーンの生成とローミングビデオのレンダリングを行う。
4ヶ月前
029.6K
Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型

Fun-ASR - ネイルとTongyiが共同で発表した新世代の音声認識モデル

Fun-ASRはNailとTongyi Labsが共同で発表した音声認識の大型モデルです。このモデルは膨大な音声データで学習され、インターネット、テクノロジー、家庭装飾などの多業種の専門用語を正確に識別することができ、認識精度が大幅に向上している。このモデルは推論最適化のためにNailの企業情報と組み合わされ、ファントム...
4ヶ月前
051.9K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - アイデアから創作までの全プロセスを支援するAI小説執筆プラットフォーム

Squiblerは、作家のために設計された強力なAI支援ライティング・プラットフォームで、構想から創作、出版までの全プロセスを支援します。このプラットフォームは、小説、脚本、短編小説などをカバーするさまざまなストーリー・テンプレートを提供します。ユーザーは最初のコンセプトを入力するだけで、AIがアウトライン、キャラクター、シーンを生成します。
4ヶ月前
029.8K
91写作 - 开源的AI智能小说创作平台

91Writing - オープンソースAIインテリジェント小説作成プラットフォーム

91Writingは、Vue 3とElement Plusをベースに開発された完全オープンソースのAI小説作成ツールで、GPT、Claude、Geminiなどの様々な高度なAIモデルを統合しています。このツールは、プロジェクトの作成を含む、アイデアからテキストまでの完全な作成ツールチェーンをクリエイターに提供します...
4ヶ月前
030.9K
Aivilization - 港科大推出的多Agent社会模拟平台

Aivilization - HKUSTが立ち上げたマルチエージェント社会シミュレーションプラットフォーム

Aivilizationは、香港科学技術大学が開発した世界初のAI多知能体社会シミュレーション・プラットフォームである。ユーザーが何千ものAI知能を作成・誘導し、未来の人間とAI共存の社会進化を観察できるビジュアルデジタルサンドボックスを構築する。このプラットフォームがサポートするのは...
4ヶ月前
052.8K
Grok 2.5 - 马斯克旗下xAI开源的人工智能模型

Grok 2.5 - マスクのxAIオープンソースAIモデル

Grok 2.5は、イーロン・マスクのxAIによるオープンソースのAIモデルである。2,690億のパラメータを持ち、強力なパフォーマンスと推論のためのMixed Expertise(MoE)アーキテクチャに基づいています。このモデルは、大学院レベルの科学知識(GPQA)、汎用知識(MMLU、MM...
4ヶ月前
032.7K
MIT最新报告《生成式AI鸿沟:2025年商业人工智能现状》

MITの新しいレポート『The Generative AI Divide: The State of Business AI in 2025』。

MITの最新レポート『The Generative AI Divide: The State of Business AI in 2025』は、300を超えるAIプロジェクトに関する詳細な調査、52の組織へのインタビュー、153人の経営幹部へのアンケート調査を実施することで、企業が経験しているジェネレーティブAI(GenAI)導入プロセスの核心を明らかにしている。
4ヶ月前
050.1K
AutoClip - 开源的AI视频切片工具,一键生成专题视频合集

AutoClip - ワンクリックでテーマ別のビデオコレクションを生成するオープンソースの AI ビデオスライスツール!

AutoClipは、自動化されたビデオ処理の完全なプロセスを達成するために高度なAI技術に基づいて、オープンソースのAIビデオ編集ツールです。ツールは自動的にビデオのハイライトを識別することができ、貴重なコンテンツの正確な抽出は、コンテンツのコレクションを生成するために、インテリジェントなクラスタリングのテーマの類似性に基づいて行うことができます。
4ヶ月前
038.5K
Seed-OSS - 字节跳动团队开源的全新AI模型

Seed-OSS - Wordpressチームがオープンソース化した新しいAIモデル

Seed-OSSは、Byte Jump Seedチームによってオープンソース化された大規模な言語モデルのファミリーで、長いテキストと推論タスクに焦点を当てています。Seed-OSSは、複雑な論理的推論や多段階推論で高い精度を発揮し、難しい問題を効率的に解くことができます。Seed-OSSは、最大512Kまでの長いテキストコンテキストをサポートしています。
4ヶ月前
035.6K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Shanghai AI Labによるオープンソースの軽量科学的マルチモーダルモデル

Intern-S1-miniは、上海人工知能研究所(SAL)が発表したパラメータスケール8Bの軽量科学用マルチモーダル・マクロモデルである。Intern-S1の強力な機能を継承し、汎用的な機能と特殊な科学的機能の両方を兼ね備えており、迅速な展開や二次開発に適している。性能面では、I...
4ヶ月前
029.7K
Nano Banana - 谷歌推出的AI图像编辑模型

ナノ・バナナ - GoogleのAI画像編集モデル

ナノ・バナナは、ジェミニ2.5フラッシュイメージのコードネームです。ジェミニは、Googleが提供するAI画像生成・編集モデルで、シンプルなテキストプロンプトに基づいて詳細で写実的な画像を生成し、既存の画像に高品質な修正を加えます。
4ヶ月前
054.4K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - Ali Tongyi オープンソース画像編集モデル

Qwen-Image-Editは、Ali Tongyiによって導入された、200億のパラメータを持つQwen-Imageアーキテクチャ上に構築された、万能画像編集モデルです。このモデルはセマンティック編集と外観編集の両方の機能を兼ね備えており、画像に対して低レベルの視覚的外観編集を行うことができます(例:追加、削除...
4ヶ月前
030.4K
MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - 崑崙微の最新音声生成フレームワーク

MoE-TTSは、KunlunWanweiによって導入された音声合成フレームワークで、事前に訓練された大規模言語モデル(LLM)と音声専門家モジュールを組み合わせたMixed Expert(MoE)アーキテクチャに基づいています。MoE-TTSは、テキストモジュールのパラメータを凍結し、音声モジュールのパラメータのみを更新することにより、強力なテキスト推論を保持します...
4ヶ月前
031K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - Jiyuanのオープンソース汎用ロボットプラットフォーム、Beihangなどと共同開発

Genie Envisioner(GE)は、Genie Roboticsチームがシンガポール国立大学、北京航空航天大学などと共同で開発したロボット操作のための統合プラットフォーム。まず想像し、それから行動する」ことで、ロボットがタスクをよりよく理解し、実行することを可能にする。
4ヶ月前
032.7K
DINOv3 - Meta AI推出的新一代自监督视觉基础模型

DINOv3 - Meta AIの次世代自己教師付き視覚ベースモデル

DINOv3は、Meta AIが開発した次世代の自己教師付き視覚ベースモデルであり、自己教師付き学習パラダイムを使用して、ラベル付けデータなしで画像の特徴を学習する。データ準備の改善とGramアンカリングの導入により、特徴量の劣化問題を解決し、汎化能力を向上させている。
4ヶ月前
041.5K
Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

Hunyuan-GameCraft - Tencent Hunyuanのオープンソースフレームワーク。

Hunyuan-GameCraftはTencent Hunyuanチームのオープンソースインタラクティブゲームビデオ生成フレームワークです。1枚の画像とプロンプトから、非常にダイナミックなゲームビデオを生成するフレームワークで、キーボードとマウスを使ってリアルタイムでビデオコンテンツを制御するユーザーをサポートします。
4ヶ月前
033.7K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - オープンソースの効率的なマルチモーダルモデリング by KunlunWanwei

Skywork UniPic 2.0は、Quintessenceによってオープンソース化された効率的なマルチモーダルモデルであり、画像生成、編集、理解に焦点を当てている。このモデルは、2BパラメータのSD3.5-Mediumアーキテクチャに基づいており、事前学習、漸進的なデュアルタスク強化戦略、共同学習によって実現される。
4ヶ月前
031.2K
RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议

RynnRCP - アリ・ダルマ研究所による初のオープンソース・ロボティクス・コンテキスト・プロトコル

RynnRCPは、Ali Dharma Instituteによるオープンソースのロボットコンテキストプロトコル(RCP)であり、身体化された知能の開発の敷居を下げ、開発プロセス全体を開放します。RynnRCPは、RCPフレームワークとRobotMotionモジュールで構成されています。RCPフレームワークは、能力の抽象化とマルチプロトコルのサポートを通じて、...
4ヶ月前
032.2K
RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - アリ・ダルマ・インスティテュートのオープンソース世界理解モデル

RynnECはAlibaba Dharma Instituteが導入した世界理解モデルで、具現化知能タスクに焦点を当てている。このモデルは、映像データと自然言語を組み合わせたマルチモーダル融合技術に基づいており、シーン内のオブジェクトを多次元から解析し、オブジェクトの理解、空間認識、映像ターゲットのセグメンテーションなどの機能をサポートする。
4ヶ月前
034.5K
Matrix-3D - 昆仑万维开源的3D世界生成框架

Matrix-3D - 崑崙ワールドワイドオープンソース3D世界生成フレームワーク

Matrix-3Dは、Skywork AIチームによるオープンソースのフレームワークで、探索可能なパノラマ3D世界の生成に特化している。このフレームワークは、パノラマビデオ生成と3D再構成技術を組み合わせて、1枚の画像やテキストプロンプトから高品質で全方位探索可能な3D世界を生成します。
4ヶ月前
032.7K
GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - Smart Spectrumによるマルチモーダル・オープンソース視覚推論モデル

GLM-4.5Vは、Smart Spectrumによって導入された世界有数のオープンソース視覚推論モデルであり、1060億の総パラメータと120億の活性化パラメータを持つ。このモデルは、新世代のテキストベースモデルGLM-4.5-Airをベースに学習され、強力な視覚理解・推論能力を持ち、画像、動画...
4ヶ月前
036K
Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

マトリックスゲーム2.0 - KunlunWeiによって開発されたインタラクティブな世界モデル

Matrix-Game 2.0は、Kunlun SkyWork AIがリリースした自社開発のインタラクティブワールドモデルです。Matrix-Game 2.0は、業界初のオープンソース、リアルタイム、長シーケンスの汎用シナリオ用インタラクティブ生成モデルであり、複数のシナリオを25FPSで動作させることができる。
4ヶ月前
035K
Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash - Tongyi Chien-quanによる高性能、低コストの言語モデル

Qwen-Flashは、アリババ「同義千問」シリーズに導入された高性能・低価格の言語モデルで、高速レスポンスとシンプルなタスクの効率的な処理のために設計されています。高度なMoE(Mixture-of-Experts)アーキテクチャに基づき、スパースエキスパートネットワークによって実現されています。
4ヶ月前
029.7K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - 崑崙王維の音声駆動型デジタル人間創造ツール

SkyReels-A3は、崑崙ワールドワイドグループが開発した音声駆動型デジタルヒューマンクリエーションツールです。SkyReels-A3は、音声駆動型デジタル人体作成ツールで、簡単な入力(例:肖像画像と音声)で高品質の動的ビデオコンテンツを生成したり、静止画を「生き生きと」させたり、既存のビデオのセリフを新しいリップシンクに置き換えてキャラクターが自動的に合わせることができます...
4ヶ月前
028.3K
MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - MiniMaxの音声生成モデル

MiniMax Speech 2.5は、MiniMaxチームによって開発された高度な音声生成モデルです。音声合成の分野において、特に多言語の表現力、音色の再現精度、言語カバー率の点で大きな進歩を遂げています。このモデルは40の言語をサポートしています。
4ヶ月前
034.8K
Genie 3 - 谷歌推出的通用世界模型

ジーニー3 - グーグルのユニバーサル世界モデル

Genie 3は、Google DeepMindが提供する新世代のユニバーサルワールドモデルで、高度にダイナミックで一貫性のある仮想世界をリアルタイムで生成することができます。Genie 3は、物理現象や自然生態系をシミュレートし、ファンタジーや歴史的なシナリオの作成をサポートします。テキストプロンプトにより、ユーザーは...
4ヶ月前
031.1K
Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - Anthropicの最強プログラミングモデル

Claude Opus 4.1は、複雑なタスクを効率的に処理するために設計された、Anthropicによる最先端の大規模言語モデルです。このモデルはプログラミング領域で優れており、高品質のコードを生成し、最大32kの単一出力をサポートし、幅広いプログラミングスタイルに適応します。
4ヶ月前
029.3K
AudioGen-Omni - 快手推出的多模态音频生成模型

AudioGen-Omni - Racerのマルチモーダル音声生成モデル

AudioGen-Omniは、Racerのマルチモーダルオーディオ生成モデルで、ビデオやテキストなどの入力に基づいて高品質のオーディオ、スピーチ、歌を生成します。AudioGen-Omniは、マルチモーダル拡散トランスフォーマーや位相整合トランスフォーマーなどの高度な技術に基づいています。
5ヶ月前
031.5K
LangExtract - 谷歌开源的Python库,提取结构化信息

LangExtract - 構造化情報を抽出するためのGoogleのオープンソースPythonライブラリ

LangExtractは、大規模言語モデル(LLM)を使用して、構造化されていないテキストから構造化された情報を抽出するGoogleオープンソースのPythonライブラリです。ユーザー定義のコマンドと少ないサンプル数で、...からの臨床メモのような重要な詳細を効率的に識別し、整理することができます。
5ヶ月前
035.7K
Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - Tongyi Qianqian、Qwen-Imageのオープンソース基本モデルを発表

Qwen-Imageは、Alibaba Tongyi Qianqianチームによってリリースされたオープンソースの画像生成ベースモデルです。200億のパラメータを持ち、マルチモーダル理解、高解像度コーディング、拡散モデリングの3つのモジュールを組み込んだマルチモーダル拡散変換アーキテクチャ(MMDiT)を採用しています。
5ヶ月前
031.5K
RedOne - 小红书最新推出的社交大模型

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。
5ヶ月前
032.4K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Qunar Technologyによる3Dガウス・セマンティック・データセット

InteriorGSは、Qunar Technologyによって導入された高品質の3Dガウス意味データセットである。このデータセットには、住宅、コンビニエンスストア、結婚式場、美術館など80以上の屋内環境をカバーする1,000の3Dシーンが含まれている。このデータセットには、755のカテゴリに分類された554,000以上のオブジェクトインスタンスが含まれている。
5ヶ月前
030.2K
ScreenCoder – 开源的UI截图生成前端代码工具

ScreenCoder - オープンソースUIスクリーンショット生成フロントエンドコードツール

ScreenCoderは、UIデザインのスクリーンショットを高品質のHTML/CSSコードに素早く変換できるオープンソースのスマートツールです。モジュラー・マルチ・インテリジェンス・アーキテクチャをベースに、ビジュアル理解、レイアウト・プランニング、コード合成技術を組み合わせたツールで、高精度でセマンティックなフロントエンド・コードの生成をサポートします。
5ヶ月前
038.3K
Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - GoogleのAI推論モデル

Gemini 2.5 Deep Thinkは、複雑なタスクを解決するために設計されたGoogleのAI推論モデルである。国際数学オリンピック(IMO)2025で金メダルを獲得したモデルの亜種であり、並列推論によって複雑なタスクを解くように設計されている。
5ヶ月前
028.6K
MindLink - 昆仑万维推出的开源推理大模型

MindLink - KunlunWeiのオープンソース推論ビッグモデル

MindLinkは崑崙ワールドワイドウェブによって起動されたオープンソースの推論の大規模なモデルです。適応推論機構を使用すると、タスクの複雑さに応じて柔軟に推論モードを切り替えることができ、単純なタスクが迅速に生成され、複雑なタスクの詳細な推論、アカウントに効率と精度を取る。計画駆動型の推論のパラダイムは、 "考える "タグを削除するには、減らす...
5ヶ月前
028.5K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - Ali Tongyi氏によるオープンソースの高性能プログラミングモデル

Qwen3-Coder-Flashは、Ali Tongyi Thousand Questionsチームによって導入された高性能プログラミングモデルであり、優れたエージェントベースプログラミングとツール呼び出し機能を持ち、複雑なプログラミングタスクを処理するのに適している。Qwen3-Coder-Flashは、256Kトークンの長い文脈理解をサポートし、1Mトーク...
5ヶ月前
028.9K
Wide Research - Manus平台推出的多智能体协同功能

ワイドリサーチ - マヌスプラットフォームにマルチインテリジェンス・コラボレーションを導入

ワイドリサーチは、複雑で大規模なタスクを処理するために設計されたManusプラットフォームの強力な機能です。このプラットフォームは、システムレベルの並列処理メカニズムとインテリジェンスコラボレーションプロトコルによって、同時に動作する数百の汎用インテリジェンスをサポートします。
5ヶ月前
028.1K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

シード拡散 - ByteHopperの最新拡散言語モデル

シード・ディフュージョンは、ByteHopが導入した実験的な拡散言語モデルで、コード生成タスクを処理する。このモデルは、2段階拡散学習、制約付き逐次学習、強化された効率的な並列デコードなどの技術に基づいており、推論速度が2,146トークン/秒と大幅に向上し、...
5ヶ月前
031K
小星绪 - 京东健康推出的AI情绪漫画生成产品

Hoshio - AIエモーションマンガ生成製品、Jingdong Healthが発表

暁星秀は京東保健が発表したAI感情漫画生成製品で、現在テスト段階にある。同製品は感情漫画ストーリー生成を核心機能としており、ユーザーは音声やテキスト入力で感情を表現したり、ストーリーを語ったりすることができ、AIは入力に基づき、マッチした4コマ漫画やストーリー解釈を生成する。
5ヶ月前
031.2K
1688 AI版 - 阿里旗下1688平台推出的AI生意助手

1688 AI Edition - アリ社の1688プラットフォームが開始したAIビジネスアシスタント

1688 AIバージョンはアリババの1688プラットフォームが発表したインテリジェント・ビジネス・アシスタント・アプリケーションで、小規模Bバイヤーと商人向けに設計されている。1688プラットフォームの膨大なデータに基づき、ビジネスチャンスプッシュ、商品推薦、アイデア創出、企業照会などの機能を提供し、ユーザーが市場ダイナミクスを正確に把握し、迅速...
5ヶ月前
043.1K
阶跃深研 - 阶跃星辰推出的AI深入研究工具

ステップス・ディープリサーチ - AIディープリサーチツール by ステップススター

Steps Deep Researchは、Steps Starが発表した効率的なAIリサーチツールで、複雑な問題のリサーチを自律的に完了し、専門的なレポートを短時間で作成することができる。このツールは、金融、コンサルティング、ヘルスケア、法律などの分野向けに設計されており、詳細な検索機能と情報統合機能により、業界レビューで優れた評価を得ている。
5ヶ月前
025.5K
Runway Aleph - Runway推出的全新AI视频编辑模型

Runway Aleph - ランウェイの新しいAIビデオ編集モデル

Runway Alephは、Runwayが発表した先進的なAIビデオ編集モデルで、シンプルなテキストコマンドをベースに、ビデオコンテンツの追加や削除、スタイル変更、環境調整、カメラの動きの最適化などを素早く行うことができる。ユーザーは複雑な操作をすることなく、簡単に冗長な要素を削除し、シーンを変更することができます...
5ヶ月前
034.4K
WebShaper - 阿里通义开源的AI训练数据合成系统

WebShaper - Ali TongyiオープンソースAI学習データ合成システム

WebShaperはアリババのTongyi Labが立ち上げたAIトレーニングデータ合成システムで、形式的モデリングと知能拡張メカニズムに基づいて高品質でスケーラブルなトレーニングデータを生成し、AI知能の複雑な情報検索能力の向上を支援する。このシステムは「知識投影」の概念を導入している。
5ヶ月前
046.9K
Skywork UniPic - 昆仑万维推出的开源多模态统一预训练模型

Skywork UniPic - KunlunWeiによるオープンソースのマルチモーダル統一事前学習モデル

Skywork UniPicは、KunlunWanweiによるオープンソースのマルチモーダル事前学習モデルで、画像理解、テキスト生成画像、画像編集の3つのコア機能を持つ。このモデルは、MARエンコーダとSigLIP2バックボーンを組み込んだ自己回帰アーキテクチャに基づいており、1.5Bのパラメータゲージを持つ。
5ヶ月前
033.8K
通义万相Wan2.2 - 阿里推出的开源AI视频生成模型

Tongyi Wanphase Wan 2.2 - オープンソースのAIビデオ生成モデル、アリが発表

Tongyi Wanphase Wan2.2は、アリババがオープンソース化した先進的なAI動画生成モデルで、総参照数は270億件に上る。このモデルには、テキスト生成ビデオ、グラフ生成ビデオ、統合ビデオ生成の3つのモードがあり、テキストの説明、画像、またはその両方の組み合わせに基づいて高品質のビデオを生成することができます。
5ヶ月前
038.4K
GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - 推論、コード、インテリジェンスのためのスマート・スペクトラム・オープンソースSOTAモデル

GLM-4.5はSmart Spectrum社のオープンソースSOTAモデルで、インテリジェント・ボディ・アプリケーション用に設計され、推論、コード生成、インテリジェント・ボディ機能を組み込んでいます。このモデルはMixed Expert(MoE)アーキテクチャに基づいており、3,550億のパラメータを持つGLM-4.5と1,060億のパラメータを持つGLM-4.5の2つのバージョンがあります。
5ヶ月前
031.5K
Coze Studio - 字节跳动推出的开源AI Agent开发平台

Coze Studio - ByteDanceのオープンソースAIエージェント開発プラットフォーム

Coze Studioは、AIアプリケーションの構築、展開、管理を簡素化するために開発者向けに設計された、ByteDanceのオープンソースAIインテリジェントボディ開発プラットフォームです。Coze Studioは、プロンプト、RAG、プラグインをサポートするワンストップ開発環境を提供します。
5ヶ月前
034.5K
Coze Loop – 字节Coze开源的AI Agent开发与调试平台

Coze Loop - バイトCozeオープンソースAIエージェント開発・デバッグプラットフォーム

Coze Loopは、ByteDance社のCozeプラットフォームのオープンソースAIインテリジェンス開発・運用保守管理プラットフォームです。キューワードエンジニアリング、エージェント効果評価、パフォーマンスモニタリング、チューニングなど、開発、デバッグ、評価、モニタリングに至るまで、完全なライフサイクル管理を開発者に提供します。
5ヶ月前
034.6K