AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - 模範的な指示に従う能力を評価するためのMeeseeksオープンソース評価セット

Meeseeksは、MeituanのM17チームがモデルの指示に従う能力を評価するために使用しているオープンソースの大規模モデル評価セットです。Meeseeksは、モデルがマクロレベルからミクロレベルまでユーザーの指示に厳密に従った回答を生成できるかどうかを総合的に測定するために3段階の評価フレームワークを使用しており、回答内容の知識をプラス評価することはありません...
3日前
04.3K
gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime - OpenAIの最新AIスピーチモデル

gpt-realtimeはOpenAIの高度な音声モデルで、自然で滑らかな音声を生成するための直接音声処理をサポートしています。このモデルは複数の言語とスタイルをサポートし、笑いなどの非言語的な合図を理解し、言語を切り替えることができます。
3日前
04.7K
HunyuanVideo-Foley - 腾讯推出的开源视频音效生成模型

HunyuanVideo-フォーリー - テンセントのオープンソース動画音源生成モデル

HunyuanVideo-Foleyは、TencentのMixed Yuanチームによるオープンソースのビデオサウンド生成モデルで、無音ビデオに正確にマッチした効果音を追加することをサポートします。このモデルは、大規模なデータセットのトレーニングに基づいており、マルチモーダル拡散コンバータアーキテクチャと、アライメント損失関数の表現とオーディオVAE最適化技術を組み合わせています...
4日前
07.9K
MiniCPM-V 4.5 - 面壁智能开源的8B参数多模态模型

MiniCPM-V 4.5 - ファセット・インテリジェント・オープンソース8Bパラメータ・マルチモーダルモデル

MiniCPM-V 4.5は、Qwen3-8BとSigLIP2-400Mをベースに構築された、画像や動画を効率的に処理できるオープンソースのファサードインテリジェンス用8Bパラメトリックマルチモーダルモデルです。ビジュアル・トークンの消費量や処理速度に優れたパフォーマンスを発揮します。
4日前
09.2K
问小白o4 - 问小白推出的并行思考模型,同时开启8条思考路径

Ask o4 - Ask o4が導入した、8つの思考経路を同時に開くパラレル思考モデル

Ask White o4は、8つの思考経路を同時に開き、問題を多角的に分析し、最適解を自動的にフィルタリングする革新的な並列思考モデルです。このモデルには、高度なLong-CoT強化学習とプロセス報酬学習技術が組み込まれており、強力な深層推論機能を持ち、複雑なタスクで優れたパフォーマンスを発揮します。
6日前
08.8K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Qunar Technologiesのオープンソース3Dシーン生成モデル

SpatialGenはQunar Technologyのオープンソース3Dシーン生成モデルであり、拡散モデルアーキテクチャに基づき、テキスト記述、参照画像、3D空間レイアウトに基づいて時空間的に一貫性のあるマルチビュー画像の生成をサポートし、さらに3Dガウスシーンの生成とローミングビデオのレンダリングを行う。
6日前
07.7K
Fun-ASR - 钉钉、通义联合推出的新一代语音识别模型

Fun-ASR - ネイルとTongyiが共同で発表した新世代の音声認識モデル

Fun-ASRはNailとTongyi Labsが共同で発表した音声認識の大型モデルです。このモデルは膨大な音声データで学習され、インターネット、テクノロジー、家庭装飾などの多業種の専門用語を正確に識別することができ、認識精度が大幅に向上している。このモデルは推論最適化のためにNailの企業情報と組み合わされ、ファントム...
7日前
09.8K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - アイデアから創作までの全プロセスを支援するAI小説執筆プラットフォーム

Squiblerは、作家のために設計された強力なAI支援ライティング・プラットフォームで、構想から創作、出版までの全プロセスを支援します。このプラットフォームは、小説、脚本、短編小説などをカバーするさまざまなストーリー・テンプレートを提供します。ユーザーは最初のコンセプトを入力するだけで、AIがアウトライン、キャラクター、シーンを生成します。
7日前
09.1K
91写作 - 开源的AI智能小说创作平台

91Writing - オープンソースAIインテリジェント小説作成プラットフォーム

91Writingは、Vue 3とElement Plusをベースに開発された完全オープンソースのAI小説作成ツールで、GPT、Claude、Geminiなどの様々な高度なAIモデルを統合しています。このツールは、プロジェクトの作成を含む、アイデアからテキストまでの完全な作成ツールチェーンをクリエイターに提供します...
7日前
08.6K
Aivilization - 港科大推出的多Agent社会模拟平台

Aivilization - HKUSTが立ち上げたマルチエージェント社会シミュレーションプラットフォーム

Aivilizationは、香港科学技術大学が開発した世界初のAI多知能体社会シミュレーション・プラットフォームである。ユーザーが何千ものAI知能を作成・誘導し、未来の人間とAI共存の社会進化を観察できるビジュアルデジタルサンドボックスを構築する。このプラットフォームがサポートするのは...
7日前
012.2K
弱人工智能(Narrow AI)是什么,一文看懂

弱小AI(ナローAI)とは何か?

弱い人工知能(Narrow AI)は現在、現実世界におけるAI技術開発の主流である。弱いAIは、特定の、明確に定義されたタスクを、その特定の領域において人間を凌駕するかもしれない知能レベルで実行するように設計され、訓練される。
7日前
04.6K
Grok 2.5 - 马斯克旗下xAI开源的人工智能模型

Grok 2.5 - マスクのxAIオープンソースAIモデル

Grok 2.5は、イーロン・マスクのxAIによるオープンソースのAIモデルである。2,690億のパラメータを持ち、強力なパフォーマンスと推論のためのMixed Expertise(MoE)アーキテクチャに基づいています。このモデルは、大学院レベルの科学知識(GPQA)、汎用知識(MMLU、MM...
7日前
010.1K
MIT最新报告《生成式AI鸿沟:2025年商业人工智能现状》

MITの新しいレポート『The Generative AI Divide: The State of Business AI in 2025』。

MITの最新レポート『The Generative AI Divide: The State of Business AI in 2025』は、300を超えるAIプロジェクトに関する詳細な調査、52の組織へのインタビュー、153人の経営幹部へのアンケート調査を実施することで、企業が経験しているジェネレーティブAI(GenAI)導入プロセスの核心を明らかにしている。
1週間前
016.1K
AutoClip - 开源的AI视频切片工具,一键生成专题视频合集

AutoClip - ワンクリックでテーマ別のビデオコレクションを生成するオープンソースの AI ビデオスライスツール!

AutoClipは、自動化されたビデオ処理の完全なプロセスを達成するために高度なAI技術に基づいて、オープンソースのAIビデオ編集ツールです。ツールは自動的にビデオのハイライトを識別することができ、貴重なコンテンツの正確な抽出は、コンテンツのコレクションを生成するために、インテリジェントなクラスタリングのテーマの類似性に基づいて行うことができます。
1週間前
011.5K
《动手学AI:人工智能通识与实践》 - 阿里云推出的免费AI通识课程

ハンズオンAI:人工知能の一般知識と実践 - AliCloudによる無料のAI一般知識コース

AliCloudの "Hands-On Learning AI: Artificial Intelligence General Knowledge and Practice "は、Superstar Erlangと共同で、様々な専門的背景を持つ学習者のための体系的なAI学習コースです。このコースは、5つの一流大学のマスター教師が指導し、AIの発展の歴史、コア技術から倫理的安全性まで、総合的な知識を身につけることができます。
1週間前
07.1K
Seed-OSS - 字节跳动团队开源的全新AI模型

Seed-OSS - Wordpressチームがオープンソース化した新しいAIモデル

Seed-OSSは、Byte Jump Seedチームによってオープンソース化された大規模な言語モデルのファミリーで、長いテキストと推論タスクに焦点を当てています。Seed-OSSは、複雑な論理的推論や多段階推論で高い精度を発揮し、難しい問題を効率的に解くことができます。Seed-OSSは、最大512Kまでの長いテキストコンテキストをサポートしています。
1週間前
012K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Shanghai AI Labによるオープンソースの軽量科学的マルチモーダルモデル

Intern-S1-miniは、上海人工知能研究所(SAL)が発表したパラメータスケール8Bの軽量科学用マルチモーダル・マクロモデルである。Intern-S1の強力な機能を継承し、汎用的な機能と特殊な科学的機能の両方を兼ね備えており、迅速な展開や二次開発に適している。性能面では、I...
1週間前
011.1K
人工智能 AI(Artificial Intelligence)是什么,一文看懂

人工知能 AI(人工知能)とは何か?

人工知能(AI)とは、人間の知能をシミュレートし、拡張し、さらにはそれを凌駕するような理論的・技術的システムを構築することを目的とするコンピューター科学の中核的な一分野である。
7日前
09.1K
Nano Banana - 谷歌推出的AI图像编辑模型

ナノ・バナナ - GoogleのAI画像編集モデル

ナノ・バナナは、ジェミニ2.5フラッシュイメージのコードネームです。ジェミニは、Googleが提供するAI画像生成・編集モデルで、シンプルなテキストプロンプトに基づいて詳細で写実的な画像を生成し、既存の画像に高品質な修正を加えます。
5日前
020.9K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - Ali Tongyi オープンソース画像編集モデル

Qwen-Image-Editは、Ali Tongyiによって導入された、200億のパラメータを持つQwen-Imageアーキテクチャ上に構築された、万能画像編集モデルです。このモデルはセマンティック編集と外観編集の両方の機能を兼ね備えており、画像に対して低レベルの視覚的外観編集を行うことができます(例:追加、削除...
2週間前
011.2K
MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - 崑崙微の最新音声生成フレームワーク

MoE-TTSは、KunlunWanweiによって導入された音声合成フレームワークで、事前に訓練された大規模言語モデル(LLM)と音声専門家モジュールを組み合わせたMixed Expert(MoE)アーキテクチャに基づいています。MoE-TTSは、テキストモジュールのパラメータを凍結し、音声モジュールのパラメータのみを更新することにより、強力なテキスト推論を保持します...
2週間前
013.7K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - Jiyuanのオープンソース汎用ロボットプラットフォーム、Beihangなどと共同開発

Genie Envisioner(GE)は、Genie Roboticsチームがシンガポール国立大学、北京航空航天大学などと共同で開発したロボット操作のための統合プラットフォーム。まず想像し、それから行動する」ことで、ロボットがタスクをよりよく理解し、実行することを可能にする。
2週間前
012.9K
DINOv3 - Meta AI推出的新一代自监督视觉基础模型

DINOv3 - Meta AIの次世代自己教師付き視覚ベースモデル

DINOv3は、Meta AIが開発した次世代の自己教師付き視覚ベースモデルであり、自己教師付き学習パラダイムを使用して、ラベル付けデータなしで画像の特徴を学習する。データ準備の改善とGramアンカリングの導入により、特徴量の劣化問題を解決し、汎化能力を向上させている。
2週間前
017.2K
Hunyuan-GameCraft - 腾讯混元开源的下一代游戏交互式视频生成框架

Hunyuan-GameCraft - Tencent Hunyuanのオープンソースフレームワーク。

Hunyuan-GameCraftはTencent Hunyuanチームのオープンソースインタラクティブゲームビデオ生成フレームワークです。1枚の画像とプロンプトから、非常にダイナミックなゲームビデオを生成するフレームワークで、キーボードとマウスを使ってリアルタイムでビデオコンテンツを制御するユーザーをサポートします。
2週間前
014.5K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - オープンソースの効率的なマルチモーダルモデリング by KunlunWanwei

Skywork UniPic 2.0は、Quintessenceによってオープンソース化された効率的なマルチモーダルモデルであり、画像生成、編集、理解に焦点を当てている。このモデルは、2BパラメータのSD3.5-Mediumアーキテクチャに基づいており、事前学習、漸進的なデュアルタスク強化戦略、共同学習によって実現される。
3週間前
014.3K
RynnRCP - 阿里达摩院推出的首个开源机器人上下文协议

RynnRCP - アリ・ダルマ研究所による初のオープンソース・ロボティクス・コンテキスト・プロトコル

RynnRCPは、Ali Dharma Instituteによるオープンソースのロボットコンテキストプロトコル(RCP)であり、身体化された知能の開発の敷居を下げ、開発プロセス全体を開放します。RynnRCPは、RCPフレームワークとRobotMotionモジュールで構成されています。RCPフレームワークは、能力の抽象化とマルチプロトコルのサポートを通じて、...
3週間前
013.4K
RynnEC - 阿里达摩院开源的世界理解模型

RynnEC - アリ・ダルマ・インスティテュートのオープンソース世界理解モデル

RynnECはAlibaba Dharma Instituteが導入した世界理解モデルで、具現化知能タスクに焦点を当てている。このモデルは、映像データと自然言語を組み合わせたマルチモーダル融合技術に基づいており、シーン内のオブジェクトを多次元から解析し、オブジェクトの理解、空間認識、映像ターゲットのセグメンテーションなどの機能をサポートする。
3週間前
013.8K
Matrix-3D - 昆仑万维开源的3D世界生成框架

Matrix-3D - 崑崙ワールドワイドオープンソース3D世界生成フレームワーク

Matrix-3Dは、Skywork AIチームによるオープンソースのフレームワークで、探索可能なパノラマ3D世界の生成に特化している。このフレームワークは、パノラマビデオ生成と3D再構成技術を組み合わせて、1枚の画像やテキストプロンプトから高品質で全方位探索可能な3D世界を生成します。
3週間前
012K
GLM-4.5V - 智谱推出的多模态开源视觉推理模型

GLM-4.5V - Smart Spectrumによるマルチモーダル・オープンソース視覚推論モデル

GLM-4.5Vは、Smart Spectrumによって導入された世界有数のオープンソース視覚推論モデルであり、1060億の総パラメータと120億の活性化パラメータを持つ。このモデルは、新世代のテキストベースモデルGLM-4.5-Airをベースに学習され、強力な視覚理解・推論能力を持ち、画像、動画...
3週間前
013.8K
Matrix-Game 2.0 - 昆仑万维开源自研的交互式世界模型

マトリックスゲーム2.0 - KunlunWeiによって開発されたインタラクティブな世界モデル

Matrix-Game 2.0は、Kunlun SkyWork AIがリリースした自社開発のインタラクティブワールドモデルです。Matrix-Game 2.0は、業界初のオープンソース、リアルタイム、長シーケンスの汎用シナリオ用インタラクティブ生成モデルであり、複数のシナリオを25FPSで動作させることができる。
3週間前
013.9K
Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash - Tongyi Chien-quanによる高性能、低コストの言語モデル

Qwen-Flashは、アリババ「同義千問」シリーズに導入された高性能・低価格の言語モデルで、高速レスポンスとシンプルなタスクの効率的な処理のために設計されています。高度なMoE(Mixture-of-Experts)アーキテクチャに基づき、スパースエキスパートネットワークによって実現されています。
3週間前
09.8K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - 崑崙王維の音声駆動型デジタル人間創造ツール

SkyReels-A3は、崑崙ワールドワイドグループが開発した音声駆動型デジタルヒューマンクリエーションツールです。SkyReels-A3は、音声駆動型デジタル人体作成ツールで、簡単な入力(例:肖像画像と音声)で高品質の動的ビデオコンテンツを生成したり、静止画を「生き生きと」させたり、既存のビデオのセリフを新しいリップシンクに置き換えてキャラクターが自動的に合わせることができます...
3週間前
010.4K
MiniMax Speech 2.5 - MiniMax推出的语音生成模型

MiniMax Speech 2.5 - MiniMaxの音声生成モデル

MiniMax Speech 2.5は、MiniMaxチームによって開発された高度な音声生成モデルです。音声合成の分野において、特に多言語の表現力、音色の再現精度、言語カバー率の点で大きな進歩を遂げています。このモデルは40の言語をサポートしています。
3週間前
013.9K
Genie 3 - 谷歌推出的通用世界模型

ジーニー3 - グーグルのユニバーサル世界モデル

Genie 3は、Google DeepMindが提供する新世代のユニバーサルワールドモデルで、高度にダイナミックで一貫性のある仮想世界をリアルタイムで生成することができます。Genie 3は、物理現象や自然生態系をシミュレートし、ファンタジーや歴史的なシナリオの作成をサポートします。テキストプロンプトにより、ユーザーは...
4週間前
011.4K
Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - Anthropicの最強プログラミングモデル

Claude Opus 4.1は、複雑なタスクを効率的に処理するために設計された、Anthropicによる最先端の大規模言語モデルです。このモデルはプログラミング領域で優れており、高品質のコードを生成し、最大32kの単一出力をサポートし、幅広いプログラミングスタイルに適応します。
4週間前
011.8K
AudioGen-Omni - 快手推出的多模态音频生成模型

AudioGen-Omni - Racerのマルチモーダル音声生成モデル

AudioGen-Omniは、Racerのマルチモーダルオーディオ生成モデルで、ビデオやテキストなどの入力に基づいて高品質のオーディオ、スピーチ、歌を生成します。AudioGen-Omniは、マルチモーダル拡散トランスフォーマーや位相整合トランスフォーマーなどの高度な技術に基づいています。
4週間前
010.1K
LangExtract - 谷歌开源的Python库,提取结构化信息

LangExtract - 構造化情報を抽出するためのGoogleのオープンソースPythonライブラリ

LangExtractは、大規模言語モデル(LLM)を使用して、構造化されていないテキストから構造化された情報を抽出するGoogleオープンソースのPythonライブラリです。ユーザー定義のコマンドと少ないサンプル数で、...からの臨床メモのような重要な詳細を効率的に識別し、整理することができます。
4週間前
012.7K
Qwen-Image - 通义千问推出开源的文生图基础模型

Qwen-Image - Tongyi Qianqian、Qwen-Imageのオープンソース基本モデルを発表

Qwen-Imageは、Alibaba Tongyi Qianqianチームによってリリースされたオープンソースの画像生成ベースモデルです。200億のパラメータを持ち、マルチモーダル理解、高解像度コーディング、拡散モデリングの3つのモジュールを組み込んだマルチモーダル拡散変換アーキテクチャ(MMDiT)を採用しています。
4週間前
010.4K
RedOne - 小红书最新推出的社交大模型

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。
4週間前
011.1K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Qunar Technologyによる3Dガウス・セマンティック・データセット

InteriorGSは、Qunar Technologyによって導入された高品質の3Dガウス意味データセットである。このデータセットには、住宅、コンビニエンスストア、結婚式場、美術館など80以上の屋内環境をカバーする1,000の3Dシーンが含まれている。このデータセットには、755のカテゴリに分類された554,000以上のオブジェクトインスタンスが含まれている。
4週間前
09.5K
ScreenCoder – 开源的UI截图生成前端代码工具

ScreenCoder - オープンソースUIスクリーンショット生成フロントエンドコードツール

ScreenCoderは、UIデザインのスクリーンショットを高品質のHTML/CSSコードに素早く変換できるオープンソースのスマートツールです。モジュラー・マルチ・インテリジェンス・アーキテクチャをベースに、ビジュアル理解、レイアウト・プランニング、コード合成技術を組み合わせたツールで、高精度でセマンティックなフロントエンド・コードの生成をサポートします。
4週間前
011K
Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - GoogleのAI推論モデル

Gemini 2.5 Deep Thinkは、複雑なタスクを解決するために設計されたGoogleのAI推論モデルである。国際数学オリンピック(IMO)2025で金メダルを獲得したモデルの亜種であり、並列推論によって複雑なタスクを解くように設計されている。
4週間前
09.1K
MindLink - 昆仑万维推出的开源推理大模型

MindLink - KunlunWeiのオープンソース推論ビッグモデル

MindLinkは崑崙ワールドワイドウェブによって起動されたオープンソースの推論の大規模なモデルです。適応推論機構を使用すると、タスクの複雑さに応じて柔軟に推論モードを切り替えることができ、単純なタスクが迅速に生成され、複雑なタスクの詳細な推論、アカウントに効率と精度を取る。計画駆動型の推論のパラダイムは、 "考える "タグを削除するには、減らす...
4週間前
010.2K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - Ali Tongyi氏によるオープンソースの高性能プログラミングモデル

Qwen3-Coder-Flashは、Ali Tongyi Thousand Questionsチームによって導入された高性能プログラミングモデルであり、優れたエージェントベースプログラミングとツール呼び出し機能を持ち、複雑なプログラミングタスクを処理するのに適している。Qwen3-Coder-Flashは、256Kトークンの長い文脈理解をサポートし、1Mトーク...
1ヶ月前
010.7K
Wide Research - Manus平台推出的多智能体协同功能

ワイドリサーチ - マヌスプラットフォームにマルチインテリジェンス・コラボレーションを導入

ワイドリサーチは、複雑で大規模なタスクを処理するために設計されたManusプラットフォームの強力な機能です。このプラットフォームは、システムレベルの並列処理メカニズムとインテリジェンスコラボレーションプロトコルによって、同時に動作する数百の汎用インテリジェンスをサポートします。
1ヶ月前
010.1K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

シード拡散 - ByteHopperの最新拡散言語モデル

シード・ディフュージョンは、ByteHopが導入した実験的な拡散言語モデルで、コード生成タスクを処理する。このモデルは、2段階拡散学習、制約付き逐次学習、強化された効率的な並列デコードなどの技術に基づいており、推論速度が2,146トークン/秒と大幅に向上し、...
1ヶ月前
011.4K
小星绪 - 京东健康推出的AI情绪漫画生成产品

Hoshio - AIエモーションマンガ生成製品、Jingdong Healthが発表

暁星秀は京東保健が発表したAI感情漫画生成製品で、現在テスト段階にある。同製品は感情漫画ストーリー生成を核心機能としており、ユーザーは音声やテキスト入力で感情を表現したり、ストーリーを語ったりすることができ、AIは入力に基づき、マッチした4コマ漫画やストーリー解釈を生成する。
1ヶ月前
09.7K
1688 AI版 - 阿里旗下1688平台推出的AI生意助手

1688 AI Edition - アリ社の1688プラットフォームが開始したAIビジネスアシスタント

1688 AIバージョンはアリババの1688プラットフォームが発表したインテリジェント・ビジネス・アシスタント・アプリケーションで、小規模Bバイヤーと商人向けに設計されている。1688プラットフォームの膨大なデータに基づき、ビジネスチャンスプッシュ、商品推薦、アイデア創出、企業照会などの機能を提供し、ユーザーが市場ダイナミクスを正確に把握し、迅速...
1ヶ月前
09.8K
阶跃深研 - 阶跃星辰推出的AI深入研究工具

ステップス・ディープリサーチ - AIディープリサーチツール by ステップススター

Steps Deep Researchは、Steps Starが発表した効率的なAIリサーチツールで、複雑な問題のリサーチを自律的に完了し、専門的なレポートを短時間で作成することができる。このツールは、金融、コンサルティング、ヘルスケア、法律などの分野向けに設計されており、詳細な検索機能と情報統合機能により、業界レビューで優れた評価を得ている。
4週間前
09.4K
Runway Aleph - Runway推出的全新AI视频编辑模型

Runway Aleph - ランウェイの新しいAIビデオ編集モデル

Runway Alephは、Runwayが発表した先進的なAIビデオ編集モデルで、シンプルなテキストコマンドをベースに、ビデオコンテンツの追加や削除、スタイル変更、環境調整、カメラの動きの最適化などを素早く行うことができる。ユーザーは複雑な操作をすることなく、簡単に冗長な要素を削除し、シーンを変更することができます...
1ヶ月前
011.3K
WebShaper - 阿里通义开源的AI训练数据合成系统

WebShaper - Ali TongyiオープンソースAI学習データ合成システム

WebShaperはアリババのTongyi Labが立ち上げたAIトレーニングデータ合成システムで、形式的モデリングと知能拡張メカニズムに基づいて高品質でスケーラブルなトレーニングデータを生成し、AI知能の複雑な情報検索能力の向上を支援する。このシステムは「知識投影」の概念を導入している。
1ヶ月前
011K
Skywork UniPic - 昆仑万维推出的开源多模态统一预训练模型

Skywork UniPic - KunlunWeiによるオープンソースのマルチモーダル統一事前学習モデル

Skywork UniPicは、KunlunWanweiによるオープンソースのマルチモーダル事前学習モデルで、画像理解、テキスト生成画像、画像編集の3つのコア機能を持つ。このモデルは、MARエンコーダとSigLIP2バックボーンを組み込んだ自己回帰アーキテクチャに基づいており、1.5Bのパラメータゲージを持つ。
1ヶ月前
011.3K
通义万相Wan2.2 - 阿里推出的开源AI视频生成模型

Tongyi Wanphase Wan 2.2 - オープンソースのAIビデオ生成モデル、アリが発表

Tongyi Wanphase Wan2.2は、アリババがオープンソース化した先進的なAI動画生成モデルで、総参照数は270億件に上る。このモデルには、テキスト生成ビデオ、グラフ生成ビデオ、統合ビデオ生成の3つのモードがあり、テキストの説明、画像、またはその両方の組み合わせに基づいて高品質のビデオを生成することができます。
1ヶ月前
013.5K
GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - 推論、コード、インテリジェンスのためのスマート・スペクトラム・オープンソースSOTAモデル

GLM-4.5はSmart Spectrum社のオープンソースSOTAモデルで、インテリジェント・ボディ・アプリケーション用に設計され、推論、コード生成、インテリジェント・ボディ機能を組み込んでいます。このモデルはMixed Expert(MoE)アーキテクチャに基づいており、3,550億のパラメータを持つGLM-4.5と1,060億のパラメータを持つGLM-4.5の2つのバージョンがあります。
1ヶ月前
011.7K
Coze Studio - 字节跳动推出的开源AI Agent开发平台

Coze Studio - ByteDanceのオープンソースAIエージェント開発プラットフォーム

Coze Studioは、AIアプリケーションの構築、展開、管理を簡素化するために開発者向けに設計された、ByteDanceのオープンソースAIインテリジェントボディ開発プラットフォームです。Coze Studioは、プロンプト、RAG、プラグインをサポートするワンストップ開発環境を提供します。
1ヶ月前
012.5K
Coze Loop – 字节Coze开源的AI Agent开发与调试平台

Coze Loop - バイトCozeオープンソースAIエージェント開発・デバッグプラットフォーム

Coze Loopは、ByteDance社のCozeプラットフォームのオープンソースAIインテリジェンス開発・運用保守管理プラットフォームです。キューワードエンジニアリング、エージェント効果評価、パフォーマンスモニタリング、チューニングなど、開発、デバッグ、評価、モニタリングに至るまで、完全なライフサイクル管理を開発者に提供します。
1ヶ月前
012.2K
悟能 - 商汤科技最新推出的具身智能平台

Wuneng - Shangtang Technologyの最新ボディ・インテリジェンス・プラットフォーム

Wunengはロボットとスマートデバイスのために設計された体現知能プラットフォームである。悟り」の世界モデルとマルチモーダルビッグモデル技術に基づき、Wunengは視覚、音声、触覚などのマルチセンサー入力を統合し、強力な知覚、意思決定、行動能力を備えている。
1ヶ月前
010.8K
Intern-S1 - 上海AI Lab开源的科学多模态大模型

Intern-S1 - 上海AIラボによるオープンソースの科学的マルチモーダル・マクロモデル

Intern-S1は、上海人工知能研究所が発表した科学的マルチモーダルグランドモデルである。このモデルは言語能力とマルチモーダル能力を深く統合しており、クロスモーダル科学構文解析、言語と視覚の融合、科学データ処理、科学的質問応答、実験設計、最適化などの強力な機能を備えている。
1ヶ月前
011.1K
混元3D世界模型 1.0 - 腾讯推出的开源3D世界生成模型

ハイブリッド3Dワールドモデル 1.0 - Tencentのオープンソース3Dワールド生成モデル

Hunyuan3D世界モデル1.0(Hunyuan World 1.0)は、Tencentのオープンソース業界初の没入型ローミング、インタラクティブ、シミュレーション世界生成モデルです。このモデルは、パノラマ視覚生成と階層的な3D再構成技術を統合し、テキストや画像の入力をサポートして、36...
1ヶ月前
011K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - 金融推論のためのビッグモデル by Anthem Digital

Agentar-Fin-R1は、Anthem社によって導入された金融領域向けの最先端の大規模言語モデルである。強力なQwen3アーキテクチャに基づいて開発されたこのモデルは、8Bと32Bの2つのパラメータスケールバージョンを提供し、多段階分析、リスク評価、戦争などの複雑な金融推論タスクを正確に処理することができます。
1ヶ月前
010.1K
MonkeyCode - 开源的企业级AI编程助手

MonkeyCode - オープンソースのエンタープライズAIプログラミングアシスタント

MonkeyCodeは、プライバシーとセキュリティを重視する開発チームのために設計された、オープンソースのエンタープライズグレードのネイティブAIプログラミングアシスタントです。MonkeyCodeは、コードデータのセキュリティを確保するために、プライベートデプロイとオフラインでの使用をサポートしています。MonkeyCodeは、コードデータのセキュリティを確保するために、プライベートデプロイとオフラインでの使用をサポートしています...
1ヶ月前
011.1K
ChatFlow - 开源AI工作流自动化工具

ChatFlow - オープンソースのAIワークフロー自動化ツール

ChatFlowはオープンソースのAIワークフロー自動化ツールで、複雑な要件を効率的なワークフローに変換することをサポートします。コードフレームワークやテストケースを素早く生成し、ソフトウェアアーキテクチャの記述や設計を支援するAI技術をベースとしたツールです。
1ヶ月前
010.8K