最新のAIリソース

共 3143 篇文章

コース情報最新のAIリソース AI知識ベース AIニュース

順番に並べる

目を通すブックマーク

Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - Googleが提供するAIバーチャルフィッティングアプリ

DopplはGoogleが提供するAIバーチャルフィッティングアプリだ。ユーザーが全身写真をアップロードした後、このアプリは自分の体のデジタル版で服の写真やスクリーンショットを「着る」ことをサポートし、静止画からAIが生成した動画に変換することができるため、ユーザーは服が体に与える影響をより実感することができる。

最新のAIリソース

1年前

062.2K

悟能 - 商汤科技最新推出的具身智能平台

Wuneng - Shangtang Technologyの最新ボディ・インテリジェンス・プラットフォーム

Wunengはロボットとスマートデバイスのために設計された体現知能プラットフォームである。悟り」の世界モデルとマルチモーダルビッグモデル技術に基づき、Wunengは視覚、音声、触覚などのマルチセンサー入力を統合し、強力な知覚、意思決定、行動能力を備えている。

最新のAIリソース

1年前

062.1K

MinerU2.5 - 上海AI Lab联合北大开源的文档解析模型

MinerU2.5 - 上海AI研究所と北京大学のオープンソース文書解析モデル

MinerU2.5は、上海人工知能研究所と北京大学のチームによって共同開発された、高解像度の文書画像解析を効率的に処理することを主眼とした非連成視覚言語モデルである。核となる革新的な点は、「大局的なレイアウト検出と局所的な内容認識」という2段階の設計にある。

最新のAIリソース

9ヶ月前

062.1K

FireRed-Image-Edit - 小红书团队开源的通用图像编辑模型

FireRed-Image-Edit - 小红书团队开源的通用图像编辑模型

FireRed-Image-Edit 是小红书 Super Intelligence 团队开源的通用图像编辑模型，基于扩散 Transformer 架构，在 GEdit、ImgEdit 等多个权威评测...

最新のAIリソース

5ヶ月前

062.1K

EmbodiChain - 跨维智能推出的开源具身智能开发平台

EmbodiChain - 跨维智能推出的开源具身智能开发平台

EmbodiChain是跨维智能推出的开源具身智能开发平台，专注于解决具身智能模型训练中数据稀缺的问题。通过数据引擎实现大规模场景相关数据生成、Real2Sim 数据轨迹映射和多模态数据扩增，从根本上...

最新のAIリソース

6ヶ月前

062.1K

Molmo 2 - Ai2开源的多模态视频图像理解模型系列

Molmo 2 - Ai2オープンソース・マルチモーダル動画像理解モデルファミリー

Molmo 2は、Allen Institute for AI (Ai2)によって公開されたオープンソースのマルチモーダルモデルで、ビデオやマルチイメージの理解を向上させる。Molmo 2 (8B)、Molmo 2 (4B)、Molmo 2-O...の3種類があります。

最新のAIリソース

8ヶ月前

062K

Step-Audio 2 mini - 阶跃星辰开源的语音大模型

Step-Audio 2 mini - Step-Star オープンソース音声マクロモデリング

Step-Audio 2 miniは、Step-Audioによるオープンソースのエンドツーエンド音声マクロモデルです。従来の音声モデル構造を打破し、真のエンド・ツー・エンド・マルチモーダルアーキテクチャを採用しており、生の音声入力をより低遅延で音声応答出力に直接変換し、パラ言語情報と非音声信号を理解します。

最新のAIリソース

11ヶ月前

062K

EXAONE 4.0 - LG推出的混合推理模型

EXAONE 4.0 - LGのハイブリッド推論モデル

EXAONE4.0は、韓国LG AI Research社のハイブリッド推論グランドモデルで、汎用自然言語処理と高度な推論機能を融合している。韓国語、英語、スペイン語をサポートし、32Bのプロフェッショナル版と1.2Bのエンドサイド版に分かれています。プロフェッショナル・バージョンは、法律、会計...

最新のAIリソース

1年前

062K

OpenAI《在AI时代保持领先》PDF指南 - 附下载链接

OpenAIの「AI時代を先取りするためのPDFガイド」 - ダウンロードリンク付き

AIの時代に先んじる」は、ビジネスリーダーがAIの時代において競争力を維持するためのOpenAIのAIリーダーシップガイドである。このガイドでは、AIの急速な成長を指摘し、より速いモデルリリース、より低いコスト、より速い企業導入...

最新のAIリソースコース情報

11ヶ月前

061.9K

DeepSeek-R1 - DeepSeek推出的AI推理模型，性能对齐 OpenAI o1 正式版

DeepSeek-R1 - DeepSeekのAI推論モデル。

DeepSeek-R1は、杭州を拠点とするDeepSeekが発表した高性能AI推論モデルで、OpenAIのo1正式版に対するベンチマークである。このモデルは、大規模な強化学習技術に基づいて事後学習されており、数学、コード、自然言語で推論を行うために必要なラベル付きデータはごくわずかである。

最新のAIリソース

1年前

061.8K

Tencent-HY-MT1.5 - 腾讯混元开源的翻译模型系列

Tencent-HY-MT1.5 - テンセントハイブリッドオープンソース翻訳モデルシリーズ

Tencent-HY-MT1.5はTencentハイブリッドオープンソース翻訳モデルバージョン1.5であり、1.8Bと7Bの2つのモデルを含み、33の国際言語と5種類の中国語および中国語/方言翻訳をサポートしています。

最新のAIリソース

7ヶ月前

061.8K

Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1-アリが発表したマルチモーダル統一AIモデル

Ovis-U1は、アリババグループのOvisチームによって導入されたマルチモーダル統一モデルで、パラメータ規模は30億である。このモデルは、マルチモーダル理解、テキストから画像への生成、画像編集の3つのコア機能を持ち、先進的なアーキテクチャ設計と協調的かつ統一的なトレーニングメソッドにより、忠実度の高い画像の実現をサポートする。

最新のAIリソース

1年前

061.8K

全球首个量子 AI 模型问世！SECQAI 发布 QLLM 即将进入 Beta 测试

世界初の量子AIモデル！SECQAIがQLLMをベータテスト公開！

英国を拠点とする超セキュアなハードウェア・ソフトウェア企業SECQAI社は、量子コンピューティング技術を従来のAIモデルに統合し、計算効率と問題解決能力を向上させる世界初の量子大規模言語モデル（QLLM）を発表した。量子力学＋AI＝より強力なAI？

最新のAIリソース

1年前

061.7K

Step-GUI - 阶跃星辰开源的AI Agent系列模型

Step-GUI - ステップスターオープンソースAIエージェントシリーズモデル

Step-GUIはStep-StarのオープンソースAIエージェントシリーズで、クラウドモデルStep-GUI、GUIエージェントのための最初のMCPプロトコル、携帯電話の展開をサポートする業界初のオープンソースエンドサイドモデルStep-GUI Edgeを含みます。

最新のAIリソース

7ヶ月前

061.7K

OpenScreen - 开源免费的屏幕录制工具，支持Mac和Windows双系统

OpenScreen - Mac と Windows 用のオープンソースのフリーのスクリーン録画ツール。

OpenScreenは、Screen Studioに代わる使いやすく機能的なオープンソースの無料画面録画ツールです。MacとWindowsの両方をサポートし、完全にフリーで、MITプロトコルに従っています。

最新のAIリソース

8ヶ月前

061.5K

AnimaTensor - 吐司AI等机构推出的二次元图像生成模型

AnimaTensor - Toast AI などによる二次画像生成モデル

AnimaTensorは、CagliostroLabチームがTensorArtと共同で開発した2次画像生成モデルで、画像生成プロセスの「速度」を予測することでノイズスケジューリングを最適化する革新的なV-予測技術に基づいています。

最新のAIリソース

1年前

061.5K

Klic Studio - AI音视频翻译配音工具，一键部署全流程

Klic Studio - AI音声・動画翻訳・ダビングツール、全プロセスをワンクリックで展開

Klic Studio（旧クリリンAI）は、動画クリエイターやコンテンツエクスポーターのために設計されたAIベースの動画翻訳、ダビング、ボイスクローンツールです。ワンクリックで動画をダウンロードから出力まで完了させることができます。

最新のAIリソース

1年前

061.4K

ChartAI - AI数据分析工具，智能推荐适合的图表类型

ChartAI - 適切なチャートタイプをインテリジェントに推奨するAIデータ分析ツール

ChartAIは、AI技術に基づいてデータを自動的に分析し、複雑な情報を素早く理解できる直感的なチャートを生成する効率的なデータ可視化ツールです。ChartAIは、さまざまなデータ形式（Excel、CSVなど）のインポートをサポートし、最適なチャートをインテリジェントに推薦します。

最新のAIリソース

1年前

061.4K

AudioFly - 科大讯飞开源的文本生成音效AI模型

AudioFly - KU Xunfeiオープンソーステキスト生成サウンドAIモデル

AudioFlyは、KDDIが開発したテキストから効果音を生成するオープンソースのAIモデルです。AudioSet、AudioCaps、TUTなどの公開データセットと内部データセットを含む、大規模で多様な音声テキストデータセットで学習させた、10億個のパラメータを持つ潜在拡散モデルアーキテクチャに基づいています。

最新のAIリソース

10ヶ月前

061.4K

商汤如影 - 商汤科技推出的AI数字人视频制作平台

Shangtang Ruyi - Shangtang Technologyが立ち上げたAIデジタルヒューマンビデオ制作プラットフォーム

Shangtang Ruyingは、Shangtang Technologyが発表したAIデジタル人体映像制作プラットフォームである。ビッグモデル技術に基づき、顔の特徴、服装、髪型など、非常にリアルなデジタル人体イメージの作成とパーソナライズをサポートする。このプラットフォームは、サウンドクローン、ビデオ生成、自動データ注釈、リアルタイムインタラクションなどの機能を備えている。

最新のAIリソース

1年前

061.4K

Paper2Slides - 香港大学开源的学术论文转为幻灯片AI工具

Paper2Slides - 香港大学のオープンソース学術論文をスライドに変換するAIツール

Paper2Slidesは、香港大学のData Intelligence LaboratoryによるオープンソースのAIツールで、学術論文をワンクリックでプロフェッショナルなスライドやポスターに変換する。RAG (Retrieval Augmented Generation)技術を使用し、ネットワーク情報に依存するのではなく、ドキュメントの内容を直接解析することで、生成されるPPTが元のPPTと高い整合性を持つようにします。

最新のAIリソース

8ヶ月前

061.3K

优雅YOYA - 中科闻歌推出的AI音视频内容创作平台

エレガントなYOYA - AIオーディオ/ビデオコンテンツクリエーションプラットフォームは、ZTE Winkoによって開始された

Elegant YOYAはZhongke Wengeが立ち上げたマルチモーダルリテラティブビデオプラットフォームであり、AIマルチモーダル技術に基づいて、ビデオコンテンツ作成の全チェーンを強化する。ユーザーはテーマ要件を入力するだけで、プラットフォームはスクリプト、画像、動画を迅速に生成し、インテリジェント編集、音声合成、キャラクター口駆動などの操作を完了することができ、出力...

最新のAIリソース

1年前

061.3K

FineVision - Hugging Face推出的开源视觉语言数据集

FineVision - Hugging Faceがオープンソースの視覚言語データセットを発表

FineVisionは、高度な視覚言語モデルをトレーニングするためのHugging Faceのオープンソースの視覚言語データセットです。1,730万枚の画像、2,430万個のサンプル、8,890万ラウンドの対話、95億個のアンサートークンが含まれています。このデータセットは...

最新のAIリソース

11ヶ月前

061.3K

json-render - Vercel Labs开源的AI生成UI的工具

json-render - Vercel Labs开源的AI生成UI的工具

json-render是Vercel Labs开源的AI生成UI的工具，通过“AI → JSON → UI”的流程实现结构化、可控的界面生成。要求AI仅输出符合预定义Schema的JSON数据，前端再...

最新のAIリソース

6ヶ月前

061.2K

Gemini 2.5 Flash Image - 谷歌推出的最强图像生成与编辑模型

Gemini 2.5 Flash Image - Googleによる最も強力な画像生成・編集モデル

ジェミニ2.5フラッシュイメージ（コードネームnano banana）は、Googleが提供する最先端の画像生成・編集モデルであり、シーン間の文字の一貫性を維持し、背景をぼかしたり、汚れを除去したりといった自然言語による精密な画像編集をサポートする。

最新のAIリソース

11ヶ月前

061.2K

DeepSeek-OCR 2 - DeepSeek团队开源的新一代OCR模型

DeepSeek-OCR 2 - DeepSeek团队开源的新一代OCR模型

DeepSeek-OCR 2是DeepSeek团队开源的新一代OCR模型，核心创新在于采用DeepEncoder V2架构，将传统固定栅格扫描的视觉编码方式升级为基于语义推理的动态处理。模型通过因果流...

最新のAIリソース

6ヶ月前

061.1K

DragonV2.1 - 微软推出的零样本语音合成模型

DragonV2.1 - マイクロソフトのゼロサンプル音声合成モデル

DragonV2.1は、マイクロソフト社の先進的なゼロサンプル音声合成（TTS）モデルです。Transformerアーキテクチャをベースとしたこのモデルは、多言語およびゼロサンプル音声クローンをサポートし、わずか5～90秒の音声プロンプトで自然で表現力豊かな音声を生成します。

最新のAIリソース

1年前

061.1K

Higress MCP - 今日投资推出的MCP服务平台

ハイプレスMCP - インベスト・トゥデイがMCPサービス・プラットフォームを開始

ハイグレスMCPは、インベスト・トゥデイが発表した革新的なプラットフォームで、従来の金融データAPIを最新のMCPサービスに迅速に変換することをサポートします。ハイグレスMCPは、コーディング不要の簡単な設定に基づき、REST APIをMCPサーバーに変換することができます。

最新のAIリソース

1年前

061K

Magentic-UI - 微软开源的人机协作AI Agent

Magentic-UI - マイクロソフト、人間とコンピュータのコラボレーションのためのオープンソースAIエージェント

Magentic-UIは、マイクロソフトのオープンソースの人間とコンピュータのコラボレーションAIエージェント研究ツールです。Magentic-UIは、ウェブブラウジング、コード実行、ファイル操作などの複雑なウェブタスクを容易にするために、ユーザーと密接に連携することに基づいています。Magentic-UIは、ユーザーと密接に連携し、ウェブブラウジングやコード実行、ファイル操作などの複雑なウェブタスクを容易にすることを基本としています。

最新のAIリソース

1年前

061K

企鹅读伴 - 腾讯推出的中小学生AI阅读助手

ペンギン・リーディング・コンパニオン - テンセントの小中学生向けAI読書アシスタント

Penguin Reading Companionは、テンセントが開発した小中学生向けのAI読書アシスタントです。Penguin Reading Companionは、テンセントのハイブリッドビッグモデルとメタマシンプラットフォームに、義務教育言語カリキュラムプログラムとカリキュラム標準（2022年版）を組み合わせることで、生徒にパーソナライズされたおすすめの読書、複数の読書モード（フォーカス、音読、リスニング...

最新のAIリソース

1年前

060.9K

FactSnap - 新一代AI信息核查工具

FactSnap - 次世代AI情報検証ツール

FactSnapは、ウェブ情報の真偽を迅速に検証する新世代AI情報検証ツールです。複数のモデルと検索エンジンを統合することで、ユーザーがウェブを閲覧している間に、選択したテキストの検証をリアルタイムで実行します。

最新のAIリソース

1年前

060.9K

VoxCPM 1.5 - 面壁智能开源的端到端文本到语音模型

VoxCPM 1.5 - Faceted Intelligenceオープンソースエンドツーエンド音声合成モデリング

VoxCPM 1.5は、Facade Intelligence社がリリースしたオープンソースの音声生成モデルで、スプリッターを必要としないテキスト音声合成（TTS）技術をベースに、いくつかの革新的な改良が加えられています。エンド・ツー・エンドの拡散自己回帰アーキテクチャを採用し、テキストから直接連続音声波形を生成することで、従来のセグメンテーション手法の制限を回避...

最新のAIリソース

8ヶ月前

060.9K

Qwen-Image-Layered - 阿里团队开源的AI图像编辑模型

Qwen-Image-Layered - AI画像編集モデルをAliチームがオープンソース化

Qwen-Image-Layeredは、AliチームによるオープンソースのAI画像編集モデルで、通常の画像を独立した透明なレイヤーにインテリジェントに分解し、Photoshopのような精密な編集を実現する。このモデルはApache 2.0プロトコルを使用してオープンソース化されており、レイヤーの柔軟な制御をサポートしています。

最新のAIリソース

7ヶ月前

060.9K

通义DeepResearch - 阿里通义开源的深度研究智能体

Tongyi DeepResearch - アリ・トンイオープンソース・ディープリサーチインテリジェンス機関

Tongyi DeepResearch（同義ディープリサーチ）は、アリババが立ち上げたオープンソースのインテリジェントボディで、深い情報検索と複雑なタスクの推論のために設計され、300億のパラメータを持ち、ReActモードと深度モードを含む複数の推論モードをサポートする...

最新のAIリソース

11ヶ月前

060.8K

MonkeyCode - 开源的企业级AI编程助手

MonkeyCode - オープンソースのエンタープライズAIプログラミングアシスタント

MonkeyCodeは、プライバシーとセキュリティを重視する開発チームのために設計された、オープンソースのエンタープライズグレードのネイティブAIプログラミングアシスタントです。MonkeyCodeは、コードデータのセキュリティを確保するために、プライベートデプロイとオフラインでの使用をサポートしています。MonkeyCodeは、コードデータのセキュリティを確保するために、プライベートデプロイとオフラインでの使用をサポートしています...

最新のAIリソース

1年前

060.8K

Why My Wife Yelling At Me：模拟婚姻沟通的互动工具

なぜ妻は私を怒鳴るのか：夫婦間のコミュニケーションを疑似体験できるインタラクティブ・ツール

概要「妻が私に怒鳴る理由」は、人工知能を通じてパートナーの感情的な反応やコミュニケーションパターンを理解できるように設計された、ユニークな夫婦関係シミュレーションサイトである。ユーザーは様々なシナリオを入力し、仮想パートナーの反応を体験することができます。

最新のAIリソース

1年前

060.8K

QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max - アリ・トンイ、視覚的推論モデルを発表

QVQ-MaxはAlitonix社の最先端の視覚推論モデルで、QVQ-72B-Previewのアップグレード版です。画像やビデオコンテンツを「読み取り」、分析と問題解決のための情報と組み合わせることができます。QVQ-Maxは、画像やビデオコンテンツを「読み取り」、分析、推論、問題解決のために情報を組み合わせることができる最先端の視覚推論モデルです。QVQ-Maxの主な機能には、画像解析、ビデオ分析...

最新のAIリソース

1年前

060.7K

Lumina-DiMOO - 上海AI Lab联合华为昇腾开源的多模态大模型

Lumina-DiMOO - 上海AIラボとHuawei Riseがオープンソース化したマルチモーダル大型モデル

Lumina-DiMOOは、上海人工知能研究所（SAL）が世界人工知能会議2025でファーウェイ・ライズと共同で発表した、マルチモーダル生成・理解のための新世代統一モデルである。Rise AI基本ハードウェア・ソフトウェアプラットフォームとMindSpeed MMマルチモーダル大規模モデルスイートをベースとし、...

最新のAIリソース

11ヶ月前

060.7K

RedOne - 小红书最新推出的社交大模型

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。

最新のAIリソース

1年前

060.7K

CRIC深度智联 - 克而瑞推出的中国房地产首个AI Agent

CRIC - 中国初の不動産AIエージェントをCRICが開始

CRIC Depth Intelligenceは、CRICが独自に開発した中国不動産初のAIインテリジェント体であり、CRICの20年にわたる不動産業界での経験とデータ蓄積、マルチモーダルビッグモデル技術に基づき、データ統合、インテリジェント分析からコンテンツ生成までの全チェーンを切り開く。

最新のAIリソース

1年前

060.6K

FlowAct-R1 - 字节跳动开源的实时交互数字人视频生成框架

FlowAct-R1 - 字节跳动开源的实时交互数字人视频生成框架

FlowAct-R1是字节跳动开源的实时交互数字人视频生成框架，能通过单张参考图和音频流式生成无限时长的高保真全身动态视频。核心创新在于分块流式生成技术，将视频拆解为0.5秒一小段接力处理，配合结构化...

最新のAIリソース

6ヶ月前

060.6K

Hyprnote - 开源的本地优先AI会议笔记工具

Hyprnote - オープンソースのローカルファーストAI会議メモツール

Hyprnoteは、ユーザーのプライバシーを保護し、会議の効率を向上させるために専門家のために設計された、オープンソースのローカルファーストAI会議メモツールです。ローカルファースト」の原則を採用し、データの保存と処理はすべてユーザーのローカルデバイス上で行われるため、データの安全性が確保され、オフラインでの操作もサポートされます。

最新のAIリソース

11ヶ月前

060.6K

Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列

カンディンスキー5.0 - ロシアのAIチームがオープンソースの映像生成モデルシリーズを公開

Kandinsky 5.0は、ロシアのAIチームによって開発された最新のビデオジェネレーションモデルシリーズで、軽量設計と高性能に重点を置いている。シリーズ最初のモデルであるKandinsky 5.0 Video Liteは、パラメータはわずか20億だが、類似の14Bモデルを凌駕しており、特に...

最新のAIリソース

10ヶ月前

060.5K

分析 civitai 226K 得到的常用正负面提示词

シビタイ226Kから得られた一般的なポジティブキューとネガティブキューの分析

リソース・リストトップ10 最も一般的なトークン1000 最も一般的なネガティブ・トークン20 最も一般的なサンプラー100 最も一般的なステップ100 最も一般的なディメンション50 最も一般的な...

最新のAIリソース # AI画像生成エイド

2年前

060.5K

Confucius3-Math - 网易有道推出专注于数学教育的开源推理模型

孔子3-数学 - NetEase.com、数学教育に特化したオープンソースの推論モデルを発表

Confucius3-Mathは、NetEaseYouDaoによってオープンソース化された、数学教育に特化した国内初のオープンソース推論モデルです。140億のパラメータを持ち、K-12の数学教育シナリオに最適化されており、コンシューマーグレードのGPU（例：RTX 4090D）1つで効率的に実行でき、推論性能は約...

最新のAIリソース

1年前

060.4K

Qwen VLo – 通义千问推出的多模态统一理解与生成模型

Qwen VLo - 統一されたマルチモーダル理解・生成モデル by Tongyi Qianqian

Qwen VLoはTongyi Qianqianチームによって導入されたマルチモーダル統一理解・生成モデルである。クウェンVLoは世界を「理解」し、その理解に基づいて高品質で再現することができ、知覚から生成への飛躍を実現する。VLoは映像の内容を正確に理解し、それに基づいて一貫した高品質の生成を行うことができる。

最新のAIリソース

1年前

060.3K

职达AI简历 - AI简历生成与优化平台，精准分析问题、提供优化建议

JobTech AI CV - AI履歴書生成・最適化プラットフォーム。

ジョブAI履歴書は、効率的で便利なインテリジェント履歴書生成・最適化プラットフォームです。AI技術に基づき、ユーザーはプロフェッショナルでパーソナライズされた履歴書を素早く作成することができます。ユーザーは基本的な情報と経験を入力するだけで、短時間で高品質の履歴書を作成することができ、2800以上の美しいテンプレートを提供し、様々な職種をカバーします。

最新のAIリソース

1年前

060.3K

Skywork Deep Research Agent v2 - 昆仑万维推出的深度研究智能体升级版

Skywork Deep Research Agent v2 - 崑崙のDeep Research Intelligenceのアップグレード版。

Skywork Deep Research Agent v2は、Kunlun Waveが発表したマルチモーダル情報の統合と分析に特化したディープリサーチインテリジェントボディです。

最新のAIリソース

12ヶ月前

060.3K

稿定AI社区 - AI创意内容设计平台，多种设计资源满足不同创作需求

Drafting AI Community - AIクリエイティブコンテンツデザインプラットフォーム。

Drafting AI Communityは、ユーザーに豊富なクリエイティブデザインリソースとツールを提供するオンラインAIクリエイティブインスピレーションプラットフォームです。このプラットフォームは、イメージ写真、Eコマースデザイン、ホリデーテーマ、3Dイラスト、アバターデザイン、小紅集素材、似顔絵デザインなど、様々なデザイン分野をカバーし、様々なユーザーのニーズに応えます。

最新のAIリソース

1年前

060.3K

2024年自动化流程执行创作工作的14款出色AI工具

2024年、クリエイティブな仕事のプロセスを自動化する14の優れたAIツール

人工知能の力を利用して、日々の仕事を支援したり、プライベートや仕事のワークフローを自動化したいと考えているなら、利用可能な幅広いAIツールに興味があるかもしれない。 AssemblyAIは、自動化に使用できるツールの詳細を紹介する5分間のビデオを作成しました...

最新のAIリソース

2年前

060.2K

AntSK FileChunk - 免费的AI语义文档切片工具，动态切片调整

AntSK FileChunk - フリーのAIセマンティック文書スライスツール、動的スライス調整

AntSK FileChunk は、RAG (Retrieval Augmented Generation) アプリケーションのために設計された、無料のインテリジェントドキュメントスライスツールです。セマンティックを中核として、文書はインテリジェントに、意味的に完全で首尾一貫したセグメントにスライスされ、多言語をサポートし、文脈の一貫性を保証するためにスライスのサイズを動的に調整します。

最新のAIリソース

11ヶ月前

060.2K

Mureka V7 - 昆仑万维推出的AI音乐生成模型

Mureka V7 - クインテッセンスのAI音楽生成モデル

Mureka V7は、崑崙ワールドワイドが発表した先進的なAI音楽生成モデルである。このモデルはMusiCoT技術に基づいており、音楽の全体的な構造を計画してから細部を詰めることで、より首尾一貫した芸術的な音楽作品を生成することができる。

最新のAIリソース

1年前

060.1K

Magistral - Mistral AI 推出的系列推理模型

Magistral - Mistral AIによる推論モデルシリーズ

MagistralはMistral AIによる推論モデルで、透過的、多言語、ドメイン固有の推論機能に焦点を当てている。このモデルは、オープンソース版（Magistral Small）とエンタープライズ版（Magistral Medium）で構成されており、後者は...

最新のAIリソース

1年前

060K

Seed LiveInterpret 2.0 - 字节跳动推出的同声传译模型

シード LiveInterpret 2.0 - バイトホップの同時通訳モデル！

Seed LiveInterpret 2.0は、ByteDanceのSeedチームによって発表された、中国語と英語の双方向翻訳をサポートする最先端の同時通訳モデルです。このモデルは、実際の翻訳に近い精度を持ち、平均音声対音声遅延はわずか2-3秒と、非常に低い遅延を実現しています。

最新のAIリソース

1年前

060K

NitroGen - 英伟达联合斯坦福大学、加州理工等开源的游戏AI模型

NitroGen - NVIDIAがスタンフォード大学、カリフォルニア工科大学などと共同で開発したオープンソースのゲームAIモデル

NitroGenは、NVIDIAがスタンフォード大学やカリフォルニア工科大学などと共同で開発したオープンソースのゲームAIモデルで、1,000種類以上のゲームをプレイすることができる。このモデルはGROOT N1.5アーキテクチャをベースとしており、4万時間に及ぶゲーム映像データ（ジョイスティック操作のアノテーションを含む）を分析することで実現されています...

最新のAIリソース

7ヶ月前

059.9K

AntAngelMed - 蚂蚁联合浙江省卫生健康信息中心开源的医疗大模型

AntAngelMed - 蚂蚁联合浙江省卫生健康信息中心开源的医疗大模型

AntAngelMed（蚂蚁·安诊儿医疗大模型）是浙江省卫生健康信息中心、蚂蚁健康、浙江省安诊儿医学人工智能科技有限公司联合开发的开源医疗大模型。模型采用混合专家架构（MoE），总参数量达1000亿...

最新のAIリソース

7ヶ月前

059.9K

问小白5 - 问小白推出的全能AI模型

アスク・ホワイト5 - アスク・ホワイトのオールインワンAIモデル

アスクホワイト5は、非常に高い知性を備えた「オール・イン・ワン」のフラッグシップモデルである。AA-Index総合評価スコア64.7点、STEM能力評価スコア86点など、多くの評価で好成績を収め、世界トップクラスのGPT-5に迫る。

最新のAIリソース

11ヶ月前

059.7K

Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - 金融推論のためのビッグモデル by Anthem Digital

Agentar-Fin-R1は、Anthem社によって導入された金融領域向けの最先端の大規模言語モデルである。強力なQwen3アーキテクチャに基づいて開発されたこのモデルは、8Bと32Bの2つのパラメータスケールバージョンを提供し、多段階分析、リスク評価、戦争などの複雑な金融推論タスクを正確に処理することができます。

最新のAIリソース

1年前

059.7K

IQuest-Coder-V1 - 至知创新研究院开源的代码大模型系列

IQuest-Coder-V1 - 至知创新研究院开源的代码大模型系列

IQuest-Coder-V1是九坤投资旗下至知创新研究院研发的开源代码大模型系列，专注于代码智能领域，具备自动编程、Bug修复和代码解释等能力。模型采用创新的Code-Flow训练范式，从代码库演化...

最新のAIリソース

7ヶ月前

059.6K

SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Qunar Technologiesのオープンソース3Dシーン生成モデル

SpatialGenはQunar Technologyのオープンソース3Dシーン生成モデルであり、拡散モデルアーキテクチャに基づき、テキスト記述、参照画像、3D空間レイアウトに基づいて時空間的に一貫性のあるマルチビュー画像の生成をサポートし、さらに3Dガウスシーンの生成とローミングビデオのレンダリングを行う。

最新のAIリソース

11ヶ月前

059.6K

FireRedChat - 小红书开源的全双工语音交互系统

FireRedChat - Little Red Bookのオープンソース全二重音声対話システム

FireRedChatは、リアルタイムの双方向対話機能と制御された中断をサポートするXiaohongshuのためのオープンソースの全二重音声対話システムです。トランスクリプションコントロールモジュール、インタラクションモジュール、ダイアログマネージャーなどのモジュール設計により、カスケードやセミカスケードアーキテクチャをサポートし、柔軟な展開を実現します。

最新のAIリソース

10ヶ月前

059.4K

MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - 崑崙微の最新音声生成フレームワーク

MoE-TTSは、KunlunWanweiによって導入された音声合成フレームワークで、事前に訓練された大規模言語モデル（LLM）と音声専門家モジュールを組み合わせたMixed Expert（MoE）アーキテクチャに基づいています。MoE-TTSは、テキストモジュールのパラメータを凍結し、音声モジュールのパラメータのみを更新することにより、強力なテキスト推論を保持します...

最新のAIリソース

12ヶ月前

059.4K

Qwen3Guard - 阿里Qwen开源的安全模型

Qwen3Guard - Ali Qwenオープンソースセキュリティモデル

Qwen3Guardは、Qwen3の基本モデルに基づき、セキュリティ検出のために設計された、きめ細かいセキュリティ保護モデルです。Qwen3Guardは、2つのプロ...

最新のAIリソース

10ヶ月前

059.4K

ClawFeed - 开源AI新闻摘要工具，一站式聚合任意网站内容

ClawFeed - 开源AI新闻摘要工具，一站式聚合任意网站内容

ClawFeed是开发者Kevin He推出的开源AI新闻摘要工具，解决信息过载问题。通过聚合Twitter、RSS、GitHub等多平台信息源，利用AI自动生成4小时、每日、每周和每月的结构化摘要...

最新のAIリソース

5ヶ月前

059.3K

MindLink - 昆仑万维推出的开源推理大模型

MindLink - KunlunWeiのオープンソース推論ビッグモデル

MindLinkは崑崙ワールドワイドウェブによって起動されたオープンソースの推論の大規模なモデルです。適応推論機構を使用すると、タスクの複雑さに応じて柔軟に推論モードを切り替えることができ、単純なタスクが迅速に生成され、複雑なタスクの詳細な推論、アカウントに効率と精度を取る。計画駆動型の推論のパラダイムは、 "考える "タグを削除するには、減らす...

最新のAIリソース

1年前

059.2K

Xiaomi-MiMo-Audio - 小米开源的首个原生端到端语音大模型

Xiaomi-MiMo-Audio-シャオミ・オープンソース初のネイティブ・エンド・トゥ・エンド・スピーチ・ビッグモデル

Xiaomi-MiMo-Audioは、多言語対話、音声継続、サンプル数の少ない汎化、音声理解などの強力な機能を備えた、Xiaomiのオープンソースの70億パラメータのエンドツーエンド音声マクロモデルであり、音声インテリジェンスと音声理解のベンチマークでSOTAレベルに達することができ、Google Gemi...を上回っています。

最新のAIリソース

10ヶ月前

059.1K

Midjourney V1- Midjourney推出的首个图生视频模型

Midjourney V1- ミッドジャーニー初のグラフィックビデオモデル

Midjourney V1は、Midjourney初のAIビデオ生成モデルで、高度なAI技術の助けを借りて、静止画像を鮮やかでダイナミックなビデオに変換することをサポートします。ユーザーは画像またはMidjourneyで生成された画像をアップロードし、...

最新のAIリソース

1年前

059K

Meeseeks - 美团开源的评估模型指令遵循能力的评测集

Meeseeks - 模範的な指示に従う能力を評価するためのMeeseeksオープンソース評価セット

Meeseeksは、MeituanのM17チームがモデルの指示に従う能力を評価するために使用しているオープンソースの大規模モデル評価セットです。Meeseeksは、モデルがマクロレベルからミクロレベルまでユーザーの指示に厳密に従った回答を生成できるかどうかを総合的に測定するために3段階の評価フレームワークを使用しており、回答内容の知識をプラス評価することはありません...

最新のAIリソース

11ヶ月前

059K

MiniMax Music 1.5 - MiniMax最新推出的AI音乐生成模型

MiniMax Music 1.5 - MiniMaxの最新AI音楽生成モデル！

MiniMax Music 1.5は、ユーザーの自然言語による記述に基づいて最大4分の音楽を生成する、高度なAI音楽生成ツールです。このモデルは、幅広い音楽スタイルとムードのカスタマイズをサポートし、自然で完全なボーカルトーン、スムーズなトランジション、豊かなレイヤーアレンジを生成します...

最新のAIリソース

11ヶ月前

059K

Gemini 2.5 Deep Think - 谷歌推出的AI推理模型

Gemini 2.5 Deep Think - GoogleのAI推論モデル

Gemini 2.5 Deep Thinkは、複雑なタスクを解決するために設計されたGoogleのAI推論モデルである。国際数学オリンピック(IMO)2025で金メダルを獲得したモデルの亜種であり、並列推論によって複雑なタスクを解くように設計されている。

最新のAIリソース

1年前

059K

文心大模型X1.1 - 百度推出的深度思考模型，理解能力更强

文信ビッグモデルX1.1 - 百度のより良い理解のための深層思考モデル

Wenxin Big Model X1.1は、バイドゥが発表したディープシンキングモデルで、ハイブリッド強化学習フレームワークに基づいており、言語理解と生成の向上に重点を置いている。このモデルは、複雑な質問の処理、指示に従うこと、知性の行動のシミュレーションに優れており、知識豊富な回答や高品質のテキストコンテンツを正確に提供することができる。

最新のAIリソース

11ヶ月前

059K

飞算JavaAI - AI Java开发助手，自然语言实现全流程智能化开发

Flycount JavaAI - AI Java開発アシスタント、インテリジェント開発の全プロセスの自然言語実装

Flycount JavaAIは、Flycount Technologyが発表したインテリジェントなJava開発アシスタントです。このプラットフォームは自然言語入力をサポートし、要件分析からコード生成まで、インテリジェントな開発の全プロセスを実現します。開発者は要件の説明を入力するだけで、Flycount JavaAIは正確に理解し、完全なエンジニアリングコードフレームワークを生成することができます。

最新のAIリソース

1年前

058.8K

Qwen3-Max-Preview - 通义千问推出的旗舰大语言模型

Qwen3-Max-Preview - Tongyi Qianqianのフラッグシップ・ビッグ言語モデル

Qwen3-Max-Previewは、Tongyi Qianwenがリリースした最新のフラッグシップ大規模言語モデルです。Qwen3ファミリーの中で最大のパラメータ数を持つモデルであり、パラメータサイズは1兆を超える。推論、命令追従、多言語サポート、ロングテール知識カバレッジが大幅に改善されています。

最新のAIリソース

11ヶ月前

058.6K

PaCoRe - 阶跃星辰开源的并行协同AI推理框架

PaCoRe - StepStarのオープンソース並列協調AI推論フレームワーク

PaCoRe (Parallel Coordinated Reasoning)は、StepFunのオープンソースの革新的な並列協調推論フレームワークで、超並列思考メカニズムを通じて、複数の視点から同時に問題解決策を探索し、従来の...

最新のAIリソース

8ヶ月前

058.5K

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge - 月之暗面推出的 AI Agent 浏览器交互插件

Kimi WebBridge 是月之暗面（Moonshot AI）推出的浏览器扩展 + 本地桥接服务，专为 AI Agent 设计。让 AI 能像真人一样在你的 Chrome 或 Edge 浏览器中执...

最新のAIリソース

2ヶ月前

058.4K

Youtu-GraphRAG - 腾讯优图实验室开源的图检索增强生成框架

Youtu-GraphRAG - Tencent Youtu Labs オープンソースグラフ検索拡張生成フレームワーク

Youtu-GraphRAGは、Tencent Youtu Labsが提供するオープンソースのグラフ検索拡張生成フレームワークで、大規模な言語モデルが複雑なQ&Aタスクをより正確に処理できるようにする。4層の知識ツリーを構築することで、知識を属性、関係、キーワード、コミュニティの4つのレベルに分解し、行為の自...

最新のAIリソース

11ヶ月前

058.3K

Report mAIstro：生成任意自定义主题的详细报告文档，例如商业分析、年终汇报等

レポートMAIstro：ビジネス分析、期末レポートなど、カスタムトピックに関する詳細なレポートを作成します。

概要レポートmaistroは、自然言語処理技術により、ユーザーが簡単にカスタムレポートを作成できるように設計された強力なツールです。このツールはLangChainテクノロジーを利用し、ユーザーから提供されたトピックや構造を詳細なレポートに変換します。

最新のAIリソース # AI Java オープンソースプロジェクト # 詳細な調査レポートの作成

1年前

058.2K

Vibe Kanban - 开源的免费AI编程代理任务管理工具

Vibe Kanban - 开源的免费AI编程代理任务管理工具

Vibe Kanban是开源的AI编程代理任务管理工具，专为同时使用多个AI编程助手（如Claude Code、Gemini CLI、Codex等）的开发者设计。通过看板形式统一管理任务进度，支持并行...

最新のAIリソース

7ヶ月前

058.2K

万兴天幕 – 万兴科技推出AIGC视频创作平台

万興キャノピー - 万興科技、AIGCビデオ作成プラットフォームを発表

万興キャノピーは万興科技が発表したAIGC動画作成プラットフォームで、動画、画像、音声の3大作成分野をカバーし、メディア・文化産業従事者、映画・テレビ・ポストプロダクション従事者、アート・デザイン従事者、広告・マーケティング従事者などのために特別に設計され、ワンストップの専門的作成ソリューションを提供する。

最新のAIリソース

1年前

058.2K

Logics-Parsing - 阿里开源的文档解析模型

Logics-Parsing - Ali オープンソース文書解析モデル

Logics-Parsingは、Qwen2.5-VL-7Bをベースとした、オープンソースのAliのエンドツーエンドの文書解析モデルです。強化学習を通じて、文書のレイアウト解析と読み順推論を最適化し、PDF画像を構造化されたHTML出力に変換することができます。

最新のAIリソース

10ヶ月前

058.2K

Qwen3-Coder-Next - 阿里通义千问开源的编程智能体混合模型

Qwen3-Coder-Next - 阿里通义千问开源的编程智能体混合模型

Qwen3-Coder-Next是阿里巴巴通义千问团队开源的专为编程智能体设计的高效混合模型，基于80B总参数的Qwen3-Next架构，推理时仅激活3B参数。核心创新在于采用环境交互和强化学习训练方...

最新のAIリソース

6ヶ月前

058K

Stand-In - 腾讯微信视觉开源的轻量级视频生成框架

スタンドイン - Tencent WeChat Visualオープンソース軽量動画生成フレームワーク

Stand-Inは、テンセントのWeChat Visionチームが開発した、軽量でプラグアンドプレイのID保持動画生成フレームワークである。動画生成において特定のアイデンティティ特徴を保持することに重点を置き、ベースモデル1%の追加パラメータを学習するだけで、顔の類似性と自然さにおいて優れた結果を得ることができる。

最新のAIリソース

11ヶ月前

057.7K

DeepSeek-OCR - DeepSeek开源的光学字符识别模型

DeepSeek-OCR - DeepSeekオープンソース光学式文字認識モデル

DeepSeek-OCRは、DeepSeekチームによってオープンソース化された高度な光学式文字認識（OCR）モデルであり、「文脈光学圧縮」技術によってテキストを画像に変換し、圧縮と復号に視覚的トークンを使用することで、効率的な長文テキスト処理を実現する。

最新のAIリソース

9ヶ月前

057.7K

MobiAgent - 上海交大开源的移动端智能体全栈构建框架

MobiAgent - 上海交通大学オープンソースモバイルインテリジェントボディフルスタック構築フレームワーク

MobiAgentは、上海交通大学IPADS研究室が開発したオープンソースのモバイルインテリジェントボディツールチェーンで、ユーザーが独自のモバイルインテリジェントアシスタントを構築することを支援する。ユーザーの操作軌跡を記録し、高品質なデータを生成することで、自然言語コマンドを理解できる知的体を育成する。コア機能には、効率的な...

最新のAIリソース

11ヶ月前

057.4K

WebWeaver - 阿里通义开源的新型双智能体框架

WebWeaver - アリ・トンイ、新しいデュアル・インテリジェンス・ボディ・フレームワークをオープンソースで公開

WebWeaverはアリババ同業チームが導入した新しい二重知能体フレームワークで、主にオープンディープリサーチで使用され、人間の研究プロセスをシミュレートすることができる。

最新のAIリソース

11ヶ月前

057.4K

Ming-Omni-tts - 蚂蚁联合Inclusion AI开源的多模态音频生成模型

Ming-Omni-tts - 蚂蚁联合Inclusion AI开源的多模态音频生成模型

Ming-Omni-tts 是蚂蚁集团与Inclusion AI联合开源的多模态音频生成模型，包含0.5B和16.8B-A3B两个版本。模型首次实现了语音、环境音和音乐的统一自回归生成，支持语速、音量...

最新のAIリソース

5ヶ月前

057.4K

Nemotron 3 - 英伟达发布的开源 AI 模型系列

Nemotron 3 - NVIDIAがリリースしたオープンソースのAIモデルファミリー

Nemotron 3は、NVIDIAがNano、Super、UltraサイズでリリースしたオープンソースのAIモデルファミリーです。Nemotron 3は、潜在MoEアーキテクチャを採用し、推論効率を大幅に向上させ、運用コストを削減している。そのうちの1つ...

最新のAIリソース

8ヶ月前

057.2K

Klear-Reasoner - 快手推出的全新推理模型

Klear-Reasoner - レーサーが導入した新しい推論モデル

Klear-ReasonerはQwen3-8B-BaseをベースとしたRacerの高性能推論モデルである。Klear-Reasonerは、長い思考連鎖による教師付き微調整と強化学習によって学習され、数学的推論やコード推論において優れた性能を発揮する。

最新のAIリソース

11ヶ月前

057.1K

Qwen3.5 - 阿里通义千问团队开源的最新一代大语言模型

Qwen3.5 - 阿里通义千问团队开源的最新一代大语言模型

Qwen3.5是阿里巴巴通义千问团队开源的最新一代大语言模型，属于千问（Qwen）系列的升级版本。Qwen3.5突破了传统文本模型的限制，实现了真正的原生多模态理解，可直接处理文本、图像、视频等多种模...

最新のAIリソース

5ヶ月前

057.1K

HunyuanWorld-Voyager - 腾讯开源的超长漫游世界模型

HunyuanWorld-Voyager-テンセントオープンソースの超長距離ローミングワールドモデル

HunyuanWorld-Voyager（略してHunyuan Voyager）は、テンセントがリリースした業界初のネイティブ3D再構成をサポートする超長距離ローミングワールドモデルである。1枚の画像からユーザーが定義したカメラパスの3D点群シーケンスを生成する新しいビデオ拡散フレームワークであり、...

最新のAIリソース

11ヶ月前

057K

Qwen3-VL-Embedding - 阿里通义团队开源的多模态嵌入模型

Qwen3-VL-Embedding - 阿里通义团队开源的多模态嵌入模型

Qwen3-VL-Embedding是阿里通义团队开源的多模态嵌入模型，属于Qwen3-VL系列，主要用于跨模态检索任务。模型将文本、图像、视频等不同模态数据映射到同一语义空间，通过双塔架构生成向量表...

最新のAIリソース

7ヶ月前

056.9K

PersonaPlex - 英伟达开源的全双工语音对话模型

PersonaPlex - 英伟达开源的全双工语音对话模型

PersonaPlex是英伟达开源的全双工语音对话模型，拥有70亿参数。摒弃了传统的语音识别→语言模型→文本到语音的级联流程，采用统一的Transformer架构，能同步处理语音理解与生成。模型支持全...

最新のAIリソース

6ヶ月前

056.8K

OneCAT - 美团联合上海交大开源的多模态模型

OneCAT - Meituanと上海交通大学のオープンソース・マルチモーダルモデル

OneCATは、Meituanが上海交通大学と共同で発表した新しい統一マルチモーダルモデルで、マルチモーダル理解、テキスト画像生成、画像編集機能をシームレスに統合した純粋なデコーダーアーキテクチャを採用している。このモデルは、外部の視覚コーダーや曖昧性解消器に依存する従来のマルチモーダルモデルの設計を放棄し、モダリティに特化した...

最新のAIリソース

11ヶ月前

056.6K

Ming-flash-omni 2.0 - 蚂蚁集团开源的全模态大模型

Ming-flash-omni 2.0 - 蚂蚁集团开源的全模态大模型

Ming-flash-omni 2.0是蚂蚁集团开源的全模态大模型，集成了视觉、语音和生成能力的AI模型，在多项基准测试中性能领先。支持同时生成语音、环境音效和音乐，能通过自然语言指令精细控制音色、语...

最新のAIリソース

5ヶ月前

056.6K

Gemini Robotics On-Device - 谷歌推出首个在本地运行的具身智能模型

Gemini Robotics On-Device - グーグル、ローカルで動作する初のエンボディド・インテリジェンス・モデルを発表

Gemini Robotics On-Deviceは、Google DeepMindの視覚言語アクションモデルであり、ロボットのローカルでの実行をサポートする。このモデルは、オフラインでタスクを実行することができ、服をたたんだり、開いたバッグを引っ張ったりといった、自然言語コマンドに基づいた細かい動作を完了する。

最新のAIリソース

1年前

056.6K

Qwen3-Omni - 阿里通义推出的全模态AI模型

Qwen3-Omni - Ali Tongyiが紹介するオムニモーダルAIモデル

Qwen3-Omniは、Ali Tongyiチームによって導入された完全なモーダルAIモデルであり、テキスト、画像、オーディオ、ビデオなどの複数のデータタイプを扱うことができ、低レイテンシと高い制御性で119言語のテキストインタラクションをサポートしています。

最新のAIリソース

10ヶ月前

056.6K

FLUX.1 Kontext - 黑森林推出的图像生成与编辑模型

FLUX.1 Kontext - ブラックフォレストの画像生成・編集モデル

FLUX.1 Kontextは、Black Forest Labs社の画像生成・編集モデルで、コンテキストを意識した画像処理技術を提供する。このモデルは、テキストや画像の合図に対する反応を理解し、オブジェクトの修正、スタイルの変換、背景の置換などのタスクを実行しながら、コーナー...

最新のAIリソース

1年前

056.6K

混元世界模型1.5 - 腾讯混元开源的实时世界模型生成框架

Mixed World Model 1.5 - Tencent Mixedオープンソースリアルタイム世界モデル生成フレームワーク

ハイブリッド世界モデル1.5（Tencent HY WorldPlay）は、Tencentがリリースした業界初のオープンソースリアルタイム世界モデルフレームワークであり、データ、トレーニング、ストリーミング推論の展開のフルチェーンをカバーする。コアとなるのはWorldPlay自己回帰拡散モデルで、Next-F...

最新のAIリソース

8ヶ月前

056.5K

VTP - MiniMax海螺视频团队开源的视觉生成模型技术

VTP - MiniMaxコンク・ビデオ・チームのオープンソース視覚的生成モデリング技術

VTP（Visual Tokenizer Pre-training）とは、MiniMax Conch Videoチームが提唱するビジュアル生成モデルのキーテクノロジーで、ビジュアル・トークナイザー（トークナイザー）の事前学習方法を改善することで、生成システムのパフォーマンスを向上させるものです。従来の方法...

最新のAIリソース

7ヶ月前

056.5K

もっと読む