最新のAIリソース

共 3109 篇文章

コース情報最新のAIリソース AI知識ベース AIニュース

順番に並べる

目を通すブックマーク

PixVerse V5 - 爱诗科技推出的自研AI视频模型

PixVerse V5 - アイシ・テクノロジーズが自社開発のAI動画モデルを発表

PixVerse V5は、アイシ・テクノロジーが発表したAI動画生成の大型モデルである。ユーザーが入力したテキスト説明文や画像をもとに、高品質な動画コンテンツを生成できるモデルで、アニメ、SF、国民的など様々なスタイルに対応している。

最新のAIリソース

10ヶ月前

054.4K

吴恩达面向开发者的ChatGPT提示工程免费课程

アーネスト・ンによる開発者のためのChatGPTチップエンジニアリング無料コース

ChatGPT Tip Engineering for Developersは、開発者向けにデザインされたDeepLearning.AIとOpenAIの共同コースで、Isa Fulford、Andrew Ngを講師に迎え、大規模言語モデル（LLM）の使い方を学びます。

最新のAIリソースコース情報

10ヶ月前

054.4K

宠TA - 京东推出的AI宠物互动产品

ペットTA - AIペット対話製品、京東が発売

ペットTA」は京東のAIGCペットインタラクティブ製品で、ペット愛好家に楽しくて暖かいオンラインインタラクティブプラットフォームを提供することができる。ユーザーがペットのために様々な可愛い服やアクセサリーを選んだり、個人的な着せ替えをしたり、ペットのデジタルイメージを作成したりして、ペットとの豊かな交流をサポートする。このプラットフォームは...

最新のAIリソース

12ヶ月前

054.4K

ScienceOne - 中国科学院自动化研究所等机构推出的智能科研平台

ScienceOne - 中国科学院自動化研究所などが立ち上げたインテリジェント研究プラットフォーム

ScienceOneは、中国科学院自動化研究所が共同で立ち上げたインテリジェント科学研究プラットフォームである。ScienceOneは、中国科学院自動化研究所が共同で立ち上げたインテリジェント科学研究プラットフォームで、大規模な科学基盤モデルの構築に基づいており、学際的なコラボレーションによるインテリジェント科学研究の新しいパラダイムを推進し、科学研究の全プロセスをサポートします。

最新のAIリソース

1年前

054.4K

Stable Diffusion Web:在线体验Stable Diffusion XL

安定拡散ウェブ：安定拡散XLをオンラインで体験しよう！

一般的な説明 Stable Diffusion Webは、ユーザーが無料で使用できるオンラインの安定拡散モデリング・プラットフォームです。このモデルは、使いやすいインターフェースでテキストをフォトリアリスティックな画像に変換するために使用されます。テキストプロンプトを入力し、"Generate "をクリックすることで、ユーザーは素早く...

最新のAIリソース # AIオンライン画像生成

2年前

054.4K

Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - Googleオープンソースプログラミングエージェント

Gemini CLIは、強力なAI機能を開発者に提供するために、開発者のエンドポイントにGemini Big Modelを組み込むことに基づいたGoogleのオープンソースAIプログラミングツールである。このツールは、コードを理解し、ファイルを操作し、コマンドを実行し、問題を動的にトラブルシュートし、開発者が効率的にジェネレーションを書けるように支援する。

最新のAIリソース

12ヶ月前

054.3K

Step-Audio 2 mini - 阶跃星辰开源的语音大模型

Step-Audio 2 mini - Step-Star オープンソース音声マクロモデリング

Step-Audio 2 miniは、Step-Audioによるオープンソースのエンドツーエンド音声マクロモデルです。従来の音声モデル構造を打破し、真のエンド・ツー・エンド・マルチモーダルアーキテクチャを採用しており、生の音声入力をより低遅延で音声応答出力に直接変換し、パラ言語情報と非音声信号を理解します。

最新のAIリソース

10ヶ月前

054.3K

MonkeyCode - 开源的企业级AI编程助手

MonkeyCode - オープンソースのエンタープライズAIプログラミングアシスタント

MonkeyCodeは、プライバシーとセキュリティを重視する開発チームのために設計された、オープンソースのエンタープライズグレードのネイティブAIプログラミングアシスタントです。MonkeyCodeは、コードデータのセキュリティを確保するために、プライベートデプロイとオフラインでの使用をサポートしています。MonkeyCodeは、コードデータのセキュリティを確保するために、プライベートデプロイとオフラインでの使用をサポートしています...

最新のAIリソース

11ヶ月前

054.3K

Knit：提示词指令设计管理工具

ニット：キュー・ワード指導設計管理ツール

一般的な紹介 PromptKnitは、AIプロンプトデザイナーのためのトップAIサンドボックスプラットフォームであり、gpt-4-turbo/vision、claude-3、gemini-1.5-proや他の多くのモデルのためのプロフェッショナルなプロンプトエディタを提供します。ユーザーは、プロンプトをグループ化することができます。

最新のAIリソース # AIオープンサービス

2年前

054.3K

ConverzAI - AI招聘平台，自动收集候选人信息进行筛选

ConverzAI（コンバーツエーアイ） - 候補者情報を自動収集し選考を行うAI採用プラットフォーム

ConverzAIは、採用プロセスを最適化するAI技術をベースとした採用プラットフォームである。このプラットフォームは、仮想リクルーター（AIエージェント）を配置し、応募追跡システム（ATS）から候補者情報を自動的に収集し、一次スクリーニングを行うことを基本としている。このプラットフォームは、電話、Eメール、SMSなどの複数のチャネルを使用する。

最新のAIリソース

1年前

054.2K

Kotae - AI聊天机器人平台，分析网站内容、培训文件生成准确回答

AIチャットボットプラットフォーム「Kotae」ウェブサイトコンテンツやトレーニング資料を分析し、的確な回答を生成

Kotaeは中小企業向けに設計されたインテリジェントなチャットボットプラットフォームで、ChatGPTテクノロジーをベースに開発されています。80以上の言語をサポートするこのプラットフォームは、顧客からの問い合わせに素早く自然に応答し、ユーザーのウェブサイトコンテンツ、トレーニングドキュメント、FAQなどを分析して正確な回答を生成します。

最新のAIリソース

1年前

054.2K

RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 - ウィズダムスペクトラムのオープンソース・クロスオントロジー・エンボディド・ブレインサイズ・コラボレーション・フレームワーク

RoboOS 2.0は、オントロジーを超えた脳と脳のコラボレーションを実現するオープンソースのフレームワークであり、ロボットの単一知能からグループ協調知能への転換を促進する。このフレームワークでは、クラウドブレインが複雑な意思決定とコラボレーションを担当し、スモールブレインモジュールが特定のスキルの実行に集中するという、効率的な役割分担を実現するために「ビッグブレイン」アーキテクチャを採用している。

最新のAIリソース

11ヶ月前

054.2K

Mobvoi MCP Server - 出门问问开源的多模态MCP服务工具

モボイMCPサーバー - オープンソースのマルチモーダルMCPサービスツールをアスクアウト

モボイMCPサーバーは、GoDoQが提供を開始したマルチモーダルAI機能を統合するツールです。Mobvoi MCP Serverは、音声生成、サウンドクローン、イメージドリブンデジタルピープル、ビデオダビング、ビデオ翻訳を統合したマルチモーダルAIツールで、ユーザーがテキストを入力することで柔軟に呼び出すことができます。

最新のAIリソース

1年前

054.2K

RoboBrain 2.0 - 智谱开源的通用具身大脑模型

RoboBrain 2.0 - ウィズダムスペクトラムのオープンソース汎用具現化脳モデル

ロボブレイン2.0は、ロボットに強力な知覚、推論、計画能力を提供するオープンソースの先進的な具現化脳モデルである。ロボブレイン2.0は、7Bと32Bの2つのバージョンで構成され、視覚エンコーダーと言語モデルを統合したヘテロジニアスアーキテクチャを採用し、ロボットをサポートする...

最新のAIリソース

11ヶ月前

054.1K

A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI - エージェント駆動型ユーザー・インタラクション・インターフェースのためのGoogleのオープンソース宣言型プロトコル

A2UI（Agent-to-User Interface）は、Googleがオープンソースで提供するエージェント駆動型インターフェース・プロトコルであり、AIエージェント向けに複雑な対話型インターフェースを生成する際の課題に対処する。AIエージェントがユーザーインターフェースの構造を記述できるようにする宣言的なJSONフォーマットを通じて、クライアントアプリケーションは、AIエージェントがユーザーインターフェースの構造を記述できるようにします。

最新のAIリソース

6ヶ月前

054.1K

ChatGPT Study - OpenAI推出的创新学习模式

ChatGPTスタディ - OpenAIが導入した革新的な学習モデル

ChatGPT Studyは、ソクラテスのような質問、足場となる回答、パーソナライズされた質問を通して、ユーザーが能動的に考え、段階的に問題を解決できるようガイドします。

最新のAIリソース

11ヶ月前

054.1K

Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - Googleが提供するAIバーチャルフィッティングアプリ

DopplはGoogleが提供するAIバーチャルフィッティングアプリだ。ユーザーが全身写真をアップロードした後、このアプリは自分の体のデジタル版で服の写真やスクリーンショットを「着る」ことをサポートし、静止画からAIが生成した動画に変換することができるため、ユーザーは服が体に与える影響をより実感することができる。

最新のAIリソース

12ヶ月前

054K

DeepSeek V3.1 - DeepSeek推出的最新开源AI模型

DeepSeek V3.1 - DeepSeekの最新のオープンソースAIモデル

DeepSeek V3.1は、DeepSeekが導入した新世代のAIモデルで、前モデルのV3をベースに重要なアップグレードが施されています。 DeepSeek V3.1は、思考モードと非思考モードを柔軟に切り替えることができるハイブリッド推論アーキテクチャを導入しており、思考...

最新のAIリソース

10ヶ月前

054K

靠岸妙写 - AI论文写作工具，构思到成稿一站式解决

Cushion Wonderful Writer - AIエッセイライティングツール、アイデアから論文完成までのワンストップソリューション

Leaning Wonderful WriterはAI論文作成ツールで、学術論文作成のための効率的で便利なソリューションを提供します。このツールは、ワンクリックで学位論文のアウトライン、アブストラクト、本文の初稿を作成することができ、科学技術、リベラルアーツ、社会科学などの学際的な分野をカバーし、学部生や修士号などさまざまなレベルの学術ニーズに対応します。

最新のAIリソース

1年前

054K

Squibler - AI小说辅助写作平台，助力构思到创作全过程

Squibler - アイデアから創作までの全プロセスを支援するAI小説執筆プラットフォーム

Squiblerは、作家のために設計された強力なAI支援ライティング・プラットフォームで、構想から創作、出版までの全プロセスを支援します。このプラットフォームは、小説、脚本、短編小説などをカバーするさまざまなストーリー・テンプレートを提供します。ユーザーは最初のコンセプトを入力するだけで、AIがアウトライン、キャラクター、シーンを生成します。

最新のAIリソース

10ヶ月前

054K

Make - AI无代码自动化工作流搭建平台

Make - AIによるコード不要の自動ワークフロー構築プラットフォーム

Makeは、自動化されたプロセスに基づいて組織の効率性と革新性の向上を支援する、AI主導のコード不要の自動化プラットフォームです。このプラットフォームは、マーケティング、販売、財務など、さまざまなビジネスシナリオをサポートする2,000以上の構築済みアプリを提供しています。Makeの主な機能には、コード不要のビジュアルプロセス作成、AI...

最新のAIリソース

1年前

053.9K

Hailuo 02 - MiniMax推出的AI视频生成模型，性能超越可灵和Veo 3

Hailuo 02 - MiniMax、KoringとVeo 3を凌駕するAI動画生成モデルを発表

Hailuo 02はMiniMaxの新しいAIビデオ生成モデルで、Hailuo 01のアップグレード版です。このモデルは、グラフ生成ビデオとテキスト生成ビデオの領域で優れたパフォーマンスを発揮し、ByteのSeedance 1.0に次いで2位、Fast...

最新のAIリソース

1年前

053.9K

Step-Audio-AQAA – StepFun推出的端到端大音频语言模型

Step-Audio-AQAA - StepFunのエンドツーエンド・ビッグオーディオ言語モデル

Step-Audio-AQAAは、StepFunチームによる、Audio Query-Audio Answer (AQAA)タスクのためのエンドツーエンドの大規模音声言語モデルです。従来の自動音声認識(AQAA)に頼ることなく、音声入力を直接処理し、自然で正確な音声応答を生成することができます。

最新のAIリソース

12ヶ月前

053.9K

NeverEnds：使用文字描述生成效果逼真的视频

NeverEnds：テキスト説明付きのリアルな動画を生成する

一般的な紹介ネバーエンドはシンガポール発のプラットフォームで、高度なモデルを通じてテキストをビデオに変換することで、あらゆる種類のストーリーに無限の創造的空間を提供している。ユーザーはこのプラットフォームで、創造性を自由に表現し、感情を伝え、ブランドイメージを構築することができる。このプラットフォームは、そのユニークな...

最新のAIリソース # AI画像から動画へ # AIテキストからビデオへ

2年前

053.8K

Muzaic - AI音乐生成平台，一键生成与视频内容匹配的音乐

Muzaic - ワンクリックで動画コンテンツにマッチした音楽を生成するAI音楽生成プラットフォーム

Muzaicは、動画制作者やコンテンツクリエイター向けに設計されたAI主導のオンライン音楽生成プラットフォームで、AIベースの技術により、動画の内容にマッチしたカスタム音楽を素早く生成し、わずか8秒で1分間のスタジオ品質のトラックを生成することができる。

最新のAIリソース

1年前

053.8K

MuseSteamer - 百度推出的视频生成大模型

MuseSteamer - 百度、動画生成のビッグモデルを発表

MuseSteamerは、百度が発表したマルチモーダル動画生成のための大型モデルである。このモデルは、ユーザーから提供されたテキスト説明や画像に基づいて、高品質の動的なビデオコンテンツを迅速に生成することができ、さまざまなシナリオでの作成のニーズを満たすために、様々な透明性と機能のバージョンをサポートしています。

最新のAIリソース

12ヶ月前

053.7K

UnifiedTTS - 一站式TTS API服务平台，实时性能监控

UnifiedTTS - ワンストップTTS APIサービスプラットフォーム、リアルタイムパフォーマンス監視

UnifiedTTSは音声合成（TTS）サービスのワンストッププラットフォームです。中国語、英語、日本語、韓国語を含む多言語をサポートし、グローバルビジネスのニーズに応えます。統一されたAPIインターフェイスを通じて、Micro...

最新のAIリソース

9ヶ月前

053.7K

MiDashengLM - 小米开源的声音理解模型

MiDashengLM - シャオミのオープンソース音理解モデル

MiDashengLMは、Xiaomiのオープンソースの効率的なサウンド理解のための大規模なモデルであり、特定のパラメータバージョンMiDashengLM-7Bは、オーディオ処理と理解に焦点を当てています。このモデルは、Xiaomi DashengオーディオエンコーダとQwen2.5-オム...

最新のAIリソース

11ヶ月前

053.7K

ChartAI - AI数据分析工具，智能推荐适合的图表类型

ChartAI - 適切なチャートタイプをインテリジェントに推奨するAIデータ分析ツール

ChartAIは、AI技術に基づいてデータを自動的に分析し、複雑な情報を素早く理解できる直感的なチャートを生成する効率的なデータ可視化ツールです。ChartAIは、さまざまなデータ形式（Excel、CSVなど）のインポートをサポートし、最適なチャートをインテリジェントに推薦します。

最新のAIリソース

1年前

053.6K

Goedel-Prover-V2 - 普林斯顿联合清华和英伟达等开源的定理证明模型

Goedel-Prover-V2 - プリンストン大学が清華大学やNVIDIAなどと共同で開発したオープンソースの定理証明モデル。

Goedel-Prover-V2は、プリンストン大学、清華大学、NVIDIAなどの主要機関が提供するオープンソースの定理証明モデルである。このモデルは、階層的データ合成、検証者による自己修正、モデルの平均化などの革新的な技術に基づいており、自動化された形式証明のパフォーマンスを大幅に向上させる。

最新のAIリソース

11ヶ月前

053.6K

Seed Diffusion - 字节跳动最新推出的扩散语言模型

シード拡散 - ByteHopperの最新拡散言語モデル

シード・ディフュージョンは、ByteHopが導入した実験的な拡散言語モデルで、コード生成タスクを処理する。このモデルは、2段階拡散学習、制約付き逐次学習、強化された効率的な並列デコードなどの技術に基づいており、推論速度が2,146トークン/秒と大幅に向上し、...

最新のAIリソース

11ヶ月前

053.5K

Olovka AI - AI学术写作辅助平台，提供精准的写作建议和辅助

Olovka AI - 正確な執筆アドバイスと支援のためのAIアカデミックライティング支援プラットフォーム

Olovka AIは、学生のためのAIアカデミックライティング支援プラットフォームで、学生の学術レベル、専門分野、論文の種類に基づいた的確なライティングアドバイスと支援を提供します。インテリジェントなアルゴリズムに基づき、Olovka AIは学生が高品質な学術論文を素早く執筆できるようサポートします。

最新のAIリソース

1年前

053.5K

V-JEPA 2 - Meta AI 推出的最强世界大模型

V-JEPA 2 - Meta AIによる世界最強の大型モデル

V-JEPA 2は、Meta AIが提供する12億のパラメータを持つビデオデータに基づく世界の大規模モデルである。このモデルは、100万時間以上のビデオと100万枚の画像から自己教師付き学習に基づいて学習され、物理世界の物体、行動、操作を理解する...

最新のAIリソース

1年前

053.5K

ChatFlow - 开源AI工作流自动化工具

ChatFlow - オープンソースのAIワークフロー自動化ツール

ChatFlowはオープンソースのAIワークフロー自動化ツールで、複雑な要件を効率的なワークフローに変換することをサポートします。コードフレームワークやテストケースを素早く生成し、ソフトウェアアーキテクチャの記述や設計を支援するAI技術をベースとしたツールです。

最新のAIリソース

11ヶ月前

053.5K

AopsAI - AI照片处理工具，一键将旧照片转动态视频

AopsAI - AI写真加工ツール、ワンクリックで古い写真をモーションビデオに変える！

AopsAIは、古い写真をダイナミックなショートビデオに変換するオンラインAIツールです。高度なAI技術に基づき、このツールは静止した写真を「動かす」ことで、過去の美しい瞬間を再現する。ユーザーが写真をアップロードし、メールアドレスを入力すると、AopsAIが24時間以内に自動的にビデオを生成し、それを...

最新のAIリソース

1年前

053.4K

GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - 推論、コード、インテリジェンスのためのスマート・スペクトラム・オープンソースSOTAモデル

GLM-4.5はSmart Spectrum社のオープンソースSOTAモデルで、インテリジェント・ボディ・アプリケーション用に設計され、推論、コード生成、インテリジェント・ボディ機能を組み込んでいます。このモデルはMixed Expert（MoE）アーキテクチャに基づいており、3,550億のパラメータを持つGLM-4.5と1,060億のパラメータを持つGLM-4.5の2つのバージョンがあります。

最新のAIリソース

11ヶ月前

053.4K

JoyHallo - 京东开源的AI数字人模型

JoyHallo - JingdongのオープンソースAIデジタル人体モデル

JoyHalloは、Jingdongが提供するオープンソースのAIデジタル人体モデルで、北京語向けに設計されており、音声をリアルなスピーキングビデオに変換することができます。JoyHalloは、唇の動きの予測精度を向上させるために半結合構造を使用したwav2vec2モデルに基づく音声特徴を埋め込み、英語ビデオの生成をサポートします。

最新のAIリソース

1年前

053.4K

绘想 - 百度推出的AI视频生成平台

絵画思考 - 百度がAI動画生成プラットフォームを発表

Paintingは百度が発表したAI動画生成プラットフォームで、AI技術に基づいて、ユーザーが簡単にパーソナライズされた動画を作成できるようにする。直感的なインターフェイス、強力なツール、インスピレーションの推薦機能を備えたペインティングは、クリエイターに創造的なインスピレーションを提供することができ、同じ操作のキーをサポートし、迅速に類似したビデオを生成することができ、創造的なプロセスを簡素化します。

最新のAIリソース

12ヶ月前

053.4K

MiniMax-M1 - MiniMax推出的开源推理模型

MiniMax-M1 - MiniMaxのオープンソース推論モデル

MiniMax-M1はMiniMaxチームによるオープンソースの推論モデルで、Mixed Expert Architecture（MoE）とLightning Attentionメカニズムの組み合わせに基づいており、総パラメータは4,560億である。このモデルは100...

最新のAIリソース

1年前

053.4K

LandPPT - 开源免费的AI PPT生成工具，支持本地部署和云端协作

LandPPT - 开源免费的AI PPT生成工具，支持本地部署和云端协作

LandPPT是基于大语言模型的开源AI PPT生成工具，支持通过主题或上传文档（PDF/Word/Excel）一键生成专业演示文稿。集成了多模型驱动、实时联网搜索和AI绘图功能，提供丰富的模板和场景...

最新のAIリソース

5ヶ月前

053.3K

羚珑 - 京东推出的AI商品图设计工具

Antelope（アンテロープ） - AI商品イメージデザインツール、京東が発表

AntelopeはJingdongが発表したインテリジェントデザインツールで、電子商取引業者と個人に効率的で便利なデザインソリューションを提供します。インテリジェントキーイング、インテリジェントレイアウト、インテリジェントカラーマッチングなどの機能により、ユーザーは商品のメイン画像、広告バナー、ショップページなど各種Eコマースストアに合わせた高品質なデザイン作品を素早く作成することができます。

最新のAIリソース

12ヶ月前

053.3K

MinerU2.5 - 上海AI Lab联合北大开源的文档解析模型

MinerU2.5 - 上海AI研究所と北京大学のオープンソース文書解析モデル

MinerU2.5は、上海人工知能研究所と北京大学のチームによって共同開発された、高解像度の文書画像解析を効率的に処理することを主眼とした非連成視覚言語モデルである。核となる革新的な点は、「大局的なレイアウト検出と局所的な内容認識」という2段階の設計にある。

最新のAIリソース

8ヶ月前

053.2K

OpenAkita - 开源的自进化AI助手框架，多平台无缝协作

OpenAkita - 开源的自进化AI助手框架，多平台无缝协作

OpenAkita是开源的自进化AI助手框架，提供智能、灵活且易于使用的AI辅助工具。每日自动执行内存整合、错误自检与修复、任务复盘，遇到卡壳时自动生成新技能并安装依赖，越用越聪明。支持Windows...

最新のAIリソース

4ヶ月前

053.2K

Megrez-3B-Omni：端侧多模态理解模型，支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni：テキスト、画像、音声のマルチモーダル理解と解析をサポートするエンドサイド・マルチモーダル理解モデル

総合紹介 Infini-Megrezは、ハードウェアとソフトウェアの共同設計により、効率的なマルチモーダル理解と解析の実現を目指し、不問の中核ドーム（Infinigence AI）が開発したエッジ・インテリジェンス・ソリューションである。プロジェクトの中核となるのは、グラフをサポートするMegrez-3Bモデルである。

最新のAIリソース # AI Java オープンソースプロジェクト # マルチモーダルなリアルタイム・インタラクティブ製品

1年前

053.1K

HunyuanVideo-アバター - テンセントハイブリッドオープンソース音声デジタル人体モデル

HunyuanVideo-Avatarは、Tencent Mixed YuanチームとTencent Music Tianqin Labが共同で発表した先進的な音声デジタル人体モデルである。このモデルは革新的なマルチモーダル拡散トランスフォーマーアーキテクチャに基づいており、ユーザーがアップロードしたキャラクター画像と音声に基づいて自然な表情を生成します。

最新のAIリソース

1年前

053.1K

CombatVLA - 淘天集团推出的高效VLA模型

CombatVLA - アモイ・グループによる効率的なVLAモデル

CombatVLAは、3Bパラメトリックスケールで構築されたビジョン-言語-アクション（VLA）モデルで、モーショントラッカーを通して人間のプレイヤーを収集します。

最新のAIリソース

10ヶ月前

053.1K

FastDeploy - 百度推出的高性能大模型推理与部署工具

FastDeploy - Baiduの高性能大規模モデル推論・展開ツール

FastDeployはFlying Paddle (PaddlePaddle)フレームワークに基づいて開発され、様々なハードウェアプラットフォームをサポートしています。

最新のAIリソース

11ヶ月前

053.1K

Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

シード GR-3 - ワードプレスシードチームによる汎用ロボティクスモデル

Seed GR-3は、ByteDance社が導入した汎用ロボットモデルで、新しい環境や複雑なコマンドに適応するための強力な汎化能力を備えている。このモデルは、視覚情報、言語情報、動作情報を融合し、ロボットデータ、VR人間の軌跡データ、公共グラフィックデータの3-in-1の学習方法に基づいており、新しい対象への対応能力を向上させる...

最新のAIリソース

11ヶ月前

053.1K

AIMangaStudio - 免费的AI漫画创作工具，提供完整创作流程

AIMangaStudio - フリーのAIマンガ作成ツール！

AIMangaStudioは、プロット生成、サブシーンデザイン、キャラクター設定などの機能を含む完全なマンガ制作パイプラインをクリエイターに提供し、脚本からマンガページまでの制作プロセスを簡素化できる無料のAIマンガ制作ツールです。プロット、セリフ、キャラクター設定など、マンガ原稿の自然言語生成をサポート。

最新のAIリソース

9ヶ月前

053.1K

Banana Slides - 基于Nano Banana Pro模型的开源AI PPT生成工具

Banana Slides - Nano Banana Proモデルに基づいたオープンソースのAI PPT生成ツール

Banana Slidesは、Nano Banana Pro AIモデルに基づいたオープンソースのインテリジェントなPPTジェネレーターです。ユーザーがトピックを一文で説明することができ（例えば「生態系への人間の影響」）、それを自己...

最新のAIリソース

6ヶ月前

053K

VoxCPM - 面壁智能联合清华开源的端到端TTS模型

VoxCPM - Facing Intelligenceと清華オープンソースのエンドツーエンドTTSモデル

VoxCPMはエンド・ツー・エンドの拡散自己回帰アーキテクチャを採用し、テキストから直接連続音声表現を生成することで、従来の離散的な曖昧性解消の限界を打ち破っている。階層的言語モデリングと有限状態量子化を通して...

最新のAIリソース

9ヶ月前

052.9K

EXAONE 4.0 - LG推出的混合推理模型

EXAONE 4.0 - LGのハイブリッド推論モデル

EXAONE4.0は、韓国LG AI Research社のハイブリッド推論グランドモデルで、汎用自然言語処理と高度な推論機能を融合している。韓国語、英語、スペイン語をサポートし、32Bのプロフェッショナル版と1.2Bのエンドサイド版に分かれています。プロフェッショナル・バージョンは、法律、会計...

最新のAIリソース

11ヶ月前

052.9K

Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列

カンディンスキー5.0 - ロシアのAIチームがオープンソースの映像生成モデルシリーズを公開

Kandinsky 5.0は、ロシアのAIチームによって開発された最新のビデオジェネレーションモデルシリーズで、軽量設計と高性能に重点を置いている。シリーズ最初のモデルであるKandinsky 5.0 Video Liteは、パラメータはわずか20億だが、類似の14Bモデルを凌駕しており、特に...

最新のAIリソース

8ヶ月前

052.7K

OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker - アリ、リアルタイムテキスト駆動型トーキングアバター生成フレームワークを発表

OmniTalkerは、アリババが提供するリアルタイムテキストドリブントーキングアバター生成フレームワークです。このフレームワークは、ストリーミングアプローチに基づいて自然な音声応答を生成するために、テキスト、画像、音声、ビデオなどの複数のモーダル入力を同時に扱うことができます。コアはThinker-Talkerアーキテクチャに基づいています。

最新のAIリソース

1年前

052.7K

Mu - 微软推出的小参数语言模型，支持Windows智能体

Mu - マイクロソフト、Windows Intelligentsiaをサポートする小さなパラメータ言語モデルを発表

Muは、NPUやエッジデバイスで効率的に動作するように設計された、わずか3億3,000万のパラメータを持つMicrosoftの小パラメータ言語モデルである。このモデルはエンコーダー・デコーダー・アーキテクチャーに基づいており、ハードウェアを意識した最適化、モデルの定量化、タスク固有の微調整により、1秒間に100トークンを超える応答速度を達成している。

最新のAIリソース

1年前

052.7K

女娲智能体OS - 西南财经开源的通用智能体操作系统

女娲智能体OS - 西南财经开源的通用智能体操作系统

女娲智能体OS（Nuwax Agent OS）是西南财经大学赵宇教授团队推出的全球首个开源通用智能体操作系统。具备自主执行引擎，可实现从需求拆解到任务规划与执行的全链路自动化。系统支持可视化工作流编排...

最新のAIリソース

5ヶ月前

052.7K

InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Qunar Technologyによる3Dガウス・セマンティック・データセット

InteriorGSは、Qunar Technologyによって導入された高品質の3Dガウス意味データセットである。このデータセットには、住宅、コンビニエンスストア、結婚式場、美術館など80以上の屋内環境をカバーする1,000の3Dシーンが含まれている。このデータセットには、755のカテゴリに分類された554,000以上のオブジェクトインスタンスが含まれている。

最新のAIリソース

11ヶ月前

052.7K

日日新 V6.5 - 商汤科技推出的最新多模态推理大模型

Day by Day V6.5 - ShangTechによる最新のマルチモーダル推論マクロモデル

Day by Day V6.5はShangTechの先進的なマルチモーダル推論マクロモデルで、画像とテキストの混合入力を扱うように設計されており、画像コンテンツの正確な理解をサポートし、テキストと組み合わせて説明文を生成したり、質問に答えたりする。

最新のAIリソース

11ヶ月前

052.6K

ChatGPT Agent – OpenAI推出的通用智能AI Agent

ChatGPTエージェント - OpenAIによる汎用インテリジェントAIエージェント

ChatGPTエージェントはOpenAIの汎用AIエージェントで、複数の機能を組み合わせて複雑なタスクを自律的にこなします。ユーザーは自然言語でニーズを記述するだけで、エージェントは自動的に適切なツールを選択することができます。例えば、ウェブの閲覧、情報の抽出、コードの実行...

最新のAIリソース

11ヶ月前

052.6K

nanobot - HKUDS开源的超轻量级个人AI助手框架

nanobot - HKUDS开源的超轻量级个人AI助手框架

nanobot 是香港大学数据智能实验室（HKUDS）开源的超轻量级个人AI助手框架，仅用约 4,000行Python代码实现了完整的多通道AI助手功能。作为 OpenClaw 的轻量替代品，nano...

最新のAIリソース

4ヶ月前

052.6K

MoFlow - AI情绪管理应用，用自由书写调节情绪

MoFlow - 自由な書き込みで感情を調整するAIムード管理アプリ

MoFlowは心理学とAI技術を組み合わせた感情管理アプリだ。ユーザーが自分の感情を文章やチャットで表現できるプライベートな空間を提供し、AIパートナーが辛抱強く話を聞いてフィードバックしてくれる。

最新のAIリソース

1年前

052.6K

Hailuo Video Agent - MiniMax推出的AI视频创作Agent

Hailuoビデオエージェント - MiniMaxのAIビデオ作成エージェント

Hailuo Video Agentは、MiniMaxが発表した閾値ゼロのAI動画作成エージェントで、オープンベータ版です。簡単なテキスト入力や画像のアップロードにより、ワンクリックで高品質なクリエイティブ動画を作成することができ、幅広い用途に対応します。

最新のAIリソース

1年前

052.6K

琴乐大模型 - 腾讯推出的AI音乐创作模型

ピアノ音楽ビッグモデル-テンセントがAI作曲モデルを発表

Qin Music Grand Modelは、Tencent AI LabとTencent TME Tianqin Labが共同で発表した先進的なAI音楽作成グランドモデルである。このモデルは、ユーザーが入力したキーワード、説明文、または英語と中国語のオーディオクリップに基づいて、高品質のステレオオーディオまたはマルチトラックの楽譜をインテリジェントに生成します。

最新のAIリソース

1年前

052.6K

悟能 - 商汤科技最新推出的具身智能平台

Wuneng - Shangtang Technologyの最新ボディ・インテリジェンス・プラットフォーム

Wunengはロボットとスマートデバイスのために設計された体現知能プラットフォームである。悟り」の世界モデルとマルチモーダルビッグモデル技術に基づき、Wunengは視覚、音声、触覚などのマルチセンサー入力を統合し、強力な知覚、意思決定、行動能力を備えている。

最新のAIリソース

11ヶ月前

052.6K

Lemon Slice Live - Lemon Slice推出的 AI 实时视频聊天工具

Lemon Slice Live - レモンスライスからのAIライブビデオチャット

Lemon Slice Liveは、Lemon Slice社が提供するリアルタイムビデオチャットAIツールです。Lemon Slice Liveは、Diffusion Transformerモデル（DiT）に基づいており、あらゆる写真やイラストをリアルタイムのインタラクティブな動きに変換することができます。

最新のAIリソース

1年前

052.5K

HIRING.STUDIO - AI招聘面试辅助工具，针对特定职位生成面试问题

HIRING.STUDIO - 職種別の面接質問を生成するAI面接支援ツール

HIRING.STUDIOは、採用チームが職種に特化した面接質問を効率的に作成するためのAI採用面接支援ツールです。AI技術に基づき、面接質問を生成し、フォローアップ質問を提案し、質の異なる回答に対する評価基準を作成します。このツールは、STAR方式をサポートしています...

最新のAIリソース

1年前

052.5K

AudioFly - 科大讯飞开源的文本生成音效AI模型

AudioFly - KU Xunfeiオープンソーステキスト生成サウンドAIモデル

AudioFlyは、KDDIが開発したテキストから効果音を生成するオープンソースのAIモデルです。AudioSet、AudioCaps、TUTなどの公開データセットと内部データセットを含む、大規模で多様な音声テキストデータセットで学習させた、10億個のパラメータを持つ潜在拡散モデルアーキテクチャに基づいています。

最新のAIリソース

9ヶ月前

052.5K

Vace AI - AI 视频制作和编辑平台，提供一站式视频创作服务

Vace AI - AI映像制作・編集プラットフォーム、ワンストップ映像制作サービスを提供

Vace AIは強力なワンストップAI動画制作・編集プラットフォームです。このプラットフォームは、テキスト説明や参照画像に基づいて高品質のビデオコンテンツを生成し、ビデオの拡張、スタイル変換、被写体の除去や再構築などのさまざまな編集機能をサポートしています。

最新のAIリソース

1年前

052.5K

Hunyuan3D-Omni - 腾讯混元开源的3D模型生成框架

Hunyuan3D-Omni - テンセント混合ソースオープンソース3Dモデル生成フレームワーク

Hunyuan3D-Omni（ハイブリッド3D-オムニ）は、Tencentのハイブリッド3Dチームによるオープンソースの3Dアセット生成フレームワークで、複数の制御信号を通じて正確な3Dモデル生成を可能にする。Hunyuan3D 2.1アーキテクチャに基づき、点...

最新のAIリソース

9ヶ月前

052.4K

Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - Anthropicの最強プログラミングモデル

Claude Opus 4.1は、複雑なタスクを効率的に処理するために設計された、Anthropicによる最先端の大規模言語モデルです。このモデルはプログラミング領域で優れており、高品質のコードを生成し、最大32kの単一出力をサポートし、幅広いプログラミングスタイルに適応します。

最新のAIリソース

11ヶ月前

052.4K

DeepSeek-R1 - DeepSeek推出的AI推理模型，性能对齐 OpenAI o1 正式版

DeepSeek-R1 - DeepSeekのAI推論モデル。

DeepSeek-R1は、杭州を拠点とするDeepSeekが発表した高性能AI推論モデルで、OpenAIのo1正式版に対するベンチマークである。このモデルは、大規模な強化学習技術に基づいて事後学習されており、数学、コード、自然言語で推論を行うために必要なラベル付きデータはごくわずかである。

最新のAIリソース

1年前

052.3K

企鹅读伴 - 腾讯推出的中小学生AI阅读助手

ペンギン・リーディング・コンパニオン - テンセントの小中学生向けAI読書アシスタント

Penguin Reading Companionは、テンセントが開発した小中学生向けのAI読書アシスタントです。Penguin Reading Companionは、テンセントのハイブリッドビッグモデルとメタマシンプラットフォームに、義務教育言語カリキュラムプログラムとカリキュラム標準（2022年版）を組み合わせることで、生徒にパーソナライズされたおすすめの読書、複数の読書モード（フォーカス、音読、リスニング...

最新のAIリソース

1年前

052.3K

Lucy Edit - 开源的AI视频编辑工具，自然语言描述编辑

Lucy Edit - オープンソースのAIビデオ編集ツール、自然言語記述編集

Lucy Editは、Decart AIが開発したオープンソースのAI動画編集ツールです。複雑な微調整やマスクの使用を必要とせず、「キャラクターをシロクマに変える」「シーンを2Dアニメ風にする」といった簡単な自然言語による記述で動画を編集できる。

最新のAIリソース

9ヶ月前

052.2K

浙江大学免费PDF资料《大模型基础》 - 附下载链接

浙江大学から大型モデルの基礎の無料PDF - ダウンロードリンク付き

ファンダメンタルズ・オブ・ラージ・モデルは、ラージ・ランゲージ・モデル（LLM）のコア技術と実用的な道筋を詳細に分析する。言語モデリングの基礎理論から始まり、統計的、リカレントニューラルネットワーク（RNN）、トランスフォーマーアーキテクチャに基づくモデル設計の原理を、3つの主要な大規模言語モデルに焦点を当てて体系的に解説しています。

最新のAIリソースコース情報

9ヶ月前

052.2K

Klic Studio - AI音视频翻译配音工具，一键部署全流程

Klic Studio - AI音声・動画翻訳・ダビングツール、全プロセスをワンクリックで展開

Klic Studio（旧クリリンAI）は、動画クリエイターやコンテンツエクスポーターのために設計されたAIベースの動画翻訳、ダビング、ボイスクローンツールです。ワンクリックで動画をダウンロードから出力まで完了させることができます。

最新のAIリソース

1年前

052.2K

EchoMimicV3 - 蚂蚁开源的多模态数字人动画生成模型

EchoMimicV3 - Ant オープンソースマルチモーダルデジタルヒューマンアニメーション生成モデル

EchoMimicV3は、Ant Groupが発表したマルチモーダルデジタル人体動画生成モデルで、13億のパラメータを持ち、音声、テキスト、画像などの複数の入力を扱うことができ、高品質のデジタル人体アニメーションを生成することができます。

最新のAIリソース

10ヶ月前

052.1K

Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - Jiyuanのオープンソース汎用ロボットプラットフォーム、Beihangなどと共同開発

Genie Envisioner（GE）は、Genie Roboticsチームがシンガポール国立大学、北京航空航天大学などと共同で開発したロボット操作のための統合プラットフォーム。まず想像し、それから行動する」ことで、ロボットがタスクをよりよく理解し、実行することを可能にする。

最新のAIリソース

10ヶ月前

052.1K

Hyperbolic AgentKit：让Agents拥有自己的计算资源，能够自主管理 GPU、执行区块链操作和社交发布

Hyperbolic AgentKit: エージェントに独自の計算リソースを提供し、GPUを自律的に管理し、ブロックチェーン操作やソーシャルパブリッシングを実行する能力を与える。

概要 Hyperbolic AgentKitは、ブロックチェーンとコンピューティングパワーを組み合わせたAIエージェントを実行するためのテンプレートを提供することを目的としたオープンソースプロジェクトである。このプロジェクトは、CoinbaseのCDP Agentkitをベースに、ブロックチェーンの端末をサポートするための修正と拡張を加えています。

最新のAIリソース # AIオープンサービス

2年前

052.1K

ML-Master – 上海交大推出的AI专家Agent

ML-マスター - SJTUがAIエキスパートエージェントを発表

ML-Masterは上海交通大学人工知能学院のエージェントチームによって開発されたAIエキスパート・インテリジェンスです。OpenAIの権威あるベンチマークテストMLE-benchで好成績を収め、平均メダル獲得率29.3%でマイクロソフトのRD-Agentを上回りトップに立った。

最新のAIリソース

12ヶ月前

052K

ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - オーディオ・ジェネレーション・モデリング from Ali Tongyi

ThinkSoundは、アリ・トンイのスピーチチームが初めて導入したCoT（連鎖思考）音声生成モデルです。このモデルは、CoT推論の導入に基づいて、従来の技術では画面の動的な詳細や空間的な関係をキャプチャすることが困難であるという問題を解決するために、ビデオ画像に正確に一致する効果音を生成することができます。

最新のAIリソース

12ヶ月前

052K

Mureka V7.5 - 昆仑万维推出的先进AI音乐创作模型

Mureka V7.5 - クインテッセンスの先進AI音楽制作モデル

Mureka V7.5は、崑崙ワールドワイドが提供する、中国歌曲に特化した最先端のAI音楽生成モデルです。このモデルは、音色と演奏テクニックを正確に再現し、自然で滑らかで感情的なボーカルを生成します。最適化された自動音声認識（ASR）技術に基づき、Mureka V...

最新のAIリソース

10ヶ月前

052K

AionUi - 免费开源的多AI Agent桌面应用

AionUi - 免费开源的多AI Agent桌面应用

AionUi是一个免费开源的多AI Agent桌面应用，支持将Gemini CLI、Claude Code等命令行AI工具整合到图形界面，提供本地文件操作、多会话管理、跨平台运行等功能。支持macOS...

最新のAIリソース

4ヶ月前

051.9K

Shortbread - AI漫画生成工具，自然语言描述完成漫画创作

ショートブレッド - AIコミック生成ツール、自然言語記述でコミックを完成させる

Shortbreadは、ユーザーが簡単な自然言語の説明に基づいて完全なコミックをすばやく作成できるAIコミック生成ツールです。Shortbreadは、描画スキルを必要とせず、テキストを入力するだけで、AIがユニークなキャラクター、シーン、感情を持つパーソナライズされたコミックをすばやく生成します。

最新のAIリソース

1年前

051.9K

AI Agent Company Researcher：自动化公司信息研究情报员

AIエージェント企業研究家：自動企業情報リサーチ・インテリジェンサー

概要 AI Company Research Assistantは、企業リサーチとリードジェネレーションのプロセスを自動化するために設計された人工知能ベースのツールです。LangGraphやFireCrawlなどの技術を利用し、わずか数分で詳細な企業調査レポートを作成することができます。ユーザは単に...

最新のAIリソース

1年前

051.9K

QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max - アリ・トンイ、視覚的推論モデルを発表

QVQ-MaxはAlitonix社の最先端の視覚推論モデルで、QVQ-72B-Previewのアップグレード版です。画像やビデオコンテンツを「読み取り」、分析と問題解決のための情報と組み合わせることができます。QVQ-Maxは、画像やビデオコンテンツを「読み取り」、分析、推論、問題解決のために情報を組み合わせることができる最先端の視覚推論モデルです。QVQ-Maxの主な機能には、画像解析、ビデオ分析...

最新のAIリソース

1年前

051.8K

11ai - ElevenLabs推出个人AI语音助理

11ai - イレブンラボ、パーソナルAI音声アシスタントを発表

11aiはElevenLabsが発表したAI音声アシスタントで、音声対話を中核とし、自然でスムーズな対話を通じてユーザーの作業効率を高める。11aiは5,000以上の音声をサポートし、ユーザーは専用の音声をカスタマイズでき、アシスタントはよりパーソナライズされる。低遅延の音声インタ...

最新のAIリソース

12ヶ月前

051.7K

自动生成每日Product Hunt热门产品榜单

Product Huntのホットプロダクトリストを毎日自動生成する

概要 Product Hunt Daily Chinese Hotlistは、GitHub Actionsをベースとした自動化ツールで、Product Huntで人気のある商品のリストを、Markdownファイルの形で毎日定期的に生成します。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

051.6K

有道小P - 网易有道推出的新一代AI全科学习助手

Youdao Xiao P - Netease Youdaoが発表した新世代のAI総合学習アシスタント

Youdao Little Pは、NetEase Youdaoが発表したAI全教科学習アシスタントで、K12の学生向けに設計され、Youdao Ziyi教育ビッグモデルを搭載し、小学校、中学校、高校の全教科のQ&Aをカバーし、個人的な学習アドバイスを提供する。AI単語検索とAI翻訳機能で、Youdao Little Pは生徒が言語の問題を素早く解決できるようサポートします...

最新のAIリソース

1年前

051.6K

Wan2.2-S2V - 阿里通义开源的音频驱动视频生成模型

Wan2.2-S2V - Ali Tongyi オープンソース音声駆動ビデオ生成モデル

Wan2.2-S2VはAli Tongyiのオープンソースのマルチモーダルビデオ生成モデルであり、静止画像と音声のみで、高品質のデジタルヒューマンビデオを生成することができ、様々な画像タイプとフレームをサポートしています。

最新のAIリソース

10ヶ月前

051.5K

稿定AI社区 - AI创意内容设计平台，多种设计资源满足不同创作需求

Drafting AI Community - AIクリエイティブコンテンツデザインプラットフォーム。

Drafting AI Communityは、ユーザーに豊富なクリエイティブデザインリソースとツールを提供するオンラインAIクリエイティブインスピレーションプラットフォームです。このプラットフォームは、イメージ写真、Eコマースデザイン、ホリデーテーマ、3Dイラスト、アバターデザイン、小紅集素材、似顔絵デザインなど、様々なデザイン分野をカバーし、様々なユーザーのニーズに応えます。

最新のAIリソース

1年前

051.5K

Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - Ali Tongyi オープンソース画像編集モデル

Qwen-Image-Editは、Ali Tongyiによって導入された、200億のパラメータを持つQwen-Imageアーキテクチャ上に構築された、万能画像編集モデルです。このモデルはセマンティック編集と外観編集の両方の機能を兼ね備えており、画像に対して低レベルの視覚的外観編集を行うことができます（例：追加、削除...

最新のAIリソース

10ヶ月前

051.4K

Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - オープンソースの効率的なマルチモーダルモデリング by KunlunWanwei

Skywork UniPic 2.0は、Quintessenceによってオープンソース化された効率的なマルチモーダルモデルであり、画像生成、編集、理解に焦点を当てている。このモデルは、2BパラメータのSD3.5-Mediumアーキテクチャに基づいており、事前学習、漸進的なデュアルタスク強化戦略、共同学習によって実現される。

最新のAIリソース

10ヶ月前

051.4K

Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - Ali Tongyi氏によるオープンソースの高性能プログラミングモデル

Qwen3-Coder-Flashは、Ali Tongyi Thousand Questionsチームによって導入された高性能プログラミングモデルであり、優れたエージェントベースプログラミングとツール呼び出し機能を持ち、複雑なプログラミングタスクを処理するのに適している。Qwen3-Coder-Flashは、256Kトークンの長い文脈理解をサポートし、1Mトーク...

最新のAIリソース

11ヶ月前

051.4K

Claudable - 开源AI Web应用构建器，自然语言生成代码

Claudable - オープンソースAIウェブアプリケーションビルダー、自然言語生成コード

Claudableは、Next.jsをベースにしたオープンソースのウェブアプリビルダーです。Claude CodeとCursor CLIの高度なAIエージェント機能と、Lovableのシンプルで直感的なアプリ構築体験を組み合わせています。

最新のAIリソース

10ヶ月前

051.3K

RedOne - 小红书最新推出的社交大模型

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。

最新のAIリソース

11ヶ月前

051.3K

AnimaTensor - 吐司AI等机构推出的二次元图像生成模型

AnimaTensor - Toast AI などによる二次画像生成モデル

AnimaTensorは、CagliostroLabチームがTensorArtと共同で開発した2次画像生成モデルで、画像生成プロセスの「速度」を予測することでノイズスケジューリングを最適化する革新的なV-予測技術に基づいています。

最新のAIリソース

12ヶ月前

051.2K

Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1-アリが発表したマルチモーダル統一AIモデル

Ovis-U1は、アリババグループのOvisチームによって導入されたマルチモーダル統一モデルで、パラメータ規模は30億である。このモデルは、マルチモーダル理解、テキストから画像への生成、画像編集の3つのコア機能を持ち、先進的なアーキテクチャ設計と協調的かつ統一的なトレーニングメソッドにより、忠実度の高い画像の実現をサポートする。

最新のAIリソース

12ヶ月前

051.2K

Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - 金融推論のためのビッグモデル by Anthem Digital

Agentar-Fin-R1は、Anthem社によって導入された金融領域向けの最先端の大規模言語モデルである。強力なQwen3アーキテクチャに基づいて開発されたこのモデルは、8Bと32Bの2つのパラメータスケールバージョンを提供し、多段階分析、リスク評価、戦争などの複雑な金融推論タスクを正確に処理することができます。

最新のAIリソース

11ヶ月前

051.1K

Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Shanghai AI Labによるオープンソースの軽量科学的マルチモーダルモデル

Intern-S1-miniは、上海人工知能研究所(SAL)が発表したパラメータスケール8Bの軽量科学用マルチモーダル・マクロモデルである。Intern-S1の強力な機能を継承し、汎用的な機能と特殊な科学的機能の両方を兼ね備えており、迅速な展開や二次開発に適している。性能面では、I...

最新のAIリソース

10ヶ月前

051.1K

もっと読む