最新のAIリソース

共 3107 篇文章
PromptForge - AI 提示词生成与优化工作台

プロンプトフォージ - AIプロンプト生成・最適化ワークベンチ

プロンプトフォージ(PromptForge)は、AIキューを効率的に作成、テスト、最適化するための強力なAIキューエンジニアリングワークベンチです。プロンプトフォージ(PromptForge)は、マルチモデル比較とダイナミックパラメーターチューニングをサポートするインテリジェントな生成機能により最適化提案を提供し、ユーザーに柔軟な比較を提供します。
11ヶ月前
053.1K
ScienceOne - 中国科学院自动化研究所等机构推出的智能科研平台

ScienceOne - 中国科学院自動化研究所などが立ち上げたインテリジェント研究プラットフォーム

ScienceOneは、中国科学院自動化研究所が共同で立ち上げたインテリジェント科学研究プラットフォームである。ScienceOneは、中国科学院自動化研究所が共同で立ち上げたインテリジェント科学研究プラットフォームで、大規模な科学基盤モデルの構築に基づいており、学際的なコラボレーションによるインテリジェント科学研究の新しいパラダイムを推進し、科学研究の全プロセスをサポートします。
1年前
053K
Goedel-Prover-V2 - 普林斯顿联合清华和英伟达等开源的定理证明模型

Goedel-Prover-V2 - プリンストン大学が清華大学やNVIDIAなどと共同で開発したオープンソースの定理証明モデル。

Goedel-Prover-V2は、プリンストン大学、清華大学、NVIDIAなどの主要機関が提供するオープンソースの定理証明モデルである。このモデルは、階層的データ合成、検証者による自己修正、モデルの平均化などの革新的な技術に基づいており、自動化された形式証明のパフォーマンスを大幅に向上させる。
11ヶ月前
052.9K
觅果·Migo - AI学术研究助手,智能问答满足多样化需求

Migo - AI学術研究アシスタント、多様なニーズに応えるインテリジェントQ&A

Forage-Migoは、テキスト、言語、視覚、データ処理をサポートする強力なマルチモーダルAI機能を備えた、AI主導の学習・研究イノベーションプラットフォームです。Migoは、インテリジェントなQ&A、ウェブページの読書支援、文献の読書、アカデミックライティング、論文の読書、化学...
1年前
052.9K
Mobvoi MCP Server - 出门问问开源的多模态MCP服务工具

モボイMCPサーバー - オープンソースのマルチモーダルMCPサービスツールをアスクアウト

モボイMCPサーバーは、GoDoQが提供を開始したマルチモーダルAI機能を統合するツールです。Mobvoi MCP Serverは、音声生成、サウンドクローン、イメージドリブンデジタルピープル、ビデオダビング、ビデオ翻訳を統合したマルチモーダルAIツールで、ユーザーがテキストを入力することで柔軟に呼び出すことができます。
1年前
052.9K
RoboBrain 2.0 - 智谱开源的通用具身大脑模型

RoboBrain 2.0 - ウィズダムスペクトラムのオープンソース汎用具現化脳モデル

ロボブレイン2.0は、ロボットに強力な知覚、推論、計画能力を提供するオープンソースの先進的な具現化脳モデルである。ロボブレイン2.0は、7Bと32Bの2つのバージョンで構成され、視覚エンコーダーと言語モデルを統合したヘテロジニアスアーキテクチャを採用し、ロボットをサポートする...
11ヶ月前
052.9K
Knit:提示词指令设计管理工具

ニット:キュー・ワード指導設計管理ツール

一般的な紹介 PromptKnitは、AIプロンプトデザイナーのためのトップAIサンドボックスプラットフォームであり、gpt-4-turbo/vision、claude-3、gemini-1.5-proや他の多くのモデルのためのプロフェッショナルなプロンプトエディタを提供します。ユーザーは、プロンプトをグループ化することができます。
2年前
052.9K
ConverzAI - AI招聘平台,自动收集候选人信息进行筛选

ConverzAI(コンバーツエーアイ) - 候補者情報を自動収集し選考を行うAI採用プラットフォーム

ConverzAIは、採用プロセスを最適化するAI技術をベースとした採用プラットフォームである。このプラットフォームは、仮想リクルーター(AIエージェント)を配置し、応募追跡システム(ATS)から候補者情報を自動的に収集し、一次スクリーニングを行うことを基本としている。このプラットフォームは、電話、Eメール、SMSなどの複数のチャネルを使用する。
1年前
052.8K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI - エージェント駆動型ユーザー・インタラクション・インターフェースのためのGoogleのオープンソース宣言型プロトコル

A2UI(Agent-to-User Interface)は、Googleがオープンソースで提供するエージェント駆動型インターフェース・プロトコルであり、AIエージェント向けに複雑な対話型インターフェースを生成する際の課題に対処する。AIエージェントがユーザーインターフェースの構造を記述できるようにする宣言的なJSONフォーマットを通じて、クライアントアプリケーションは、AIエージェントがユーザーインターフェースの構造を記述できるようにします。
6ヶ月前
052.8K
NeverEnds:使用文字描述生成效果逼真的视频

NeverEnds:テキスト説明付きのリアルな動画を生成する

一般的な紹介 ネバーエンドはシンガポール発のプラットフォームで、高度なモデルを通じてテキストをビデオに変換することで、あらゆる種類のストーリーに無限の創造的空間を提供している。ユーザーはこのプラットフォームで、創造性を自由に表現し、感情を伝え、ブランドイメージを構築することができる。このプラットフォームは、そのユニークな...
2年前
052.8K
宠TA - 京东推出的AI宠物互动产品

ペットTA - AIペット対話製品、京東が発売

ペットTA」は京東のAIGCペットインタラクティブ製品で、ペット愛好家に楽しくて暖かいオンラインインタラクティブプラットフォームを提供することができる。ユーザーがペットのために様々な可愛い服やアクセサリーを選んだり、個人的な着せ替えをしたり、ペットのデジタルイメージを作成したりして、ペットとの豊かな交流をサポートする。このプラットフォームは...
12ヶ月前
052.7K
Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - Googleオープンソースプログラミングエージェント

Gemini CLIは、強力なAI機能を開発者に提供するために、開発者のエンドポイントにGemini Big Modelを組み込むことに基づいたGoogleのオープンソースAIプログラミングツールである。このツールは、コードを理解し、ファイルを操作し、コマンドを実行し、問題を動的にトラブルシュートし、開発者が効率的にジェネレーションを書けるように支援する。
12ヶ月前
052.7K
RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 - ウィズダムスペクトラムのオープンソース・クロスオントロジー・エンボディド・ブレインサイズ・コラボレーション・フレームワーク

RoboOS 2.0は、オントロジーを超えた脳と脳のコラボレーションを実現するオープンソースのフレームワークであり、ロボットの単一知能からグループ協調知能への転換を促進する。このフレームワークでは、クラウドブレインが複雑な意思決定とコラボレーションを担当し、スモールブレインモジュールが特定のスキルの実行に集中するという、効率的な役割分担を実現するために「ビッグブレイン」アーキテクチャを採用している。
11ヶ月前
052.6K
靠岸妙写 - AI论文写作工具,构思到成稿一站式解决

Cushion Wonderful Writer - AIエッセイライティングツール、アイデアから論文完成までのワンストップソリューション

Leaning Wonderful WriterはAI論文作成ツールで、学術論文作成のための効率的で便利なソリューションを提供します。このツールは、ワンクリックで学位論文のアウトライン、アブストラクト、本文の初稿を作成することができ、科学技術、リベラルアーツ、社会科学などの学際的な分野をカバーし、学部生や修士号などさまざまなレベルの学術ニーズに対応します。
1年前
052.6K
Make - AI无代码自动化工作流搭建平台

Make - AIによるコード不要の自動ワークフロー構築プラットフォーム

Makeは、自動化されたプロセスに基づいて組織の効率性と革新性の向上を支援する、AI主導のコード不要の自動化プラットフォームです。このプラットフォームは、マーケティング、販売、財務など、さまざまなビジネスシナリオをサポートする2,000以上の構築済みアプリを提供しています。Makeの主な機能には、コード不要のビジュアルプロセス作成、AI...
1年前
052.5K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - アイデアから創作までの全プロセスを支援するAI小説執筆プラットフォーム

Squiblerは、作家のために設計された強力なAI支援ライティング・プラットフォームで、構想から創作、出版までの全プロセスを支援します。このプラットフォームは、小説、脚本、短編小説などをカバーするさまざまなストーリー・テンプレートを提供します。ユーザーは最初のコンセプトを入力するだけで、AIがアウトライン、キャラクター、シーンを生成します。
10ヶ月前
052.4K
Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助

Olovka AI - 正確な執筆アドバイスと支援のためのAIアカデミックライティング支援プラットフォーム

Olovka AIは、学生のためのAIアカデミックライティング支援プラットフォームで、学生の学術レベル、専門分野、論文の種類に基づいた的確なライティングアドバイスと支援を提供します。インテリジェントなアルゴリズムに基づき、Olovka AIは学生が高品質な学術論文を素早く執筆できるようサポートします。
1年前
052.3K
Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - Googleが提供するAIバーチャルフィッティングアプリ

DopplはGoogleが提供するAIバーチャルフィッティングアプリだ。ユーザーが全身写真をアップロードした後、このアプリは自分の体のデジタル版で服の写真やスクリーンショットを「着る」ことをサポートし、静止画からAIが生成した動画に変換することができるため、ユーザーは服が体に与える影響をより実感することができる。
12ヶ月前
052.3K
Muzaic - AI音乐生成平台,一键生成与视频内容匹配的音乐

Muzaic - ワンクリックで動画コンテンツにマッチした音楽を生成するAI音楽生成プラットフォーム

Muzaicは、動画制作者やコンテンツクリエイター向けに設計されたAI主導のオンライン音楽生成プラットフォームで、AIベースの技術により、動画の内容にマッチしたカスタム音楽を素早く生成し、わずか8秒で1分間のスタジオ品質のトラックを生成することができる。
1年前
052.2K
V-JEPA 2 - Meta AI 推出的最强世界大模型

V-JEPA 2 - Meta AIによる世界最強の大型モデル

V-JEPA 2は、Meta AIが提供する12億のパラメータを持つビデオデータに基づく世界の大規模モデルである。このモデルは、100万時間以上のビデオと100万枚の画像から自己教師付き学習に基づいて学習され、物理世界の物体、行動、操作を理解する...
1年前
052.1K
GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - 推論、コード、インテリジェンスのためのスマート・スペクトラム・オープンソースSOTAモデル

GLM-4.5はSmart Spectrum社のオープンソースSOTAモデルで、インテリジェント・ボディ・アプリケーション用に設計され、推論、コード生成、インテリジェント・ボディ機能を組み込んでいます。このモデルはMixed Expert(MoE)アーキテクチャに基づいており、3,550億のパラメータを持つGLM-4.5と1,060億のパラメータを持つGLM-4.5の2つのバージョンがあります。
11ヶ月前
052.1K
MuseSteamer - 百度推出的视频生成大模型

MuseSteamer - 百度、動画生成のビッグモデルを発表

MuseSteamerは、百度が発表したマルチモーダル動画生成のための大型モデルである。このモデルは、ユーザーから提供されたテキスト説明や画像に基づいて、高品質の動的なビデオコンテンツを迅速に生成することができ、さまざまなシナリオでの作成のニーズを満たすために、様々な透明性と機能のバージョンをサポートしています。
12ヶ月前
052.1K
JoyHallo - 京东开源的AI数字人模型

JoyHallo - JingdongのオープンソースAIデジタル人体モデル

JoyHalloは、Jingdongが提供するオープンソースのAIデジタル人体モデルで、北京語向けに設計されており、音声をリアルなスピーキングビデオに変換することができます。JoyHalloは、唇の動きの予測精度を向上させるために半結合構造を使用したwav2vec2モデルに基づく音声特徴を埋め込み、英語ビデオの生成をサポートします。
1年前
052K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

シード拡散 - ByteHopperの最新拡散言語モデル

シード・ディフュージョンは、ByteHopが導入した実験的な拡散言語モデルで、コード生成タスクを処理する。このモデルは、2段階拡散学習、制約付き逐次学習、強化された効率的な並列デコードなどの技術に基づいており、推論速度が2,146トークン/秒と大幅に向上し、...
11ヶ月前
052K
绘想 - 百度推出的AI视频生成平台

絵画思考 - 百度がAI動画生成プラットフォームを発表

Paintingは百度が発表したAI動画生成プラットフォームで、AI技術に基づいて、ユーザーが簡単にパーソナライズされた動画を作成できるようにする。直感的なインターフェイス、強力なツール、インスピレーションの推薦機能を備えたペインティングは、クリエイターに創造的なインスピレーションを提供することができ、同じ操作のキーをサポートし、迅速に類似したビデオを生成することができ、創造的なプロセスを簡素化します。
12ヶ月前
052K
ChartAI - AI数据分析工具,智能推荐适合的图表类型

ChartAI - 適切なチャートタイプをインテリジェントに推奨するAIデータ分析ツール

ChartAIは、AI技術に基づいてデータを自動的に分析し、複雑な情報を素早く理解できる直感的なチャートを生成する効率的なデータ可視化ツールです。ChartAIは、さまざまなデータ形式(Excel、CSVなど)のインポートをサポートし、最適なチャートをインテリジェントに推薦します。
1年前
052K
ChatFlow - 开源AI工作流自动化工具

ChatFlow - オープンソースのAIワークフロー自動化ツール

ChatFlowはオープンソースのAIワークフロー自動化ツールで、複雑な要件を効率的なワークフローに変換することをサポートします。コードフレームワークやテストケースを素早く生成し、ソフトウェアアーキテクチャの記述や設計を支援するAI技術をベースとしたツールです。
11ヶ月前
051.9K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni:テキスト、画像、音声のマルチモーダル理解と解析をサポートするエンドサイド・マルチモーダル理解モデル

総合紹介 Infini-Megrezは、ハードウェアとソフトウェアの共同設計により、効率的なマルチモーダル理解と解析の実現を目指し、不問の中核ドーム(Infinigence AI)が開発したエッジ・インテリジェンス・ソリューションである。プロジェクトの中核となるのは、グラフをサポートするMegrez-3Bモデルである。
1年前
051.8K
AopsAI - AI照片处理工具,一键将旧照片转动态视频

AopsAI - AI写真加工ツール、ワンクリックで古い写真をモーションビデオに変える!

AopsAIは、古い写真をダイナミックなショートビデオに変換するオンラインAIツールです。高度なAI技術に基づき、このツールは静止した写真を「動かす」ことで、過去の美しい瞬間を再現する。ユーザーが写真をアップロードし、メールアドレスを入力すると、AopsAIが24時間以内に自動的にビデオを生成し、それを...
1年前
051.6K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

シード GR-3 - ワードプレスシードチームによる汎用ロボティクスモデル

Seed GR-3は、ByteDance社が導入した汎用ロボットモデルで、新しい環境や複雑なコマンドに適応するための強力な汎化能力を備えている。このモデルは、視覚情報、言語情報、動作情報を融合し、ロボットデータ、VR人間の軌跡データ、公共グラフィックデータの3-in-1の学習方法に基づいており、新しい対象への対応能力を向上させる...
11ヶ月前
051.6K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Qunar Technologyによる3Dガウス・セマンティック・データセット

InteriorGSは、Qunar Technologyによって導入された高品質の3Dガウス意味データセットである。このデータセットには、住宅、コンビニエンスストア、結婚式場、美術館など80以上の屋内環境をカバーする1,000の3Dシーンが含まれている。このデータセットには、755のカテゴリに分類された554,000以上のオブジェクトインスタンスが含まれている。
11ヶ月前
051.5K
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

HunyuanVideo-アバター - テンセントハイブリッドオープンソース音声デジタル人体モデル

HunyuanVideo-Avatarは、Tencent Mixed YuanチームとTencent Music Tianqin Labが共同で発表した先進的な音声デジタル人体モデルである。このモデルは革新的なマルチモーダル拡散トランスフォーマーアーキテクチャに基づいており、ユーザーがアップロードしたキャラクター画像と音声に基づいて自然な表情を生成します。
1年前
051.5K
OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker - アリ、リアルタイムテキスト駆動型トーキングアバター生成フレームワークを発表

OmniTalkerは、アリババが提供するリアルタイムテキストドリブントーキングアバター生成フレームワークです。このフレームワークは、ストリーミングアプローチに基づいて自然な音声応答を生成するために、テキスト、画像、音声、ビデオなどの複数のモーダル入力を同時に扱うことができます。コアはThinker-Talkerアーキテクチャに基づいています。
12ヶ月前
051.5K
Mu - 微软推出的小参数语言模型,支持Windows智能体

Mu - マイクロソフト、Windows Intelligentsiaをサポートする小さなパラメータ言語モデルを発表

Muは、NPUやエッジデバイスで効率的に動作するように設計された、わずか3億3,000万のパラメータを持つMicrosoftの小パラメータ言語モデルである。このモデルはエンコーダー・デコーダー・アーキテクチャーに基づいており、ハードウェアを意識した最適化、モデルの定量化、タスク固有の微調整により、1秒間に100トークンを超える応答速度を達成している。
12ヶ月前
051.5K
AIMangaStudio - 免费的AI漫画创作工具,提供完整创作流程

AIMangaStudio - フリーのAIマンガ作成ツール!

AIMangaStudioは、プロット生成、サブシーンデザイン、キャラクター設定などの機能を含む完全なマンガ制作パイプラインをクリエイターに提供し、脚本からマンガページまでの制作プロセスを簡素化できる無料のAIマンガ制作ツールです。プロット、セリフ、キャラクター設定など、マンガ原稿の自然言語生成をサポート。
8ヶ月前
051.5K
琴乐大模型 - 腾讯推出的AI音乐创作模型

ピアノ音楽ビッグモデル-テンセントがAI作曲モデルを発表

Qin Music Grand Modelは、Tencent AI LabとTencent TME Tianqin Labが共同で発表した先進的なAI音楽作成グランドモデルである。このモデルは、ユーザーが入力したキーワード、説明文、または英語と中国語のオーディオクリップに基づいて、高品質のステレオオーディオまたはマルチトラックの楽譜をインテリジェントに生成します。
1年前
051.4K
EXAONE 4.0 - LG推出的混合推理模型

EXAONE 4.0 - LGのハイブリッド推論モデル

EXAONE4.0は、韓国LG AI Research社のハイブリッド推論グランドモデルで、汎用自然言語処理と高度な推論機能を融合している。韓国語、英語、スペイン語をサポートし、32Bのプロフェッショナル版と1.2Bのエンドサイド版に分かれています。プロフェッショナル・バージョンは、法律、会計...
11ヶ月前
051.4K
Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - Anthropicの最強プログラミングモデル

Claude Opus 4.1は、複雑なタスクを効率的に処理するために設計された、Anthropicによる最先端の大規模言語モデルです。このモデルはプログラミング領域で優れており、高品質のコードを生成し、最大32kの単一出力をサポートし、幅広いプログラミングスタイルに適応します。
10ヶ月前
051.4K
AudioFly - 科大讯飞开源的文本生成音效AI模型

AudioFly - KU Xunfeiオープンソーステキスト生成サウンドAIモデル

AudioFlyは、KDDIが開発したテキストから効果音を生成するオープンソースのAIモデルです。AudioSet、AudioCaps、TUTなどの公開データセットと内部データセットを含む、大規模で多様な音声テキストデータセットで学習させた、10億個のパラメータを持つ潜在拡散モデルアーキテクチャに基づいています。
9ヶ月前
051.4K
羚珑 - 京东推出的AI商品图设计工具

Antelope(アンテロープ) - AI商品イメージデザインツール、京東が発表

AntelopeはJingdongが発表したインテリジェントデザインツールで、電子商取引業者と個人に効率的で便利なデザインソリューションを提供します。インテリジェントキーイング、インテリジェントレイアウト、インテリジェントカラーマッチングなどの機能により、ユーザーは商品のメイン画像、広告バナー、ショップページなど各種Eコマースストアに合わせた高品質なデザイン作品を素早く作成することができます。
12ヶ月前
051.3K
ChatGPT Agent – OpenAI推出的通用智能AI Agent

ChatGPTエージェント - OpenAIによる汎用インテリジェントAIエージェント

ChatGPTエージェントはOpenAIの汎用AIエージェントで、複数の機能を組み合わせて複雑なタスクを自律的にこなします。ユーザーは自然言語でニーズを記述するだけで、エージェントは自動的に適切なツールを選択することができます。例えば、ウェブの閲覧、情報の抽出、コードの実行...
11ヶ月前
051.2K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - Jiyuanのオープンソース汎用ロボットプラットフォーム、Beihangなどと共同開発

Genie Envisioner(GE)は、Genie Roboticsチームがシンガポール国立大学、北京航空航天大学などと共同で開発したロボット操作のための統合プラットフォーム。まず想像し、それから行動する」ことで、ロボットがタスクをよりよく理解し、実行することを可能にする。
10ヶ月前
051.2K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版

DeepSeek-R1 - DeepSeekのAI推論モデル。

DeepSeek-R1は、杭州を拠点とするDeepSeekが発表した高性能AI推論モデルで、OpenAIのo1正式版に対するベンチマークである。このモデルは、大規模な強化学習技術に基づいて事後学習されており、数学、コード、自然言語で推論を行うために必要なラベル付きデータはごくわずかである。
1年前
051.2K
Hyperbolic AgentKit:让Agents拥有自己的计算资源,能够自主管理 GPU、执行区块链操作和社交发布

Hyperbolic AgentKit: エージェントに独自の計算リソースを提供し、GPUを自律的に管理し、ブロックチェーン操作やソーシャルパブリッシングを実行する能力を与える。

概要 Hyperbolic AgentKitは、ブロックチェーンとコンピューティングパワーを組み合わせたAIエージェントを実行するためのテンプレートを提供することを目的としたオープンソースプロジェクトである。このプロジェクトは、CoinbaseのCDP Agentkitをベースに、ブロックチェーンの端末をサポートするための修正と拡張を加えています。
2年前
051.1K
浙江大学免费PDF资料《大模型基础》 - 附下载链接

浙江大学から大型モデルの基礎の無料PDF - ダウンロードリンク付き

ファンダメンタルズ・オブ・ラージ・モデルは、ラージ・ランゲージ・モデル(LLM)のコア技術と実用的な道筋を詳細に分析する。言語モデリングの基礎理論から始まり、統計的、リカレントニューラルネットワーク(RNN)、トランスフォーマーアーキテクチャに基づくモデル設計の原理を、3つの主要な大規模言語モデルに焦点を当てて体系的に解説しています。
9ヶ月前
051.1K
Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列

カンディンスキー5.0 - ロシアのAIチームがオープンソースの映像生成モデルシリーズを公開

Kandinsky 5.0は、ロシアのAIチームによって開発された最新のビデオジェネレーションモデルシリーズで、軽量設計と高性能に重点を置いている。シリーズ最初のモデルであるKandinsky 5.0 Video Liteは、パラメータはわずか20億だが、類似の14Bモデルを凌駕しており、特に...
8ヶ月前
051.1K
Vace AI - AI 视频制作和编辑平台,提供一站式视频创作服务

Vace AI - AI映像制作・編集プラットフォーム、ワンストップ映像制作サービスを提供

Vace AIは強力なワンストップAI動画制作・編集プラットフォームです。このプラットフォームは、テキスト説明や参照画像に基づいて高品質のビデオコンテンツを生成し、ビデオの拡張、スタイル変換、被写体の除去や再構築などのさまざまな編集機能をサポートしています。
1年前
051.1K
悟能 - 商汤科技最新推出的具身智能平台

Wuneng - Shangtang Technologyの最新ボディ・インテリジェンス・プラットフォーム

Wunengはロボットとスマートデバイスのために設計された体現知能プラットフォームである。悟り」の世界モデルとマルチモーダルビッグモデル技術に基づき、Wunengは視覚、音声、触覚などのマルチセンサー入力を統合し、強力な知覚、意思決定、行動能力を備えている。
11ヶ月前
050.8K
ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - オーディオ・ジェネレーション・モデリング from Ali Tongyi

ThinkSoundは、アリ・トンイのスピーチチームが初めて導入したCoT(連鎖思考)音声生成モデルです。このモデルは、CoT推論の導入に基づいて、従来の技術では画面の動的な詳細や空間的な関係をキャプチャすることが困難であるという問題を解決するために、ビデオ画像に正確に一致する効果音を生成することができます。
12ヶ月前
050.7K
QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max - アリ・トンイ、視覚的推論モデルを発表

QVQ-MaxはAlitonix社の最先端の視覚推論モデルで、QVQ-72B-Previewのアップグレード版です。画像やビデオコンテンツを「読み取り」、分析と問題解決のための情報と組み合わせることができます。QVQ-Maxは、画像やビデオコンテンツを「読み取り」、分析、推論、問題解決のために情報を組み合わせることができる最先端の視覚推論モデルです。QVQ-Maxの主な機能には、画像解析、ビデオ分析...
1年前
050.5K
有道小P - 网易有道推出的新一代AI全科学习助手

Youdao Xiao P - Netease Youdaoが発表した新世代のAI総合学習アシスタント

Youdao Little Pは、NetEase Youdaoが発表したAI全教科学習アシスタントで、K12の学生向けに設計され、Youdao Ziyi教育ビッグモデルを搭載し、小学校、中学校、高校の全教科のQ&Aをカバーし、個人的な学習アドバイスを提供する。AI単語検索とAI翻訳機能で、Youdao Little Pは生徒が言語の問題を素早く解決できるようサポートします...
1年前
050.5K
Shortbread - AI漫画生成工具,自然语言描述完成漫画创作

ショートブレッド - AIコミック生成ツール、自然言語記述でコミックを完成させる

Shortbreadは、ユーザーが簡単な自然言語の説明に基づいて完全なコミックをすばやく作成できるAIコミック生成ツールです。Shortbreadは、描画スキルを必要とせず、テキストを入力するだけで、AIがユニークなキャラクター、シーン、感情を持つパーソナライズされたコミックをすばやく生成します。
1年前
050.5K
企鹅读伴 - 腾讯推出的中小学生AI阅读助手

ペンギン・リーディング・コンパニオン - テンセントの小中学生向けAI読書アシスタント

Penguin Reading Companionは、テンセントが開発した小中学生向けのAI読書アシスタントです。Penguin Reading Companionは、テンセントのハイブリッドビッグモデルとメタマシンプラットフォームに、義務教育言語カリキュラムプログラムとカリキュラム標準(2022年版)を組み合わせることで、生徒にパーソナライズされたおすすめの読書、複数の読書モード(フォーカス、音読、リスニング...
1年前
050.5K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - Ali Tongyi氏によるオープンソースの高性能プログラミングモデル

Qwen3-Coder-Flashは、Ali Tongyi Thousand Questionsチームによって導入された高性能プログラミングモデルであり、優れたエージェントベースプログラミングとツール呼び出し機能を持ち、複雑なプログラミングタスクを処理するのに適している。Qwen3-Coder-Flashは、256Kトークンの長い文脈理解をサポートし、1Mトーク...
11ヶ月前
050.4K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - オープンソースの効率的なマルチモーダルモデリング by KunlunWanwei

Skywork UniPic 2.0は、Quintessenceによってオープンソース化された効率的なマルチモーダルモデルであり、画像生成、編集、理解に焦点を当てている。このモデルは、2BパラメータのSD3.5-Mediumアーキテクチャに基づいており、事前学習、漸進的なデュアルタスク強化戦略、共同学習によって実現される。
10ヶ月前
050.4K
稿定AI社区 - AI创意内容设计平台,多种设计资源满足不同创作需求

Drafting AI Community - AIクリエイティブコンテンツデザインプラットフォーム。

Drafting AI Communityは、ユーザーに豊富なクリエイティブデザインリソースとツールを提供するオンラインAIクリエイティブインスピレーションプラットフォームです。このプラットフォームは、イメージ写真、Eコマースデザイン、ホリデーテーマ、3Dイラスト、アバターデザイン、小紅集素材、似顔絵デザインなど、様々なデザイン分野をカバーし、様々なユーザーのニーズに応えます。
1年前
050.4K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Shanghai AI Labによるオープンソースの軽量科学的マルチモーダルモデル

Intern-S1-miniは、上海人工知能研究所(SAL)が発表したパラメータスケール8Bの軽量科学用マルチモーダル・マクロモデルである。Intern-S1の強力な機能を継承し、汎用的な機能と特殊な科学的機能の両方を兼ね備えており、迅速な展開や二次開発に適している。性能面では、I...
10ヶ月前
050.3K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - Ali Tongyi オープンソース画像編集モデル

Qwen-Image-Editは、Ali Tongyiによって導入された、200億のパラメータを持つQwen-Imageアーキテクチャ上に構築された、万能画像編集モデルです。このモデルはセマンティック編集と外観編集の両方の機能を兼ね備えており、画像に対して低レベルの視覚的外観編集を行うことができます(例:追加、削除...
10ヶ月前
050.1K
RedOne - 小红书最新推出的社交大模型

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。
11ヶ月前
050K
Ovis-U1 - 阿里推出的多模态统一AI模型

Ovis-U1-アリが発表したマルチモーダル統一AIモデル

Ovis-U1は、アリババグループのOvisチームによって導入されたマルチモーダル統一モデルで、パラメータ規模は30億である。このモデルは、マルチモーダル理解、テキストから画像への生成、画像編集の3つのコア機能を持ち、先進的なアーキテクチャ設計と協調的かつ統一的なトレーニングメソッドにより、忠実度の高い画像の実現をサポートする。
12ヶ月前
049.9K