最新のAIリソース

共 3098 篇文章
靠岸妙写 - AI论文写作工具,构思到成稿一站式解决

Cushion Wonderful Writer - AIエッセイライティングツール、アイデアから論文完成までのワンストップソリューション

Leaning Wonderful WriterはAI論文作成ツールで、学術論文作成のための効率的で便利なソリューションを提供します。このツールは、ワンクリックで学位論文のアウトライン、アブストラクト、本文の初稿を作成することができ、科学技術、リベラルアーツ、社会科学などの学際的な分野をカバーし、学部生や修士号などさまざまなレベルの学術ニーズに対応します。
11ヶ月前
050.3K
小星绪 - 京东健康推出的AI情绪漫画生成产品

Hoshio - AIエモーションマンガ生成製品、Jingdong Healthが発表

暁星秀は京東保健が発表したAI感情漫画生成製品で、現在テスト段階にある。同製品は感情漫画ストーリー生成を核心機能としており、ユーザーは音声やテキスト入力で感情を表現したり、ストーリーを語ったりすることができ、AIは入力に基づき、マッチした4コマ漫画やストーリー解釈を生成する。
9ヶ月前
050.2K
ConverzAI - AI招聘平台,自动收集候选人信息进行筛选

ConverzAI(コンバーツエーアイ) - 候補者情報を自動収集し選考を行うAI採用プラットフォーム

ConverzAIは、採用プロセスを最適化するAI技術をベースとした採用プラットフォームである。このプラットフォームは、仮想リクルーター(AIエージェント)を配置し、応募追跡システム(ATS)から候補者情報を自動的に収集し、一次スクリーニングを行うことを基本としている。このプラットフォームは、電話、Eメール、SMSなどの複数のチャネルを使用する。
11ヶ月前
050.2K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

シード拡散 - ByteHopperの最新拡散言語モデル

シード・ディフュージョンは、ByteHopが導入した実験的な拡散言語モデルで、コード生成タスクを処理する。このモデルは、2段階拡散学習、制約付き逐次学習、強化された効率的な並列デコードなどの技術に基づいており、推論速度が2,146トークン/秒と大幅に向上し、...
9ヶ月前
050.1K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

シード GR-3 - ワードプレスシードチームによる汎用ロボティクスモデル

Seed GR-3は、ByteDance社が導入した汎用ロボットモデルで、新しい環境や複雑なコマンドに適応するための強力な汎化能力を備えている。このモデルは、視覚情報、言語情報、動作情報を融合し、ロボットデータ、VR人間の軌跡データ、公共グラフィックデータの3-in-1の学習方法に基づいており、新しい対象への対応能力を向上させる...
9ヶ月前
050.1K
浙江大学免费PDF资料《大模型基础》 - 附下载链接

浙江大学から大型モデルの基礎の無料PDF - ダウンロードリンク付き

ファンダメンタルズ・オブ・ラージ・モデルは、ラージ・ランゲージ・モデル(LLM)のコア技術と実用的な道筋を詳細に分析する。言語モデリングの基礎理論から始まり、統計的、リカレントニューラルネットワーク(RNN)、トランスフォーマーアーキテクチャに基づくモデル設計の原理を、3つの主要な大規模言語モデルに焦点を当てて体系的に解説しています。
7ヶ月前
050.1K
Make - AI无代码自动化工作流搭建平台

Make - AIによるコード不要の自動ワークフロー構築プラットフォーム

Makeは、自動化されたプロセスに基づいて組織の効率性と革新性の向上を支援する、AI主導のコード不要の自動化プラットフォームです。このプラットフォームは、マーケティング、販売、財務など、さまざまなビジネスシナリオをサポートする2,000以上の構築済みアプリを提供しています。Makeの主な機能には、コード不要のビジュアルプロセス作成、AI...
11ヶ月前
050K
妙构 - AI视频分析与生成工具,揭示爆款视频创作规律

MyoConstruct(マイオコンストラクト) - AI動画分析・生成ツール、爆発的な動画作成の法則を解き明かす

Miaojiaoは、ディープラーニングアルゴリズムに基づいたプロフェッショナルなAI動画コンテンツ分析・生成ツールで、動画のビジュアル、オーディオ、クリエイティブ構造を全方位的に分析し、爆発的な動画の背後にある法則を明らかにします。Miaojiaoは、構図、色、カメラ言語を分析し、クリエイティブな独自性と感情的な共鳴を評価し、トレンドの洞察と最適化の提案を提供することができます...
11ヶ月前
050K
MuseSteamer - 百度推出的视频生成大模型

MuseSteamer - 百度、動画生成のビッグモデルを発表

MuseSteamerは、百度が発表したマルチモーダル動画生成のための大型モデルである。このモデルは、ユーザーから提供されたテキスト説明や画像に基づいて、高品質の動的なビデオコンテンツを迅速に生成することができ、さまざまなシナリオでの作成のニーズを満たすために、様々な透明性と機能のバージョンをサポートしています。
10ヶ月前
050K
Step-Audio 2 mini - 阶跃星辰开源的语音大模型

Step-Audio 2 mini - Step-Star オープンソース音声マクロモデリング

Step-Audio 2 miniは、Step-Audioによるオープンソースのエンドツーエンド音声マクロモデルです。従来の音声モデル構造を打破し、真のエンド・ツー・エンド・マルチモーダルアーキテクチャを採用しており、生の音声入力をより低遅延で音声応答出力に直接変換し、パラ言語情報と非音声信号を理解します。
8ヶ月前
050K
Vortn:利用AI编写与管理企业内部知识库

Vortn:AIによる社内ナレッジベースのオーサリングと管理

概要 Vortnは、インテリジェントな知識の保存と管理に特化したプラットフォームであり、AIエージェントとアクセス制御システムを通じて、パーソナライズされた知識管理サービスをユーザーに提供する。このプラットフォームは、AIチャット機能の使用をサポートし、コンテキストに基づいたインテリジェントな応答を提供することで、ユーザーの情報整理、アクセス、活用を支援します。
1年前
050K
FastVLM - 苹果公司推出的视觉语言模型

FastVLM - Appleのビジュアル言語モデリング

FastVLM(Fast Vision Language Model)は、アップルが導入した効率的な視覚言語モデルである。FastViTHDハイブリッド視覚コーダーをコアとし、畳み込みとトランスフォーマーアーキテクチャを組み込むことで、視覚言語を大幅に...
8ヶ月前
049.9K
Tizzy.ai - 百度推出的AI搜索应用

百度がAI検索アプリ「Tizzy.ai」を発表

Tizzy.aiはBaiduが発表したAIインテリジェント検索アプリケーションです。Tizzy.aiはBaiduのビッグモデル技術に基づいており、強力なインテリジェント検索機能を備え、質問に素早く答え、深く考え、意思決定を支援することができます。Tizzy.aiはシンプルなインターフェイスで、広告やポップアップがなく、ガイドの下部に...
10ヶ月前
049.8K
GLM-Experimental - 智谱AI推出的实验性模型

GLM-Experimental - Smart Spectrum AIが立ち上げた実験的モデル

GLM-Experimentalは、Wisdom Spectrum AIが発表した実験的な大規模言語モデルで、現在Z.aiプラットフォームで利用可能です。このモデルにはPPTを自動生成する機能があり、ユーザーがトピックやキーポイントを入力すると、明確な構造でフォーマットされたプレゼンテーションを素早く生成することができます。
10ヶ月前
049.8K
探饭 - 字节跳动推出的AI美食推荐工具

スカウティング・ライス - ワードプレスがAI食品レコメンデーションツールを発表

TanRiceは、ByteDanceの子会社であるJitterbugが立ち上げたAI食品推薦ツールであり、Beanbag Big Modelに依存して、パーソナライズされた食品推薦、店舗スカウト比較、食品ヒントやその他のサービスをユーザーに提供する。TanRiceは、ユーザーの味の好みや場所に基づいて、近くのレストランや料理を正確に推薦し、注文を支援し、グループ購入や持ち帰りサービスを提供することができる。
10ヶ月前
049.7K
Muzaic - AI音乐生成平台,一键生成与视频内容匹配的音乐

Muzaic - ワンクリックで動画コンテンツにマッチした音楽を生成するAI音楽生成プラットフォーム

Muzaicは、動画制作者やコンテンツクリエイター向けに設計されたAI主導のオンライン音楽生成プラットフォームで、AIベースの技術により、動画の内容にマッチしたカスタム音楽を素早く生成し、わずか8秒で1分間のスタジオ品質のトラックを生成することができる。
11ヶ月前
049.7K
MonkeyCode - 开源的企业级AI编程助手

MonkeyCode - オープンソースのエンタープライズAIプログラミングアシスタント

MonkeyCodeは、プライバシーとセキュリティを重視する開発チームのために設計された、オープンソースのエンタープライズグレードのネイティブAIプログラミングアシスタントです。MonkeyCodeは、コードデータのセキュリティを確保するために、プライベートデプロイとオフラインでの使用をサポートしています。MonkeyCodeは、コードデータのセキュリティを確保するために、プライベートデプロイとオフラインでの使用をサポートしています...
9ヶ月前
049.7K
V-JEPA 2 - Meta AI 推出的最强世界大模型

V-JEPA 2 - Meta AIによる世界最強の大型モデル

V-JEPA 2は、Meta AIが提供する12億のパラメータを持つビデオデータに基づく世界の大規模モデルである。このモデルは、100万時間以上のビデオと100万枚の画像から自己教師付き学習に基づいて学習され、物理世界の物体、行動、操作を理解する...
11ヶ月前
049.6K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版

DeepSeek-R1 - DeepSeekのAI推論モデル。

DeepSeek-R1は、杭州を拠点とするDeepSeekが発表した高性能AI推論モデルで、OpenAIのo1正式版に対するベンチマークである。このモデルは、大規模な強化学習技術に基づいて事後学習されており、数学、コード、自然言語で推論を行うために必要なラベル付きデータはごくわずかである。
11ヶ月前
049.6K
宠TA - 京东推出的AI宠物互动产品

ペットTA - AIペット対話製品、京東が発売

ペットTA」は京東のAIGCペットインタラクティブ製品で、ペット愛好家に楽しくて暖かいオンラインインタラクティブプラットフォームを提供することができる。ユーザーがペットのために様々な可愛い服やアクセサリーを選んだり、個人的な着せ替えをしたり、ペットのデジタルイメージを作成したりして、ペットとの豊かな交流をサポートする。このプラットフォームは...
10ヶ月前
049.4K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI - エージェント駆動型ユーザー・インタラクション・インターフェースのためのGoogleのオープンソース宣言型プロトコル

A2UI(Agent-to-User Interface)は、Googleがオープンソースで提供するエージェント駆動型インターフェース・プロトコルであり、AIエージェント向けに複雑な対話型インターフェースを生成する際の課題に対処する。AIエージェントがユーザーインターフェースの構造を記述できるようにする宣言的なJSONフォーマットを通じて、クライアントアプリケーションは、AIエージェントがユーザーインターフェースの構造を記述できるようにします。
4ヶ月前
049.4K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - アイデアから創作までの全プロセスを支援するAI小説執筆プラットフォーム

Squiblerは、作家のために設計された強力なAI支援ライティング・プラットフォームで、構想から創作、出版までの全プロセスを支援します。このプラットフォームは、小説、脚本、短編小説などをカバーするさまざまなストーリー・テンプレートを提供します。ユーザーは最初のコンセプトを入力するだけで、AIがアウトライン、キャラクター、シーンを生成します。
8ヶ月前
049.4K
RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 - ウィズダムスペクトラムのオープンソース・クロスオントロジー・エンボディド・ブレインサイズ・コラボレーション・フレームワーク

RoboOS 2.0は、オントロジーを超えた脳と脳のコラボレーションを実現するオープンソースのフレームワークであり、ロボットの単一知能からグループ協調知能への転換を促進する。このフレームワークでは、クラウドブレインが複雑な意思決定とコラボレーションを担当し、スモールブレインモジュールが特定のスキルの実行に集中するという、効率的な役割分担を実現するために「ビッグブレイン」アーキテクチャを採用している。
10ヶ月前
049.4K
OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker - アリ、リアルタイムテキスト駆動型トーキングアバター生成フレームワークを発表

OmniTalkerは、アリババが提供するリアルタイムテキストドリブントーキングアバター生成フレームワークです。このフレームワークは、ストリーミングアプローチに基づいて自然な音声応答を生成するために、テキスト、画像、音声、ビデオなどの複数のモーダル入力を同時に扱うことができます。コアはThinker-Talkerアーキテクチャに基づいています。
10ヶ月前
049.4K
JoyHallo - 京东开源的AI数字人模型

JoyHallo - JingdongのオープンソースAIデジタル人体モデル

JoyHalloは、Jingdongが提供するオープンソースのAIデジタル人体モデルで、北京語向けに設計されており、音声をリアルなスピーキングビデオに変換することができます。JoyHalloは、唇の動きの予測精度を向上させるために半結合構造を使用したwav2vec2モデルに基づく音声特徴を埋め込み、英語ビデオの生成をサポートします。
11ヶ月前
049.4K
GLM-4.7 - 智谱AI开源的最新一代旗舰大模型

GLM-4.7 - ウィズダムスペクトラムAIオープンソースの最新世代フラッグシップ大型モデル

GLM-4.7は、Smart Spectrum AIによってリリースされ、オープンソース化されたフラッグシップ・グランドモデルの最新世代で、AIプログラミング、複雑な推論、知的身体タスクのために深く最適化されています。このモデルは、200kのコンテキスト長と128kの最大出力をサポートし、多言語コーディング、長距離タスク計画、ツールコラボレーション機能を備えています。
4ヶ月前
049.3K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Qunar Technologyによる3Dガウス・セマンティック・データセット

InteriorGSは、Qunar Technologyによって導入された高品質の3Dガウス意味データセットである。このデータセットには、住宅、コンビニエンスストア、結婚式場、美術館など80以上の屋内環境をカバーする1,000の3Dシーンが含まれている。このデータセットには、755のカテゴリに分類された554,000以上のオブジェクトインスタンスが含まれている。
9ヶ月前
049.3K
Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助

Olovka AI - 正確な執筆アドバイスと支援のためのAIアカデミックライティング支援プラットフォーム

Olovka AIは、学生のためのAIアカデミックライティング支援プラットフォームで、学生の学術レベル、専門分野、論文の種類に基づいた的確なライティングアドバイスと支援を提供します。インテリジェントなアルゴリズムに基づき、Olovka AIは学生が高品質な学術論文を素早く執筆できるようサポートします。
11ヶ月前
049.3K
幕布 - AI大纲笔记工具,复杂信息一键生成思维导图

カーテン - AIアウトラインノートツール、複雑な情報もワンクリックでマインドマップを生成

Curtainは、ユーザーが構造化されたアウトラインフォームに基づいて断片化された知識を体系化するためのAIアウトラインノートツールであり、このツールはマインドマップのワンクリック生成をサポートしています。また、ワンクリックでマインドマップを作成することもできます。カーテンは、複雑な情報を直感的なグラフィックで表現し、思考を素早く明瞭にし、理解力と記憶効率を向上させることをサポートします。
11ヶ月前
049.2K
Hyperbolic AgentKit:让Agents拥有自己的计算资源,能够自主管理 GPU、执行区块链操作和社交发布

Hyperbolic AgentKit: エージェントに独自の計算リソースを提供し、GPUを自律的に管理し、ブロックチェーン操作やソーシャルパブリッシングを実行する能力を与える。

概要 Hyperbolic AgentKitは、ブロックチェーンとコンピューティングパワーを組み合わせたAIエージェントを実行するためのテンプレートを提供することを目的としたオープンソースプロジェクトである。このプロジェクトは、CoinbaseのCDP Agentkitをベースに、ブロックチェーンの端末をサポートするための修正と拡張を加えています。
1年前
049K
Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - Googleが提供するAIバーチャルフィッティングアプリ

DopplはGoogleが提供するAIバーチャルフィッティングアプリだ。ユーザーが全身写真をアップロードした後、このアプリは自分の体のデジタル版で服の写真やスクリーンショットを「着る」ことをサポートし、静止画からAIが生成した動画に変換することができるため、ユーザーは服が体に与える影響をより実感することができる。
10ヶ月前
049K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - オープンソースの効率的なマルチモーダルモデリング by KunlunWanwei

Skywork UniPic 2.0は、Quintessenceによってオープンソース化された効率的なマルチモーダルモデルであり、画像生成、編集、理解に焦点を当てている。このモデルは、2BパラメータのSD3.5-Mediumアーキテクチャに基づいており、事前学習、漸進的なデュアルタスク強化戦略、共同学習によって実現される。
9ヶ月前
049K
Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - Anthropicの最強プログラミングモデル

Claude Opus 4.1は、複雑なタスクを効率的に処理するために設計された、Anthropicによる最先端の大規模言語モデルです。このモデルはプログラミング領域で優れており、高品質のコードを生成し、最大32kの単一出力をサポートし、幅広いプログラミングスタイルに適応します。
9ヶ月前
048.9K
Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - Googleオープンソースプログラミングエージェント

Gemini CLIは、強力なAI機能を開発者に提供するために、開発者のエンドポイントにGemini Big Modelを組み込むことに基づいたGoogleのオープンソースAIプログラミングツールである。このツールは、コードを理解し、ファイルを操作し、コマンドを実行し、問題を動的にトラブルシュートし、開発者が効率的にジェネレーションを書けるように支援する。
10ヶ月前
048.9K
AopsAI - AI照片处理工具,一键将旧照片转动态视频

AopsAI - AI写真加工ツール、ワンクリックで古い写真をモーションビデオに変える!

AopsAIは、古い写真をダイナミックなショートビデオに変換するオンラインAIツールです。高度なAI技術に基づき、このツールは静止した写真を「動かす」ことで、過去の美しい瞬間を再現する。ユーザーが写真をアップロードし、メールアドレスを入力すると、AopsAIが24時間以内に自動的にビデオを生成し、それを...
11ヶ月前
048.9K
ChartAI - AI数据分析工具,智能推荐适合的图表类型

ChartAI - 適切なチャートタイプをインテリジェントに推奨するAIデータ分析ツール

ChartAIは、AI技術に基づいてデータを自動的に分析し、複雑な情報を素早く理解できる直感的なチャートを生成する効率的なデータ可視化ツールです。ChartAIは、さまざまなデータ形式(Excel、CSVなど)のインポートをサポートし、最適なチャートをインテリジェントに推薦します。
11ヶ月前
048.8K
ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - オーディオ・ジェネレーション・モデリング from Ali Tongyi

ThinkSoundは、アリ・トンイのスピーチチームが初めて導入したCoT(連鎖思考)音声生成モデルです。このモデルは、CoT推論の導入に基づいて、従来の技術では画面の動的な詳細や空間的な関係をキャプチャすることが困難であるという問題を解決するために、ビデオ画像に正確に一致する効果音を生成することができます。
10ヶ月前
048.8K
ChatFlow - 开源AI工作流自动化工具

ChatFlow - オープンソースのAIワークフロー自動化ツール

ChatFlowはオープンソースのAIワークフロー自動化ツールで、複雑な要件を効率的なワークフローに変換することをサポートします。コードフレームワークやテストケースを素早く生成し、ソフトウェアアーキテクチャの記述や設計を支援するAI技術をベースとしたツールです。
9ヶ月前
048.7K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - Jiyuanのオープンソース汎用ロボットプラットフォーム、Beihangなどと共同開発

Genie Envisioner(GE)は、Genie Roboticsチームがシンガポール国立大学、北京航空航天大学などと共同で開発したロボット操作のための統合プラットフォーム。まず想像し、それから行動する」ことで、ロボットがタスクをよりよく理解し、実行することを可能にする。
9ヶ月前
048.7K
Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列

カンディンスキー5.0 - ロシアのAIチームがオープンソースの映像生成モデルシリーズを公開

Kandinsky 5.0は、ロシアのAIチームによって開発された最新のビデオジェネレーションモデルシリーズで、軽量設計と高性能に重点を置いている。シリーズ最初のモデルであるKandinsky 5.0 Video Liteは、パラメータはわずか20億だが、類似の14Bモデルを凌駕しており、特に...
7ヶ月前
048.7K
Mu - 微软推出的小参数语言模型,支持Windows智能体

Mu - マイクロソフト、Windows Intelligentsiaをサポートする小さなパラメータ言語モデルを発表

Muは、NPUやエッジデバイスで効率的に動作するように設計された、わずか3億3,000万のパラメータを持つMicrosoftの小パラメータ言語モデルである。このモデルはエンコーダー・デコーダー・アーキテクチャーに基づいており、ハードウェアを意識した最適化、モデルの定量化、タスク固有の微調整により、1秒間に100トークンを超える応答速度を達成している。
10ヶ月前
048.7K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni:テキスト、画像、音声のマルチモーダル理解と解析をサポートするエンドサイド・マルチモーダル理解モデル

総合紹介 Infini-Megrezは、ハードウェアとソフトウェアの共同設計により、効率的なマルチモーダル理解と解析の実現を目指し、不問の中核ドーム(Infinigence AI)が開発したエッジ・インテリジェンス・ソリューションである。プロジェクトの中核となるのは、グラフをサポートするMegrez-3Bモデルである。
1年前
048.6K
Genie 3 - 谷歌推出的通用世界模型

ジーニー3 - グーグルのユニバーサル世界モデル

Genie 3は、Google DeepMindが提供する新世代のユニバーサルワールドモデルで、高度にダイナミックで一貫性のある仮想世界をリアルタイムで生成することができます。Genie 3は、物理現象や自然生態系をシミュレートし、ファンタジーや歴史的なシナリオの作成をサポートします。テキストプロンプトにより、ユーザーは...
9ヶ月前
048.5K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - 金融推論のためのビッグモデル by Anthem Digital

Agentar-Fin-R1は、Anthem社によって導入された金融領域向けの最先端の大規模言語モデルである。強力なQwen3アーキテクチャに基づいて開発されたこのモデルは、8Bと32Bの2つのパラメータスケールバージョンを提供し、多段階分析、リスク評価、戦争などの複雑な金融推論タスクを正確に処理することができます。
9ヶ月前
048.4K
羚珑 - 京东推出的AI商品图设计工具

Antelope(アンテロープ) - AI商品イメージデザインツール、京東が発表

AntelopeはJingdongが発表したインテリジェントデザインツールで、電子商取引業者と個人に効率的で便利なデザインソリューションを提供します。インテリジェントキーイング、インテリジェントレイアウト、インテリジェントカラーマッチングなどの機能により、ユーザーは商品のメイン画像、広告バナー、ショップページなど各種Eコマースストアに合わせた高品質なデザイン作品を素早く作成することができます。
10ヶ月前
048.3K
MagicTryOn - 浙大和vivo等机构推出的视频虚拟试穿框架

MagicTryOn(マジックトライオン) - ZJUやVivoなどが提供するビデオバーチャル試着フレームワーク

MagicTryOnは、浙江大学コンピューター科学技術学院がvivoや他の組織と共同で立ち上げた先進的なビデオバーチャルトライオン・フレームワークである。このフレームワークは、従来のU-Netアーキテクチャを革新的なDiffusion Transformer (DiT)アーキテクチャに置き換え、完全なセルフアテンションマシンと組み合わせたものである。
11ヶ月前
048.2K
稿定AI社区 - AI创意内容设计平台,多种设计资源满足不同创作需求

Drafting AI Community - AIクリエイティブコンテンツデザインプラットフォーム。

Drafting AI Communityは、ユーザーに豊富なクリエイティブデザインリソースとツールを提供するオンラインAIクリエイティブインスピレーションプラットフォームです。このプラットフォームは、イメージ写真、Eコマースデザイン、ホリデーテーマ、3Dイラスト、アバターデザイン、小紅集素材、似顔絵デザインなど、様々なデザイン分野をカバーし、様々なユーザーのニーズに応えます。
11ヶ月前
048.1K
Qwen-Image-Edit - 阿里通义开源的图像编辑模型

Qwen-Image-Edit - Ali Tongyi オープンソース画像編集モデル

Qwen-Image-Editは、Ali Tongyiによって導入された、200億のパラメータを持つQwen-Imageアーキテクチャ上に構築された、万能画像編集モデルです。このモデルはセマンティック編集と外観編集の両方の機能を兼ね備えており、画像に対して低レベルの視覚的外観編集を行うことができます(例:追加、削除...
8ヶ月前
048.1K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - Ali Tongyi氏によるオープンソースの高性能プログラミングモデル

Qwen3-Coder-Flashは、Ali Tongyi Thousand Questionsチームによって導入された高性能プログラミングモデルであり、優れたエージェントベースプログラミングとツール呼び出し機能を持ち、複雑なプログラミングタスクを処理するのに適している。Qwen3-Coder-Flashは、256Kトークンの長い文脈理解をサポートし、1Mトーク...
9ヶ月前
048.1K
RedOne - 小红书最新推出的社交大模型

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。
9ヶ月前
048K
QVQ-Max - 阿里通义推出视觉推理模型

QVQ-Max - アリ・トンイ、視覚的推論モデルを発表

QVQ-MaxはAlitonix社の最先端の視覚推論モデルで、QVQ-72B-Previewのアップグレード版です。画像やビデオコンテンツを「読み取り」、分析と問題解決のための情報と組み合わせることができます。QVQ-Maxは、画像やビデオコンテンツを「読み取り」、分析、推論、問題解決のために情報を組み合わせることができる最先端の視覚推論モデルです。QVQ-Maxの主な機能には、画像解析、ビデオ分析...
11ヶ月前
048K
Vace AI - AI 视频制作和编辑平台,提供一站式视频创作服务

Vace AI - AI映像制作・編集プラットフォーム、ワンストップ映像制作サービスを提供

Vace AIは強力なワンストップAI動画制作・編集プラットフォームです。このプラットフォームは、テキスト説明や参照画像に基づいて高品質のビデオコンテンツを生成し、ビデオの拡張、スタイル変換、被写体の除去や再構築などのさまざまな編集機能をサポートしています。
11ヶ月前
048K
SkyReels-A3 - 昆仑万维推出的音频驱动数字人创作工具

SkyReels-A3 - 崑崙王維の音声駆動型デジタル人間創造ツール

SkyReels-A3は、崑崙ワールドワイドグループが開発した音声駆動型デジタルヒューマンクリエーションツールです。SkyReels-A3は、音声駆動型デジタル人体作成ツールで、簡単な入力(例:肖像画像と音声)で高品質の動的ビデオコンテンツを生成したり、静止画を「生き生きと」させたり、既存のビデオのセリフを新しいリップシンクに置き換えてキャラクターが自動的に合わせることができます...
9ヶ月前
048K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Shanghai AI Labによるオープンソースの軽量科学的マルチモーダルモデル

Intern-S1-miniは、上海人工知能研究所(SAL)が発表したパラメータスケール8Bの軽量科学用マルチモーダル・マクロモデルである。Intern-S1の強力な機能を継承し、汎用的な機能と特殊な科学的機能の両方を兼ね備えており、迅速な展開や二次開発に適している。性能面では、I...
8ヶ月前
047.9K
悟能 - 商汤科技最新推出的具身智能平台

Wuneng - Shangtang Technologyの最新ボディ・インテリジェンス・プラットフォーム

Wunengはロボットとスマートデバイスのために設計された体現知能プラットフォームである。悟り」の世界モデルとマルチモーダルビッグモデル技術に基づき、Wunengは視覚、音声、触覚などのマルチセンサー入力を統合し、強力な知覚、意思決定、行動能力を備えている。
9ヶ月前
047.9K
ChatGPT Agent – OpenAI推出的通用智能AI Agent

ChatGPTエージェント - OpenAIによる汎用インテリジェントAIエージェント

ChatGPTエージェントはOpenAIの汎用AIエージェントで、複数の機能を組み合わせて複雑なタスクを自律的にこなします。ユーザーは自然言語でニーズを記述するだけで、エージェントは自動的に適切なツールを選択することができます。例えば、ウェブの閲覧、情報の抽出、コードの実行...
10ヶ月前
047.7K
MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - 崑崙微の最新音声生成フレームワーク

MoE-TTSは、KunlunWanweiによって導入された音声合成フレームワークで、事前に訓練された大規模言語モデル(LLM)と音声専門家モジュールを組み合わせたMixed Expert(MoE)アーキテクチャに基づいています。MoE-TTSは、テキストモジュールのパラメータを凍結し、音声モジュールのパラメータのみを更新することにより、強力なテキスト推論を保持します...
9ヶ月前
047.7K
琴乐大模型 - 腾讯推出的AI音乐创作模型

ピアノ音楽ビッグモデル-テンセントがAI作曲モデルを発表

Qin Music Grand Modelは、Tencent AI LabとTencent TME Tianqin Labが共同で発表した先進的なAI音楽作成グランドモデルである。このモデルは、ユーザーが入力したキーワード、説明文、または英語と中国語のオーディオクリップに基づいて、高品質のステレオオーディオまたはマルチトラックの楽譜をインテリジェントに生成します。
11ヶ月前
047.7K
绘想 - 百度推出的AI视频生成平台

絵画思考 - 百度がAI動画生成プラットフォームを発表

Paintingは百度が発表したAI動画生成プラットフォームで、AI技術に基づいて、ユーザーが簡単にパーソナライズされた動画を作成できるようにする。直感的なインターフェイス、強力なツール、インスピレーションの推薦機能を備えたペインティングは、クリエイターに創造的なインスピレーションを提供することができ、同じ操作のキーをサポートし、迅速に類似したビデオを生成することができ、創造的なプロセスを簡素化します。
10ヶ月前
047.6K
企鹅读伴 - 腾讯推出的中小学生AI阅读助手

ペンギン・リーディング・コンパニオン - テンセントの小中学生向けAI読書アシスタント

Penguin Reading Companionは、テンセントが開発した小中学生向けのAI読書アシスタントです。Penguin Reading Companionは、テンセントのハイブリッドビッグモデルとメタマシンプラットフォームに、義務教育言語カリキュラムプログラムとカリキュラム標準(2022年版)を組み合わせることで、生徒にパーソナライズされたおすすめの読書、複数の読書モード(フォーカス、音読、リスニング...
11ヶ月前
047.5K
商汤如影 - 商汤科技推出的AI数字人视频制作平台

Shangtang Ruyi - Shangtang Technologyが立ち上げたAIデジタルヒューマンビデオ制作プラットフォーム

Shangtang Ruyingは、Shangtang Technologyが発表したAIデジタル人体映像制作プラットフォームである。ビッグモデル技術に基づき、顔の特徴、服装、髪型など、非常にリアルなデジタル人体イメージの作成とパーソナライズをサポートする。このプラットフォームは、サウンドクローン、ビデオ生成、自動データ注釈、リアルタイムインタラクションなどの機能を備えている。
11ヶ月前
047.4K