最新のAIリソース

共 2985 篇文章
V-JEPA 2 - Meta AI 推出的最强世界大模型

V-JEPA 2 - Meta AIによる世界最強の大型モデル

V-JEPA 2は、Meta AIが提供する12億のパラメータを持つビデオデータに基づく世界の大規模モデルである。このモデルは、100万時間以上のビデオと100万枚の画像から自己教師付き学習に基づいて学習され、物理世界の物体、行動、操作を理解する...
9ヶ月前
042.9K
UnifoLM-WMA-0 - 宇树科技开源的世界模型动作架构

UnifoLM-WMA-0 - Yushu Technology オープンソースワールドモデルアクションアーキテクチャ

UnifoLM-WMA-0は、Yu Shu Technologyによる複数のクラスのロボットオントロジーにまたがるオープンソースのワールドモデル-アクションアーキテクチャであり、一般的なロボット学習のために設計されている。ワールドモデルとアクションアーキテクチャから構成され、ワールドモデルはロボットと環境の相互作用の物理法則を理解し、アクションアーキテクチャは特定の...
6ヶ月前
042.9K
Doppl - 谷歌推出的AI虚拟试衣应用

Doppl - Googleが提供するAIバーチャルフィッティングアプリ

DopplはGoogleが提供するAIバーチャルフィッティングアプリだ。ユーザーが全身写真をアップロードした後、このアプリは自分の体のデジタル版で服の写真やスクリーンショットを「着る」ことをサポートし、静止画からAIが生成した動画に変換することができるため、ユーザーは服が体に与える影響をより実感することができる。
9ヶ月前
042.9K
JoyHallo - 京东开源的AI数字人模型

JoyHallo - JingdongのオープンソースAIデジタル人体モデル

JoyHalloは、Jingdongが提供するオープンソースのAIデジタル人体モデルで、北京語向けに設計されており、音声をリアルなスピーキングビデオに変換することができます。JoyHalloは、唇の動きの予測精度を向上させるために半結合構造を使用したwav2vec2モデルに基づく音声特徴を埋め込み、英語ビデオの生成をサポートします。
9ヶ月前
042.8K
Qwen-Flash - 通义千问推出的高性能、低成本语言模型

Qwen-Flash - Tongyi Chien-quanによる高性能、低コストの言語モデル

Qwen-Flashは、アリババ「同義千問」シリーズに導入された高性能・低価格の言語モデルで、高速レスポンスとシンプルなタスクの効率的な処理のために設計されています。高度なMoE(Mixture-of-Experts)アーキテクチャに基づき、スパースエキスパートネットワークによって実現されています。
7ヶ月前
042.8K
商汤商量:日日新(SenseNova)超千亿参数模型,商量智能助手

SenseNova: 日々(SenseNova)1000億以上のパラメータモデル、コンサルティングインテリジェントアシスタント

総合的な紹介 Shangtang Consultationは、SenseChatとして知られているShangtang Technologyによって開発された超1000億パラメータAI言語ビッグモデルプラットフォームです。プラットフォームは、Shangtangの強力なMaaS(Model as a Service)サービスと演算サポートに基づいており、ユーザーに幅広いAIコンテンツを提供しています...
1年前
042.8K
幕布 - AI大纲笔记工具,复杂信息一键生成思维导图

カーテン - AIアウトラインノートツール、複雑な情報もワンクリックでマインドマップを生成

Curtainは、ユーザーが構造化されたアウトラインフォームに基づいて断片化された知識を体系化するためのAIアウトラインノートツールであり、このツールはマインドマップのワンクリック生成をサポートしています。また、ワンクリックでマインドマップを作成することもできます。カーテンは、複雑な情報を直感的なグラフィックで表現し、思考を素早く明瞭にし、理解力と記憶効率を向上させることをサポートします。
9ヶ月前
042.7K
无问芯穹:企业级AI开发,云端资源服务平台

問答無用のコア・ドーム:エンタープライズAI開発、クラウド・リソース・サービス・プラットフォーム

総合紹介 No Ask Core DomeはAI開発者向けの総合サービスプラットフォームで、有能なAI開発ツールとビッグモデルサービスを提供する。このプラットフォームには、AIStudio、GenStudioなどの様々な機械学習開発ツールがあり、モデルのデプロイ、データストレージ、モデル...
1年前
042.7K
NeverEnds:使用文字描述生成效果逼真的视频

NeverEnds:テキスト説明付きのリアルな動画を生成する

一般的な紹介 ネバーエンドはシンガポール発のプラットフォームで、高度なモデルを通じてテキストをビデオに変換することで、あらゆる種類のストーリーに無限の創造的空間を提供している。ユーザーはこのプラットフォームで、創造性を自由に表現し、感情を伝え、ブランドイメージを構築することができる。このプラットフォームは、そのユニークな...
2年前
042.7K
Genie Envisioner - 智元联合北航等开源的通用机器人操作平台

Genie Envisioner - Jiyuanのオープンソース汎用ロボットプラットフォーム、Beihangなどと共同開発

Genie Envisioner(GE)は、Genie Roboticsチームがシンガポール国立大学、北京航空航天大学などと共同で開発したロボット操作のための統合プラットフォーム。まず想像し、それから行動する」ことで、ロボットがタスクをよりよく理解し、実行することを可能にする。
7ヶ月前
042.6K
探饭 - 字节跳动推出的AI美食推荐工具

スカウティング・ライス - ワードプレスがAI食品レコメンデーションツールを発表

TanRiceは、ByteDanceの子会社であるJitterbugが立ち上げたAI食品推薦ツールであり、Beanbag Big Modelに依存して、パーソナライズされた食品推薦、店舗スカウト比較、食品ヒントやその他のサービスをユーザーに提供する。TanRiceは、ユーザーの味の好みや場所に基づいて、近くのレストランや料理を正確に推薦し、注文を支援し、グループ購入や持ち帰りサービスを提供することができる。
9ヶ月前
042.6K
Seed GR-3 - 字节跳动Seed团队推出的通用机器人模型

シード GR-3 - ワードプレスシードチームによる汎用ロボティクスモデル

Seed GR-3は、ByteDance社が導入した汎用ロボットモデルで、新しい環境や複雑なコマンドに適応するための強力な汎化能力を備えている。このモデルは、視覚情報、言語情報、動作情報を融合し、ロボットデータ、VR人間の軌跡データ、公共グラフィックデータの3-in-1の学習方法に基づいており、新しい対象への対応能力を向上させる...
8ヶ月前
042.6K
Squibler - AI小说辅助写作平台,助力构思到创作全过程

Squibler - アイデアから創作までの全プロセスを支援するAI小説執筆プラットフォーム

Squiblerは、作家のために設計された強力なAI支援ライティング・プラットフォームで、構想から創作、出版までの全プロセスを支援します。このプラットフォームは、小説、脚本、短編小説などをカバーするさまざまなストーリー・テンプレートを提供します。ユーザーは最初のコンセプトを入力するだけで、AIがアウトライン、キャラクター、シーンを生成します。
7ヶ月前
042.5K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版

DeepSeek-R1 - DeepSeekのAI推論モデル。

DeepSeek-R1は、杭州を拠点とするDeepSeekが発表した高性能AI推論モデルで、OpenAIのo1正式版に対するベンチマークである。このモデルは、大規模な強化学習技術に基づいて事後学習されており、数学、コード、自然言語で推論を行うために必要なラベル付きデータはごくわずかである。
10ヶ月前
042.5K
Tizzy.ai - 百度推出的AI搜索应用

百度がAI検索アプリ「Tizzy.ai」を発表

Tizzy.aiはBaiduが発表したAIインテリジェント検索アプリケーションです。Tizzy.aiはBaiduのビッグモデル技術に基づいており、強力なインテリジェント検索機能を備え、質問に素早く答え、深く考え、意思決定を支援することができます。Tizzy.aiはシンプルなインターフェイスで、広告やポップアップがなく、ガイドの下部に...
8ヶ月前
042.5K
MuseSteamer - 百度推出的视频生成大模型

MuseSteamer - 百度、動画生成のビッグモデルを発表

MuseSteamerは、百度が発表したマルチモーダル動画生成のための大型モデルである。このモデルは、ユーザーから提供されたテキスト説明や画像に基づいて、高品質の動的なビデオコンテンツを迅速に生成することができ、さまざまなシナリオでの作成のニーズを満たすために、様々な透明性と機能のバージョンをサポートしています。
9ヶ月前
042.5K
OmniTalker - 阿里推出实时文本驱动的说话头像生成框架

OmniTalker - アリ、リアルタイムテキスト駆動型トーキングアバター生成フレームワークを発表

OmniTalkerは、アリババが提供するリアルタイムテキストドリブントーキングアバター生成フレームワークです。このフレームワークは、ストリーミングアプローチに基づいて自然な音声応答を生成するために、テキスト、画像、音声、ビデオなどの複数のモーダル入力を同時に扱うことができます。コアはThinker-Talkerアーキテクチャに基づいています。
9ヶ月前
042.5K
Foudinge Scrub:从餐厅评论中构建知识图谱

Foudinge Scrub: レストランのレビューからナレッジグラフを構築する

一般的な紹介 Foudinge ScrubはGitHubでホストされているオープンソースのウェブツールで、開発者のThéophile Cantelobreによって作成された。複雑なテキストデータから抽出されたナレッジグラフのクリーニングと編集を支援するように設計されています。
1年前
042.4K
宠TA - 京东推出的AI宠物互动产品

ペットTA - AIペット対話製品、京東が発売

ペットTA」は京東のAIGCペットインタラクティブ製品で、ペット愛好家に楽しくて暖かいオンラインインタラクティブプラットフォームを提供することができる。ユーザーがペットのために様々な可愛い服やアクセサリーを選んだり、個人的な着せ替えをしたり、ペットのデジタルイメージを作成したりして、ペットとの豊かな交流をサポートする。このプラットフォームは...
8ヶ月前
042.4K
Skywork UniPic 2.0 - 昆仑万维开源的高效多模态模型

Skywork UniPic 2.0 - オープンソースの効率的なマルチモーダルモデリング by KunlunWanwei

Skywork UniPic 2.0は、Quintessenceによってオープンソース化された効率的なマルチモーダルモデルであり、画像生成、編集、理解に焦点を当てている。このモデルは、2BパラメータのSD3.5-Mediumアーキテクチャに基づいており、事前学習、漸進的なデュアルタスク強化戦略、共同学習によって実現される。
7ヶ月前
042.4K
ChatFlow - 开源AI工作流自动化工具

ChatFlow - オープンソースのAIワークフロー自動化ツール

ChatFlowはオープンソースのAIワークフロー自動化ツールで、複雑な要件を効率的なワークフローに変換することをサポートします。コードフレームワークやテストケースを素早く生成し、ソフトウェアアーキテクチャの記述や設計を支援するAI技術をベースとしたツールです。
8ヶ月前
042.4K
Make - AI无代码自动化工作流搭建平台

Make - AIによるコード不要の自動ワークフロー構築プラットフォーム

Makeは、自動化されたプロセスに基づいて組織の効率性と革新性の向上を支援する、AI主導のコード不要の自動化プラットフォームです。このプラットフォームは、マーケティング、販売、財務など、さまざまなビジネスシナリオをサポートする2,000以上の構築済みアプリを提供しています。Makeの主な機能には、コード不要のビジュアルプロセス作成、AI...
9ヶ月前
042.3K
Muzaic - AI音乐生成平台,一键生成与视频内容匹配的音乐

Muzaic - ワンクリックで動画コンテンツにマッチした音楽を生成するAI音楽生成プラットフォーム

Muzaicは、動画制作者やコンテンツクリエイター向けに設計されたAI主導のオンライン音楽生成プラットフォームで、AIベースの技術により、動画の内容にマッチしたカスタム音楽を素早く生成し、わずか8秒で1分間のスタジオ品質のトラックを生成することができる。
9ヶ月前
042.2K
觅果·Migo - AI学术研究助手,智能问答满足多样化需求

Migo - AI学術研究アシスタント、多様なニーズに応えるインテリジェントQ&A

Forage-Migoは、テキスト、言語、視覚、データ処理をサポートする強力なマルチモーダルAI機能を備えた、AI主導の学習・研究イノベーションプラットフォームです。Migoは、インテリジェントなQ&A、ウェブページの読書支援、文献の読書、アカデミックライティング、論文の読書、化学...
9ヶ月前
042.2K
EXAONE 4.0 - LG推出的混合推理模型

EXAONE 4.0 - LGのハイブリッド推論モデル

EXAONE4.0は、韓国LG AI Research社のハイブリッド推論グランドモデルで、汎用自然言語処理と高度な推論機能を融合している。韓国語、英語、スペイン語をサポートし、32Bのプロフェッショナル版と1.2Bのエンドサイド版に分かれています。プロフェッショナル・バージョンは、法律、会計...
8ヶ月前
042.2K
RoboOS 2.0 - 智谱开源的跨本体具身大小脑协作框架

RoboOS 2.0 - ウィズダムスペクトラムのオープンソース・クロスオントロジー・エンボディド・ブレインサイズ・コラボレーション・フレームワーク

RoboOS 2.0は、オントロジーを超えた脳と脳のコラボレーションを実現するオープンソースのフレームワークであり、ロボットの単一知能からグループ協調知能への転換を促進する。このフレームワークでは、クラウドブレインが複雑な意思決定とコラボレーションを担当し、スモールブレインモジュールが特定のスキルの実行に集中するという、効率的な役割分担を実現するために「ビッグブレイン」アーキテクチャを採用している。
8ヶ月前
042.2K
Hyperbolic AgentKit:让Agents拥有自己的计算资源,能够自主管理 GPU、执行区块链操作和社交发布

Hyperbolic AgentKit: エージェントに独自の計算リソースを提供し、GPUを自律的に管理し、ブロックチェーン操作やソーシャルパブリッシングを実行する能力を与える。

概要 Hyperbolic AgentKitは、ブロックチェーンとコンピューティングパワーを組み合わせたAIエージェントを実行するためのテンプレートを提供することを目的としたオープンソースプロジェクトである。このプロジェクトは、CoinbaseのCDP Agentkitをベースに、ブロックチェーンの端末をサポートするための修正と拡張を加えています。
1年前
042.2K
ChartAI - AI数据分析工具,智能推荐适合的图表类型

ChartAI - 適切なチャートタイプをインテリジェントに推奨するAIデータ分析ツール

ChartAIは、AI技術に基づいてデータを自動的に分析し、複雑な情報を素早く理解できる直感的なチャートを生成する効率的なデータ可視化ツールです。ChartAIは、さまざまなデータ形式(Excel、CSVなど)のインポートをサポートし、最適なチャートをインテリジェントに推薦します。
9ヶ月前
042.2K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具

リンコードIDE - 同義リンコード、AIネイティブ開発環境ツールを発表

Spirit Code IDEは、同義Spirit Codeが発売したAIネイティブ統合開発環境(IDE)で、千題の3大モデルに深く適応し、強力なプログラミング知能体モードを持っており、プロジェクトの認識、コードの検索、端末操作の実行などのタスクを自律的に完了することをサポートします。MCPツールをサポートし、Magic Hitch MCP Squareの3...
9ヶ月前
042.1K
RedOne - 小红书最新推出的社交大模型

RedOne - リトルレッドブックの最新ソーシャルメガモデル

RedOneは、Little Red Bookによって導入されたソーシャルネットワーク用に調整された大規模言語モデルである。RedOneは、社会的・文化的知識を取り入れ、マルチタスク能力を強化し、人間の嗜好を調整する3段階の学習戦略によって学習される。RedOneは、社会的タスクのパフォーマンス、有害コンテンツの検出とブラウジングにおいて、基本モデルを大幅に上回る。
7ヶ月前
042.1K
GLM-4.5 - 智谱开源的面向推理、代码与智能体的SOTA模型

GLM-4.5 - 推論、コード、インテリジェンスのためのスマート・スペクトラム・オープンソースSOTAモデル

GLM-4.5はSmart Spectrum社のオープンソースSOTAモデルで、インテリジェント・ボディ・アプリケーション用に設計され、推論、コード生成、インテリジェント・ボディ機能を組み込んでいます。このモデルはMixed Expert(MoE)アーキテクチャに基づいており、3,550億のパラメータを持つGLM-4.5と1,060億のパラメータを持つGLM-4.5の2つのバージョンがあります。
8ヶ月前
042K
Kandinsky 5.0 - 俄罗斯AI团队开源的视频生成模型系列

カンディンスキー5.0 - ロシアのAIチームがオープンソースの映像生成モデルシリーズを公開

Kandinsky 5.0は、ロシアのAIチームによって開発された最新のビデオジェネレーションモデルシリーズで、軽量設計と高性能に重点を置いている。シリーズ最初のモデルであるKandinsky 5.0 Video Liteは、パラメータはわずか20億だが、類似の14Bモデルを凌駕しており、特に...
5ヶ月前
041.9K
Genie 3 - 谷歌推出的通用世界模型

ジーニー3 - グーグルのユニバーサル世界モデル

Genie 3は、Google DeepMindが提供する新世代のユニバーサルワールドモデルで、高度にダイナミックで一貫性のある仮想世界をリアルタイムで生成することができます。Genie 3は、物理現象や自然生態系をシミュレートし、ファンタジーや歴史的なシナリオの作成をサポートします。テキストプロンプトにより、ユーザーは...
7ヶ月前
041.9K
绘想 - 百度推出的AI视频生成平台

絵画思考 - 百度がAI動画生成プラットフォームを発表

Paintingは百度が発表したAI動画生成プラットフォームで、AI技術に基づいて、ユーザーが簡単にパーソナライズされた動画を作成できるようにする。直感的なインターフェイス、強力なツール、インスピレーションの推薦機能を備えたペインティングは、クリエイターに創造的なインスピレーションを提供することができ、同じ操作のキーをサポートし、迅速に類似したビデオを生成することができ、創造的なプロセスを簡素化します。
9ヶ月前
041.8K
MoE-TTS - 昆仑万维推出的最新语音生成框架

MoE-TTS - 崑崙微の最新音声生成フレームワーク

MoE-TTSは、KunlunWanweiによって導入された音声合成フレームワークで、事前に訓練された大規模言語モデル(LLM)と音声専門家モジュールを組み合わせたMixed Expert(MoE)アーキテクチャに基づいています。MoE-TTSは、テキストモジュールのパラメータを凍結し、音声モジュールのパラメータのみを更新することにより、強力なテキスト推論を保持します...
7ヶ月前
041.8K
AopsAI - AI照片处理工具,一键将旧照片转动态视频

AopsAI - AI写真加工ツール、ワンクリックで古い写真をモーションビデオに変える!

AopsAIは、古い写真をダイナミックなショートビデオに変換するオンラインAIツールです。高度なAI技術に基づき、このツールは静止した写真を「動かす」ことで、過去の美しい瞬間を再現する。ユーザーが写真をアップロードし、メールアドレスを入力すると、AopsAIが24時間以内に自動的にビデオを生成し、それを...
9ヶ月前
041.7K
ScienceOne - 中国科学院自动化研究所等机构推出的智能科研平台

ScienceOne - 中国科学院自動化研究所などが立ち上げたインテリジェント研究プラットフォーム

ScienceOneは、中国科学院自動化研究所が共同で立ち上げたインテリジェント科学研究プラットフォームである。ScienceOneは、中国科学院自動化研究所が共同で立ち上げたインテリジェント科学研究プラットフォームで、大規模な科学基盤モデルの構築に基づいており、学際的なコラボレーションによるインテリジェント科学研究の新しいパラダイムを推進し、科学研究の全プロセスをサポートします。
9ヶ月前
041.7K
Claude Opus 4.1 - Anthropic推出的最强编程模型

Claude Opus 4.1 - Anthropicの最強プログラミングモデル

Claude Opus 4.1は、複雑なタスクを効率的に処理するために設計された、Anthropicによる最先端の大規模言語モデルです。このモデルはプログラミング領域で優れており、高品質のコードを生成し、最大32kの単一出力をサポートし、幅広いプログラミングスタイルに適応します。
7ヶ月前
041.7K
ThinkSound - 阿里通义推出的音频生成模型

ThinkSound - オーディオ・ジェネレーション・モデリング from Ali Tongyi

ThinkSoundは、アリ・トンイのスピーチチームが初めて導入したCoT(連鎖思考)音声生成モデルです。このモデルは、CoT推論の導入に基づいて、従来の技術では画面の動的な詳細や空間的な関係をキャプチャすることが困難であるという問題を解決するために、ビデオ画像に正確に一致する効果音を生成することができます。
9ヶ月前
041.6K
Mu - 微软推出的小参数语言模型,支持Windows智能体

Mu - マイクロソフト、Windows Intelligentsiaをサポートする小さなパラメータ言語モデルを発表

Muは、NPUやエッジデバイスで効率的に動作するように設計された、わずか3億3,000万のパラメータを持つMicrosoftの小パラメータ言語モデルである。このモデルはエンコーダー・デコーダー・アーキテクチャーに基づいており、ハードウェアを意識した最適化、モデルの定量化、タスク固有の微調整により、1秒間に100トークンを超える応答速度を達成している。
9ヶ月前
041.6K
InteriorGS - 群核科技推出的3D高斯语义数据集

InteriorGS - Qunar Technologyによる3Dガウス・セマンティック・データセット

InteriorGSは、Qunar Technologyによって導入された高品質の3Dガウス意味データセットである。このデータセットには、住宅、コンビニエンスストア、結婚式場、美術館など80以上の屋内環境をカバーする1,000の3Dシーンが含まれている。このデータセットには、755のカテゴリに分類された554,000以上のオブジェクトインスタンスが含まれている。
7ヶ月前
041.6K
Seed Diffusion - 字节跳动最新推出的扩散语言模型

シード拡散 - ByteHopperの最新拡散言語モデル

シード・ディフュージョンは、ByteHopが導入した実験的な拡散言語モデルで、コード生成タスクを処理する。このモデルは、2段階拡散学習、制約付き逐次学習、強化された効率的な並列デコードなどの技術に基づいており、推論速度が2,146トークン/秒と大幅に向上し、...
8ヶ月前
041.6K
Gemini CLI - 谷歌开源的编程Agent

Gemini CLI - Googleオープンソースプログラミングエージェント

Gemini CLIは、強力なAI機能を開発者に提供するために、開発者のエンドポイントにGemini Big Modelを組み込むことに基づいたGoogleのオープンソースAIプログラミングツールである。このツールは、コードを理解し、ファイルを操作し、コマンドを実行し、問題を動的にトラブルシュートし、開発者が効率的にジェネレーションを書けるように支援する。
9ヶ月前
041.5K
企鹅读伴 - 腾讯推出的中小学生AI阅读助手

ペンギン・リーディング・コンパニオン - テンセントの小中学生向けAI読書アシスタント

Penguin Reading Companionは、テンセントが開発した小中学生向けのAI読書アシスタントです。Penguin Reading Companionは、テンセントのハイブリッドビッグモデルとメタマシンプラットフォームに、義務教育言語カリキュラムプログラムとカリキュラム標準(2022年版)を組み合わせることで、生徒にパーソナライズされたおすすめの読書、複数の読書モード(フォーカス、音読、リスニング...
9ヶ月前
041.5K
Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助

Olovka AI - 正確な執筆アドバイスと支援のためのAIアカデミックライティング支援プラットフォーム

Olovka AIは、学生のためのAIアカデミックライティング支援プラットフォームで、学生の学術レベル、専門分野、論文の種類に基づいた的確なライティングアドバイスと支援を提供します。インテリジェントなアルゴリズムに基づき、Olovka AIは学生が高品質な学術論文を素早く執筆できるようサポートします。
9ヶ月前
041.5K
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

HunyuanVideo-アバター - テンセントハイブリッドオープンソース音声デジタル人体モデル

HunyuanVideo-Avatarは、Tencent Mixed YuanチームとTencent Music Tianqin Labが共同で発表した先進的な音声デジタル人体モデルである。このモデルは革新的なマルチモーダル拡散トランスフォーマーアーキテクチャに基づいており、ユーザーがアップロードしたキャラクター画像と音声に基づいて自然な表情を生成します。
9ヶ月前
041.4K
Intern-S1-mini - 上海AI Lab开源的轻量化科学多模态模型

Intern-S1-mini - Shanghai AI Labによるオープンソースの軽量科学的マルチモーダルモデル

Intern-S1-miniは、上海人工知能研究所(SAL)が発表したパラメータスケール8Bの軽量科学用マルチモーダル・マクロモデルである。Intern-S1の強力な機能を継承し、汎用的な機能と特殊な科学的機能の両方を兼ね備えており、迅速な展開や二次開発に適している。性能面では、I...
7ヶ月前
041.3K
商汤如影 - 商汤科技推出的AI数字人视频制作平台

Shangtang Ruyi - Shangtang Technologyが立ち上げたAIデジタルヒューマンビデオ制作プラットフォーム

Shangtang Ruyingは、Shangtang Technologyが発表したAIデジタル人体映像制作プラットフォームである。ビッグモデル技術に基づき、顔の特徴、服装、髪型など、非常にリアルなデジタル人体イメージの作成とパーソナライズをサポートする。このプラットフォームは、サウンドクローン、ビデオ生成、自動データ注釈、リアルタイムインタラクションなどの機能を備えている。
9ヶ月前
041.3K
Agentar-Fin-R1 - 蚂蚁数科推出的金融领域推理大模型

Agentar-Fin-R1 - 金融推論のためのビッグモデル by Anthem Digital

Agentar-Fin-R1は、Anthem社によって導入された金融領域向けの最先端の大規模言語モデルである。強力なQwen3アーキテクチャに基づいて開発されたこのモデルは、8Bと32Bの2つのパラメータスケールバージョンを提供し、多段階分析、リスク評価、戦争などの複雑な金融推論タスクを正確に処理することができます。
8ヶ月前
041.1K
稿定AI社区 - AI创意内容设计平台,多种设计资源满足不同创作需求

Drafting AI Community - AIクリエイティブコンテンツデザインプラットフォーム。

Drafting AI Communityは、ユーザーに豊富なクリエイティブデザインリソースとツールを提供するオンラインAIクリエイティブインスピレーションプラットフォームです。このプラットフォームは、イメージ写真、Eコマースデザイン、ホリデーテーマ、3Dイラスト、アバターデザイン、小紅集素材、似顔絵デザインなど、様々なデザイン分野をカバーし、様々なユーザーのニーズに応えます。
10ヶ月前
041K
MagicTryOn - 浙大和vivo等机构推出的视频虚拟试穿框架

MagicTryOn(マジックトライオン) - ZJUやVivoなどが提供するビデオバーチャル試着フレームワーク

MagicTryOnは、浙江大学コンピューター科学技術学院がvivoや他の組織と共同で立ち上げた先進的なビデオバーチャルトライオン・フレームワークである。このフレームワークは、従来のU-Netアーキテクチャを革新的なDiffusion Transformer (DiT)アーキテクチャに置き換え、完全なセルフアテンションマシンと組み合わせたものである。
9ヶ月前
041K
gpt-realtime - OpenAI最新推出的AI语音模型

gpt-realtime - OpenAIの最新AIスピーチモデル

gpt-realtimeはOpenAIの高度な音声モデルで、自然で滑らかな音声を生成するための直接音声処理をサポートしています。このモデルは複数の言語とスタイルをサポートし、笑いなどの非言語的な合図を理解し、言語を切り替えることができます。
7ヶ月前
040.9K
悟能 - 商汤科技最新推出的具身智能平台

Wuneng - Shangtang Technologyの最新ボディ・インテリジェンス・プラットフォーム

Wunengはロボットとスマートデバイスのために設計された体現知能プラットフォームである。悟り」の世界モデルとマルチモーダルビッグモデル技術に基づき、Wunengは視覚、音声、触覚などのマルチセンサー入力を統合し、強力な知覚、意思決定、行動能力を備えている。
8ヶ月前
040.8K
Qwen3-Coder-Flash - 阿里通义推出的开源高性能编程模型

Qwen3-Coder-Flash - Ali Tongyi氏によるオープンソースの高性能プログラミングモデル

Qwen3-Coder-Flashは、Ali Tongyi Thousand Questionsチームによって導入された高性能プログラミングモデルであり、優れたエージェントベースプログラミングとツール呼び出し機能を持ち、複雑なプログラミングタスクを処理するのに適している。Qwen3-Coder-Flashは、256Kトークンの長い文脈理解をサポートし、1Mトーク...
8ヶ月前
040.7K
SpatialGen - 群核科技推出的开源3D场景生成模型

SpatialGen - Qunar Technologiesのオープンソース3Dシーン生成モデル

SpatialGenはQunar Technologyのオープンソース3Dシーン生成モデルであり、拡散モデルアーキテクチャに基づき、テキスト記述、参照画像、3D空間レイアウトに基づいて時空間的に一貫性のあるマルチビュー画像の生成をサポートし、さらに3Dガウスシーンの生成とローミングビデオのレンダリングを行う。
7ヶ月前
040.7K
Megrez-3B-Omni:端侧多模态理解模型,支持文本、图像、音频多模态理解和分析

Megrez-3B-Omni:テキスト、画像、音声のマルチモーダル理解と解析をサポートするエンドサイド・マルチモーダル理解モデル

総合紹介 Infini-Megrezは、ハードウェアとソフトウェアの共同設計により、効率的なマルチモーダル理解と解析の実現を目指し、不問の中核ドーム(Infinigence AI)が開発したエッジ・インテリジェンス・ソリューションである。プロジェクトの中核となるのは、グラフをサポートするMegrez-3Bモデルである。
1年前
040.6K
羚珑 - 京东推出的AI商品图设计工具

Antelope(アンテロープ) - AI商品イメージデザインツール、京東が発表

AntelopeはJingdongが発表したインテリジェントデザインツールで、電子商取引業者と個人に効率的で便利なデザインソリューションを提供します。インテリジェントキーイング、インテリジェントレイアウト、インテリジェントカラーマッチングなどの機能により、ユーザーは商品のメイン画像、広告バナー、ショップページなど各種Eコマースストアに合わせた高品質なデザイン作品を素早く作成することができます。
9ヶ月前
040.5K
Vace AI - AI 视频制作和编辑平台,提供一站式视频创作服务

Vace AI - AI映像制作・編集プラットフォーム、ワンストップ映像制作サービスを提供

Vace AIは強力なワンストップAI動画制作・編集プラットフォームです。このプラットフォームは、テキスト説明や参照画像に基づいて高品質のビデオコンテンツを生成し、ビデオの拡張、スタイル変換、被写体の除去や再構築などのさまざまな編集機能をサポートしています。
9ヶ月前
040.5K
Magentic-UI - 微软开源的人机协作AI Agent

Magentic-UI - マイクロソフト、人間とコンピュータのコラボレーションのためのオープンソースAIエージェント

Magentic-UIは、マイクロソフトのオープンソースの人間とコンピュータのコラボレーションAIエージェント研究ツールです。Magentic-UIは、ウェブブラウジング、コード実行、ファイル操作などの複雑なウェブタスクを容易にするために、ユーザーと密接に連携することに基づいています。Magentic-UIは、ユーザーと密接に連携し、ウェブブラウジングやコード実行、ファイル操作などの複雑なウェブタスクを容易にすることを基本としています。
9ヶ月前
040.5K
ChatGPT Agent – OpenAI推出的通用智能AI Agent

ChatGPTエージェント - OpenAIによる汎用インテリジェントAIエージェント

ChatGPTエージェントはOpenAIの汎用AIエージェントで、複数の機能を組み合わせて複雑なタスクを自律的にこなします。ユーザーは自然言語でニーズを記述するだけで、エージェントは自動的に適切なツールを選択することができます。例えば、ウェブの閲覧、情報の抽出、コードの実行...
8ヶ月前
040.4K
Shortbread - AI漫画生成工具,自然语言描述完成漫画创作

ショートブレッド - AIコミック生成ツール、自然言語記述でコミックを完成させる

Shortbreadは、ユーザーが簡単な自然言語の説明に基づいて完全なコミックをすばやく作成できるAIコミック生成ツールです。Shortbreadは、描画スキルを必要とせず、テキストを入力するだけで、AIがユニークなキャラクター、シーン、感情を持つパーソナライズされたコミックをすばやく生成します。
9ヶ月前
040.4K
HeyGen - AI 数字人视频创作平台,支持多语言翻译配音

HeyGen - 多言語翻訳・吹き替えに対応したAIデジタルヒューマン動画作成プラットフォーム

HeyGenは、AIを活用したデジタルヒューマンビデオ作成プラットフォームで、合理的なビデオ制作プロセスをサポートし、ユーザーはプロ級のデジタルヒューマンビデオを素早く作成することができます。このプラットフォームは高度なAI技術に基づいており、ユーザーはデジタルキャラクターのイメージと声を完全にコントロールすることができます。
9ヶ月前
040.4K
琴乐大模型 - 腾讯推出的AI音乐创作模型

ピアノ音楽ビッグモデル-テンセントがAI作曲モデルを発表

Qin Music Grand Modelは、Tencent AI LabとTencent TME Tianqin Labが共同で発表した先進的なAI音楽作成グランドモデルである。このモデルは、ユーザーが入力したキーワード、説明文、または英語と中国語のオーディオクリップに基づいて、高品質のステレオオーディオまたはマルチトラックの楽譜をインテリジェントに生成します。
9ヶ月前
040.3K
ViMax - 香港大学开源的多智能体视频生成框架

ViMax - 香港大学のオープンソースマルチインテリジェントボディビデオ生成フレームワーク

ViMaxは、香港大学のデータサイエンス研究所が開発したオープンソースのマルチインテリジェンス・ボディ・ビデオ生成フレームワークで、クリエイティブな入力からビデオ出力までの全プロセスを自動化することができます。スクリプト生成、シーンデザイン、ショットプランニング、ビデオレンダリング機能を統合し、自然言語記述による首尾一貫した映画・テレビグレードのビデオ生成をサポートします。
4ヶ月前
040.3K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

レポートMAIstro:ビジネス分析、期末レポートなど、カスタムトピックに関する詳細なレポートを作成します。

概要 レポートmaistroは、自然言語処理技術により、ユーザーが簡単にカスタムレポートを作成できるように設計された強力なツールです。このツールはLangChainテクノロジーを利用し、ユーザーから提供されたトピックや構造を詳細なレポートに変換します。
12ヶ月前
040.2K
A2UI - 谷歌开源的Agent驱动型用户交互界面声明式协议

A2UI - エージェント駆動型ユーザー・インタラクション・インターフェースのためのGoogleのオープンソース宣言型プロトコル

A2UI(Agent-to-User Interface)は、Googleがオープンソースで提供するエージェント駆動型インターフェース・プロトコルであり、AIエージェント向けに複雑な対話型インターフェースを生成する際の課題に対処する。AIエージェントがユーザーインターフェースの構造を記述できるようにする宣言的なJSONフォーマットを通じて、クライアントアプリケーションは、AIエージェントがユーザーインターフェースの構造を記述できるようにします。
3ヶ月前
040.1K