最新のAIリソース

共 2832 篇文章
V-JEPA 2 - Meta AI 推出的最强世界大模型

V-JEPA 2 - Meta AIによる世界最強の大型モデル

V-JEPA 2は、Meta AIが提供する12億のパラメータを持つビデオデータに基づく世界の大規模モデルである。このモデルは、100万時間以上のビデオと100万枚の画像から自己教師付き学習に基づいて学習され、物理世界の物体、行動、操作を理解する...
6ヶ月前
027.8K
AopsAI - AI照片处理工具,一键将旧照片转动态视频

AopsAI - AI写真加工ツール、ワンクリックで古い写真をモーションビデオに変える!

AopsAIは、古い写真をダイナミックなショートビデオに変換するオンラインAIツールです。高度なAI技術に基づき、このツールは静止した写真を「動かす」ことで、過去の美しい瞬間を再現する。ユーザーが写真をアップロードし、メールアドレスを入力すると、AopsAIが24時間以内に自動的にビデオを生成し、それを...
6ヶ月前
027.4K
Genspark AI - Genspark推出的AI浏览器

Genspark AI - ジェンスパークがAIブラウザを発表

Genspark AIは、Genspark社が提供する革新的なAIブラウザです。Genspark AIはインテリジェントなアシスタントを内蔵しており、ユーザーがショッピング中に、よりお買い得な商品を見つけたり、商品価格を比較したり、ユーザーレビューを分析したりすることで、より賢い購買決定を行えるようサポートします...
6ヶ月前
035.6K
豆包大模型1.6 - 字节跳动豆包团队推出的多模态深度思考大模型

Beanbag Big Model 1.6 - WordPopのBeanbagチームによるマルチモーダル深層思考ビッグモデル

同袍ビッグモデル1.6(Doubao-Seed-1.6)は、ByteDanceが発表したマルチモーダル深層思考ビッグモデルである。このモデルはテキスト、画像、動画など様々な入力形式をサポートし、高品質のテキスト出力を生成することができる。このモデルは256k長のコンテキストウィンドウを持ち、最大入力長は2...
6ヶ月前
0103.8K
Seedance 1.0 - 字节跳动推出的视频生成基础模型

Seedance 1.0 - 動画生成の基本モデルをByteDanceが発表

Seedance1.0は、ByteDance Seedチームによって導入された高度なビデオ生成モデルです。Seedance1.0は、テキストと画像の入力をサポートし、シームレスなマルチカメラ切り替えで1080pの高画質ビデオを生成し、ネイティブのマルチカメラナレーション機能を持ち、遠景、中景、近景を実現することができます。
6ヶ月前
032.3K
爱扒谱 - AI音乐处理平台,一键将音频文件转为五线谱

Love Sheet Music - AI音楽処理プラットフォーム、オーディオファイルを5線楽譜に変換するキー

AiPuSheetsは、主に音楽クリエイター、教師、学生、音楽愛好家のためのAI技術に基づいた音楽処理プラットフォームです。このプラットフォームは、ワンクリックでオーディオファイルをペンタトニック楽譜に変換したり、ボーカルトラックとバッキングトラックを素早く分離したり、ユーザーが入力したメロディやコードに基づいて完全な音楽作品を自動生成したり、MP3...
6ヶ月前
030.5K
Splash - AI音乐创作平台,文字描述生成旋律和演唱效果

Splash - AI音楽制作プラットフォーム、テキスト記述でメロディと歌唱効果を生成

Splashは革新的なAI音楽作成プラットフォームで、ユーザーが簡単にパーソナライズされた音楽作品を作成できる。高度なAI技術に基づき、このプラットフォームは、テキストを入力するだけでAIがメロディーや歌のエフェクトを生成する、テキストから歌へ、テキストからラップへ、生成的なテキストから音楽への機能を提供する。
6ヶ月前
032.5K
Music Muse - AI音乐创作平台,简单描述生成音乐作品

Music Muse - 簡単な説明で楽曲を生成するAI音楽制作プラットフォーム

Music Museは、高度なAI技術に基づいた音楽制作プラットフォームです。ユーザーが音楽のスタイル、ムード、リズムなどの簡単な説明を入力すると、専門的な音楽の知識がなくても、AIがニーズに合った音楽作品を素早く生成する。ポップス、ロック、クラシックなど様々なスタイルに対応し、ムードに合わせて音楽を生成することができる。
6ヶ月前
028.8K
Jammable - AI 音乐翻唱平台,支持AI模仿特定歌手或风格进行创作

Jammable - 特定のアーティストやスタイルを模倣するAIをサポートするAI音楽カバープラットフォーム

Jammableは、ユーザーが音楽をアップロードするか、既存の作品を選択し、AIに好きな歌手の声やスタイルを模倣させて新しいカバーバージョンを作成することができるAI音楽カバープラットフォームです。Jammableは、高品質の音楽をすばやく生成し、結果は数秒で表示され、人気のサウンド、音楽コンピレーション、およびコ...
6ヶ月前
029.3K
o3-pro - OpenAI推出的 o3 升级版推理模型

o3-pro - OpenAIからアップグレードされたo3推論モデル

o3-proはOpenAIのo3推論モデルのアップグレード版で、複雑な質問を扱い、正確な答えを提供するように設計されています。このモデルは、ウェブ検索、ファイル解析、画像推論、Pythonプログラミングなど、ChatGPTの全ツールの呼び出しをサポートしており、強力な実行力を発揮します。
6ヶ月前
027.6K
AIFlowy - 开源的企业级 AI 应用开发平台

AIFlowy - オープンソースのエンタープライズAIアプリケーション開発プラットフォーム

AIFlowyは、オープンソースのエンタープライズレベルのAIアプリケーション開発プラットフォームで、Java開発をベースとし、byte Coze、Tencent meta ware、Difyなどの製品に対応しています。インテリジェント対話ロボット、プライベート知識ベース構築、AIワークフローオーケストレーション、大規模モデル管理などの機能をサポートし、完全なシステム管理モデルを提供します。
6ヶ月前
027.4K
优雅YOYA - 中科闻歌推出的AI音视频内容创作平台

エレガントなYOYA - AIオーディオ/ビデオコンテンツクリエーションプラットフォームは、ZTE Winkoによって開始された

Elegant YOYAはZhongke Wengeが立ち上げたマルチモーダルリテラティブビデオプラットフォームであり、AIマルチモーダル技術に基づいて、ビデオコンテンツ作成の全チェーンを強化する。ユーザーはテーマ要件を入力するだけで、プラットフォームはスクリプト、画像、動画を迅速に生成し、インテリジェント編集、音声合成、キャラクター口駆動などの操作を完了することができ、出力...
6ヶ月前
025.1K
Uthana - AI 3D 角色动画生成平台,文字描述或参考视频生成逼真动画

Uthana - AI 3Dキャラクターアニメーション生成プラットフォーム、リアルなアニメーションを生成するためのテキスト説明やリファレンスビデオ

Uthanaは、強力なAI 3Dキャラクターアニメーション生成プラットフォームです。ユーザーがテキスト説明を入力したり、参考動画をアップロードしたり、モーションライブラリを検索したりすると、AIがどんな骨構造のモデルにも対応できるリアルなアニメーションを素早く生成します。このプラットフォームは、スタイル移行、API統合、カスタマイズ...といった様々な機能を備えています。
6ヶ月前
030K
Vace AI - AI 视频制作和编辑平台,提供一站式视频创作服务

Vace AI - AI映像制作・編集プラットフォーム、ワンストップ映像制作サービスを提供

Vace AIは強力なワンストップAI動画制作・編集プラットフォームです。このプラットフォームは、テキスト説明や参照画像に基づいて高品質のビデオコンテンツを生成し、ビデオの拡張、スタイル変換、被写体の除去や再構築などのさまざまな編集機能をサポートしています。
6ヶ月前
025.9K
企鹅读伴 - 腾讯推出的中小学生AI阅读助手

ペンギン・リーディング・コンパニオン - テンセントの小中学生向けAI読書アシスタント

Penguin Reading Companionは、テンセントが開発した小中学生向けのAI読書アシスタントです。Penguin Reading Companionは、テンセントのハイブリッドビッグモデルとメタマシンプラットフォームに、義務教育言語カリキュラムプログラムとカリキュラム標準(2022年版)を組み合わせることで、生徒にパーソナライズされたおすすめの読書、複数の読書モード(フォーカス、音読、リスニング...
6ヶ月前
026.8K
BoomCut - 小影科技推出的 AI 出海营销视频生成工具

BoomCut - Little Shadow TechnologyのAIアウトバウンドマーケティング動画生成ツール

BoomCutは、Little Shadow Technologyが発表したAI国境を越えたマーケティングビデオのローカリゼーションツールである。このツールは、高度なリップシンクドライブとトーンクローン技術に基づく強力な機能を備えており、異なる国や地域のユーザーの言語ニーズを満たすために、話し言葉ビデオの多言語バージョンを迅速に生成します。
6ヶ月前
029.2K
Mobvoi MCP Server - 出门问问开源的多模态MCP服务工具

モボイMCPサーバー - オープンソースのマルチモーダルMCPサービスツールをアスクアウト

モボイMCPサーバーは、GoDoQが提供を開始したマルチモーダルAI機能を統合するツールです。Mobvoi MCP Serverは、音声生成、サウンドクローン、イメージドリブンデジタルピープル、ビデオダビング、ビデオ翻訳を統合したマルチモーダルAIツールで、ユーザーがテキストを入力することで柔軟に呼び出すことができます。
6ヶ月前
028.8K
Rowboat - 开源的智能体开发框架

Rowboat - スマートボディ開発のためのオープンソースフレームワーク

Rowboatは、マルチインテリジェントなボディアシスタントの構築をサポートするオープンソースのローコードAI IDEです。ビジュアルインターフェースとAI支援開発機能に基づいて、Rowboatは、ユーザーがインテリジェントなボディワークフローを迅速に設計、設定、テストするのに役立ちます。ユーザーが自然言語で要件を記述することをサポートし、Row...
6ヶ月前
028.7K
商汤如影 - 商汤科技推出的AI数字人视频制作平台

Shangtang Ruyi - Shangtang Technologyが立ち上げたAIデジタルヒューマンビデオ制作プラットフォーム

Shangtang Ruyingは、Shangtang Technologyが発表したAIデジタル人体映像制作プラットフォームである。ビッグモデル技術に基づき、顔の特徴、服装、髪型など、非常にリアルなデジタル人体イメージの作成とパーソナライズをサポートする。このプラットフォームは、サウンドクローン、ビデオ生成、自動データ注釈、リアルタイムインタラクションなどの機能を備えている。
6ヶ月前
026.8K
JoyHallo - 京东开源的AI数字人模型

JoyHallo - JingdongのオープンソースAIデジタル人体モデル

JoyHalloは、Jingdongが提供するオープンソースのAIデジタル人体モデルで、北京語向けに設計されており、音声をリアルなスピーキングビデオに変換することができます。JoyHalloは、唇の動きの予測精度を向上させるために半結合構造を使用したwav2vec2モデルに基づく音声特徴を埋め込み、英語ビデオの生成をサポートします。
6ヶ月前
028.8K
硅语AI知识创业平台 - 硅基智能推出的AI数字人技术平台

シリコン・ランゲージAI知識起業プラットフォーム - シリコン・インテリジェンスが立ち上げたAIデジタル・ヒューマン・テクノロジー・プラットフォーム

シリコン・ランゲージAIナレッジ・ベンチャー・プラットフォームは、南京シリコン・インテリジェンス・テクノロジーが立ち上げたAIデジタル・ヒューマン・テクノロジー・プラットフォームである。このプラットフォームは、自然意味処理、機械学習、ディープラーニングなどの高度なAI技術に依存し、人間と対話できるバーチャルキャラクターを作成する。
6ヶ月前
028.2K
必火AI - AI数字人生成平台,支持中英双语声音克隆

Mustfire AI - 中国語・英語バイリンガル・ボイスクローンをサポートするAIデジタルヒューマン・ジェネレーション・プラットフォーム

マストファイアAIは、ショートビデオクリエイター向けの国産AIデジタルヒューマン生成プラットフォームです。ユーザーは、実在の人物を撮影した3分間の動画をアップロードすることで、0.1mmの微表情精度を持つ、非常にリアルなデジタルヒューマン画像を素早く生成することができます。音声合成や音声サンプルの録音にも対応しており、実在の人物に匹敵するAI音声モデルを生成することができる。
6ヶ月前
029K
智谱CoCo - 智谱推出的企业级超级助手Agent

ワイズスペクトラムCoCo - ワイズスペクトラムのエンタープライズ・スーパー・アシスタント・エージェント

Wisdom Spectrum CoCoは、Wisdom SpectrumのAICOプラットフォームが発表した初のエンタープライズレベルのスーパーアシスタントエージェントです。Wisdom Spectrum CoCoは、配信指向、記憶メカニズム、シームレスな組み込みという3つのコア機能を備えています。政府業務の分野において、CoCoは政策の解釈、ソリューションのカスタマイズ、実施効果の追跡が可能で、政策が効率的に実施されるよう支援します。
6ヶ月前
028.2K
draw.io - 在线图表绘制工具,支持流程图、思维导图等多种图表

draw.io - オンラインダイアグラムツール。フローチャート、マインドマップ、その他のダイアグラムに対応。

draw.ioは、ブラウザベースのプラットフォーム上で動作し、ソフトウェアのインストールを必要としない無料のオンライン描画ツールです。draw.ioは、フローチャート、マインドマップ、ネットワークトポロジーダイアグラム、ガントチャートなど、さまざまなシナリオのニーズを満たすために、さまざまな種類の図をサポートしています。操作...
6ヶ月前
032.8K
觅果·Migo - AI学术研究助手,智能问答满足多样化需求

Migo - AI学術研究アシスタント、多様なニーズに応えるインテリジェントQ&A

Forage-Migoは、テキスト、言語、視覚、データ処理をサポートする強力なマルチモーダルAI機能を備えた、AI主導の学習・研究イノベーションプラットフォームです。Migoは、インテリジェントなQ&A、ウェブページの読書支援、文献の読書、アカデミックライティング、論文の読書、化学...
6ヶ月前
027.2K
ScienceOne - 中国科学院自动化研究所等机构推出的智能科研平台

ScienceOne - 中国科学院自動化研究所などが立ち上げたインテリジェント研究プラットフォーム

ScienceOneは、中国科学院自動化研究所が共同で立ち上げたインテリジェント科学研究プラットフォームである。ScienceOneは、中国科学院自動化研究所が共同で立ち上げたインテリジェント科学研究プラットフォームで、大規模な科学基盤モデルの構築に基づいており、学際的なコラボレーションによるインテリジェント科学研究の新しいパラダイムを推進し、科学研究の全プロセスをサポートします。
6ヶ月前
027.2K
QBot - 腾讯QQ浏览器推出的AI浏览器

QBot - テンセントQQブラウザによるAIブラウザ

QBotはTencent QQ Browserが発表したAI機能を統合したスマートブラウザである。テキスト、音声、画像検索をサポートし、迅速かつ正確な回答を提供するAI検索や、ウェブコンテンツの迅速な解釈をサポートし、マインドマップを生成するAIブラウジング機能など、さまざまな実用的機能を備えている。
6ヶ月前
028.8K
FiaMind - AI 思维导图工具,提供无限画布自由拆分组合

FiaMind - キャンバスを自由に分割・組み合わせできるAIマインドマップツール

FiaMindは、効率的な情報管理と創造的な支援のためにデザインされたAIマインドマップツールです。このツールは柔軟で無制限のキャンバスを持ち、マインドマップの自由な分割と結合をサポートし、ロジックダイアグラム、マインドマップ、組織図など多様なレイアウトのニーズに応えます。
6ヶ月前
028.3K
幕布 - AI大纲笔记工具,复杂信息一键生成思维导图

カーテン - AIアウトラインノートツール、複雑な情報もワンクリックでマインドマップを生成

Curtainは、ユーザーが構造化されたアウトラインフォームに基づいて断片化された知識を体系化するためのAIアウトラインノートツールであり、このツールはマインドマップのワンクリック生成をサポートしています。また、ワンクリックでマインドマップを作成することもできます。カーテンは、複雑な情報を直感的なグラフィックで表現し、思考を素早く明瞭にし、理解力と記憶効率を向上させることをサポートします。
6ヶ月前
027.9K
StartAI - AI 绘画软件,基于 Adobe Photoshop 提供多种绘图功能

StartAI - Adobe PhotoshopをベースにしたAIペイントソフト。

StartAIは、デザイナーやクリエイター向けにデザインされたAdobe PhotoshopベースのAIペイントソフトです。デザイン効率を向上させ、創造性を刺激するAI技術に基づいており、テキストベースの描画、部分的な再描画、ラインカラーリング、非破壊ズーム、高精細復元などをサポートしています。
6ヶ月前
031.1K
意间AI - AI绘画平台,支持中英双语文本生成图像

Inter AI - AI描画プラットフォーム、中国語と英語のバイリンガルテキストをサポートし、画像を生成する。

Italian AIは、バイリンガルの入力をサポートし、400以上のモデルと100,000の図面スタイルを含む、業界をリードするAI図面・デザインカスタマイズプラットフォームです。ユーザーは、テキスト説明文を入力したり、画像をアップロードすることで、要件を満たす画像を素早く生成することができます。
6ヶ月前
028.4K
元镜 - AI视频创作工具,自动生成脚本

Metascope - スクリプトを自動生成するAIビデオ作成ツール

Metamirrorは、人間とコンピュータの共生エンジンをベースとしたAI映像制作ツールで、クリエイティブなひらめきから完成映像までの効率的な制作をサポートします。自動スクリプト生成、キャラクタースタイル統一、マルチモーダル融合、インテリジェントワークフローなどの機能を備えており、ワンクリックでクリエイティブな動画スクリプト、マルチモーダル分割画面デザインを素早く生成し、完成動画を合成することができます...
6ヶ月前
027.6K
朱雀AI检测 - 腾讯推出的AI图片和文本检测平台

Jubilee AI Inspection - テンセントが立ち上げたAI画像・テキスト検査プラットフォーム

Vermilion Bird AI Detectionは、テンセントのハイブリッド・セキュリティ・チームであるVermilion Bird Labsが立ち上げたAI検出プラットフォームで、ユーザーがAIによって生成された画像やテキスト・コンテンツを識別するのを支援する。Vermilion Bird AI Detectionは、画像の隠された特徴、常識的な論理に合致しないコンテンツ、「透かし」ロゴなどを分析し、AIによって生成された画像かどうかを迅速に判断する。
6ヶ月前
033.5K
琴乐大模型 - 腾讯推出的AI音乐创作模型

ピアノ音楽ビッグモデル-テンセントがAI作曲モデルを発表

Qin Music Grand Modelは、Tencent AI LabとTencent TME Tianqin Labが共同で発表した先進的なAI音楽作成グランドモデルである。このモデルは、ユーザーが入力したキーワード、説明文、または英語と中国語のオーディオクリップに基づいて、高品質のステレオオーディオまたはマルチトラックの楽譜をインテリジェントに生成します。
6ヶ月前
025.7K
拍我AI - 爱诗科技推出的PixVerse国内版AI视频生成平台

AI動画生成プラットフォーム「PixVerse」国内版をアイシ・テクノロジーズが提供開始

Shoot Me AIは、Aishi Technologyが国内市場向けにカスタマイズして発表した革新的なAI動画生成プラットフォームで、PixVerseの国内版です。このプラットフォームは、簡単なテキストプロンプトまたはアップロードされた画像に基づいて、高品質の動的なビデオコンテンツを迅速に生成することをサポートしています。このプラットフォームの最新バージョンV4.5では、ビデオの品質、アニメーションの滑らかさが改善されました。
6ヶ月前
030.8K
钉钉宜搭 - 阿里推出的低代码应用开发平台

Nail Yihu - アリのローコードアプリ開発プラットフォーム

Nail Yitaiは、アリババが立ち上げたローコード・アプリケーション開発プラットフォームで、企業のデジタル・ビジネス・アプリケーションの迅速な構築を支援する。視覚的なドラッグ&ドロップや設定方法を通じて、コードを知らないビジネスパーソンでも簡単にニーズに合ったアプリケーションを開発することができ、開発の敷居とコストを大幅に削減することができます。
6ヶ月前
028.2K
Seed-Music - 字节跳动推出的AI音乐生成模型

バイトホッパーがAI音楽生成モデル「Seed-Music」を発表

Seed-Musicは、ByteDanceが発表したAI音楽生成の大きなモデルであり、ユーザーが録音した10秒間の音声を完全な楽曲に変換することをサポートする。自己回帰言語モデルと拡散法に基づいて、マルチモーダルなユーザー入力(例えば、スタイル記述、オーディオ参照、スコア、サウンドキュー)を高...
6ヶ月前
029.3K
反谱 - AI音乐转谱平台,支持音频文件转五线谱和简谱

Anti-score - AI音楽トランスクリプションプラットフォーム。

AntiSpectrumは、先進的なAI技術に基づき、オーディオファイル(MP3、FLACなど)をペンタトニックやシンプルな楽譜に変換する革新的なオンラインAI音楽変換プラットフォームです。AntiSpectrumにはボーカル分離機能があり、音楽中のボーカルと伴奏を分離し、音楽制作やミキシングを簡単にします。AntiSpectrumは、MIDIファイルの変換をサポートしています...
6ヶ月前
037.9K
Replay - AI 音乐伴奏分离工具,自动分离主唱、人声和伴奏

Replay - リードボーカル、ボーカル、バッキングトラックを自動的に分離するAI音楽バッキングトラック分離ツール

Replayは、ディープラーニング技術に基づいた先進的なAI伴奏分離ツールです。このツールは、オーディオコンテンツを自動的に分析し、リードボーカル、ボーカル、バッキングトラックなどのトラックを正確に分離して、別々のオーディオファイルを生成します。Replayは、MP3、WAV、FL...など、多くの一般的なオーディオフォーマットをサポートしています。
6ヶ月前
032.9K
MakeBestMusic - AI 音乐创作平台,用文本描述或歌词生成音乐

MakeBestMusic - テキスト説明や歌詞付きの音楽を生成するAI音楽作成プラットフォーム

MakeBestMusicは、AIベースの音楽作成プラットフォームで、ユーザーはテキストの説明や歌詞に基づいて高品質のインストゥルメンタルまたはボーカル音楽をすばやく生成することができます。MakeBestMusicは、ポップ、ロック、クラシック、エレクトロニック、その他の音楽スタイルをサポートし、音楽分離機能を提供します...
6ヶ月前
034K
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

HunyuanVideo-アバター - テンセントハイブリッドオープンソース音声デジタル人体モデル

HunyuanVideo-Avatarは、Tencent Mixed YuanチームとTencent Music Tianqin Labが共同で発表した先進的な音声デジタル人体モデルである。このモデルは革新的なマルチモーダル拡散トランスフォーマーアーキテクチャに基づいており、ユーザーがアップロードしたキャラクター画像と音声に基づいて自然な表情を生成します。
6ヶ月前
026K
HeyGen - AI 数字人视频创作平台,支持多语言翻译配音

HeyGen - 多言語翻訳・吹き替えに対応したAIデジタルヒューマン動画作成プラットフォーム

HeyGenは、AIを活用したデジタルヒューマンビデオ作成プラットフォームで、合理的なビデオ制作プロセスをサポートし、ユーザーはプロ級のデジタルヒューマンビデオを素早く作成することができます。このプラットフォームは高度なAI技術に基づいており、ユーザーはデジタルキャラクターのイメージと声を完全にコントロールすることができます。
6ヶ月前
026.3K
Keevx - AI 数字人视频创作平台,一键生成脚本和视频

Keevx - AIデジタルヒューマンビデオ作成プラットフォーム、ワンクリックスクリプトとビデオ生成

Keevxは、主に海外の中小企業や個人クリエイターを対象としたAIデジタルヒューマン動画作成プラットフォームです。AIによるインテリジェントなスクリプト生成と翻訳機能をベースに、高品質な公開ポートレートとテンプレートを備え、ユーザーにワンクリックでデジタルヒューマンマーケティングビデオ生成サービスを提供します。
6ヶ月前
029K
Make - AI无代码自动化工作流搭建平台

Make - AIによるコード不要の自動ワークフロー構築プラットフォーム

Makeは、自動化されたプロセスに基づいて組織の効率性と革新性の向上を支援する、AI主導のコード不要の自動化プラットフォームです。このプラットフォームは、マーケティング、販売、財務など、さまざまなビジネスシナリオをサポートする2,000以上の構築済みアプリを提供しています。Makeの主な機能には、コード不要のビジュアルプロセス作成、AI...
6ヶ月前
026K
MiMo-VL - 小米开源的多模态模型

MiMo-VL - シャオミのオープンソース・マルチモーダルモデル

MiMo-VLはシャオミのオープンソースのマルチモーダルグランドモデルで、視覚コーダー、クロスモーダル投影レイヤー、言語モデルで構成されている。視覚コーダーはQwen2.5-ViTに基づいており、ネイティブ解像度の入力をサポートし、より詳細な情報を保持する。言語モデルはシャオミが独自に開発したMiMo-7Bで、複雑な投影のために設計されている。
6ヶ月前
026.6K
Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助

Olovka AI - 正確な執筆アドバイスと支援のためのAIアカデミックライティング支援プラットフォーム

Olovka AIは、学生のためのAIアカデミックライティング支援プラットフォームで、学生の学術レベル、専門分野、論文の種類に基づいた的確なライティングアドバイスと支援を提供します。インテリジェントなアルゴリズムに基づき、Olovka AIは学生が高品質な学術論文を素早く執筆できるようサポートします。
6ヶ月前
026.4K
Fish Audio - AI 语音合成与声音克隆工具

Fish Audio - AI音声合成とサウンドクローニングツール

Fish Audioは、テキスト音声合成(TTS)と音声クローンをサポートする強力な生成AI音声合成ツールです。ユーザーはテキストを入力するだけで、自然で滑らかな音声に変換することができ、プラットフォームはさまざまな言語と音声スタイルを提供し、さまざまなシナリオやユーザー...
6ヶ月前
035.5K
SignGemma - 谷歌 DeepMind 推出的手语翻译模型

SignGemma - Google DeepMindの手話翻訳モデル

SignGemmaは、Google DeepMindが提供する世界で最も強力な手話通訳AIモデルであり、アメリカ手話(ASL)の英語テキストへの正確な翻訳をサポートする。このモデルはマルチモーダルトレーニングに基づいており、視覚データとテキストデータを組み合わせることで、手話の動作をリアルタイムで捉え、素早くテキストに翻訳する。
6ヶ月前
029.7K
CRIC深度智联 - 克而瑞推出的中国房地产首个AI Agent

CRIC - 中国初の不動産AIエージェントをCRICが開始

CRIC Depth Intelligenceは、CRICが独自に開発した中国不動産初のAIインテリジェント体であり、CRICの20年にわたる不動産業界での経験とデータ蓄積、マルチモーダルビッグモデル技術に基づき、データ統合、インテリジェント分析からコンテンツ生成までの全チェーンを切り開く。
6ヶ月前
025.3K
WebAgent - 阿里通义开源的自主搜索AI Agent

WebAgent - Ali Tongyi オープンソース自律検索AIエージェント

WebAgentは、Alibaba Tongyi Labsが開発したオープンソースの自律型検索AIエージェントで、強力なエンドツーエンドの自律型情報検索と多段階の推論機能を備えています。WebAgentは、人間のようにネットワーク環境を能動的に認識、判断、行動することができ、学術研究やビジネスの意思決定に広く利用されています。
6ヶ月前
030K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具

リンコードIDE - 同義リンコード、AIネイティブ開発環境ツールを発表

Spirit Code IDEは、同義Spirit Codeが発売したAIネイティブ統合開発環境(IDE)で、千題の3大モデルに深く適応し、強力なプログラミング知能体モードを持っており、プロジェクトの認識、コードの検索、端末操作の実行などのタスクを自律的に完了することをサポートします。MCPツールをサポートし、Magic Hitch MCP Squareの3...
6ヶ月前
024.7K
BAGEL - 字节跳动推出的开源多模态基础模型

BAGEL - Wordpressがオープンソースのマルチモーダルベースモデルを発表

BAGELは、ByteDanceによってオープンソース化されたマルチモーダルベースモデルで、140億のパラメータを持ち、そのうち70億がアクティブである。このモデルベースとMixed Transformer Expert Architecture (MoT)は、それぞれ独立した2つのエンコーダで画像のピクセルレベルとセマンティックレベルの特徴をキャプチャし、画像、テキスト、ビデオの効率的な処理をサポートします。
6ヶ月前
027.2K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版

DeepSeek-R1 - DeepSeekのAI推論モデル。

DeepSeek-R1は、杭州を拠点とするDeepSeekが発表した高性能AI推論モデルで、OpenAIのo1正式版に対するベンチマークである。このモデルは、大規模な強化学習技術に基づいて事後学習されており、数学、コード、自然言語で推論を行うために必要なラベル付きデータはごくわずかである。
6ヶ月前
027.7K
幻舟AI - 一站式AI短片创作平台,批量生成各类型视频内容

Phantom Boat AI - ワンストップのAIショートフィルム制作プラットフォーム、様々なタイプの映像コンテンツを一括生成

Phantom Boat AIは、CM、プロモ、アニメーションなど、様々なタイプの映像コンテンツの効率的な一括生成をサポートする、ワンストップの強力なAIショートフィルム作成プラットフォームです。Midjourney、Runwayをはじめとする世界最先端のAIモデルをベースとしたこのプラットフォームは、脚本作成から...
6ヶ月前
031.6K
Data Agent - 火山引擎推出的新一代企业级数据智能体

データ・エージェント - ボルケーノ・エンジンが提供するエンタープライズクラスの新世代データ・インテリジェンス

データエージェントは、ボルケーノ・エンジンが立ち上げた新世代のエンタープライズグレードのデータインテリジェンスで、データ分析とインテリジェントマーケティングに焦点を当てています。データエージェントは、企業内の構造化データと非構造化データを統合し、綿密な調査と分析に基づいて包括的で詳細な調査レポートを作成します。
6ヶ月前
031K
可灵 2.1 - 快手推出的AI视频生成模型

Keling 2.1 - レーサーのAIビデオ生成モデル

KeLing 2.1は、レーサーが発表したAIビデオ生成モデルである。このモデルには、標準、高品質、マスターの3つのバージョンがあり、720P、1080P、フィルムレベルのエフェクトを提供し、さまざまなクリエイティブ・ニーズに対応する。標準バージョンの生成スピードは、迅速な制作に適している。
6ヶ月前
029.6K
小云雀 - 剪映推出的智能创作Agent

リトルラーク - シアーイメージのスマートクリエーションエージェント

Little Larkは、Shear Imageが発表したインテリジェントなクリエイションエージェントで、AI技術に基づき、コンテンツ制作の境界線を再構築し、よりシンプルで効率的、そして面白いクリエイションを実現します。リトルラークは、閾値ゼロの動画作成、デジタルポップアップビデオ、デザイン画、背景用画像をサポートしており、ユーザーはコマンドを入力するだけで、AIサポートが効率的に...
6ヶ月前
042.4K
稿定AI社区 - AI创意内容设计平台,多种设计资源满足不同创作需求

Drafting AI Community - AIクリエイティブコンテンツデザインプラットフォーム。

Drafting AI Communityは、ユーザーに豊富なクリエイティブデザインリソースとツールを提供するオンラインAIクリエイティブインスピレーションプラットフォームです。このプラットフォームは、イメージ写真、Eコマースデザイン、ホリデーテーマ、3Dイラスト、アバターデザイン、小紅集素材、似顔絵デザインなど、様々なデザイン分野をカバーし、様々なユーザーのニーズに応えます。
6ヶ月前
026.6K
NoCode – 美团推出的零代码AI开发平台

NoCode-ゼロコードAI開発プラットフォーム、Meituanが発表

NoCodeとは NoCodeはMissionが立ち上げたゼロコードAI開発プラットフォームです。プログラミングの経験がなくても、自然言語で要件を記述するだけで、ウェブサイトページ、ユーティリティ、小さなゲーム、イベントページ、その他のアプリケーションを素早く生成することができます。
6ヶ月前
037.2K
Smithery:连接AI与工具的MCP服务器注册平台

Smithery:AIとツールをつなぐMCPサーバー登録プラットフォーム

包括的な紹介 Smitheryは、開発者がモデル・コンテキスト・プロトコル(MCP)サーバーを発見、デプロイ、管理できるようにするプラットフォームです。MCPは、大規模言語モデル(LLM)が外部のツールやデータソースと連携することを可能にするオープンなプロトコルです。
6ヶ月前
060.8K
Artbreeder:超强图像控制与图像风格混合工具,适合教学使用

Artbreeder: 教材のための優れたイメージコントロールとイメージスタイルブレンドツール!

Artbreederの紹介 Artbreederは、人工知能(AI)ベースの共同アート制作サイトです。StyleGANとBigGANモデルを使用し、ユーザーが顔、風景、絵画などの画像を生成したり、修正したりするのを支援します。遺伝子 "スライダーの操作...
6ヶ月前
040.2K
ZeroGPT:免费检测AI生成内容的工具

ZeroGPT:AIが生成したコンテンツを検出する無料ツール

一般的な紹介 ZeroGPTは、ChatGPT、GPT-4、その他の言語モデルなどのAIによって生成されたテキストかどうかを検出するための無料のオンラインツールです。言語パターン、文章構造、その他の特徴についてテキストを分析し、そのコンテンツが人間によって作成されたものか、機械によって作成されたものかを判断します。
6ヶ月前
040.5K
QuillBot:智能辅助改写与校对文本的写作工具

QuillBot:文章のリライトと校正をインテリジェントにアシストするライティングツール

概要 QuillBotは、AIベースのオンラインライティング支援プラットフォームで、ユーザーがテキストコンテンツを素早くリライト、校正、最適化できるように設計されています。自然言語処理技術により、文章のリライト、文法チェック、要約、翻訳を提供し、学生、社会人、社内...
6ヶ月前
034K
Exponent:在任何环境中执行自动化编程任务

Exponent: あらゆる環境でプログラミング作業を自動化

一般的な紹介 Exponentは、コードの探索から最終的なデプロイまで、あらゆるソフトウェアエンジニアリングのタスクでユーザーと協力するように設計された強力なAIプログラミングエージェントです。ローカル開発環境、端末操作、または継続的インテグレーション(CI)プロセスで実行することができ、ユーザーを様々な...
6ヶ月前
027.8K
KrillinAI:一键翻译和配音的视频多语言全球化工具

KrillinAI: ワンクリックで翻訳とダビングができる動画用多言語グローバル化ツール

包括的な紹介 KrillinAIは、ユーザーがビデオを翻訳し、自動的にそれらをダビングするために人工知能を使用することに焦点を当てたオープンソースのビデオ処理ツールです。ビデオのダウンロードから始まり、様々なプラットフォームに適応した完成品の生成まで、全てのプロセスは数クリックで完了します。開発者はGitHubで公開されている。
6ヶ月前
041.8K
Genspark:基于Genspark智能体深度搜索并撰写研究报告

ジェンスパーク:ジェンスパーク・インテリジェンスに基づく調査レポートの深い検索と執筆

はじめに Gensparkは人工知能ベースの検索ツールである。バイドゥの元幹部によって2023年に設立され、カリフォルニア州パロアルトを拠点としている。従来の検索エンジンとは異なり、Gensparkは複数のAIインテリジェンスを使用して、カスタマイズされた検索をリアルタイムで生成する。
6ヶ月前
043.7K
VideoMind:视频按时间戳定位内容与问答的开源项目

VideoMind:タイムスタンプによるビデオ位置決めコンテンツとQ&Aオープンソースプロジェクト

概論 VideoMindは、長い動画の推論、Q&A、要約生成に焦点を当てたオープンソースのマルチモーダルAIツールである。香港理工大学のYe Liuとシンガポール国立大学のShow Labのチームによって開発された。このツールは人間の動画理解を模倣している。
6ヶ月前
033.3K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini: タスクのマルチモデルオーケストレーションとAPIインターフェースへのカプセル化

概論 DeepGeminiは、開発者Thomas Sligterによって作成されたオープンソースプロジェクトである。マルチモデルオーケストレーションをサポートするAI管理ツールであり、様々なAIモデルを柔軟に組み合わせることができるのが主な特徴である。
6ヶ月前
027.7K
LatentSync:用音频直接生成唇形同步视频的开源工具

LatentSync: 音声から直接リップシンクされたビデオを生成するオープンソースツール

概要 LatentSyncはByteDanceによって開発され、GitHubでホストされているオープンソースツールです。動画内のキャラクターの唇の動きを音声を通して直接駆動し、口の形が音声と正確に一致するようにします。このプロジェクトは、Stable Di...
6ヶ月前
079.3K
GPT-Crawler:自动爬取网站内容生成知识库文件

GPT-Crawler: ウェブサイトコンテンツを自動的にクロールして知識ベースドキュメントを生成

一般的な紹介 GPT-Crawlerは、BuilderIOチームによって開発され、GitHubでホストされているオープンソースツールです。1つ以上のウェブサイトのURLを入力することでページのコンテンツをクロールし、構造化ナレッジファイル(output.jso...
6ヶ月前
034.2K
Solver:自主完成编程任务的智能工具

ソルバー:プログラミング・タスクを自律的に完了させるインテリジェント・ツール

概要 Solverは、プログラミング・タスクを自律的に完了させるためのスマート・ツールである。開発者が直面するタスクバックログの問題を解決することを目的に、アップルやサムスンで活躍したエンジニアリーダーのチームによって開発された。このツールは、バグ修正から新規開発まで、ソフトウェア開発における様々なタスクを独立して処理することができる。
6ヶ月前
030.7K
Pollinations:URL拼接和API形式提供免费大模型服务

受粉:URLスプライシングやAPIの形をした無料のビッグモデル・サービス

Pollinationsは、ベルリンを拠点とするPollination.AIチームによって開発された完全オープンソースのプラットフォームで、画像、テキスト、音声の生成サービスを無料で提供している。ユーザーは、ウェブやAPI経由で使用するために、登録やAPIキーの申請は必要ありません...
6ヶ月前
051.9K
MUAH.AI:实时语音通话且无限制互动的AI女友

MUAH.AI: リアルタイムの音声通話と無制限のインタラクションを備えたAIガールフレンド

総合紹介 MUAH.AIは、無制限のインタラクションを重視したAIコンパニオンプラットフォームで、ユーザーはいつでもどこでも、話題の制限なくバーチャルキャラクターとコミュニケーションをとることができます。MUAH.AIの核心機能はリアルタイム電話機能のサポートで、ユーザーは電話を通じてAIと会話し、よりリアルなコンパニオン感覚を体験することができます。
3ヶ月前
047.4K
Highlight AI:使用语音和屏幕分析完成桌面任务的AI助手

Highlight AI: 音声と画面分析を使ってデスクトップタスクをこなすAIアシスタント

概要 Highlight AIはWindowsおよびmacOS向けのデスクトップAIアシスタントで(モバイル版は開発中)、音声コマンドと画面コンテンツの分析を通じて、ユーザーがあらゆるアプリケーションでタスクを素早く完了できるよう支援する。画面のコンテンツをキャプチャし、生成します。
6ヶ月前
040K
HeyGem:硅基智能开源的 Heygen 数字人平替产品

HeyGem:シリコン・インテリジェンスのオープンソースHeygenデジタル・ヒューマン・ピンクッション製品

概論 HeyGemはWindowsシステム用に設計された完全オフラインのビデオ合成ツールで、GuijiAI (Silicon Intelligence)チームによって開発され、GitHubでオープンソース化されています。高度なAIアルゴリズムを使用し、ユーザーの外見と声を正確にクローニングします。
6ヶ月前
065.6K
Manus:面向终端用户自主交付任务的通用智能体

Manus:自律的なエンドユーザーのタスクデリバリーのための汎用インテリジェンス

一般的な紹介 マヌスは、モニカのチームによって構築された汎用AIインテリジェンス・プラットフォームであり、ユーザーのアイデアを具体的な結果に変換することに特化している。質問に答えるだけでなく、仮想環境内のツール(ブラウザ、コードエディタ、テキストエディタなど)を呼び出すことで、タスク要件を自律的に分析します。
6ヶ月前
049.2K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: 対訳付きリアルタイム字幕を生成するビデオプレーヤー

概要 LLPlayerはGitHubでホストされている、開発者umlx5hによって作成された言語学習者のためのオープンソースメディアプレーヤーです。バイリンガル字幕表示、AI自動生成字幕、リアルタイム翻訳、単語検索など様々な便利な機能が統合されています。
6ヶ月前
074.4K