最新のAIリソース

共 2921 篇文章
Jammable - AI 音乐翻唱平台,支持AI模仿特定歌手或风格进行创作

Jammable - 特定のアーティストやスタイルを模倣するAIをサポートするAI音楽カバープラットフォーム

Jammableは、ユーザーが音楽をアップロードするか、既存の作品を選択し、AIに好きな歌手の声やスタイルを模倣させて新しいカバーバージョンを作成することができるAI音楽カバープラットフォームです。Jammableは、高品質の音楽をすばやく生成し、結果は数秒で表示され、人気のサウンド、音楽コンピレーション、およびコ...
7ヶ月前
038.4K
o3-pro - OpenAI推出的 o3 升级版推理模型

o3-pro - OpenAIからアップグレードされたo3推論モデル

o3-proはOpenAIのo3推論モデルのアップグレード版で、複雑な質問を扱い、正確な答えを提供するように設計されています。このモデルは、ウェブ検索、ファイル解析、画像推論、Pythonプログラミングなど、ChatGPTの全ツールの呼び出しをサポートしており、強力な実行力を発揮します。
7ヶ月前
034.2K
AIFlowy - 开源的企业级 AI 应用开发平台

AIFlowy - オープンソースのエンタープライズAIアプリケーション開発プラットフォーム

AIFlowyは、オープンソースのエンタープライズレベルのAIアプリケーション開発プラットフォームで、Java開発をベースとし、byte Coze、Tencent meta ware、Difyなどの製品に対応しています。インテリジェント対話ロボット、プライベート知識ベース構築、AIワークフローオーケストレーション、大規模モデル管理などの機能をサポートし、完全なシステム管理モデルを提供します。
7ヶ月前
033.7K
优雅YOYA - 中科闻歌推出的AI音视频内容创作平台

エレガントなYOYA - AIオーディオ/ビデオコンテンツクリエーションプラットフォームは、ZTE Winkoによって開始された

Elegant YOYAはZhongke Wengeが立ち上げたマルチモーダルリテラティブビデオプラットフォームであり、AIマルチモーダル技術に基づいて、ビデオコンテンツ作成の全チェーンを強化する。ユーザーはテーマ要件を入力するだけで、プラットフォームはスクリプト、画像、動画を迅速に生成し、インテリジェント編集、音声合成、キャラクター口駆動などの操作を完了することができ、出力...
7ヶ月前
031.3K
Uthana - AI 3D 角色动画生成平台,文字描述或参考视频生成逼真动画

Uthana - AI 3Dキャラクターアニメーション生成プラットフォーム、リアルなアニメーションを生成するためのテキスト説明やリファレンスビデオ

Uthanaは、強力なAI 3Dキャラクターアニメーション生成プラットフォームです。ユーザーがテキスト説明を入力したり、参考動画をアップロードしたり、モーションライブラリを検索したりすると、AIがどんな骨構造のモデルにも対応できるリアルなアニメーションを素早く生成します。このプラットフォームは、スタイル移行、API統合、カスタマイズ...といった様々な機能を備えています。
7ヶ月前
037.6K
Vace AI - AI 视频制作和编辑平台,提供一站式视频创作服务

Vace AI - AI映像制作・編集プラットフォーム、ワンストップ映像制作サービスを提供

Vace AIは強力なワンストップAI動画制作・編集プラットフォームです。このプラットフォームは、テキスト説明や参照画像に基づいて高品質のビデオコンテンツを生成し、ビデオの拡張、スタイル変換、被写体の除去や再構築などのさまざまな編集機能をサポートしています。
7ヶ月前
032.3K
企鹅读伴 - 腾讯推出的中小学生AI阅读助手

ペンギン・リーディング・コンパニオン - テンセントの小中学生向けAI読書アシスタント

Penguin Reading Companionは、テンセントが開発した小中学生向けのAI読書アシスタントです。Penguin Reading Companionは、テンセントのハイブリッドビッグモデルとメタマシンプラットフォームに、義務教育言語カリキュラムプログラムとカリキュラム標準(2022年版)を組み合わせることで、生徒にパーソナライズされたおすすめの読書、複数の読書モード(フォーカス、音読、リスニング...
7ヶ月前
032K
BoomCut - 小影科技推出的 AI 出海营销视频生成工具

BoomCut - Little Shadow TechnologyのAIアウトバウンドマーケティング動画生成ツール

BoomCutは、Little Shadow Technologyが発表したAI国境を越えたマーケティングビデオのローカリゼーションツールである。このツールは、高度なリップシンクドライブとトーンクローン技術に基づく強力な機能を備えており、異なる国や地域のユーザーの言語ニーズを満たすために、話し言葉ビデオの多言語バージョンを迅速に生成します。
7ヶ月前
036.7K
Mobvoi MCP Server - 出门问问开源的多模态MCP服务工具

モボイMCPサーバー - オープンソースのマルチモーダルMCPサービスツールをアスクアウト

モボイMCPサーバーは、GoDoQが提供を開始したマルチモーダルAI機能を統合するツールです。Mobvoi MCP Serverは、音声生成、サウンドクローン、イメージドリブンデジタルピープル、ビデオダビング、ビデオ翻訳を統合したマルチモーダルAIツールで、ユーザーがテキストを入力することで柔軟に呼び出すことができます。
7ヶ月前
035.1K
Rowboat - 开源的智能体开发框架

Rowboat - スマートボディ開発のためのオープンソースフレームワーク

Rowboatは、マルチインテリジェントなボディアシスタントの構築をサポートするオープンソースのローコードAI IDEです。ビジュアルインターフェースとAI支援開発機能に基づいて、Rowboatは、ユーザーがインテリジェントなボディワークフローを迅速に設計、設定、テストするのに役立ちます。ユーザーが自然言語で要件を記述することをサポートし、Row...
7ヶ月前
034.4K
商汤如影 - 商汤科技推出的AI数字人视频制作平台

Shangtang Ruyi - Shangtang Technologyが立ち上げたAIデジタルヒューマンビデオ制作プラットフォーム

Shangtang Ruyingは、Shangtang Technologyが発表したAIデジタル人体映像制作プラットフォームである。ビッグモデル技術に基づき、顔の特徴、服装、髪型など、非常にリアルなデジタル人体イメージの作成とパーソナライズをサポートする。このプラットフォームは、サウンドクローン、ビデオ生成、自動データ注釈、リアルタイムインタラクションなどの機能を備えている。
7ヶ月前
033.4K
JoyHallo - 京东开源的AI数字人模型

JoyHallo - JingdongのオープンソースAIデジタル人体モデル

JoyHalloは、Jingdongが提供するオープンソースのAIデジタル人体モデルで、北京語向けに設計されており、音声をリアルなスピーキングビデオに変換することができます。JoyHalloは、唇の動きの予測精度を向上させるために半結合構造を使用したwav2vec2モデルに基づく音声特徴を埋め込み、英語ビデオの生成をサポートします。
7ヶ月前
034.8K
硅语AI知识创业平台 - 硅基智能推出的AI数字人技术平台

シリコン・ランゲージAI知識起業プラットフォーム - シリコン・インテリジェンスが立ち上げたAIデジタル・ヒューマン・テクノロジー・プラットフォーム

シリコン・ランゲージAIナレッジ・ベンチャー・プラットフォームは、南京シリコン・インテリジェンス・テクノロジーが立ち上げたAIデジタル・ヒューマン・テクノロジー・プラットフォームである。このプラットフォームは、自然意味処理、機械学習、ディープラーニングなどの高度なAI技術に依存し、人間と対話できるバーチャルキャラクターを作成する。
7ヶ月前
035.5K
必火AI - AI数字人生成平台,支持中英双语声音克隆

Mustfire AI - 中国語・英語バイリンガル・ボイスクローンをサポートするAIデジタルヒューマン・ジェネレーション・プラットフォーム

マストファイアAIは、ショートビデオクリエイター向けの国産AIデジタルヒューマン生成プラットフォームです。ユーザーは、実在の人物を撮影した3分間の動画をアップロードすることで、0.1mmの微表情精度を持つ、非常にリアルなデジタルヒューマン画像を素早く生成することができます。音声合成や音声サンプルの録音にも対応しており、実在の人物に匹敵するAI音声モデルを生成することができる。
7ヶ月前
038.2K
智谱CoCo - 智谱推出的企业级超级助手Agent

ワイズスペクトラムCoCo - ワイズスペクトラムのエンタープライズ・スーパー・アシスタント・エージェント

Wisdom Spectrum CoCoは、Wisdom SpectrumのAICOプラットフォームが発表した初のエンタープライズレベルのスーパーアシスタントエージェントです。Wisdom Spectrum CoCoは、配信指向、記憶メカニズム、シームレスな組み込みという3つのコア機能を備えています。政府業務の分野において、CoCoは政策の解釈、ソリューションのカスタマイズ、実施効果の追跡が可能で、政策が効率的に実施されるよう支援します。
7ヶ月前
033.9K
draw.io - 在线图表绘制工具,支持流程图、思维导图等多种图表

draw.io - オンラインダイアグラムツール。フローチャート、マインドマップ、その他のダイアグラムに対応。

draw.ioは、ブラウザベースのプラットフォーム上で動作し、ソフトウェアのインストールを必要としない無料のオンライン描画ツールです。draw.ioは、フローチャート、マインドマップ、ネットワークトポロジーダイアグラム、ガントチャートなど、さまざまなシナリオのニーズを満たすために、さまざまな種類の図をサポートしています。操作...
7ヶ月前
042.1K
觅果·Migo - AI学术研究助手,智能问答满足多样化需求

Migo - AI学術研究アシスタント、多様なニーズに応えるインテリジェントQ&A

Forage-Migoは、テキスト、言語、視覚、データ処理をサポートする強力なマルチモーダルAI機能を備えた、AI主導の学習・研究イノベーションプラットフォームです。Migoは、インテリジェントなQ&A、ウェブページの読書支援、文献の読書、アカデミックライティング、論文の読書、化学...
7ヶ月前
033K
ScienceOne - 中国科学院自动化研究所等机构推出的智能科研平台

ScienceOne - 中国科学院自動化研究所などが立ち上げたインテリジェント研究プラットフォーム

ScienceOneは、中国科学院自動化研究所が共同で立ち上げたインテリジェント科学研究プラットフォームである。ScienceOneは、中国科学院自動化研究所が共同で立ち上げたインテリジェント科学研究プラットフォームで、大規模な科学基盤モデルの構築に基づいており、学際的なコラボレーションによるインテリジェント科学研究の新しいパラダイムを推進し、科学研究の全プロセスをサポートします。
7ヶ月前
032.9K
QBot - 腾讯QQ浏览器推出的AI浏览器

QBot - テンセントQQブラウザによるAIブラウザ

QBotはTencent QQ Browserが発表したAI機能を統合したスマートブラウザである。テキスト、音声、画像検索をサポートし、迅速かつ正確な回答を提供するAI検索や、ウェブコンテンツの迅速な解釈をサポートし、マインドマップを生成するAIブラウジング機能など、さまざまな実用的機能を備えている。
7ヶ月前
035.7K
FiaMind - AI 思维导图工具,提供无限画布自由拆分组合

FiaMind - キャンバスを自由に分割・組み合わせできるAIマインドマップツール

FiaMindは、効率的な情報管理と創造的な支援のためにデザインされたAIマインドマップツールです。このツールは柔軟で無制限のキャンバスを持ち、マインドマップの自由な分割と結合をサポートし、ロジックダイアグラム、マインドマップ、組織図など多様なレイアウトのニーズに応えます。
7ヶ月前
036.5K
幕布 - AI大纲笔记工具,复杂信息一键生成思维导图

カーテン - AIアウトラインノートツール、複雑な情報もワンクリックでマインドマップを生成

Curtainは、ユーザーが構造化されたアウトラインフォームに基づいて断片化された知識を体系化するためのAIアウトラインノートツールであり、このツールはマインドマップのワンクリック生成をサポートしています。また、ワンクリックでマインドマップを作成することもできます。カーテンは、複雑な情報を直感的なグラフィックで表現し、思考を素早く明瞭にし、理解力と記憶効率を向上させることをサポートします。
7ヶ月前
033.8K
StartAI - AI 绘画软件,基于 Adobe Photoshop 提供多种绘图功能

StartAI - Adobe PhotoshopをベースにしたAIペイントソフト。

StartAIは、デザイナーやクリエイター向けにデザインされたAdobe PhotoshopベースのAIペイントソフトです。デザイン効率を向上させ、創造性を刺激するAI技術に基づいており、テキストベースの描画、部分的な再描画、ラインカラーリング、非破壊ズーム、高精細復元などをサポートしています。
7ヶ月前
040.4K
意间AI - AI绘画平台,支持中英双语文本生成图像

Inter AI - AI描画プラットフォーム、中国語と英語のバイリンガルテキストをサポートし、画像を生成する。

Italian AIは、バイリンガルの入力をサポートし、400以上のモデルと100,000の図面スタイルを含む、業界をリードするAI図面・デザインカスタマイズプラットフォームです。ユーザーは、テキスト説明文を入力したり、画像をアップロードすることで、要件を満たす画像を素早く生成することができます。
7ヶ月前
036K
元镜 - AI视频创作工具,自动生成脚本

Metascope - スクリプトを自動生成するAIビデオ作成ツール

Metamirrorは、人間とコンピュータの共生エンジンをベースとしたAI映像制作ツールで、クリエイティブなひらめきから完成映像までの効率的な制作をサポートします。自動スクリプト生成、キャラクタースタイル統一、マルチモーダル融合、インテリジェントワークフローなどの機能を備えており、ワンクリックでクリエイティブな動画スクリプト、マルチモーダル分割画面デザインを素早く生成し、完成動画を合成することができます...
7ヶ月前
034K
朱雀AI检测 - 腾讯推出的AI图片和文本检测平台

Jubilee AI Inspection - テンセントが立ち上げたAI画像・テキスト検査プラットフォーム

Vermilion Bird AI Detectionは、テンセントのハイブリッド・セキュリティ・チームであるVermilion Bird Labsが立ち上げたAI検出プラットフォームで、ユーザーがAIによって生成された画像やテキスト・コンテンツを識別するのを支援する。Vermilion Bird AI Detectionは、画像の隠された特徴、常識的な論理に合致しないコンテンツ、「透かし」ロゴなどを分析し、AIによって生成された画像かどうかを迅速に判断する。
7ヶ月前
040.6K
琴乐大模型 - 腾讯推出的AI音乐创作模型

ピアノ音楽ビッグモデル-テンセントがAI作曲モデルを発表

Qin Music Grand Modelは、Tencent AI LabとTencent TME Tianqin Labが共同で発表した先進的なAI音楽作成グランドモデルである。このモデルは、ユーザーが入力したキーワード、説明文、または英語と中国語のオーディオクリップに基づいて、高品質のステレオオーディオまたはマルチトラックの楽譜をインテリジェントに生成します。
7ヶ月前
031.5K
拍我AI - 爱诗科技推出的PixVerse国内版AI视频生成平台

AI動画生成プラットフォーム「PixVerse」国内版をアイシ・テクノロジーズが提供開始

Shoot Me AIは、Aishi Technologyが国内市場向けにカスタマイズして発表した革新的なAI動画生成プラットフォームで、PixVerseの国内版です。このプラットフォームは、簡単なテキストプロンプトまたはアップロードされた画像に基づいて、高品質の動的なビデオコンテンツを迅速に生成することをサポートしています。このプラットフォームの最新バージョンV4.5では、ビデオの品質、アニメーションの滑らかさが改善されました。
7ヶ月前
037.5K
钉钉宜搭 - 阿里推出的低代码应用开发平台

Nail Yihu - アリのローコードアプリ開発プラットフォーム

Nail Yitaiは、アリババが立ち上げたローコード・アプリケーション開発プラットフォームで、企業のデジタル・ビジネス・アプリケーションの迅速な構築を支援する。視覚的なドラッグ&ドロップや設定方法を通じて、コードを知らないビジネスパーソンでも簡単にニーズに合ったアプリケーションを開発することができ、開発の敷居とコストを大幅に削減することができます。
7ヶ月前
053.5K
Seed-Music - 字节跳动推出的AI音乐生成模型

バイトホッパーがAI音楽生成モデル「Seed-Music」を発表

Seed-Musicは、ByteDanceが発表したAI音楽生成の大きなモデルであり、ユーザーが録音した10秒間の音声を完全な楽曲に変換することをサポートする。自己回帰言語モデルと拡散法に基づいて、マルチモーダルなユーザー入力(例えば、スタイル記述、オーディオ参照、スコア、サウンドキュー)を高...
7ヶ月前
037K
反谱 - AI音乐转谱平台,支持音频文件转五线谱和简谱

Anti-score - AI音楽トランスクリプションプラットフォーム。

AntiSpectrumは、先進的なAI技術に基づき、オーディオファイル(MP3、FLACなど)をペンタトニックやシンプルな楽譜に変換する革新的なオンラインAI音楽変換プラットフォームです。AntiSpectrumにはボーカル分離機能があり、音楽中のボーカルと伴奏を分離し、音楽制作やミキシングを簡単にします。AntiSpectrumは、MIDIファイルの変換をサポートしています...
7ヶ月前
051.3K
Replay - AI 音乐伴奏分离工具,自动分离主唱、人声和伴奏

Replay - リードボーカル、ボーカル、バッキングトラックを自動的に分離するAI音楽バッキングトラック分離ツール

Replayは、ディープラーニング技術に基づいた先進的なAI伴奏分離ツールです。このツールは、オーディオコンテンツを自動的に分析し、リードボーカル、ボーカル、バッキングトラックなどのトラックを正確に分離して、別々のオーディオファイルを生成します。Replayは、MP3、WAV、FL...など、多くの一般的なオーディオフォーマットをサポートしています。
7ヶ月前
045.6K
MakeBestMusic - AI 音乐创作平台,用文本描述或歌词生成音乐

MakeBestMusic - テキスト説明や歌詞付きの音楽を生成するAI音楽作成プラットフォーム

MakeBestMusicは、AIベースの音楽作成プラットフォームで、ユーザーはテキストの説明や歌詞に基づいて高品質のインストゥルメンタルまたはボーカル音楽をすばやく生成することができます。MakeBestMusicは、ポップ、ロック、クラシック、エレクトロニック、その他の音楽スタイルをサポートし、音楽分離機能を提供します...
7ヶ月前
042.1K
HunyuanVideo-Avatar - 腾讯混元开源的语音数字人模型

HunyuanVideo-アバター - テンセントハイブリッドオープンソース音声デジタル人体モデル

HunyuanVideo-Avatarは、Tencent Mixed YuanチームとTencent Music Tianqin Labが共同で発表した先進的な音声デジタル人体モデルである。このモデルは革新的なマルチモーダル拡散トランスフォーマーアーキテクチャに基づいており、ユーザーがアップロードしたキャラクター画像と音声に基づいて自然な表情を生成します。
7ヶ月前
032.3K
HeyGen - AI 数字人视频创作平台,支持多语言翻译配音

HeyGen - 多言語翻訳・吹き替えに対応したAIデジタルヒューマン動画作成プラットフォーム

HeyGenは、AIを活用したデジタルヒューマンビデオ作成プラットフォームで、合理的なビデオ制作プロセスをサポートし、ユーザーはプロ級のデジタルヒューマンビデオを素早く作成することができます。このプラットフォームは高度なAI技術に基づいており、ユーザーはデジタルキャラクターのイメージと声を完全にコントロールすることができます。
7ヶ月前
032.9K
Keevx - AI 数字人视频创作平台,一键生成脚本和视频

Keevx - AIデジタルヒューマンビデオ作成プラットフォーム、ワンクリックスクリプトとビデオ生成

Keevxは、主に海外の中小企業や個人クリエイターを対象としたAIデジタルヒューマン動画作成プラットフォームです。AIによるインテリジェントなスクリプト生成と翻訳機能をベースに、高品質な公開ポートレートとテンプレートを備え、ユーザーにワンクリックでデジタルヒューマンマーケティングビデオ生成サービスを提供します。
7ヶ月前
036.6K
Make - AI无代码自动化工作流搭建平台

Make - AIによるコード不要の自動ワークフロー構築プラットフォーム

Makeは、自動化されたプロセスに基づいて組織の効率性と革新性の向上を支援する、AI主導のコード不要の自動化プラットフォームです。このプラットフォームは、マーケティング、販売、財務など、さまざまなビジネスシナリオをサポートする2,000以上の構築済みアプリを提供しています。Makeの主な機能には、コード不要のビジュアルプロセス作成、AI...
7ヶ月前
032.9K
MiMo-VL - 小米开源的多模态模型

MiMo-VL - シャオミのオープンソース・マルチモーダルモデル

MiMo-VLはシャオミのオープンソースのマルチモーダルグランドモデルで、視覚コーダー、クロスモーダル投影レイヤー、言語モデルで構成されている。視覚コーダーはQwen2.5-ViTに基づいており、ネイティブ解像度の入力をサポートし、より詳細な情報を保持する。言語モデルはシャオミが独自に開発したMiMo-7Bで、複雑な投影のために設計されている。
7ヶ月前
035.5K
Olovka AI - AI学术写作辅助平台,提供精准的写作建议和辅助

Olovka AI - 正確な執筆アドバイスと支援のためのAIアカデミックライティング支援プラットフォーム

Olovka AIは、学生のためのAIアカデミックライティング支援プラットフォームで、学生の学術レベル、専門分野、論文の種類に基づいた的確なライティングアドバイスと支援を提供します。インテリジェントなアルゴリズムに基づき、Olovka AIは学生が高品質な学術論文を素早く執筆できるようサポートします。
7ヶ月前
032.1K
Fish Audio - AI 语音合成与声音克隆工具

Fish Audio - AI音声合成とサウンドクローニングツール

Fish Audioは、テキスト音声合成(TTS)と音声クローンをサポートする強力な生成AI音声合成ツールです。ユーザーはテキストを入力するだけで、自然で滑らかな音声に変換することができ、プラットフォームはさまざまな言語と音声スタイルを提供し、さまざまなシナリオやユーザー...
7ヶ月前
051.2K
SignGemma - 谷歌 DeepMind 推出的手语翻译模型

SignGemma - Google DeepMindの手話翻訳モデル

SignGemmaは、Google DeepMindが提供する世界で最も強力な手話通訳AIモデルであり、アメリカ手話(ASL)の英語テキストへの正確な翻訳をサポートする。このモデルはマルチモーダルトレーニングに基づいており、視覚データとテキストデータを組み合わせることで、手話の動作をリアルタイムで捉え、素早くテキストに翻訳する。
7ヶ月前
037.2K
CRIC深度智联 - 克而瑞推出的中国房地产首个AI Agent

CRIC - 中国初の不動産AIエージェントをCRICが開始

CRIC Depth Intelligenceは、CRICが独自に開発した中国不動産初のAIインテリジェント体であり、CRICの20年にわたる不動産業界での経験とデータ蓄積、マルチモーダルビッグモデル技術に基づき、データ統合、インテリジェント分析からコンテンツ生成までの全チェーンを切り開く。
7ヶ月前
030.5K
WebAgent - 阿里通义开源的自主搜索AI Agent

WebAgent - Ali Tongyi オープンソース自律検索AIエージェント

WebAgentは、Alibaba Tongyi Labsが開発したオープンソースの自律型検索AIエージェントで、強力なエンドツーエンドの自律型情報検索と多段階の推論機能を備えています。WebAgentは、人間のようにネットワーク環境を能動的に認識、判断、行動することができ、学術研究やビジネスの意思決定に広く利用されています。
7ヶ月前
036.8K
灵码 IDE - 通义灵码推出 AI 原生开发环境工具

リンコードIDE - 同義リンコード、AIネイティブ開発環境ツールを発表

Spirit Code IDEは、同義Spirit Codeが発売したAIネイティブ統合開発環境(IDE)で、千題の3大モデルに深く適応し、強力なプログラミング知能体モードを持っており、プロジェクトの認識、コードの検索、端末操作の実行などのタスクを自律的に完了することをサポートします。MCPツールをサポートし、Magic Hitch MCP Squareの3...
7ヶ月前
032.6K
BAGEL - 字节跳动推出的开源多模态基础模型

BAGEL - Wordpressがオープンソースのマルチモーダルベースモデルを発表

BAGELは、ByteDanceによってオープンソース化されたマルチモーダルベースモデルで、140億のパラメータを持ち、そのうち70億がアクティブである。このモデルベースとMixed Transformer Expert Architecture (MoT)は、それぞれ独立した2つのエンコーダで画像のピクセルレベルとセマンティックレベルの特徴をキャプチャし、画像、テキスト、ビデオの効率的な処理をサポートします。
7ヶ月前
034.8K
DeepSeek-R1 - DeepSeek推出的AI推理模型,性能对齐 OpenAI o1 正式版

DeepSeek-R1 - DeepSeekのAI推論モデル。

DeepSeek-R1は、杭州を拠点とするDeepSeekが発表した高性能AI推論モデルで、OpenAIのo1正式版に対するベンチマークである。このモデルは、大規模な強化学習技術に基づいて事後学習されており、数学、コード、自然言語で推論を行うために必要なラベル付きデータはごくわずかである。
7ヶ月前
033.1K
幻舟AI - 一站式AI短片创作平台,批量生成各类型视频内容

Phantom Boat AI - ワンストップのAIショートフィルム制作プラットフォーム、様々なタイプの映像コンテンツを一括生成

Phantom Boat AIは、CM、プロモ、アニメーションなど、様々なタイプの映像コンテンツの効率的な一括生成をサポートする、ワンストップの強力なAIショートフィルム作成プラットフォームです。Midjourney、Runwayをはじめとする世界最先端のAIモデルをベースとしたこのプラットフォームは、脚本作成から...
7ヶ月前
040.8K
Data Agent - 火山引擎推出的新一代企业级数据智能体

データ・エージェント - ボルケーノ・エンジンが提供するエンタープライズクラスの新世代データ・インテリジェンス

データエージェントは、ボルケーノ・エンジンが立ち上げた新世代のエンタープライズグレードのデータインテリジェンスで、データ分析とインテリジェントマーケティングに焦点を当てています。データエージェントは、企業内の構造化データと非構造化データを統合し、綿密な調査と分析に基づいて包括的で詳細な調査レポートを作成します。
7ヶ月前
039.1K
可灵 2.1 - 快手推出的AI视频生成模型

Keling 2.1 - レーサーのAIビデオ生成モデル

KeLing 2.1は、レーサーが発表したAIビデオ生成モデルである。このモデルには、標準、高品質、マスターの3つのバージョンがあり、720P、1080P、フィルムレベルのエフェクトを提供し、さまざまなクリエイティブ・ニーズに対応する。標準バージョンの生成スピードは、迅速な制作に適している。
8ヶ月前
038K
小云雀 - 剪映推出的智能创作Agent

リトルラーク - シアーイメージのスマートクリエーションエージェント

Little Larkは、Shear Imageが発表したインテリジェントなクリエイションエージェントで、AI技術に基づき、コンテンツ制作の境界線を再構築し、よりシンプルで効率的、そして面白いクリエイションを実現します。リトルラークは、閾値ゼロの動画作成、デジタルポップアップビデオ、デザイン画、背景用画像をサポートしており、ユーザーはコマンドを入力するだけで、AIサポートが効率的に...
8ヶ月前
056.5K
稿定AI社区 - AI创意内容设计平台,多种设计资源满足不同创作需求

Drafting AI Community - AIクリエイティブコンテンツデザインプラットフォーム。

Drafting AI Communityは、ユーザーに豊富なクリエイティブデザインリソースとツールを提供するオンラインAIクリエイティブインスピレーションプラットフォームです。このプラットフォームは、イメージ写真、Eコマースデザイン、ホリデーテーマ、3Dイラスト、アバターデザイン、小紅集素材、似顔絵デザインなど、様々なデザイン分野をカバーし、様々なユーザーのニーズに応えます。
8ヶ月前
032.9K
NoCode – 美团推出的零代码AI开发平台

NoCode-ゼロコードAI開発プラットフォーム、Meituanが発表

NoCodeとは NoCodeはMissionが立ち上げたゼロコードAI開発プラットフォームです。プログラミングの経験がなくても、自然言語で要件を記述するだけで、ウェブサイトページ、ユーティリティ、小さなゲーム、イベントページ、その他のアプリケーションを素早く生成することができます。
8ヶ月前
046.2K
Sim Studio:开源的AI代理工作流构建工具

Sim Studio: AIエージェントのためのオープンソースワークフロービルダー

包括的な紹介 Sim Studioは、軽量で直感的なビジュアルインターフェースを通じて、大規模言語モデル(LLM)ワークフローの迅速な設計、テスト、およびデプロイを支援することに重点を置いた、オープンソースのAIエージェントワークフロー構築プラットフォームです。ドラッグ&ドロップで複雑なワークフローを作成できます。
8ヶ月前
068.7K
Hula:将自拍一键生成病毒式短视频和个性化贴纸

Hula:自撮り写真をワンクリックで短いバイラルビデオやパーソナライズされたステッカーに変身させる

概要説明 HulaはAIを搭載したクリエイティブツールで、ワンタッチの簡単操作でユーザーのセルフィーをバイラルビデオ、マルチスタイル画像、パーソナライズされたステッカーパックに変換するように設計されています。開発元のPrequel Inc.は、iOSに対応したアプリを開発しました。
8ヶ月前
078.1K
LoveyDovey:与虚拟角色进行浪漫对话的AI应用

LoveyDovey:バーチャルキャラクターとロマンチックな会話ができるAIアプリ

はじめに LoveyDovey は、バーチャル・キャラクターとのリアルタイムの対話体験をユーザーに提供することに特化した AI を搭載したチャット・アプリである。ユーザーは、自分のキャラクターを作成したり、既存のキャラクターを選択して、恋愛、友情、その他のタイプの対話を開始することができます。このアプリは、高度にカスタマイズ可能なキャラクターセットを通じて動作します...
8ヶ月前
0117.3K
Step1X-Edit:自然语言指令编辑图像的开源工具

Step1X-Edit:自然言語指示による画像編集のためのオープンソースツール

一般的な紹介 Step1X-Editは、Stepfun AIチームによって開発され、GitHubでホストされているオープンソースの画像編集フレームワークです。マルチモーダル大規模言語モデル(Qwen-VL)と拡散変換器(DiT)を組み合わせることで、ユーザーはシンプルで自然な操作で画像を作成することができます。
8ヶ月前
054K
Klavis AI:面向AI应用的模型上下文协议(MCP)集成工具

Klavis AI: AIアプリケーションのためのモデルコンテキストプロトコル(MCP)統合ツール

概論 Klavis AIは、AIアプリケーションが外部のツールやデータソースと動的に接続することを可能にするオープンスタンダードであるモデルコンテキストプロトコル(MCP)の使用と統合を簡素化することに焦点を当てたオープンソースプラットフォームです。
8ヶ月前
044.7K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: AIとの低遅延自然音声対話

はじめに RealtimeVoiceChat は、音声による人工知能とのリアルタイムで自然な会話に特化したオープンソースプロジェクトです。ユーザーはマイクを使って音声を入力し、システムはブラウザを通して音声をキャプチャし、素早くテキストに変換し、大規模言語モデル(LLM)が音声を生成します。
8ヶ月前
057.3K
MiMo:高效数学推理与代码生成的小型开源模型

MiMo: 効率的な数学的推論とコード生成のための小さなオープンソースモデル

一般的な紹介 MiMoはXiaomiによって開発されたオープンソースの大規模言語モデリングプロジェクトであり、数学的推論とコード生成に焦点を当てている。コアプロダクトはMiMo-7Bファミリーのモデルで、ベースモデル(Base)、教師あり微調整モデル(SFT)、ベースモデルから学習された強力な化学モデル(Strong Chemical)を含んでいます。
8ヶ月前
049.2K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS:パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成(TTS)モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。
8ヶ月前
050.5K
CAD-MCP:通过自然语言指令控制CAD软件的MCP服务

CAD-MCP: CADソフトウェアを自然言語コマンドで制御するMCPサービス

概論 CAD-MCPはオープンソースプロジェクトであり、ユーザが自然言語コマンドによってCADソフトウェアを制御し、描画操作を行うことを可能にします。自然言語処理とCAD自動化技術を組み合わせ、ユーザーが手動でCADインターフェイスを操作する必要がなく、簡単なテキストコマンドを入力するだけで、CADソフトウェアを操作することができます。
8ヶ月前
057.8K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成する

包括的な紹介 GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークであり、GitHubでホストされている。GraphGenは、知識グラフを通して合成データ生成を導くことによって、大規模言語モデル(LLM)の教師ありファインチューニングを最適化することに焦点を当てている。LLMは...
8ヶ月前
044.8K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf:大規模言語モデルをPDFファイルで実行する実験的プロジェクト

一般的な紹介 llm.pdfは、ユーザーが直接PDFファイルで大規模言語モデル(LLM)を実行できるようにするオープンソースプロジェクトです。EvanZhouDevによって開発され、GitHubでホストされているこのプロジェクトは、革新的なアプローチを示しています:Em...
8ヶ月前
042K
Abogen:将多种文本格式转换为有声读物的工具

Abogen:複数のテキスト形式をオーディオブックに変換するツール

一般的な紹介 Abogenは、ePub、PDF、またはプレーンテキストファイルを高品質な音声に素早く変換するために設計されたオープンソースツールです。自然で滑らかな音声を生成するためにKokoro-82Mモデルを使用し、同時字幕生成もサポートしているので、オーディオブックの制作に適しています...
8ヶ月前
058.3K
Local Deep Research:本地运行的生成深度研究报告工具

ローカル・ディープ・リサーチ:詳細な調査レポートを作成するためのローカルで実行可能なツール

一般的な紹介 Local Deep Research は、ユーザが深い研究を行い、複雑な問題に対する詳細なレポートを作成するために設計されたオープンソースの AI 研究アシスタントです。ローカルでの実行をサポートしており、ユーザーはクラウドサービスに依存することなく研究タスクを完了することができます。このツールは ...
8ヶ月前
047.5K
Trackers:用于视频对象跟踪的开源工具库

Trackers: ビデオオブジェクト追跡のためのオープンソースツールライブラリ

一般的な紹介 Trackersは、映像内の複数オブジェクトのトラッキングに特化したオープンソースのPythonツールライブラリです。SORTやDeepSORTのようないくつかの主要なトラッキングアルゴリズムを統合しており、ユーザーは異なるオブジェクト検出モデル(YOLO...
8ヶ月前
049.3K
Kimi-Audio:开源音频处理与对话基础模型

Kimi-Audio:オープンソースの音声処理と対話ベースモデル

一般的な紹介 Kimi-Audioは、Moonshot AIによって開発されたオープンソースの音声ベースモデルで、音声の理解、生成、対話に焦点を当てています。音声認識、音声Q&A、音声感情認識など、幅広い音声処理タスクをサポートしています。このモデルは130以上のテストが行われています。
8ヶ月前
074.8K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: マルチインテリジェンス・タスク・コラボレーション・ツールの構築

一般的な紹介 Cooragentは、清華大学のLeapLabによって開発され、GitHubでホストされているオープンソースのAIエージェントコラボレーションフレームワークです。ユーザーは、1文の記述でインテリジェントなAIエージェントを作成することができ、複雑なタスクで共同作業する複数のエージェントをサポートしています。このフレームワークは2つの...
8ヶ月前
042.8K
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter:単一の画像から一貫性のある文字を生成するオープンソースツール

概要 InstantCharacterは、Tencent HunyuanとInstantXチームによって開発されたオープンソースプロジェクトで、GitHubでホストされています。InstantCharacterは、参照画像とテキスト説明文を含む、一貫性のある文字マップを生成します。
8ヶ月前
050.1K
Claude生成深度研究报告的MCP服务

詳細な調査レポートを作成するクロードのMCPサービス

一般的な紹介 MCP Server Deep Researchは、人工知能とウェブ検索によって複雑な問題の構造化された調査レポートを自動的に生成するオープンソースツールです。ユーザーがリサーチクエスチョンを入力すると、ツールはそのクエスチョンを分解し、権威ある情報を検索し、ソースの信頼性を評価します。
8ヶ月前
041.1K
Deep Recall:为大模型提供企业级记忆框架的开源工具

Deep Recall:大規模モデルのためのエンタープライズクラスのメモリフレームワークを提供するオープンソースツール

包括的な紹介 Deep Recallは、大規模言語モデル(LLM)のために設計されたオープンソースのエンタープライズクラスのメモリフレームワークです。効率的な文脈検索と統合により、超パーソナライズされた応答性を提供します。このフレームワークは、メモリサービス、推論サービス、コーディネータを含む3層アーキテクチャを採用しており、...
8ヶ月前
045.9K
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee:オープンソースのAIリサーチアシスタントが引用研究を生成

一般的な紹介 CleverBeeはGitHubでホストされているオープンソースのAI研究アシスタントであり、SureScaleAIによって開発された。ウェブブラウジング技術と大規模な言語モデル(GeminiやClaudeなど)を組み合わせることで、ユーザーを支援します...
8ヶ月前
036.6K
FantasyTalking:生成真实感说话肖像的开源工具

FantasyTalking: リアルな似顔絵を生成するオープンソースツール

一般的な紹介 FantasyTalkingは、Fantasy-AMAPチームによって開発されたオープンソースプロジェクトで、オーディオドライブを通してリアルなトーキングポートレート動画を生成することに焦点を当てています。このプロジェクトは、高度なビデオ拡散モデルWan2.1とオーディオエンコーダWa...
8ヶ月前
041.7K
Paper2Code:将机器学习论文自动转化为可运行代码

Paper2Code: 機械学習論文を実行可能なコードに自動変換する

一般的な紹介 Paper2Codeは、機械学習論文のコード実装が不足しているという問題を解決することを目的としたオープンソースプロジェクトである。マルチエージェントの大規模言語モデリング(LLM)システムPaperCoderによって、科学論文を実行可能なコードリポジトリに自動的に変換する。このシステムは、計画言語モデリング...
8ヶ月前
046.4K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档

DeepWiki-Open:GitHub、GitLabリポジトリ用のAIドキュメント自動生成

包括的な紹介 DeepWiki-Openは、GitHub、GitLab、Bitbucket上のコードリポジトリの構造化ドキュメントを自動的に生成するために設計されたオープンソースプロジェクトです。AI技術を使って、コード構造、ファイルの内容、論理的な関係を分析し、迅速に構造化ドキュメントを生成します。
8ヶ月前
092.3K
On Device AI:iPhone本地运行的AI语音转录与聊天工具

オンデバイスAI:iPhoneネイティブ対応のAI音声書き起こし&チャットツール

一般的な紹介 On-Device AIは、完全にオフラインで動作するAIアプリで、iOS、macOS、およびvisionOSをサポートするAppleデバイス向けに設計されています。ローカルの大規模言語モデル(LLM)の実行、リアルタイムの音声転写、文書分析などを、リンクすることなく提供します。
8ヶ月前
050.3K
VoltAgent:快速构建AI智能体的TypeScript开源框架

VoltAgent:AIインテリジェンスを迅速に構築するためのTypeScriptオープンソースフレームワーク

概要 VoltAgentはオープンソースのTypeScriptフレームワークで、AIインテリジェンスの迅速な構築とオーケストレーションを支援するために開発者向けに設計されている。モジュール化されたツールと標準化された開発モデルを提供することで、大規模な言語モデル(LLM)、ステート...
8ヶ月前
045.6K
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: プロンプトを素早く管理・使用するためのブラウザ拡張機能

General Quick Promptはプロンプトの管理と高速入力に特化したオープンソースのブラウザ拡張機能です。ユーザーはプロンプトのライブラリを作成、整理、保存し、プリセットされたプロンプトコンテンツをウェブページの入力ボックスに素早く挿入することができます。このツールは特に...
8ヶ月前
044.1K
Suna:集成浏览器操作与数据分析的智能代理

Suna: ブラウザ操作とデータ分析を統合するインテリジェント・エージェント

一般的な紹介 SunaはKortix AIによって開発されたオープンソースの汎用AIエージェントで、Apache 2.0ライセンスに基づいてGitHubでホストされており、ユーザーは無料でダウンロード、変更、セルフホストすることができます。自然言語対話を使用して、ユーザーを支援します。
9ヶ月前
072.9K