中国初のAI IDE インテリジェント・プログラミング・ソフトウェア 🚀体験への招待 Trae 中国語版ダウンロードDeepSeek-R1とDoubao-proは無制限で利用できる！

合計914記事

タグ: AIのオープンソースプロジェクト 46ページ

CrisperWhisper：正確な逐語音声書き起こしツール

一般的な説明 CrisperWhisperはOpenAI Whisperをベースとした高度な音声認識ツールで、高速で正確な単語単位の音声書き起こしに重点を置いています。スピーチのフィルやポーズがあっても、正確な単語レベルのタイムスタンプを提供します。

2024-09-09AIツール AIオープンソースプロジェクト AI音声合成

PaddleOCR: Flying Paddleベースの多言語OCRツールライブラリ。

概要 PaddleOCRはPaddlePaddleをベースとした多言語OCRツールキットで、実用的で超軽量なOCRシステムを提供するように設計されています。80以上の言語の認識をサポートし、サーバー、モバイルデバイス、組み込みデバイス、IoTデバイスをサポートするデータ注釈と合成ツールを提供します。

2024-09-09AIツール AIオープンソースプロジェクト光学式文字認識

Trae中国語版ダウンロードへの最初の招待：登録後、DeepSeek-R1を無制限に使用できます！

ビルダーインテリジェントプログラミングモード、DeepSeek-R1とDeepSeek-V3の無制限の使用、海外版よりも滑らかな経験を有効にします。ただ、中国語のコマンドを入力し、プログラミングの知識はまた、独自のアプリケーションを書くためにゼロしきい値をすることはできません。

2025-04-03

Deep Live Cam：开源的实时AI换脸工具，一张照片就能实现实时换脸直播-首席AI分享圈

ディープライブカム：オープンソースのリアルタイムAI顔交換ツール、リアルタイムでライブ顔交換するための写真

一般的な紹介 Deep Live Camは、1枚の写真からリアルタイムで顔を置き換え、深いフェイクビデオを生成できるように設計されたオープンソースのAIツールです。高度なディープラーニングアルゴリズムを使用して、ライブストリームやビデオ通話中にリアルタイムで顔を置き換え、ユーザーのプライバシーを保護し、興味を持たせることができます。

2024-09-09AIツール AIオープンソースプロジェクト AIビデオ顔交換

NarratoAI：テキスト生成映画・TVナレーション・自動編集ツール

概論 NarratoAIは、映画やテレビのナレーション、自動編集、吹き替え、字幕生成を統合した完全自動化ツールです。大規模言語モデリング(LLM)技術に基づき、コピーを自動生成し、対応するナレーションや字幕とビデオを自動編集します。

2024-09-09AIツール AI副業お金儲けプロジェクト AIオープンソースプロジェクト AIテキストからビデオへ AIオーディオ・ビデオ編集

Babelfish.ai：ブラウザで動作するリアルタイム音声書き起こし翻訳アプリケーション

概論 Babelfish.aiは、Huggingface Transformer.jsとSupabase Realtimeで構築されたリアルタイム音声翻訳アプリケーションです。このアプリケーションは、ブラウザで大きなモデルを読み込み、ローカルで実行することで、リアルタイムの音声読み上げと翻訳機能を実現します。ユーザーはシンプルな...

2024-09-09AIツール AIオープンソースプロジェクト AI音声合成

Vector Vein：コードフリーのAIワークフロー構築プラットフォーム

概要 Vector Veinは、インテリジェントで自動化されたワークフローを簡単に作成できるように設計された、コードフリーのAIワークフロー構築プラットフォームです。プログラミングの知識がなくても、ドラッグ＆ドロップ操作で様々な機能モジュールを接続するだけで、複雑なAIワークフローを構築することができます。このプラットフォームは、...

2024-09-09AIツール AIオープンソースプロジェクトローコード・ワークフロー

LivePortrait：静止画や動画からダイナミックなポートレートを生成するアニメーションツール

一般的な紹介 LivePortraitはRacer Technologyによって開発された先進的なAIダイナミックポートレートアニメーションツールです。革新的なAI技術を利用し、静止画像を鮮やかなビデオアニメーションに変換します。実際の写真、アニメーションスタイル、芸術的な肖像画のいずれを使用しても、LivePortraitは高品質のモーションを提供します...

2024-09-08AIツール AI画像からビデオへ AIオープンソースプロジェクト AI動画変換スタイル

PhiData: 記憶、知識、ツールを備えたAIインテリジェンスの構築

PhiDataは、インテリジェントなAIアシスタントを開発するために設計されたフレームワークです。PhiDataは、AIアシスタントのインテリジェンスを強化するだけでなく、AIアシスタントを拡張します。

2024-09-06AIツール AIオープンソースプロジェクトインテリジェント・ボディ・アプリケーション

ChatTTS：模仿真人说话声音的语音生成模型（ChatTTS一键加速包）-首席AI分享圈

ChatTTS：実際の人の話し声を模倣した音声生成モデル（ChatTTSワンクリックアクセラレーションパッケージ）

一般的な紹介 ChatTTSは対話シナリオ用に設計された生成音声モデルです。自然で表現力豊かな音声を生成し、多言語、複数話者をサポートし、対話型ダイアログに適しています。このモデルは、笑い、ポーズ、間投詞のような細かな韻律的特徴を予測し、制御することで、大規模なモデルを超えています...

2024-09-05AIツール AIオープンソースプロジェクト AI音声合成

MoneyPrinterPlus：一键生成短视频的AI工具，免费批量混剪-首席AI分享圈

MoneyPrinterPlus：ワンクリックで短い動画を作成するAIツール、無料のバッチミキシング

総合紹介 MoneyPrinterPlusは、AI技術を通じて、ワンクリックであらゆる種類の短い動画を生成・ミックスし、Jieyin、Shutterbugs、Xiaohongshu、Video Numberなどの複数の動画プラットフォームに自動的に公開することを目的としたオープンソースプロジェクトです。このツールは、chatTTS、fasterwhisper、G...などのローカルおよびクラウドベースの音声モデルをサポートしています。

2024-09-05AIツール AI副業お金儲けプロジェクト AIオープンソースプロジェクト AIビデオ生成ツール

TF-ID：学術論文フォーム／画像認識ツール

包括的な紹介 TF-ID（Table/Figure IDentifier）は、学術論文から表や画像を抽出するためのオブジェクト検出モデル群である。このプロジェクトはYifei Huによって作成され、GitHubでオープンソース化されています。TF-IDモデルは、学術論文から表や画像を認識・抽出するために微調整されています...

2024-09-05AIツール AIオープンソースプロジェクト

Chatbot UI：模仿ChatGPT界面和功能的开源AI聊天应用程序-首席AI分享圈

チャットボットUI：ChatGPTのインターフェースと機能を模倣したオープンソースのAIチャットアプリ

一般的な紹介 Chatbot UIは、開発者がパーソナライズされたインテリジェントな会話インターフェースを作成できるように設計されたオープンソースプロジェクトです。このプロジェクトは、ユーザーにスムーズでスマートな対話体験を提供するために、既存のチャットボットシステムに簡単に統合できる一連のインターフェースコンポーネントと対話機能を提供します。

2024-09-05AIツール AIオープンソースプロジェクト AIローカライズチャットアプリ

GLIGEN GUI：精确控制图像元素位置，基于ComfyUI的直观图形界面-首席AI分享圈

GLIGEN GUI：画像要素の位置を正確にコントロール、ComfyUIをベースにした直感的なグラフィカル・インターフェース

概論 GLIGEN GUIはComfyUIをベースとした直感的なグラフィカル・インターフェースであり、画像中のオブジェクトの位置を正確に指定することができる新しいテキストから画像へのモデルであるGLIGENモデルの使用を簡素化するように設計されている。GLIGEN GUIでは、ユーザはボックスを描いたり、テキストを入力したりすることでプロンプトが表示される...

2024-09-05AIツール AI画像生成補助 AIオープンソースプロジェクト

Easy Voice Toolkit: 地域展開のためのAI音声ツールキット

包括的な紹介 Easy-Voice-Toolkitは、音声認識、音声トランスクリプション、音声変換、データセット作成、モデルトレーニングのための幅広い自動音声ツールを提供する、オープンソーススピーチプロジェクトに基づいた多目的ツールキットです。ユーザーは必要に応じて、これらのツールを選択的または連続的に使用することができます...

2024-09-04AIツール AIオープンソースプロジェクト AI音声合成 AIボイス・クローン AI音声合成

FaceFusion：ビデオ顔交換強化ツール｜音声同期ビデオ口の動き

概要 FaceFusionは、画像からビデオ、画像から画像への交換プロセスを5つのプロフェッショナルモデルで最適化し、完璧な出力を保証する、顔交換とエンハンスメント機能を統合した最先端のクラウドプラットフォームです。さらに、3つの異なるモデルを使用して、7つのモデルでフェイシャル・エンハンスメントを実行します。

2024-09-04AIツール AIオープンソースプロジェクト AIビデオ顔交換

Kotaemon: 簡単に導入できるオープンソースのマルチモーダル文書クイズツール

概論 Kotaemonは、RAG（Retrieval Augmented Generation）に基づいたQ&A機能をエンドユーザーや開発者に提供するために設計されたオープンソースのドキュメントQ&Aツールです。Cinnamonによって開発されたこのプロジェクトは、様々なLLM APIプロバイダー（OpenAI、AzureOpenAI、Cohereなど）をサポートし、またネイティブ...

2024-09-03AIツール AIオープンソースプロジェクトナレッジマップ知識検索とRAGフレームワーク

HivisionIDPhotos：オープンソースのスマートAI写真ID作成ツール

包括的な紹介 HivisionIDPhotosは、オープンソースの軽量AI文書写真制作ツールであり、インテリジェントにユーザーの写真のシーンとキーイングを識別することができ、様々な仕様に沿って標準的な文書の写真を生成します。このツールは、カスタム背景色とサイズをサポートしており、将来的には、美しさとインテリジェントな正装の変更機能を導入する予定です。このツールで...

2024-09-03AIツール AIオープンソースプロジェクト AIキーで背景を変更

Marker：PDFをMarkdownに素早く変換するオープンソースツール

一般的な紹介 Markerは、PDFファイルをMarkdown形式に迅速かつ正確に変換するために設計されたディープラーニングベースの文書処理ツールです。幅広い種類のドキュメントをサポートし、特に書籍や科学論文の変換に最適化されています。Markerは、ヘッダーやフッターなどの冗長なコンテンツを削除し、表や...

2024-09-03AIツール AIオープンソースプロジェクトドキュメントの抽出とクリーニング

SadTalker：让照片说话|嘴型同步音频|合成口型同步视频|免费数字人-首席AI分享圈

SadTalker: 写真にしゃべらせる｜口パク音声｜合成口パク動画｜無料デジタルピープル

はじめに SadTalkerは、1枚の静止画と音声ファイルを組み合わせて、パーソナライズされたメッセージや教育コンテンツなど、幅広いシナリオに対応するリアルなトーキングヘッドビデオを作成するオープンソースツールです。ExpNetやPoseVAEなどの3Dモデリング技術の革命的な使用により、微妙なファセットを捉えることに優れています。

2024-09-03AIツール AIオープンソースプロジェクト AIデジタルパーソンリップシンク

前ページ
1
---
43
44
45
46
47
48
49
次ページ
全49ページ