AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
合計992記事

タグ: AIのオープンソースプロジェクト 48ページ

Cloudflare Serverless Registry: Cloudflare Workersに基づくサーバーレス・コンテナ・レジストリ

概要 Cloudflare Serverless Registryは、Cloudflare WorkersとR2ストレージをベースにしたサーバーレスコンテナレジストリです。イメージのプッシュとプルをサポートし、ユーザー名パスワードと公開鍵ベースのJWT認証を提供します。このプロジェクトはデプロイが簡単で、Dockerオペレーションと互換性があります。

AIHawk:インテリジェントな仕事検索アシスタント、自動履歴書配置(英語のみ)

概要 Auto_Jobs_Applier_AIHawk は、人工知能技術を利用した求人検索の自動化ツールです。短時間で大量の履歴書を自動配信し、ユーザーの個人情報や求職意図に応じてパーソナライズすることができます。このツールの目的は、求職活動の効率を向上させ、手作業による履歴書の提出を減らすことです。

simple-one-api:様々な無料の大規模モデルAPIをワンクリックで統合、統一された外部OpenAIインターフェース

総合紹介 simple-one-apiは、複数のビッグモデルAPIの統合を簡素化するために設計されたオープンソースプロジェクトです。Chifan Big Model Platform、Xunfei Starfire Big Model、Tencent Hybrid、MiniMaxやDeep-SeekなどのOpenAIインターフェースと互換性のあるモデルをサポートしています。このプロジェクトに必要なのは、実行ファイルと設定ファイルだけです。

ボイスチェンジャー:お気に入りのアニメキャラクターを歌わせるリアルタイムボイスチェンジャー!

概要 Voice Changerは、MMVC、so-vits-svc、RVC、DDSP-SVC、Beatriceなど、幅広いAI音声モデルをサポートするオープンソースのリアルタイム音声変換ツールです。このツールは、Windows、Mac、Linux、Google Colabなど、多くのプラットフォームと互換性があり、ユーザーは以下のことができます。...

VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度-首席AI分享圈

VoAPI:高付加価値AIモデル転送インターフェース管理システム、公式サイトがAPI枠を毎日無料提供

総合紹介 VoAPIは、高付加価値・高性能の新しいAIモデルインターフェース管理・配信システムで、主に個人または企業の内部管理・配信チャネルに使用されます。NewAPIに基づいて開発されたこのシステムは、豊富な機能モジュールと最適化されたユーザーインターフェースを提供し、ユーザーエクスペリエンスと業務効率の向上を目指しています。

MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音-首席AI分享圈

MockingBird: 高速音声クローニングとモデルトレーニング、xtts v2に基づく音声合成

包括的な紹介 MockingBirdは、AI技術によって迅速な音声クローンと音声合成を実現することを目的としたオープンソースプロジェクトである。ユーザーは5秒間の音声サンプルを提供するだけで、あらゆる音声コンテンツを生成することができる。このプロジェクトは様々な中国語データセットをサポートし、WindowsとLinuxシステムで動作します。

Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包-首席AI分享圈

クローンボイス:Windows用のxtts_v2をベースにした多言語、サンプルレス音声クローンツール。

一般的な説明 Clone Voiceはオープンソースのサウンドクローニングツールで、ウェブベースのインターフェイスを提供し、ユーザーが任意のサウンドや個人的な声の録音を使用して声のクローンを作成することができます。このツールは使い方が簡単で、NVIDIA GPUがなくてもコンパイル済みのアプリケーションでローカルに実行できます。このツールは...

StreamingT2V:从文本到长视频的动态且可扩展的生成技术-首席AI分享圈

StreamingT2V: テキストから長尺ビデオへのダイナミックでスケーラブルな生成

一般的な紹介 StreamingT2Vは、Picsart AI研究チームによって開発された公開プロジェクトで、テキストの説明文に基づいて、一貫性があり、ダイナミックでスケーラブルな長尺動画を生成することに重点を置いている。この技術は、動画の時間的一貫性を保証し、説明テキストに密接に対応し、高いフレーム品質を維持する高度な自己回帰的アプローチを使用しています...

Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器-首席AI分享圈

Text2Video-Zero: Picsart AI研究チームによるテキストからビデオへのゼロサンプル生成ツールがリリースされました。

一般的な紹介 Text2Video-Zeroは、Picsart AI Researchチームによって開発されたGitHub用のサンプル数ゼロのテキストtoビデオジェネレータの公式実装です。このプロジェクトは、時間的一貫性と正しく従ったテキストキューを持つビデオを生成するためにテキストキューを使用する新しい方法を提供します。同チームはまた、...

Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声-首席AI分享圈

検索ベースの音声変換WebUI:検索ベースの音声変換フレームワーク|実際の歌声をシミュレートする

包括的な導入検索ベースの音声変換WebUIは、シンプルで使いやすいVITSベースの音声変換フレームワークであり、曲のカバーやリアルタイムの音声変更を含む、任意のスピーカー間の音声変換を可能にします。低遅延、優れたボイスチェンジ効果、少量のデータトレーニングが特徴です。

VoiceCraft:开源零样本语音克隆与文本转语音工具-首席AI分享圈

VoiceCraft: オープンソース ゼロサンプル音声クローニング・音声合成ツール

包括的な紹介 VoiceCraftは、Neural Codec言語モデルをベースとしたオープンソースの音声編集・ゼロサンプル音声合成ツールです。革新的な符号シーケンス生成方法を採用しており、既存の音声シーケンスに対して挿入、削除、置換操作を行うことで、自然で首尾一貫した編集音声を生成することができます。同時に、...

edge-tts: 音声合成Pythonモジュール|無料音声合成サービス

概要 edge-tsは、Microsoft Edgeのオンライン音声合成サービスを、Microsoft Edgeブラウザ、Windowsオペレーティングシステム、APIキーを必要とせずにPythonコードで使用できるようにするオープンソースのPythonモジュールです。コマンドラインからのedge-ttsの直接使用とedge-...

CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式-首席AI分享圈

CoAI.Dev(チャットNio):柔軟な課金とサブスクリプションプランモデルに対応したAIアグリゲーションアプリ向けワンストップB/Cソリューション

概要 CoAI.Dev(旧Chat Nio)は、複数のAIモデルを統合し、分散ストリーミング、画像生成、クロスデバイスの会話同期と共有をサポートするチャットプラットフォームです。サブスクリプションとトークン課金システム、キートランジットサービス、マルチモデルサポートを実装し、コネクテッドサーチとAI...

ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI-首席AI分享圈

ChatOllama: Nuxt 3とOllamaをベースにしたローカルリアルタイムチャットアプリケーションUI

包括的な紹介 ChatOllamaは、大規模言語モデル(LLM)に基づいたオープンソースのオンラインチャットアプリケーションプロジェクトです。ユーザは、モデル管理(リスト表示、ダウンロード、削除)、モデルとのチャットやその他の機能のためにプラットフォームを使用することができます。このプロジェクトは、Nuxt 3フレームワークを使用しています。

MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描-首席AI分享圈

MinerU: PDFドキュメントの抽出とマルチモーダルMarkdownフォーマットへの変換、電子書籍OCRスキャンのサポート

包括的な紹介 MinerUは、上海人工知能研究所のOpenDataLabチームによって開発されたオープンソースのデータ抽出ツールで、複雑なPDF文書、ウェブページ、電子ブックからコンテンツを効率的に抽出することに重点を置いています。画像、数式、表、その他の要素を含むマルチモーダルPDFドキュメントを、分析しやすいm...

DCT-Net:照片和视频转绘为动漫风格化的开源工具-首席AI分享圈

DCT-Net:写真やビデオをスタイリッシュなアニメに変換するオープンソースツール

包括的な紹介 DCT-Netは、DAMOアカデミーと北京大学王宣コンピューター技術研究所によって開発されたオープンソースプロジェクトで、画像のアニメ定型変換を目指している。このプロジェクトは、DCT(Domain-Calibrated Translation)によるディープラーニング技術を利用し、...

Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)-首席AI分享圈

ディフューザー画像アウトペイント:超強力なオープンソースAI画像拡張ツール、画像アウトペイント(outpainting)

一般的な紹介 Diffusers Image Outpaintは、Hugging Faceコミュニティメンバーのfffiloniによって作成された強力なAI画像拡張ツールです。このツールは、高度な拡散モデリング技術を使用して、画像をシームレスに拡張(画像のエッジをアウトペイント)し、高品質な画像を作成します...

Tap4 AI WebUI:开源轻量级AI工具导航项目-首席AI分享圈

Tap4 AI WebUI:オープンソースの軽量AIツール・ナビゲーション・プロジェクト

包括的な紹介 Tap4 AI WebUIは、オープンソースの軽量AIツールナビゲーションウェブサイトプロジェクトです。このプロジェクトは、Next.jsとSupabase技術スタックを使用し、多言語SEO最適化をサポートし、AIツールの分類フィルタリング、検索、詳細表示機能を提供します。

CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版-首席AI分享圈

CodeFormer: 画像とビデオの顔復元、古い写真の復元、ワンクリック展開版を提供

CodeFormer 概要 CodeFormerは、南洋理工大学S-Labの研究チームによって開発され、NeurIPS 2022で発表された、頑健なブラインド顔修正のためのコードベースである。このプロジェクトは、コードブック・ルックアップ・トランスフォーマー(Codebook Lookup Transformer)技術を利用し、...

ja日本語