合計767記事
タグ: AIのオープンソースプロジェクト 36ページ 概要 Cloud Document Converterは、Flying BookのクラウドドキュメントをMarkdown形式に変換するためのChrome拡張機能です。ユーザーはフライングブックのクラウドドキュメントを簡単にダウンロードまたはコピーしてMarkdownファイルに変換し、二次編集や共有することができます。このツールは複数のクラウド文書をサポートしています。
総合案内 QuickPiperAudiobookは、さまざまなテキスト形式(epub、mobi、txt、PDF、HTMLなど)を、1つの簡単なコマンドで自然な音声のオーディオブックに変換するために設計されたオープンソースプロジェクトです。このツールは、変換にPiperモデルを使用し、Piperのインストールとph...
ビルダーインテリジェントプログラミングモード、DeepSeek-R1とDeepSeek-V3の無制限の使用、海外版よりも滑らかな経験を有効にします。ただ、中国語のコマンドを入力し、プログラミングの知識はまた、独自のアプリケーションを書くためにゼロしきい値をすることはできません。
2025-03-10
包括的な紹介 Crawl4AIは、大規模言語モデル(LLM)と人工知能(AI)アプリケーションのために設計されたオープンソースの非同期ウェブクローラツールです。ウェブクローリングとデータ抽出プロセスを簡素化し、効率的なウェブクローリングをサポートし、LLMに適した出力フォーマット(JSON、cleaned ...
概要 Cloudflare Serverless Registryは、Cloudflare WorkersとR2ストレージをベースにしたサーバーレスコンテナレジストリです。イメージのプッシュとプルをサポートし、ユーザー名パスワードと公開鍵ベースのJWT認証を提供します。このプロジェクトはデプロイが簡単で、Dockerオペレーションと互換性があります。
概要 Auto_Jobs_Applier_AIHawk は、人工知能技術を利用した求人検索の自動化ツールです。短時間で大量の履歴書を自動配信し、ユーザーの個人情報や求職意図に応じてパーソナライズすることができます。このツールの目的は、求職活動の効率を向上させ、手作業による履歴書の提出を減らすことです。
総合紹介 simple-one-apiは、複数のビッグモデルAPIの統合を簡素化するために設計されたオープンソースプロジェクトです。Chifan Big Model Platform、Xunfei Starfire Big Model、Tencent Hybrid、MiniMaxやDeep-SeekなどのOpenAIインターフェースと互換性のあるモデルをサポートしています。このプロジェクトに必要なのは、実行ファイルと設定ファイルだけです。
概要 Voice Changerは、MMVC、so-vits-svc、RVC、DDSP-SVC、Beatriceなど、幅広いAI音声モデルをサポートするオープンソースのリアルタイム音声変換ツールです。このツールは、Windows、Mac、Linux、Google Colabなど、多くのプラットフォームと互換性があり、ユーザーは以下のことができます。...
総合紹介 VoAPIは、高付加価値・高性能の新しいAIモデルインターフェース管理・配信システムで、主に個人または企業の内部管理・配信チャネルに使用されます。NewAPIに基づいて開発されたこのシステムは、豊富な機能モジュールと最適化されたユーザーインターフェースを提供し、ユーザーエクスペリエンスと業務効率の向上を目指しています。
包括的な紹介 MockingBirdは、AI技術によって迅速な音声クローンと音声合成を実現することを目的としたオープンソースプロジェクトである。ユーザーは5秒間の音声サンプルを提供するだけで、あらゆる音声コンテンツを生成することができる。このプロジェクトは様々な中国語データセットをサポートし、WindowsとLinuxシステムで動作します。
一般的な説明 Clone Voiceはオープンソースのサウンドクローニングツールで、ウェブベースのインターフェイスを提供し、ユーザーが任意のサウンドや個人的な声の録音を使用して声のクローンを作成することができます。このツールは使い方が簡単で、NVIDIA GPUがなくてもコンパイル済みのアプリケーションでローカルに実行できます。このツールは...
一般的な紹介 StreamingT2Vは、Picsart AI研究チームによって開発された公開プロジェクトで、テキストの説明文に基づいて、一貫性があり、ダイナミックでスケーラブルな長尺動画を生成することに重点を置いている。この技術は、動画の時間的一貫性を保証し、説明テキストに密接に対応し、高いフレーム品質を維持する高度な自己回帰的アプローチを使用しています...
一般的な紹介 Text2Video-Zeroは、Picsart AI Researchチームによって開発されたGitHub用のサンプル数ゼロのテキストtoビデオジェネレータの公式実装です。このプロジェクトは、時間的一貫性と正しく従ったテキストキューを持つビデオを生成するためにテキストキューを使用する新しい方法を提供します。同チームはまた、...
包括的な導入検索ベースの音声変換WebUIは、シンプルで使いやすいVITSベースの音声変換フレームワークであり、曲のカバーやリアルタイムの音声変更を含む、任意のスピーカー間の音声変換を可能にします。低遅延、優れたボイスチェンジ効果、少量のデータトレーニングが特徴です。
包括的な紹介 VoiceCraftは、Neural Codec言語モデルをベースとしたオープンソースの音声編集・ゼロサンプル音声合成ツールです。革新的な符号シーケンス生成方法を採用しており、既存の音声シーケンスに対して挿入、削除、置換操作を行うことで、自然で首尾一貫した編集音声を生成することができます。同時に、...
概要 edge-tsは、Microsoft Edgeのオンライン音声合成サービスを、Microsoft Edgeブラウザ、Windowsオペレーティングシステム、APIキーを必要とせずにPythonコードで使用できるようにするオープンソースのPythonモジュールです。コマンドラインからのedge-ttsの直接使用とedge-...
概要 CoAI.Dev(旧Chat Nio)は、複数のAIモデルを統合し、分散ストリーミング、画像生成、クロスデバイスの会話同期と共有をサポートするチャットプラットフォームです。サブスクリプションとトークン課金システム、キートランジットサービス、マルチモデルサポートを実装し、コネクテッドサーチとAI...
包括的な紹介 ChatOllamaは、大規模言語モデル(LLM)に基づいたオープンソースのオンラインチャットアプリケーションプロジェクトです。ユーザは、モデル管理(リスト表示、ダウンロード、削除)、モデルとのチャットやその他の機能のためにプラットフォームを使用することができます。このプロジェクトは、Nuxt 3フレームワークを使用しています。
包括的な紹介 MinerUは、上海人工知能研究所のOpenDataLabチームによって開発されたオープンソースのデータ抽出ツールで、複雑なPDF文書、ウェブページ、電子ブックからコンテンツを効率的に抽出することに重点を置いています。画像、数式、表、その他の要素を含むマルチモーダルPDFドキュメントを、分析しやすいm...
包括的な紹介 DCT-Netは、DAMOアカデミーと北京大学王宣コンピューター技術研究所によって開発されたオープンソースプロジェクトで、画像のアニメ定型変換を目指している。このプロジェクトは、DCT(Domain-Calibrated Translation)によるディープラーニング技術を利用し、...