AIパーソナル・ラーニング
と実践的なガイダンス
ビーンバッグ・マースコード1
合計910記事

タグ: AIのオープンソースプロジェクト 43ページ

CogView3:智谱轻言开源的级联扩散文本生成图像模型-首席AI分享圈

CogView3: Wisdom Spectrumのオープンソースカスケード拡散テキスト生成画像モデル

包括的な紹介 CogView3は清華大学とシンクタンクチーム(Chi Spectrum Qingyan)によって開発された先進的なテキスト生成画像システムです。CogView3の主な特徴は、多段階生成、革新的なアーキテクチャ、芸術創作のための効率的なパフォーマンスなどです。

RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用-首席AI分享圈

RocketNotes: テキスト補完、ドキュメントダイアログ、セマンティック検索をサポートしたMarkdownメモアプリ

包括的な紹介 RocketNotesは、Large Language Model (LLM)駆動のテキスト補完、チャット、セマンティック検索を統合したウェブベースのMarkdownノートアプリケーションです。100%サーバーレスRAG(Relevant AI Guided)パイプラインを使用して構築されたこのプロジェクトは、ユーザーを簡素化することを目的としています。

F5-TTS:少样本语音克隆,生成流畅且感情丰富的克隆声音-首席AI分享圈

F5-TTS: 滑らかで感情豊かなクローン音声を生成するサンプルレス・スピーチ・クローニング

Synthesis F5-TTSは、ストリームにマッチした拡散変換器(DiT)に基づく、新しい非自己回帰型音声合成(TTS)システムである。このシステムは、ConvNeXtモデルを使用してテキスト表現を最適化し、音声との整合を容易にすることで、合成品質を大幅に向上させます。

AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端-首席AI分享圈

AsrTools:音声字幕ツール、Cutscene、Racer、Must-Cutへのインターフェースを内蔵した軽量クライアント

包括的な紹介 AsrTools は、Cutscene, Racer, Must Cut などの大手のインターフェースを内蔵したインテリジェントな音声テキスト変換ツールです。GPU や面倒な設定を必要とせず、効率的なマルチスレッドバッチ処理をサポートします。PyQt5をベースに開発されており、美しくユーザーフレンドリーなインターフェイスで、SRTやTXT形式の字幕ファイルを出力できます。このツールは...

Surya:专业多语言文档OCR工具,开源本地部署-首席AI分享圈

Surya: プロフェッショナルな多言語ドキュメントOCRツール、オープンソース・ネイティブデプロイメント

包括的な紹介 Surya は、90 以上の言語のテキスト認識をサポートするオープンソースの多言語文書 OCR ツールキットです。行単位のテキスト検出だけでなく、レイアウト分析、読み順検出、表認識も実行します。Suryaの性能は、ページ、テキスト、画像、テキスト、文字列など、さまざまな種類の文書でクラウドサービスに匹敵します。

hugging faceの無料apiをcloudflareに導入し、インターフェイス転送をサポートする

国内展開が抱擁顔にアクセスすることはできませんので、クラウドフレアの労働者に展開することができるように変換に基づいて兄の展開プログラムで。 準備1、登録クラウドフレア2、抱擁顔を登録し、apiキーを申請し、apiキーのアドレス3を申請し、次のコードをコピーして展開する...

Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。-首席AI分享圈

受信トレイゼロ:AIがメールを分類、フィルタリング、処理します。

一般的な説明 Inbox Zeroは、AIアシスタントを使用して、ユーザーが迅速に受信トレイゼロの電子メールを達成するために設計されたオープンソースの電子メール管理アプリです。自動返信、アーカイブ、ラベル付け、メールの転送、ニュースレターの管理と配信停止、冷やかしメールのブロック、メールアクティビティの追跡など、様々な機能を提供しています。

xyks:小型猿口計算リバースノート、リバースエンジニアリング、復号アルゴリズム

包括的な紹介 猿の口電卓リバースノートは、猿の口電卓アプリケーションのリバースエンジニアリングのプロセスと方法を文書化し、共有することを目的としたオープンソースプロジェクトです。このプロジェクトには、ユーザーが猿の口の電卓の暗号化アルゴリズムと数を理解し、クラックするのに役立つ、Fridaやdexdumpなどの命令を使用するための様々なリバースツールとテクニックが含まれています。

XiaoYuanKouSuan_Auto:小猿口算自动答题工具,高效解决口算题目-首席AI分享圈

XiaoYuanKouSuan_Auto:XiaoYuanKouSuan自動質疑応答ツール、効率的に口頭算数の問題を解く

包括的な紹介 Ape Mouth Calculator Automatic Question Answer Tool は、OCR認識と自動化スクリプトによってApe Mouth Calculatorアプリケーションの問題を効率的に解くために設計されたPythonベースのオープンソースプロジェクトです。このツールは、OpenCVやTesseractなどの技術を利用して、リアルタイムで画面上の問題を識別し、自動的に答えを記入します。

Telegram GPT Worker:部署在Cloudflare Workers上的多模型AI Telegram机器人-首席AI分享圈

Telegram GPT Worker: Cloudflare Workers上に展開されたマルチモデルAI Telegramボット

一般的な紹介 GPT-Telegram-Workerは、Cloudflare WorkersをベースにしたマルチモデルのAI Telegramボットで、OpenAI、Claude、Azureなどの複数のAPIをサポートしています。このプロジェクトはTypeScriptで開発されており、簡単に拡張できるモジュール設計で、高速でスケーラブルなサービスを提供します!...

Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档-首席AI分享圈

クラウド文書変換:Flying Book文書ダウンロードプラグイン、Flying Bookクラウド文書からローカルMarkdown形式文書への変換

概要 Cloud Document Converterは、Flying BookのクラウドドキュメントをMarkdown形式に変換するためのChrome拡張機能です。ユーザーはフライングブックのクラウドドキュメントを簡単にダウンロードまたはコピーしてMarkdownファイルに変換し、二次編集や共有することができます。このツールは複数のクラウド文書をサポートしています。

QuickPiperAudiobook:自然な音質のオーディオブックを作成する鍵。

総合案内 QuickPiperAudiobookは、さまざまなテキスト形式(epub、mobi、txt、PDF、HTMLなど)を、1つの簡単なコマンドで自然な音声のオーディオブックに変換するために設計されたオープンソースプロジェクトです。このツールは、変換にPiperモデルを使用し、Piperのインストールとph...

Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据-首席AI分享圈

Crawl4AI:LLMなしで構造化データを抽出するオープンソースの非同期ウェブクローラツール

包括的な紹介 Crawl4AIは、大規模言語モデル(LLM)と人工知能(AI)アプリケーションのために設計されたオープンソースの非同期ウェブクローラツールです。ウェブクローリングとデータ抽出プロセスを簡素化し、効率的なウェブクローリングをサポートし、LLMに適した出力フォーマット(JSON、cleaned ...

Cloudflare Serverless Registry: Cloudflare Workersに基づくサーバーレス・コンテナ・レジストリ

概要 Cloudflare Serverless Registryは、Cloudflare WorkersとR2ストレージをベースにしたサーバーレスコンテナレジストリです。イメージのプッシュとプルをサポートし、ユーザー名パスワードと公開鍵ベースのJWT認証を提供します。このプロジェクトはデプロイが簡単で、Dockerオペレーションと互換性があります。

AIHawk:インテリジェントな仕事検索アシスタント、自動履歴書配置(英語のみ)

概要 Auto_Jobs_Applier_AIHawk は、人工知能技術を利用した求人検索の自動化ツールです。短時間で大量の履歴書を自動配信し、ユーザーの個人情報や求職意図に応じてパーソナライズすることができます。このツールの目的は、求職活動の効率を向上させ、手作業による履歴書の提出を減らすことです。

simple-one-api:様々な無料の大規模モデルAPIをワンクリックで統合、統一された外部OpenAIインターフェース

総合紹介 simple-one-apiは、複数のビッグモデルAPIの統合を簡素化するために設計されたオープンソースプロジェクトです。Chifan Big Model Platform、Xunfei Starfire Big Model、Tencent Hybrid、MiniMaxやDeep-SeekなどのOpenAIインターフェースと互換性のあるモデルをサポートしています。このプロジェクトに必要なのは、実行ファイルと設定ファイルだけです。

ボイスチェンジャー:お気に入りのアニメキャラクターを歌わせるリアルタイムボイスチェンジャー!

概要 Voice Changerは、MMVC、so-vits-svc、RVC、DDSP-SVC、Beatriceなど、幅広いAI音声モデルをサポートするオープンソースのリアルタイム音声変換ツールです。このツールは、Windows、Mac、Linux、Google Colabなど、多くのプラットフォームと互換性があり、ユーザーは以下のことができます。...

VoAPI:高颜值的AI模型转发接口管理系统,官网每日提供免费API额度-首席AI分享圈

VoAPI:高付加価値AIモデル転送インターフェース管理システム、公式サイトがAPI枠を毎日無料提供

総合紹介 VoAPIは、高付加価値・高性能の新しいAIモデルインターフェース管理・配信システムで、主に個人または企業の内部管理・配信チャネルに使用されます。NewAPIに基づいて開発されたこのシステムは、豊富な機能モジュールと最適化されたユーザーインターフェースを提供し、ユーザーエクスペリエンスと業務効率の向上を目指しています。

MockingBird:快速克隆声音与模型训练,基于 xtts v2 实现的文本转语音-首席AI分享圈

MockingBird: 高速音声クローニングとモデルトレーニング、xtts v2に基づく音声合成

包括的な紹介 MockingBirdは、AI技術によって迅速な音声クローンと音声合成を実現することを目的としたオープンソースプロジェクトである。ユーザーは5秒間の音声サンプルを提供するだけで、あらゆる音声コンテンツを生成することができる。このプロジェクトは様々な中国語データセットをサポートし、WindowsとLinuxシステムで動作します。

ja日本語