AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
合計992記事

タグ: AIのオープンソースプロジェクト 47ページ

BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)-首席AI分享圈

BlinkShot:プロンプトワードを入力してリアルタイム画像生成(Flux Schnellモデルへのフリーアクセス)

概要 BlinkShotは、Together AIとFlux Schnellの技術を利用したオープンソースのリアルタイムAI画像ジェネレーターで、ユーザーがプロンプトを入力すると同時に高品質の画像を生成することができます。このプラットフォームは完全に無料で、デザイナー、アーティスト、コンテンツ制作者向けに、ユーザーのカスタマイズや二次開発をサポートしています。

FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别-首席AI分享圈

FunASR: オープンソース音声認識ツールキット、話者分離/多人数対話音声認識

総合紹介 FunASRは、学術研究と産業アプリケーションの橋渡しをするために、アリババのDharma Instituteによって開発されたオープンソースの音声認識ツールキットです。音声認識(ASR)、音声終点検出(VAD)、句読点復元、言語モデリング、話者検証、発話...など、幅広い音声認識機能をサポートしています。

UltraPixel:革新超高分辨率图像生成技术,图像细节丰富-首席AI分享圈

UltraPixel:細部まで鮮明な超高解像度画像生成技術

一般的な紹介 UltraPixelは、非常に高品質で詳細な画像を作成するために設計された、高度な超高解像度画像生成技術です。このプロジェクトはGitHubユーザーのcatcathhによって開発され、NeurIPS 2024で発表された。UltraPixelは1Kから6Kまでのあらゆる解像度の画像をサポートする。

SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天-首席AI分享圈

SiYuan (SiYuan Notes): AIライティング/Q&Aチャットをサポートするプライバシー優先の個人知識管理ソフトウェア

概要:SiYuan Notes(SiYuan)はプライバシーを第一に考えた個人向けナレッジマネジメントソフトウェアであり、完全なオープンソースでセルフホスティングをサポートしている。TypeScriptとGolangで書かれており、きめ細かいブロックレベルの参照とMarkdownのWYSIWYG編集を提供する。SiYuan Notesは、ユーザを支援するように設計されています...

阿布量化交易系统:基于Python的开源量化交易平台-首席AI分享圈

アブ・クオンツ取引システム:Pythonベースのオープンソース・クオンツ取引プラットフォーム

一般的な紹介 Abu Quantitative Trading System は、Python ベースのオープンソースプラットフォームです。投資家がコードを通じて定量的取引戦略を実行できるよう、ユーザー「bbfamily」によって作成されました。このシステムは、株式、オプション、先物、ビットコインなど様々な金融商品のバックテストと取引をサポートする。機械学習技術を組み合わせ...

Knowledge Table:高效提取与探索结构化数据的开源工具-首席AI分享圈

知識テーブル:構造化データの効率的な抽出と探索のためのオープンソースツール

包括的な紹介 ナレッジテーブル(Knowledge Table)は、非構造化ドキュメントから構造化データを抽出し、探索するプロセスを簡素化するために設計されたオープンソースプロジェクトです。ユーザは、自然言語クエリインターフェースを介して、表やグラフなどの構造化された知識表現を作成することができます。このツールは、カスタムの抽出ルールやフォーマットをサポートしています...

CogView3:智谱轻言开源的级联扩散文本生成图像模型-首席AI分享圈

CogView3: Wisdom Spectrumのオープンソースカスケード拡散テキスト生成画像モデル

包括的な紹介 CogView3は清華大学とシンクタンクチーム(Chi Spectrum Qingyan)によって開発された先進的なテキスト生成画像システムです。CogView3の主な特徴は、多段階生成、革新的なアーキテクチャ、芸術創作のための効率的なパフォーマンスなどです。

RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用-首席AI分享圈

RocketNotes: テキスト補完、ドキュメントダイアログ、セマンティック検索をサポートしたMarkdownメモアプリ

包括的な紹介 RocketNotesは、Large Language Model (LLM)駆動のテキスト補完、チャット、セマンティック検索を統合したウェブベースのMarkdownノートアプリケーションです。100%サーバーレスRAG(Relevant AI Guided)パイプラインを使用して構築されたこのプロジェクトは、ユーザーを簡素化することを目的としています。

F5-TTS:少样本语音克隆,生成流畅且感情丰富的克隆声音-首席AI分享圈

F5-TTS: 滑らかで感情豊かなクローン音声を生成するサンプルレス・スピーチ・クローニング

Synthesis F5-TTSは、ストリームにマッチした拡散変換器(DiT)に基づく、新しい非自己回帰型音声合成(TTS)システムである。このシステムは、ConvNeXtモデルを使用してテキスト表現を最適化し、音声との整合を容易にすることで、合成品質を大幅に向上させます。

AsrTools:语音转字幕工具,内置剪映、快手、必剪接口的轻量客户端-首席AI分享圈

AsrTools:音声字幕ツール、Cutscene、Racer、Must-Cutへのインターフェースを内蔵した軽量クライアント

包括的な紹介 AsrTools は、Cutscene, Racer, Must Cut などの大手のインターフェースを内蔵したインテリジェントな音声テキスト変換ツールです。GPU や面倒な設定を必要とせず、効率的なマルチスレッドバッチ処理をサポートします。PyQt5をベースに開発されており、美しくユーザーフレンドリーなインターフェイスで、SRTやTXT形式の字幕ファイルを出力できます。このツールは...

Surya:专业多语言文档OCR工具,开源本地部署-首席AI分享圈

Surya: プロフェッショナルな多言語ドキュメントOCRツール、オープンソース・ネイティブデプロイメント

包括的な紹介 Surya は、90 以上の言語のテキスト認識をサポートするオープンソースの多言語文書 OCR ツールキットです。行単位のテキスト検出だけでなく、レイアウト分析、読み順検出、表認識も実行します。Suryaの性能は、ページ、テキスト、画像、テキスト、文字列など、さまざまな種類の文書でクラウドサービスに匹敵します。

hugging faceの無料apiをcloudflareに導入し、インターフェイス転送をサポートする

国内展開が抱擁顔にアクセスすることはできませんので、クラウドフレアの労働者に展開することができるように変換に基づいて兄の展開プログラムで。 準備1、登録クラウドフレア2、抱擁顔を登録し、apiキーを申請し、apiキーのアドレス3を申請し、次のコードをコピーして展開する...

Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。-首席AI分享圈

受信トレイゼロ:AIがメールを分類、フィルタリング、処理します。

一般的な説明 Inbox Zeroは、AIアシスタントを使用して、ユーザーが迅速に受信トレイゼロの電子メールを達成するために設計されたオープンソースの電子メール管理アプリです。自動返信、アーカイブ、ラベル付け、メールの転送、ニュースレターの管理と配信停止、冷やかしメールのブロック、メールアクティビティの追跡など、様々な機能を提供しています。

xyks:小型猿口計算リバースノート、リバースエンジニアリング、復号アルゴリズム

包括的な紹介 猿の口電卓リバースノートは、猿の口電卓アプリケーションのリバースエンジニアリングのプロセスと方法を文書化し、共有することを目的としたオープンソースプロジェクトです。このプロジェクトには、ユーザーが猿の口の電卓の暗号化アルゴリズムと数を理解し、クラックするのに役立つ、Fridaやdexdumpなどの命令を使用するための様々なリバースツールとテクニックが含まれています。

XiaoYuanKouSuan_Auto:小猿口算自动答题工具,高效解决口算题目-首席AI分享圈

XiaoYuanKouSuan_Auto:XiaoYuanKouSuan自動質疑応答ツール、効率的に口頭算数の問題を解く

包括的な紹介 Ape Mouth Calculator Automatic Question Answer Tool は、OCR認識と自動化スクリプトによってApe Mouth Calculatorアプリケーションの問題を効率的に解くために設計されたPythonベースのオープンソースプロジェクトです。このツールは、OpenCVやTesseractなどの技術を利用して、リアルタイムで画面上の問題を識別し、自動的に答えを記入します。

Telegram GPT Worker:部署在Cloudflare Workers上的多模型AI Telegram机器人-首席AI分享圈

Telegram GPT Worker: Cloudflare Workers上に展開されたマルチモデルAI Telegramボット

一般的な紹介 GPT-Telegram-Workerは、Cloudflare WorkersをベースにしたマルチモデルのAI Telegramボットで、OpenAI、Claude、Azureなどの複数のAPIをサポートしています。このプロジェクトはTypeScriptで開発されており、簡単に拡張できるモジュール設計で、高速でスケーラブルなサービスを提供します!...

Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档-首席AI分享圈

クラウド文書変換:Flying Book文書ダウンロードプラグイン、Flying Bookクラウド文書からローカルMarkdown形式文書への変換

概要 Cloud Document Converterは、Flying BookのクラウドドキュメントをMarkdown形式に変換するためのChrome拡張機能です。ユーザーはフライングブックのクラウドドキュメントを簡単にダウンロードまたはコピーしてMarkdownファイルに変換し、二次編集や共有することができます。このツールは複数のクラウド文書をサポートしています。

QuickPiperAudiobook:自然な音質のオーディオブックを作成する鍵。

総合案内 QuickPiperAudiobookは、さまざまなテキスト形式(epub、mobi、txt、PDF、HTMLなど)を、1つの簡単なコマンドで自然な音声のオーディオブックに変換するために設計されたオープンソースプロジェクトです。このツールは、変換にPiperモデルを使用し、Piperのインストールとph...

Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据-首席AI分享圈

Crawl4AI:LLMなしで構造化データを抽出するオープンソースの非同期ウェブクローラツール

包括的な紹介 Crawl4AIは、大規模言語モデル(LLM)と人工知能(AI)アプリケーションのために設計されたオープンソースの非同期ウェブクローラツールです。ウェブクローリングとデータ抽出プロセスを簡素化し、効率的なウェブクローリングをサポートし、LLMに適した出力フォーマット(JSON、cleaned ...

ja日本語