AIパーソナル・ラーニング
と実践的なガイダンス
TRAE
合計992記事

タグ: AIのオープンソースプロジェクト 42ページ

Moondream:批量反推图像提示词的开源轻量级视觉语言模型-首席AI分享圈

Moondream:画像手がかり語のバッチバックプロパゲーションのためのオープンソースの軽量視覚言語モデル

包括的な紹介 Moondreamは、ディープラーニングとコンピュータビジョン技術による画像記述機能を実現するために設計された、オープンソースの軽量視覚言語モデルです。このモデルは、様々なプラットフォーム上で効率的に実行することができ、特にエッジデバイスに適しています。Moondreamは、高度なテクニックとトレーニングデータセットを使用して、画像記述の精度を向上させることができます。

Flux Gym:低显存训练FLUX LoRA的简易UI-首席AI分享圈

FLUX Gym:低グラフィックメモリでFLUX LoRAをトレーニングするための簡単なUI

一般的な紹介 Flux Gymは、低グラフィックメモリ(12GB/16GB/20GB)をサポートしたFLUX LoRAをトレーニングするための使いやすいウェブUIです。フロントエンドはAI-ToolkitのGradio UIをベースにしており、バックエンドはKohya Scriptsを利用しています。Flux Gymは、AI-Toolkit WebUIのシンプルさとKohya Scriptsを組み合わせたものです。

PicMenu:文字菜单转换为美观的图文菜单-首席AI分享圈

PicMenu:テキストメニューを美しいグラフィックメニューに変換する

総合紹介 PicMenuは、簡単な写真操作で従来の紙メニューを鮮やかで直感的な画像メニューに変換する革新的なAIツールです。このツールは、各料理の高品質な画像を自動的に生成するだけでなく、料理に関する豊富な情報を提供し、ケータリング業界に新たなデジタル変革をもたらします...

Gemini-OpenAI:リージョン制限を回避し、OpenAI互換APIに変換する逆世代Geminiアドレス

一般的な紹介 Gemini OpenAI API Agentは、無料でサーバーのメンテナンスが不要なOpenAI準拠のエンドポイントです。ユーザは、Vercel、Netlify、Cloudflareなどのプラットフォームに、個人で簡単にデプロイすることができます。このプロジェクトは、OpenAI APIは必要だが、サーバーのメンテナンスはしたくないという方を対象としています。

Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行-首席AI分享圈

サナ:高解像度画像の高速生成、0.6Bの超小型モデル、薄型ラップトップGPU動作

概要 Sanaは、NVIDIA Labsによって開発された効率的な高解像度画像生成フレームワークで、最大4096×4096の解像度の画像を数秒で生成することができます。Sanaは、画像生成の速度と品質を劇的に向上させるために、線形拡散変換器と深層圧縮自己エンコーダ技術を採用しています。

SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面-首席AI分享圈

SP-MangaEditer:プロフェッショナル4コマ漫画イラスト作成ツール、画像生成、漫画ページ編集

SP-MangaEditerの概要 SP-MangaEditerは、漫画家のために設計された独立した漫画編集プラットフォームです。画像生成、レイヤー編集、画像調整、フィルター適用など様々な機能をサポートし、高品質なマンガイラストを簡単に作成することができます。ユーザは簡単な操作で素早く画像を生成できます。

SQLite-Utils-Ask: SQLite データベースと CSV/JSON ファイルにクエリデータをクエリできます。

概要 SQLite-Utils-Askは、SQLiteデータベースやCSV/JSONファイルに対して、LLM(Large Language Model)の助けを借りて質問と回答のデータクエリを実行できるように設計された強力なツールです。このツールは、ユーザーの質問に基づいて適切なSQLクエリを自動的に生成し、クエリを実行して...

GraphRAG-Dify:DifyにGraphRAGの機能を装備する

包括的な紹介 GraphRAG-Difyは、GraphRAGとDifyの技術を組み合わせて、AIエージェントを素早く作成し、デプロイするために設計されたオープンソースプロジェクトです。このプロジェクトは、サービス構築にFastAPIとUvicornを使用しており、DSLのインポートをサポートしています。 機能一覧 作成 ...

askrepo:ソースコード閲覧ツール。LLMを使ってコードを分析し、詳細なコード解説を提供する。

概要 askrepoはLLM(Large Language Model)に基づいたソースコードリーディングツールです。指定されたディレクトリにあるGitで管理されたテキストファイルの内容を読み取り、Google Gemini APIに送信して、指定されたプロンプトに基づいた質問への回答を提供することができる。このツールは、開発者がより良くGitを理解できるように設計されている。

PDFMathTranslate:保留PDF完整排版的AI翻译工具-首席AI分享圈

PDFMathTranslate: PDFの組版を完全に保持するAI翻訳ツール

包括的な紹介 PDFMathTranslateは、科学論文の翻訳に焦点を当てたオープンソースツールで、PDF文書の全文を翻訳し、バイリンガルバージョンを生成することができます。数式、図表、目次、注釈など、元の文書のレイアウトを完全に保持するAI技術を使用しており、Google、DeepL、Ollama...をサポートしています。

Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装-首席AI分享圈

Voice-Pro: オープンソースの多機能ビデオ翻訳ツール、多言語への音声書き起こしおよび翻訳、Windowsワンクリックインストール

概論 Voice-Proは、Gradio WebUIをベースとした、音声合成、テキスト読み上げ、リアルタイム翻訳、YouTubeビデオダウンロード、人声分離をサポートする多機能ツールです。Whisper、Faster-Whisper、Whisper-Timestamped技術を統合し、効率的な音声翻訳を提供します。

Linly-Dubbing:智能视频多语言AI配音/翻译工具-首席AI分享圈

Linly-Dubbing:インテリジェントビデオ多言語AI吹替/翻訳ツール

包括的な紹介 Linly-Dubbingはインテリジェントな多言語AIダビングと翻訳ツールで、高度なAI技術を統合することで、ユーザーに高品質の多言語ビデオダビングと字幕翻訳サービスを提供するように設計されています。このツールは、特に国際教育、グローバルコンテンツのローカリゼーションやその他のシナリオに適しており、チームが高品質なコンテンツを...

FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。-首席AI分享圈

FlipSketch: 静的なドローイングをテキストガイド付きのスケッチアニメーションに変換し、アニメーションプロセスを簡素化します。

一般的な紹介 FlipSketchは、静的な図面をテキストガイド付きのアニメーションに変換するために設計されたオープンソースプロジェクトです。FlipSketchは、画像処理と自然言語処理の技術を組み合わせています。

AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站-首席AI分享圈

AutoFlow: GraphRAGベースの会話型知識ベース/ディープ・ウェブ検索ツール。

概要 AutoFlowはPingCAP社によって開発されたオープンソースツールで、TiDBサーバーレスベクトルストレージを使ってグラフベースの知識ベースを構築します。LlamaIndexとDSPyフレームワークを統合し、複雑なダイアログ検索と知識グラフの編集をサポートする。ユーザーは、シンプルなJavaScriptサロゲート...

Maxun:开源无代码平台,自动抓取网页数据并转换为API或电子表格-首席AI分享圈

Maxun:ウェブデータを自動的にクロールし、APIやスプレッドシートに変換するオープンソースのコード不要プラットフォーム

包括的な紹介 Maxunはオープンソースのコード不要のウェブデータ抽出プラットフォームで、ウェブデータを自動的にクロールしてAPIやスプレッドシートに変換するロボットを数分で訓練することができます。このプラットフォームは、ページングとスクロールをサポートし、ウェブサイトのレイアウトの変更に対応し、強力なデータクローリング機能を提供します。

OpenPromptStudio:可视化编辑、管理图像提示词,同步自己的Notion提示词表-首席AI分享圈

OpenPromptStudio:イメージプロンプトを視覚的に編集、管理し、独自のNotionプロンプトリストを同期します!

概論 OpenPromptStudio(OPS)は、Moonvyチームによって開発されたAIGCプロンプトワード用のオープンソースビジュアルエディタです。MidjourneyのようなAIモデルをサポートし、プロンプトワードの作成と管理のプロセスを簡素化することを目的としています。OPSはNotionとの統合により、強力なプロンプトワード管理機能を提供します。

Text generation web UI:基于 Gradio 大语言模型聊天界面,支持多种后端服务-首席AI分享圈

テキスト生成ウェブUI:複数のバックエンド・サービスをサポートするGradioベースの大規模言語モデル・チャット・インターフェース

一般的な紹介 テキスト生成ウェブUIは、ラージ言語モデル(LLM)のために設計されたGradioベースのウェブUIです。Transformers、llama.cpp、ExLlamaV2を含む様々なテキスト生成バックエンドをサポートしています。簡単なステップですぐにインストールできます。

Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码-首席AI分享圈

Morphic:AIを搭載したオープンソース検索エンジン、スマートなQ&A、動画検索、UIコードの生成を提供

一般的な紹介 MorphicはAI技術に基づいた検索エンジンで、インテリジェントなQ&Aと効率的な検索体験を提供するために設計された生成的なユーザーインターフェイスを持つ。ユーザーはMorphicでテキスト、ビデオなどを含む様々な検索を行うことができ、検索履歴を保存し、検索結果を共有することができます。Morphicは様々なAIをサポートしています...

Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)-首席AI分享圈

Swarm:軽量なマルチインテリジェント身体システムを学習するための実験的教育プロジェクト(OpenAIの例)

一般的な紹介 Swarmは、OpenAIによって開発された実験的な教育用フレームワークで、マルチエージェントシステムの軽量で、制御可能で、テストが容易なインターフェースを探求するためのものです。このフレームワークは主に、開発者がマルチエージェントシステムの調整と実行を理解し、実装するのを助けるために、エージェント間のハンドオフとルーチンパターンを実証するために使用されます。

ja日本語