AIオープンソースプロジェクト

合計1020記事
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: 高速でコントロール可能な多言語(7000以上の言語に対応)音声合成ツール

一般的な紹介 IMS Toucanはドイツのシュトゥットガルト大学の自然言語処理研究所(IMS)によって開発された最先端の音声合成(TTS)ツールキットです。このツールキットは7000以上の言語をサポートし、高速で、制御可能で、必要な計算資源が少ない。
6ヶ月前
03.1K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT:ローカルデバイス上の複数のドキュメントと対話することで、データプライバシーを確保する

一般的な紹介 LocalGPTはオープンソースプロジェクトで、ユーザーがローカルデバイス上のドキュメントと会話できるように設計されており、データのプライバシーを保証します。様々なオープンソースモデルを使用することで、LocalGPTはデータをクラウドにアップロードすることなく、ドキュメントコンテンツを処理し理解することができます。このプロジェクトは、様々なアプリケーションをサポートしています。
8ヶ月前
03.1K
LivePortrait:静态图像、视频生成动态肖像动画工具

LivePortrait:静止画や動画からダイナミックなポートレートを生成するアニメーションツール

一般的な紹介 LivePortraitはRacer Technologyによって開発された先進的なAIダイナミックポートレートアニメーションツールです。革新的なAI技術を利用し、静止画像を鮮やかなビデオアニメーションに変換します。本物の写真でも、アニメーションスタイルでも、芸術的なポートレートでも、LivePo...
9ヶ月前
03.1K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm:マルチインテリジェンスクラスターコラボレーションのためのフレームワーク

QuantumSwarmは、AIの人口知能の開発と研究に焦点を当てたオープンソースの人工知能フレームワークです。このプロジェクトはQuarm AIチームによってGitHub上で管理されており、マルチインテリジェンスシステムの構築とテストのための柔軟で効率的なプラットフォームを提供することを目指している。
7ヶ月前
03.1K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe:AIにあなたのコンピュータを直接制御させる、クロードの制御コンピュータのオープンソース実装

概要 Agent.exeはオープンソースのElectronアプリケーションで、AnthropicのClaude 3.5 Sonnet APIを利用し、ユーザーがAIを通してローカルコンピューターを直接コントロールできるようにするものです。このプロジェクトは、K...
8ヶ月前
03.1K
AnyText:生成和编辑多语言图像文本,高可控在图像中生成多行中文

AnyText:多言語の画像テキストを生成・編集し、画像内に複数行の中国語を生成することができます。

総合紹介 AnyTextは、拡散モデルに基づいて開発された画期的な多言語ビジュアルテキスト生成・編集ツールです。画像の中に自然で高品質な多言語テキストを生成し、柔軟なテキスト編集機能をサポートします。研究チームによって開発され、ICLR 2024で発表されました。
7ヶ月前
03.1K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT:ワークフロー自動化と自律的タスク実行のためのインテリジェントな身体構築プラットフォーム

包括的な紹介 AutoGPTは、継続的に稼働するAIエージェントの作成、導入、管理を支援し、複雑なワークフローを自動化するために設計された強力なプラットフォームです。Significant Gravitas社によって開発されたこのプラットフォームは、幅広いツールと機能を提供し、ユーザがAIエージェントに集中できるようにします。
8ヶ月前
03.1K
Browse AI:无代码提取和监控结构化数据

ブラウズAI:コードなしで構造化データを抽出し監視する

Browseの紹介 Browse AIは、プログラミングなしであらゆるウェブサイトからデータを抽出・監視できるように設計された、コーディング不要のクラウドベースのウェブ自動化ソフトウェアです。マウス1つでデータ抽出、監視、自動化タスクを実行するボットを訓練することができます...
11ヶ月前
03.1K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: 複数のデータベースと言語モデルをサポートする効率的な検索補強生成(RAG)ツール。

概要 RAGLiteは、PostgreSQLまたはSQLiteデータベースをサポートするRAG(Retrieval Augmented Generation)用のPythonツールキットです。異なる言語モデルやリフォーマラを選択できる柔軟な設定オプションを提供します。
9ヶ月前
03K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing:インテリジェントビデオ多言語AI吹替/翻訳ツール

包括的な紹介 Linly-Dubbingはインテリジェントな多言語AIダビングと翻訳ツールで、高度なAI技術を統合することにより、ユーザーに高品質の多言語ビデオダビングと字幕翻訳サービスを提供するように設計されています。このツールは、特に国際教育、グローバルコンテンツのローカリゼーションやその他のシナリオに適しており、...
7ヶ月前
03K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器

フライング・パドル PP-TableMagic: 複雑なテーブルの構造化情報抽出

表認識の目的は、画像中の表を解析し、表の構造やセルの位置を正確に特定し、構造化された表形式(HTMLなど)に変換することである。今日の情報化時代において、大量の重要な表データがまだ構造化されていない状態で存在している(例えば、統計表の写真をスキャンした文書など)。
5ヶ月前
03K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2:高度なマルチモーダル理解のためのエキスパート視覚言語モデル

包括的な紹介 DeepSeek-VL2は、その前身であるDeepSeek-VLの性能を大幅に向上させた、高度なMoE(Mixture-of-Experts)視覚言語モデルのシリーズです。このモデルは、視覚的な質問と回答、光学式文字認識、テキスト...
6ヶ月前
03K
wechat-article-exporter:一键部署微信公众号文章批量导出工具

wechat-article-exporter:wechat公開番号記事一括エクスポートツールのワンクリックデプロイメント

包括的な紹介 wechat-article-exporterは、ユーザーがWeChatの公開番号の記事を一括エクスポートするために設計されたオープンソースのツールです。このツールは、環境を構築することなく、記事に埋め込まれたオーディオとビデオのエクスポートをサポートし、100%は、記事のスタイルを復元することができ、プライベート部分をサポートしています...
10ヶ月前
03K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测

FiveThirtyNine:検索知識に基づいて未来の出来事の確率を予測する

概論 Forecast AIは高度な人工知能技術に基づく優れた予測プラットフォームです。強力なデータ分析と機械学習アルゴリズムを駆使し、ユーザーに精度の高い未来予測を提供します。政治選挙、経済動向、社会的出来事のいずれであっても、Forecast ...
11ヶ月前
03K
infinite-zoom-stable-diffusion:生成无限缩放循环视频

infinite-zoom-stable-diffusion: 無限ズームのループビデオを生成する。

包括的な紹介 無限ズーム安定拡散(Infinite Zoom Stable Diffusion)は、安定拡散技術を使用して無限ズームビデオを作成するために設計されたオープンソースプロジェクトです。このプロジェクトは、使いやすいColabノートブックを提供し、ユーザは...
7ヶ月前
03K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: 記憶、知識、ツールを備えたAIインテリジェンスの構築

包括的な紹介 PhiDataは、インテリジェントなAIアシスタントを開発するために設計されたフレームワークです。PhiDataは、拡張されたメモリ、知識統合、ツール呼び出し機能を通じて、AIアシスタントが長期的な会話を行い、正確なビジネスコンテキストを提供し、さまざまな操作を実行できるようにします。
5ヶ月前
03K
Seed-VC:支持少样本实时转换语音和歌声

Seed-VC:少ないサンプル数で音声と歌のリアルタイム変換に対応

概要 Seed-VCはPlachtaaによって開発されたGitHub上のオープンソースプロジェクトです。Seed-VCは、1秒から30秒のリファレンスオーディオを使用することができます。このプロジェクトは、リアルタイムの音声変換、ディレイ変換、音声合成をサポートしています。
5ヶ月前
03K
Vision is All You Need:使用视觉语言模型构建智能文档检索系统(Vision RAG)

必要なのは視覚だけ:視覚言語モデルを用いた知的文書検索システムの構築 (Vision RAG)

包括的な紹介 Vision-is-all-you-needは革新的なビジュアルRAG(Retrieval Augmented Generation)システム実証プロジェクトであり、文書処理領域にビジュアル言語モデリング(VLM)を適用する新境地を開くものである。従来のテキスト・チャンキング手法とは異なり、このシステムは直接、...
7ヶ月前
03K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

ロボ・ブロガー:ラングラフをもとに音声コンテンツからブログ記事を生成、ブログ執筆を自動化

はじめに ロボ・ブロガーは、音声読み上げ技術によってコンテンツ生成プロセスを簡素化するように設計された革新的なブログ作成ツールです。ユーザーはあらゆる音声テキスト変換アプリケーションを使ってアイデアを記録することができ、ロボ・ブロガーはそれらのアイデアを構造化されたブログコンテンツに変換します。
8ヶ月前
03K
Ragas:评估RAG召回QA准确率与答案相关性

ラガス:RAGリコールQA精度と回答の相関性を評価する

包括的な紹介 Ragasは、RAG(Retrieval Augmented Generation)システムの評価と最適化のために特別に設計されたツールです。Ragasは、クエリ、検索コンテキスト、生成された回答間の関係を分析することで、包括的な評価メトリクスのセットを提供します。これらのメトリクスには、忠実度、回答の関連性、コンテキストの関連性、...
7ヶ月前
03K
DH live:在30/40系显卡流畅实时交互的AI数字人

DHライブ: 30/40シリーズグラフィックスカードでスムーズなリアルタイムインタラクションを実現するAIデジタルピープル

一般的な紹介 DH_liveは、サンプルレスラーニングに基づいたリアルタイムのライブデジタルヒューマンプロジェクトで、スムーズでインタラクティブなライブストリーミング体験をユーザーに提供することを目的としています。このプロジェクトは、NVIDIA 30および40シリーズのグラフィックカードをサポートし、25fps以上でリアルタイムに実行することができます。ユーザーは...
9ヶ月前
03K
VITA:开源视觉与语音实时交互的多模态大语言模型

VITA: リアルタイム視覚・音声インタラクションのためのオープンソース・マルチモーダル大規模言語モデル

概論 VITAは、オープンソースの対話型マルチモーダル大規模言語モデリング・プロジェクトのリーダーであり、真の完全なマルチモーダル対話を実現する能力を開拓している。プロジェクトは2024年8月にVITA-1.0を立ち上げ、初のオープンソース対話型フルモーダル大規模言語モデルを開拓した。
7ヶ月前
03K
FramePainter:AI驱动的涂鸦式图像编辑工具

FramePainter:AIを搭載した落書き風画像編集ツール

概要 FramePainterは、高度なビデオ拡散技術と直感的なSketchコントロールを活用し、複雑な画像編集を簡単に実現できる画期的なAI駆動型画像編集ツールです。簡単な調整でも、複雑なクリエイティブな変換でも、FramePainter...
7ヶ月前
03K
StickerBaker:用AI制作个性贴纸图片

ステッカーベイカー:AIでパーソナライズされたステッカー画像を作る

概要 stickerbakerは、人工知能技術を使って様々な面白いステッカーを作成するオープンソースのステッカーメーカーです。シンプルな猫のステッカーが欲しい人も、多様なステッカーをシリーズで作りたい人も、stickerbakerはあなたのニーズに応えます...
11ヶ月前
03K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer:プロフェッショナル4コマ漫画イラスト作成ツール、画像生成、漫画ページ編集

概要 SP-MangaEditerは、マンガ制作者のために設計された独立したマンガ編集プラットフォームです。画像生成、レイヤー編集、画像調整、フィルター適用など様々な機能をサポートし、高品質なマンガイラストを簡単に作成することができます。ユーザーは簡単に操作することができます...
7ヶ月前
03K
RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用

RocketNotes: テキスト補完、ドキュメントダイアログ、セマンティック検索をサポートしたMarkdownメモアプリ

一般的な紹介 RocketNotesは、Large Language Model (LLM)駆動のテキスト補完、チャット、セマンティック検索機能を統合したウェブベースのMarkdownノートアプリケーションです。このプロジェクトは100%サーバーレスRAG (Re...
9ヶ月前
03K
RealtimeSTT:实时语音转文字工具,基于Whisper实现低延迟流式语音识别

RealtimeSTT: Whisperをベースとした低遅延ストリーミング音声認識のためのリアルタイム音声テキスト変換ツール

概論 RealtimeSTTは、高度な音声アクティビティ検出とウェイクワードアクティベーションを備えた、効率的で低レイテンシーのリアルタイム音声テキスト変換ライブラリです。Kolja Beigelによって開発され、高速で正確な音声テキスト変換を必要とするアプリケーションをサポートします。
7ヶ月前
03K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek:DeepSeekを使用して4年生の単語学習教材を作成するためのオープンソースツール

総合紹介 "Vocabulary Book by DeepSeek "はDeepSeekのビッグモデルに基づいて開発されたオープンソースプロジェクトで、英語学習者が大学英語レベル4(CET-4)の語彙を効率的に習得することを目的としています。プロジェクトはGitHubでホストされています...
6ヶ月前
03K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers:大規模モデル推論パフォーマンス・エンジン:極限の加速、柔軟な権限付与

KTransformers:大規模モデル推論のボトルネックを克服するための高性能Pythonフレームワーク。 KTransformersは、単なるモデル実行ツールにとどまらず、極めて優れたパフォーマンス最適化エンジンのセットであり、柔軟なインターフェース強化プラットフォームでもあります。 KTransf...
6ヶ月前
03K
Fay数字人框架:集成语言模型与3D数字角色,支持多种应用场景

Fayデジタルヒューマンフレームワーク:言語モデルと3Dデジタルキャラクターを統合し、様々なアプリケーションシナリオをサポート。

包括的な紹介 Fayはオープンソースの3Dバーチャルデジタルヒューマンフレームワークであり、バーチャルショッピングガイド、バーチャルキャスター、アシスタント、ウェイター、教師、音声またはテキストベースのモバイルアシスタントなど、様々なアプリケーションシナリオのための言語モデルとデジタルキャラクタを統合しています。
7ヶ月前
03K
MCP Server ChatSum:依赖MCP在Claude中查询和总结微信聊天消息

MCPサーバーChatSum: ClaudeでWeChatメッセージをクエリーし要約するためにMCPに頼る

一般的な紹介 MCPサーバー ChatSumは、ユーザーがチャットメッセージを照会し要約するために設計されたオープンソースプロジェクトです。このプロジェクトはGitHubでホストされており、ユーザーが特定のパラメータに基づいてチャットログを照会し、対応する要約を生成することができる強力なツールセットを提供します...
5ヶ月前
03K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道

uni-api: 軽量なビッグモデルAPIをOpenAIインターフェイスに変換。

包括的な導入フロントエンドなし、純粋な設定ファイルの設定APIチャネル。ただ、自分のAPIステーションを実行することができますファイルを書いて、ドキュメントには、詳細な設定ガイドを持っている、白フレンドリー。 uni-apiは、統一されたAPIプロジェクトを可能にする大規模なモデルの統一管理です。
9ヶ月前
03K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook:TypeScriptの完全なプロジェクトを迅速に構築し、反復するオープンソースのフルスタックAIエンジニア

Srcbookの概要 SrcbookはTypeScriptを中心としたアプリケーション開発プラットフォームであり、AIアシスタントを用いてWebアプリケーションを迅速に作成し、繰り返し実行できるように設計されている。ネイティブランタイムをサポートし、インタラクティブなノートブックインターフェースを提供し、バックエンドのコードを書いて実行することができる。
9ヶ月前
03K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS:画期的な音声生成・音声クローニングツール

総合紹介 GPT-SoVITSは、GPTモデルとSoVITSボイスチェンジャー技術を組み合わせたオープンソースの音声変換・合成ツールです。このツールは、0サンプルや数サンプルでのオンザフライテキスト音声変換や、わずか5秒間の音声サンプルでの音声スタイル移行をサポートしています。このツールの特徴には、言語横断的な音声合成が含まれます。
11ヶ月前
03K
Raycast-G4F:通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Raycastを通じてGPT-4、Llama-3、その他多くのAIモデルに無料でアクセスできます!

概論 Raycast-G4F(GPT4Free)は、GPT-4、Llama-3を含む幅広い先進的なAIモデルに無料でアクセスできる強力なRaycast拡張機能です。この拡張機能は、リアルタイムのダイアログストリーミングを提供するだけでなく...
7ヶ月前
03K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署

素晴らしいLLMアプリ:優れたオープンソースのLLMアプリを収集・探索し、コマンド1つで素早くデプロイできます!

概要 Awesome LLM Appsは、Shubham Sabooによって作成されたGitHubリポジトリで、素晴らしいLLM(大規模言語モデリング)アプリを幅広く集め、紹介することに特化しています。このリポジトリには、OpenAI、An...
8ヶ月前
03K
Promptimizer:优化大模型提示词的实验性库,自动优化 Prompt

Promptimizer: プロンプトを最適化するための実験的ライブラリ。

概論 Promptimizerは、AIシステムのキュー・ワードを体系的に改善するための実験的なキュー・ワード最適化ライブラリです。最適化プロセスを自動化することにより、Promptimizerは特定のタスクにおけるプロンプト語のパフォーマンスを向上させることができます。ユーザが必要とするのは...
9ヶ月前
03K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: 自然言語記述によるビデオ検索、編集、生成ワークフローのためのインテリジェントビデオエージェントフレームワーク

概要 Directorは、インテリジェントなビデオエージェントを構築することで、ビデオインタラクションとワークフローを簡素化し、最適化するために設計されたオープンソースのフレームワークです。このフレームワークは、VideoDBの "video-as-data "インフラストラクチャに基づいており、検索、編集、コンパイル、生成などの複雑なビデオタスクを処理することができます。
8ヶ月前
03K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: 高品質のヒューマンアクション動画を生成するオープンソースビデオモデル

概要 SkyReels-V1は、SkyworkAIチームによって開発されたオープンソースプロジェクトで、人間中心の高品質なビデオコンテンツを生成することに重点を置いている。このプロジェクトは、HunyuanVideoモデルに基づいています。
6ヶ月前
03K
Aider:开源编程助手工具,使用AI助手进行代码编写和文件编辑

Aider: オープンソースのプログラミングアシスタントツール。

一般的な紹介 Aiderは強力なオープンソースのAIプログラミングアシスタントツールで、開発者が自然言語対話を通してコードを書いたり、編集したり、リファクタリングしたりするのを助けます。対話型AIペアプログラミングツールとして、Aiderは多くの主要なプログラミング言語をサポートし、Gitにシームレスに統合することができます...
4ヶ月前
03K
RoomGPT:上传房间照片,使用AI重新设计

RoomGPT:部屋の写真をアップロードし、AIを使ってリデザインする!

概要 RoomGPTは、GitHubユーザーのNutlopeによって開発されたオープンソースプロジェクトで、ユーザーが部屋の写真をアップロードすると、人工知能技術を使ってその部屋のリデザインバージョンを生成することができる。このプロジェクトは、高額なデザイナー費用を支払うことなく、プロ級のインテリアデザインを利用できるようにすることを目的としている。
9ヶ月前
03K
MegaParse:解析各类型文档为LLM可用数据,完整保留文档中的表格、图片等所有信息

MegaParse:各タイプのドキュメントをLLMで利用可能なデータに解析し、表や写真などドキュメント内のすべての情報をそのまま保存する。

概論 MegaParseは、Large Language Model (LLM)のデータ処理を最適化するために設計された、パワフルで多機能な文書解析ツールです。MegaParseは、テキスト、PDF、PowerPointプレゼンテーション、Word文書など、どのような文書を扱う場合でも...
8ヶ月前
03K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk:インテリジェントな仕事検索アシスタント、自動履歴書配置(英語のみ)

概論 Auto_Jobs_Applier_AIHawkは、人工知能技術を用いた求人検索の自動化ツールである。短時間で大量の履歴書を自動配信し、個人情報や求職の意図に応じてパーソナライズすることができます。このツールは、求職者の転職意欲を...
8ヶ月前
03K
Devika:开源的AI软件工程师智能体,能够理解、拆分指令为子任务并编写代码

Devika:命令を理解し、サブタスクに分割してコードを書く、オープンソースのAIソフトウェアエンジニアの知能

一般的な紹介 Devikaは高度なAIソフトウェアエンジニアであり、人間の高度な指示を理解し、それをステップに分解し、関連する情報を研究し、与えられた目標を達成するためにコードを書く。大規模な言語モデル、計画・推論アルゴリズム、ウェブブラウジング機能を使って、インテリジェントにソフトウェアを開発する。
5ヶ月前
03K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense:コンピュータビジョンプロジェクトの効率を高める、無料で使える画像注釈ツール

概要 Make Senseは、コンピュータ・ビジョン・プロジェクト用のデータセットを素早く準備できるように設計された、無料のオンライン画像注釈ツールです。複雑なインストールは不要で、ブラウザからアクセスするだけで使用でき、複数のオペレーティングシステムをサポートし、小規模なディープラーニングプロジェクトに最適です。ユーザーは...
6ヶ月前
03K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想

TextDistiller:ワンクリックで本全体を要約し、本の内容を効率的に抽出し、核となるアイデアを素早く把握する。

包括的な紹介 TextDistillerは、章ごとに、または全体として本を要約し、簡潔でありながら包括的な概要を提供するように設計された高度なAI駆動型ツールです。TextDistillerを使うことで、ユーザーはどんな本でも、核心となるアイデアや重要なポイントを素早く把握することができます...
8ヶ月前
03K
Tabby:可集成到 VSCode 的本地自托管AI编程助手

Tabby: VSCodeに統合されたネイティブなセルフホストAIプログラミングアシスタント

一般的な紹介 TabbyはTabbyMLチームによって開発されたオープンソースのAIプログラミングアシスタントで、ユーザーはローカルまたはサーバー上に自分でデプロイすることができます。コードの自動補完やスマートQ&Aなど、GitHub Copilotのような機能を提供していますが、最大の特徴は...
4ヶ月前
03K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索

Hoarder: オープンソースのAIブックマーク管理ツール、複数フォーマット対応、インテリジェントタグ分類、全文検索

概要説明 Hoarderは、リンク、メモ、PDF、画像の保存をサポートするセルフホストブックマーク管理ツールです。自動タグ付けにAI技術を使用し、全文検索機能を提供します。ユーザーはChromeプラグインとFirefoxプラグインを使用することができます...
8ヶ月前
03K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream:画像手がかり語のバッチバックプロパゲーションのためのオープンソースの軽量視覚言語モデル

包括的な紹介 Moondreamは、ディープラーニングとコンピュータビジョン技術による画像記述機能を実現するために設計された、オープンソースの軽量視覚言語モデルです。このモデルは、様々なプラットフォーム上で効率的に実行することができ、特にエッジデバイスに適しています。
7ヶ月前
03K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo:ソースコード閲覧ツール。LLMを使ってコードを分析し、詳細なコード解説を提供する。

一般的な紹介 askrepoは、LLM(Large Language Model)に基づいたソースコードリーディングツールです。指定されたディレクトリにあるGitで管理されたテキストファイルの内容を読み込み、Google Gemini APIに送信して、指定されたプロンプトに基づいた質問への回答を提供することができます...
9ヶ月前
03K
Fabric:集成众多提示词的AI开源工作流框架,高效处理各种事务

ファブリック:AIオープンソースのワークフローフレームワークで、多くのキューワードを統合し、様々なトランザクションを効率的に処理する。

概論 ファブリックは、ダニエル・ミースラーによって開発されたオープンソースのAIフレームワークで、日常的なコンピュータ・タスクを簡素化・自動化し、人工知能を使いやすくすることを目的としている。モジュール設計とあらかじめ定義されたプロンプトワード(パターン)によって、ユーザーを効率的に支援する。
10ヶ月前
03K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG:マルチモーダル検索と知識グラフ構築をサポートする超長尺動画理解のためのRAGフレームワーク

包括的な紹介 VideoRAGは、非常に長い文脈動画を処理し理解するために設計された、検索機能を強化した生成フレームワークです。このツールは、グラフ駆動のテキスト知識ベースと階層的なマルチモーダルコンテキストエンコーディングを組み合わせ、1つのNVIDIA RTX 3090 GPUで効率的に処理します...
6ヶ月前
03K
DocsGPT:文档聊天助手,从单个文档、网站来源获取可靠的答案,支持本地部署

DocsGPT: ドキュメントチャットアシスタント、1つのドキュメント、ウェブソースから信頼できる回答を得る、ローカル展開をサポート

概要 DocsGPT はオープンソースのドキュメントアシスタントで、プロジェクトドキュメントのクエリプロセスを簡素化するように設計されています。強力な GPT モデルを統合することで、開発者はプロジェクトに関する質問を簡単に行い、正確な回答を得ることができます。
9ヶ月前
03K
Chonkie:轻量级RAG文本切块库

Chonkie: 軽量なRAGテキストチャンキングライブラリ

包括的な紹介 Chonkieは軽量で効率的なRAG(Retrieval-Augmented Generation)テキストチャンキングライブラリで、開発者が素早く簡単にテキストをチャンキングできるように設計されています。このライブラリは、... を含む様々なチャンキング手法をサポートしています。
6ヶ月前
03K
Sonic:音频驱动肖像图片生成面部表情生动的数字人口播视频

ソニック:音声でポートレート画像を生成し、生き生きとした表情のデジタルデモ映像を制作

概要 Sonicは、グローバルな音声知覚に焦点を当てた革新的なプラットフォームであり、音声によって駆動される鮮やかなポートレートアニメーションを生成することを目的としている。テンセントと浙江大学の研究チームによって開発されたこのプラットフォームは、音声情報を使って表情や頭の動きを制御し、自然で滑らかなアニメーション動画を生成する。
4ヶ月前
03K
BrushEdit:腾讯ARC发布的图像修复和编辑的全能工具

BrushEdit:画像修復・編集のオールインワンツール、テンセントアークがリリース

総合紹介 BrushEditは、Tencent ARC Labsが開発したオールインワンの画像修復・編集ツールです。このツールは最新のAI技術に基づいており、画像の欠陥を自動的に識別して修復することができ、ユーザーによるインタラクティブな編集もサポートしています。
8ヶ月前
03K
xyks:小猿口算逆向笔记,逆向工程与解密算法

xyks:小型猿口計算リバースノート、リバースエンジニアリング、復号アルゴリズム

包括的な紹介 猿の口計算機リバースノートは、猿の口計算機アプリケーションのリバースエンジニアリングのプロセスと方法を文書化し、共有することを目的としたオープンソースプロジェクトです。このプロジェクトには、Fridaやdexdumpなどの命令を使用するための様々なリバースツールやテクニックが含まれています。
10ヶ月前
03K
Unsloth:高效微调和训练大语言模型的开源工具

Unsloth: 大規模言語モデルの効率的な微調整と学習のためのオープンソースツール

包括的な紹介 Unslothは、大規模言語モデル(LLM)の微調整と学習のための効率的なツールを提供するために設計されたオープンソースプロジェクトです。このプロジェクトは、Llama、Mistral、Phi、Gemmaなどの有名なモデルをサポートしています。
6ヶ月前
02.9K
Second Me:本地训练拥有个人记忆和习惯的AI分身

セカンド・ミー:個人的な記憶と習慣を持つ、現地で訓練されたAIドッペルゲンガー

Second MeはMindverseチームによって開発されたオープンソースプロジェクトで、あなたのコンピューター上に「デジタル・ドッペルゲンガー」のような働きをするAIを作り、あなたの言葉や記憶を通してあなたの話し方や癖を学習し、あなたのことを理解する賢い人間になることができる。
5ヶ月前
02.9K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体

SciToolAgent: 500以上の研究ツールを統合し、研究と科学的タスクを自動化するインテリジェンス

包括的な紹介 SciToolAgentは、杭州にある浙江大学のイノベーションセンター(HICAI-ZJU)によって開発されたオープンソースのツールプラットフォームです。ナレッジグラフ(SciToolKG)とビッグランゲージモデリング技術を通じて500以上の科学ツールを統合し、研究者が...
5ヶ月前
02.9K
Yek:读取git仓库文本文件并快速分块,以供大模型使用

Yek: git リポジトリのテキストファイルを読み込んで、大規模なモデルのために素早くチャンキングする。

一般的な紹介 Yekは、リポジトリやディレクトリからテキストファイルを読み込んでチャンキングし、大規模言語モデル(LLM)で使用するためにシリアライズするRustベースの高速ツールです。このツールはデフォルトで .gitignore ルールを使って不要なファイルをスキップし、...
7ヶ月前
02.9K
HiOllama:与本地Ollama模型交互的简洁聊天界面

HiOllama: Ollamaのネイティブ・モデルと対話するためのクリーンなチャット・インターフェース

概論 HiOllamaは、PythonとGradioで構築されたユーザーフレンドリーなインターフェースで、Ollamaモデルと対話するために設計されています。リアルタイムのテキスト生成とモデル管理機能をサポートし、シンプルで直感的なウェブインターフェースを提供します。ユーザーは、温度などのパラメーターを調整することができます。
9ヶ月前
02.9K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕

YTSage: YouTubeダウンローダー、YouTubeビデオを無料ダウンロード、音声抽出、字幕取得

概要 YTSageは、クリーンなPyQt6インターフェイスを備えたモダンなYouTubeダウンロードツールです。ユーザーはYTSageを使って、あらゆる画質の動画をダウンロードし、音声を抽出し、字幕を取得し(自動生成字幕を含む)、動画のメタ情報を表示することができます。
8ヶ月前
02.9K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口

simple-one-api:様々な無料の大規模モデルAPIをワンクリックで統合、統一された外部OpenAIインターフェース

総合紹介 simple-one-apiは、複数のビッグモデルAPIの統合を簡素化するために設計されたオープンソースプロジェクトです。Thousand Sails Big Model Platform、Xunfei Starfire Big Model、Tencent Mixed Element、MiniMax、Deep-Seek...などのOpenAI互換APIをサポートしています。
9ヶ月前
02.9K
DCT-Net:照片和视频转绘为动漫风格化的开源工具

DCT-Net:写真やビデオをスタイリッシュなアニメに変換するオープンソースツール

概説 DCT-Netは、DAMOアカデミーと北京大学王宣コンピューター技術研究所によって開発されたオープンソースプロジェクトで、画像のアニメスタイル変換を目的としている。このプロジェクトは、ディープラーニング技術を活用し、ドメインキャリブレーション翻訳(Domain-Calibrat...
7ヶ月前
02.9K
E2B:安全云沙箱中的AI代码运行平台

E2B: 安全なクラウドサンドボックスでAIコードを実行するプラットフォーム

概要 E2Bは、AIが生成したコードを安全なクラウドサンドボックスで実行するために設計されたオープンソースプラットフォームです。幅広いプログラミング言語とフレームワークをサポートし、コード実行のセキュリティと信頼性を確保するために隔離された仮想環境を提供します。E2Bは、データ分割を含む様々なAIアプリケーションシナリオに適しています。
7ヶ月前
02.9K
Fish Agent:端到端AI语音克隆助手,实时语音对话助理,Fish Speech衍生项目

フィッシュ・エージェント:エンド・ツー・エンドのAIボイス・クローン・アシスタント、リアルタイム音声対話アシスタント、フィッシュ・スピーチ・スピンオフ・プロジェクト

包括的な紹介 フィッシュ・スピーチ派生プロジェクト フィッシュ・エージェントは、V0.1 3Bモデル・アーキテクチャに基づいて開発された、革命的なエンド・ツー・エンドのAIスピーチ・クローン・システムです。完全なエンド・ツー・エンドの音声クローン処理システムとして、その最大の特徴は、革新的なスピーチレス...
7ヶ月前
02.9K
EasyControl:将人像转为吉卜力风格图像的免费工具

EasyControl:ポートレートをジブリ風に変身させる無料ツール

概要 EasyControlはオープンソースプロジェクトであり、効率的で柔軟な画像生成制御を提供する拡散変換器(DiT)アーキテクチャに基づいています。その中でも、ジブリ・コントロールLoRAは特別な機能の一つで、たった100個のサブ...
4ヶ月前
02.9K
HivisionIDPhotos:开源智能AI证件照制作工具

HivisionIDPhotos:オープンソースのスマートAI写真ID作成ツール

包括的な紹介 HivisionIDPhotosは、オープンソースの軽量AI文書写真制作ツールであり、インテリジェントに様々な仕様に沿って標準的な文書の写真を生成するために、ユーザーの写真のシーンとキーイングを識別することができます。このツールは、カスタムの背景色とサイズをサポートし、将来的には、美しさと...
11ヶ月前
02.9K
ANP:实现智能代理间安全高效通信的开源协议

ANP: インテリジェントエージェント間の安全で効率的な通信のためのオープンソースプロトコル

概要 AgentNetworkProtocol(略してANP)は、GitHubでホストされているオープンソースのプロトコルプロジェクトで、インテリジェントエージェント(AIエージェント)に安全で効率的な通信ソリューションを提供することに焦点を当てている。このプロトコルは、アイデンティティと暗号化という3つのレイヤーから構成されています。
5ヶ月前
02.9K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor:GitHubのための知識ベース+LLM駆動インテリジェントコードレビューメンター

包括的な紹介 CR-Mentorは、専門的な知識ベースと大規模言語モデリング(LLM)のパワーを組み合わせたインテリジェントなコードレビューツールです。すべてのプログラミング言語のコードレビューをサポートするだけでなく、ナレッジベースに蓄積されたベストプラクティスに基づき、チーム専用のレビュー基準やフォーカスエリアをカスタマイズします。ナレッジベースを通じて...
9ヶ月前
02.9K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: ツリーベースの会話を可視化するAIチャットインターフェース

概要 TreeGPTは、Next.jsをベースとしたオープンソースのチャットアプリケーションです。大規模な言語モデル(LLM、GPTなど)の会話を、ツリーグラフ構造(有向非循環グラフ、DAG)を通して可視化することに重点を置き、従来の直線的なチャット手法に取って代わることで、スピードと...
6ヶ月前
02.9K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本

NVインジェスト:複雑なフォーマットのドキュメントを解析し、マルチモーダルデータをメタデータとテキストに抽出する。

包括的な紹介 NV Ingest (NVIDIA Ingest)は、何十万もの複雑で厄介な非構造化PDFやその他の企業ドキュメントを解析するために設計された、早期アクセス可能なマイクロサービス群です。これらのドキュメントをメタデータとテキストに変換し、検索に埋め込むことができます...
7ヶ月前
02.9K
R2R:多模态内容解析并结合知识图谱与混合搜索的先进AI检索(RAG)系统

R2R: マルチモーダルコンテンツを解析し、知識グラフとハイブリッド検索を組み合わせた高度AI検索(RAG)システム

包括的な紹介 R2R (RAG to Riches)は、RAG (Retrieval Augmented Generation)機能をサポートする先進的なAI検索システムで、本番環境ですぐに使える機能を備えています。コンテナ化されたRESTful API上に構築されたこのシステムは、マルチモーダルコンテンツの解析、ハイブリッド検索機能を提供します。
8ヶ月前
02.9K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk:パソコンにAIモデルとチャットインターフェースをワンクリックインストール(DeepSeekとの共同開発)

一般的な紹介 AingDeskは、ユーザーがローカルコンピュータ上で様々なAIモデルを簡単にデプロイし、実行できるように設計されたオープンソースのフリーソフトウェアです。DeepSeekでもLlamaモデルでも、AingDeskはシンプルなステップ・バイ・ステップを可能にします。
6ヶ月前
02.9K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate:よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API

概要 Orateは、音声生成と文字起こしに特化したAIツールキットです。Orateは、OpenAI、ElevenLabs、AssemblyAIなどの主要なAIプロバイダーとシームレスに統合する統一APIを提供し、ユーザーが強制的に音声を作成できるようにします。
6ヶ月前
02.9K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita:モジュラーRAGアプリケーションを構築し、多様なRAG戦略を迅速にテストするためのオープンソースフレームワーク

包括的な紹介 Cognitaは、RAG(Retrieval-Augmented Generation)ベースのアプリケーションの開発を簡素化するためにTrueFoundry社によって開発されたオープンソースのフレームワークです。このフレームワークは、構造化されたモデ...
7ヶ月前
02.9K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: ワークフローを効率化するComfyUIのユーザーフレンドリーなインターフェース

概要 ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ワークフローの作成に代わるユーザーインターフェースを提供することで、ワークフローの実行を簡素化することを目的としています。
7ヶ月前
02.9K
Muyan-TTS:个性化播客语音训练与合成

Muyan-TTS:パーソナライズされたポッドキャストの音声トレーニングと合成

Synthesis Muyan-TTSは、ポッドキャスティングシナリオ用に設計されたオープンソースのテキスト音声合成(TTS)モデルです。100,000時間以上のポッドキャストオーディオデータで事前にトレーニングされており、ゼロサンプル音声合成をサポートし、高品質の自然な音声を生成します。このモデルはLlama-3.2-3...をベースにしています。
3ヶ月前
02.9K
Kolors:生成高质量图像的文本到图像模型,支持生成中文海报

Kolors: 高品質画像生成のためのテキスト画像変換モデル、中国語ポスター生成もサポート

包括的な紹介 Kolorsは、Racerチームによって開発された、ポテンシャル拡散技術に基づく大規模なテキスト画像生成モデルです。このモデルは、数十億のテキスト-画像データのペアで学習され、中国語と英語の両方の入力をサポートし、高品質で複雑な意味的に正確な画像を生成することができます。
8ヶ月前
02.9K
XRAG:优化检索增强生成系统的可视化评估工具

XRAG:検索機能拡張生成システムの最適化のための視覚的評価ツール

包括的な紹介 XRAG(eXamining the Core)は、高度な検索機能拡張生成(RAG)システムの基本コンポーネントを評価するために設計されたベンチマークフレームワークです。各コアモジュールのプロファイリングと分析により、XRAGは、異なる構成やコンポーネントがRAGにどのような影響を与えるかについての情報を提供します。
7ヶ月前
02.9K
Supermemory:导入书签和网页内容构建个人知识库

スーパーメモリー:ブックマークやウェブコンテンツをインポートして個人の知識ベースを構築する

概論 Supermemoryは、ユーザーが「第二の脳」を構築することを支援するために設計されたオープンソースプロジェクトである。強力なChrome拡張機能とAI技術により、ユーザーはウェブページやTwitterのブックマークから簡単にデータを保存、整理、取得することができます。
6ヶ月前
02.9K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot:オープンソースの大型モデルインスタントメッセージングロボット、複数のWeChat、QQ、Flybookと他のマルチプラットフォームのAIロボットの展開をサポートしています。

LangBotは、複数のメッセージングプラットフォームと大型モデルをサポートする大型モデルベースのインスタントメッセージングボットプラットフォームです。このプラットフォームはQQ、WeChat(企業WeChat、個人WeChat)、Flybook、Discord、OneBotなどのメッセージングプラットフォームに適応し、Open...
6ヶ月前
02.9K