AIオープンソースプロジェクト

合計1020記事

順番に並べる

目を通すブックマーク

MedRAX：マルチモーダル・マクロモデルを用いた胸部X線写真解析のためのインテリジェントボディ

包括的な紹介 MedRAXは、胸部X線（CXR）解析用に設計された最先端のAIインテリジェンスです。最先端のCXR解析ツールとマルチモーダル大規模言語モデルを統合し、追加トレーニングなしで複雑な医療クエリを動的に処理します。

1年前

087.1K

小説：Notion AIを模倣したオープンソースのライティング・エディター

包括的な紹介これは、Steven Teyによって開発されたオープンソースプロジェクトで、Novelと呼ばれ、NotionスタイルのWYSIWYGテキストエディタであり、ユーザーがテキスト入力の効率を向上させることができる統合されたAIの自動補完機能です。このプロジェクトは、詳細なドキュメントとインストール手順を提供します。

2年前

087.1K

GenXD: 任意の3Dおよび4Dシーンのビデオを生成するためのオープンソースフレームワーク

一般的な紹介 GenXDは、シンガポール国立大学（NUS）とMicrosoftチームによって開発されたオープンソースプロジェクトです。GenXDは、任意の3Dおよび4Dシーンを生成することに重点を置き、データ不足やモデル設計の複雑さによる現実世界の3Dおよび4D生成の問題を解決する。このプロジェクトは、...

1年前

087.1K

SmartRead: PDF技術文書に自動的に注釈を付け、関連する引用を提供

包括的な紹介 SmartReadは、技術文書向けに設計されたAIベースのオープンソースツールです。PDFファイルを自動的に分析し、重要な用語、タイトル、核となるアイデアなどの重要なコンテンツをマークし、ユーザーが複雑な文書を素早く理解できるようにします。同時に、主な内容を提供し、文書化することもできます。

1年前

087.1K

ChatGPTサービス劣化監視ツール: ChatGPTサービス劣化の検出

包括的な紹介 ChatGPTサービス劣化監視ツールは、ChatGPTサービスがハイリスクIPによって劣化しているかどうかを検出するために設計されたオープンソースプロジェクトです。このツールは、Proof of Work (PoW) の難易度の値を分析し、ユーザ...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

087K

PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

包括的な紹介 PRAG（Parametric Retrieval-Augmented Generation）は、大規模言語モデル（LLM）のパラメータ空間に直接埋め込むことで、外部知識の生成を強化することを目的とした革新的な検索拡張生成ツールである。

1年前

086.9K

AI Dev Gallery：Windows本地AI模型开发工具集，端侧模型集成到Windows应用

AI Dev Gallery: WindowsネイティブAIモデル開発ツールセット、Windowsアプリケーションへのエンドサイドモデルの統合

概論 AI Dev Galleryは、Windows開発者向けに設計されたマイクロソフトのAI開発ツールアプリケーション（現在パブリックプレビュー中）である。開発者がAI機能を簡単にWindo...

2年前

086.9K

Higress：マイクロサービスの管理を簡素化し、セキュリティを強化する効率的なAIゲートウェイ・ソリューションの提供

総合紹介 Higressはアリババが開発したクラウドネイティブなAPIゲートウェイで、IstioとEnvoyをベースに構築され、効率的なトラフィックスケジューリング、サービスガバナンス、セキュリティソリューションを提供するように設計されている。複数のプログラミング言語に対応したWasmプラグイン拡張機能をサポートし、AIビジネス...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

086.9K

Mini LLM Flow：使用100行代码构建“有向图结构”的LLM微型智能体

ミニLLMフロー：100行のコードで「有向グラフ構造」を持つLLMミニインテリジェントを構築する

概論 miniLLMFlowは、「シンプルであること」という設計哲学を実証する、わずか100行のコアコードからなる最小主義の大規模言語モデル（LLM）開発フレームワークです。このフレームワークは、AIアシスタント（ChatGPT、Claudeなど）が...

2年前

086.9K

Agentic Security：开源的LLM漏洞扫描工具，提供全面的模糊测试和攻击技术

Agentic Security: オープンソースのLLM脆弱性スキャンツール。

概要 Agentic Securityは、開発者やセキュリティ専門家に包括的なファズテストと攻撃技術を提供するために設計されたオープンソースのLLM（Large Language Model）脆弱性スキャンツールです。このツールは、カスタムルールセットやエージェントベースの攻撃をサポートし、LLM APを統合することができます。

1年前

086.8K

VBDeepSeek：DeepSeekを使用して4年生の単語学習教材を作成するためのオープンソースツール

総合紹介 "Vocabulary Book by DeepSeek "はDeepSeekのビッグモデルに基づいて開発されたオープンソースプロジェクトで、英語学習者が大学英語レベル4（CET-4）の語彙を効率的に習得することを目的としています。プロジェクトはGitHubでホストされています...

1年前

086.8K

OAK: インテリジェント・ボディ・アプリケーションを視覚的に構築するためのオープンソース・プロジェクト

概論 OAK（Open Agent Kit）は、開発者がAIインテリジェンスを迅速に構築、カスタマイズ、デプロイするためのオープンソースツールです。OpenAI、Google、Anthropic...などの大規模言語モデル（LLM）を接続することができます。

1年前

086.8K

Text generation web UI：基于 Gradio 大语言模型聊天界面，支持多种后端服务

テキスト生成ウェブUI：複数のバックエンド・サービスをサポートするGradioベースの大規模言語モデル・チャット・インターフェース

概論テキスト生成ウェブUIは、大規模言語モデル（LLM）のために設計されたGradioベースのウェブUIです。Transformers、llama.cp...を含む様々なテキスト生成バックエンドをサポートしています。

2年前

086.8K

OpenAI WebRTC Python：与OpenAI实时API进行语音交互的Python库

OpenAI WebRTC Python: OpenAIリアルタイムAPIと音声対話するためのPythonライブラリ

包括的な紹介 OpenAI Realtime WebRTC Pythonは、OpenAI Realtime APIを使った音声インタラクションの完全なソリューションを開発者に提供する、プロフェッショナルなPythonライブラリです。このプロジェクトは、低遅延を可能にするWebRTC技術に基づいています...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

086.8K

VoAPI：高付加価値AIモデル転送インターフェース管理システム、公式サイトがAPI枠を毎日無料提供

総合紹介 VoAPIは、知名度が高く高性能な新しいAIモデルインターフェース管理・配信システムであり、主に個人または企業の内部管理と配信チャネルに使用されます。NewAPIに基づいて開発されたこのシステムは、豊富な機能モジュールと最適化されたユーザーインターフェースを提供します。

2年前

086.8K

小説を自動的にクロールし、多文字のオーディオブックを生成するツール

概論 Auto-Audio-BookはGitHubでホストされているオープンソースプロジェクトです。ウェブサイトから小説の内容を自動的にクロールし、複数のキャラクターの声を持つオーディオブックに変換します。開発者 zqq-nuli Python 3.1...

1年前

086.7K

MarkPDFDown: マルチモーダルモデルに基づくPDFからMarkdownへの変換

概要 MarkPDFDownはオープンソースのツールです。Multimodal Big Language Modelを使ってPDFファイルをMarkdown形式に変換します。開発者はGitHubユーザーのjorbenです。このツールの目的はシンプルです：PDFドキュメントを...

1年前

086.7K

LAMBDA：下書きメール（Gmail）の返信を迅速に生成するローカライズされたAIメール自動化システム

概要 LAMBDA（Local Auto MailBox Draft Assistant）は、ユーザーのメールスタイルから学習し、Gmailの受信トレイにある未読メールすべてに下書きを生成するように設計された、ローカライズされたAIメール自動化システムです...

2年前

086.7K

オーケストラ：より簡単で効率的なマルチインテリジェンス共同開発のためのスマートAIチーム構築

Orchestraは革新的な軽量Pythonフレームワークで、大規模言語モデル（LLM）に基づくマルチインテリジェンス協調システムの構築に重点を置いています。複数のAI知能が交響楽団のように調和して動作するように、知能を配置する独自の方法を採用している。モデル化することで ...

2年前

086.7K

Director：智能视频代理框架，用自然语言描述执行视频搜索、编辑和生成工作流

Director: 自然言語記述によるビデオ検索、編集、生成ワークフローのためのインテリジェントビデオエージェントフレームワーク

概要 Directorは、インテリジェントなビデオエージェントを構築することで、ビデオインタラクションとワークフローを簡素化し、最適化するために設計されたオープンソースのフレームワークです。このフレームワークは、VideoDBの "video-as-data "インフラストラクチャに基づいており、検索、編集、コンパイル、生成などの複雑なビデオタスクを処理することができます。

2年前

086.7K

Quick Prompt: プロンプトを素早く管理・使用するためのブラウザ拡張機能

General Quick Promptはプロンプトの管理と高速入力に特化したオープンソースのブラウザ拡張機能です。ユーザーはプロンプトのライブラリを作成、整理、保存し、プリセットされたプロンプトコンテンツをウェブページの入力ボックスに素早く挿入することができます。このツールは特に...

1年前

086.7K

WritingBench：大規模モデルのライティング能力をテストするベンチマーク評価ツール

概要 WritingBenchはX-PLUGチームによって開発され、GitHubでホストされているオープンソースプロジェクトである。大規模なモデルのライティング能力をテストするために設計されたツールで、1239の実世界のライティングタスクを提供する。これらのタスクは...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

086.6K

DiffPortrait360: 1枚のポートレートから360度のヘッドビューを生成

概論 DiffPortrait360はオープンソースプロジェクトであり、CVPR 2025の論文 "DiffPortrait360: Consistent Portrait Diffusion for 360... "に関連している。

1年前

086.6K

Cloudflare WorkersにおけるMCPサービスの迅速な展開

概要 Cloudflare Workers MCPはCloudflareによって開発され、GitHubでホストされているオープンソースプロジェクトです。

1年前

086.6K

Deep Finder: 局所的知識を利用した深層推論検索のためのオープンソースプロジェクト

包括的な紹介 Deep Searcherは、大規模言語モデル（LLM）とベクトルデータベースを組み合わせた強力なツールで、プライベートデータに基づいて検索、評価、推論を行い、精度の高い回答と包括的なレポートを提供するように設計されています。企業のナレッジマネジメントに適しています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

086.6K

Step-Video-T2V：多言語入力とロングビデオ生成をサポートするVincennesビデオモデル

総合紹介 Step-Video-T2VはStepFun AI (StepFun Star)による先進的なテキストから動画への変換モデルです。このモデルは30億のパラメータを持ち、最大204fpsの動画を生成することができます。深く圧縮された可変オートエンコーダ（VAE）により、このモデルは...

1年前

086.5K

Moondream：画像手がかり語のバッチバックプロパゲーションのためのオープンソースの軽量視覚言語モデル

包括的な紹介 Moondreamは、ディープラーニングとコンピュータビジョン技術による画像記述機能を実現するために設計された、オープンソースの軽量視覚言語モデルです。このモデルは、様々なプラットフォーム上で効率的に実行することができ、特にエッジデバイスに適しています。

2年前

086.5K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

テキスト抽出 API (text-extract-api): テキスト情報の視覚的抽出、匿名化 PDF 抽出ツール

包括的な紹介テキスト抽出API（text-extract-api）は、さまざまな文書形式（PDF、Word、PPTXなど）からコンテンツを抽出し、解析するために設計された強力なツールです。このAPIは、最先端の光学式文字認識（OCR）技術とOl...

2年前

086.4K

askrepo：源代码阅读工具，使用LLM分析代码，提供详细代码解释，支持多种编程语言

askrepo：ソースコード閲覧ツール。LLMを使ってコードを分析し、詳細なコード解説を提供する。

一般的な紹介 askrepoは、LLM（Large Language Model）に基づいたソースコードリーディングツールです。指定されたディレクトリにあるGitで管理されたテキストファイルの内容を読み込み、Google Gemini APIに送信して、指定されたプロンプトに基づいた質問への回答を提供することができます...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

086.3K

PicMenu：テキストメニューを美しいグラフィックメニューに変換する

総合紹介 PicMenuは、簡単な写真操作で従来の紙メニューを鮮やかで直感的な画像メニューに変換する革新的なAIツールです。各料理の高画質画像を自動生成するだけでなく、料理に関する豊富な情報を提供し、外食産業のデジタル変革に貢献します...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

086.3K

GPT4Free: 複数のGPTモデルを自由に使用するためのAI対話ウェブサイトのインターフェイスをデコンパイルします。

GPT4Freeの概要 GPT4Freeは、開発者のxtekkyがGitHubで公開したオープンソースプロジェクトで、GPT-3.5、GPT-4、Llama、Gemini-Pro、Bar...など、さまざまな強力な言語モデルを無料で提供することを目的としています。

2年前

086.3K

MoshiVis: リアルタイムの音声対話と画像理解のためのオープンソースモデル

一般的な紹介 MoshiVisはKyutai Labsによって開発され、GitHubでホストされているオープンソースプロジェクトです。MoshiVisはMoshi speech-to-text model (7Bパラメータ)をベースにしており、約2億600万個の新しい適応パラメータと凍結されたPal...

1年前

086.2K

MCP Server ChatSum：依赖MCP在Claude中查询和总结微信聊天消息

MCPサーバーChatSum: ClaudeでWeChatメッセージをクエリーし要約するためにMCPに頼る

一般的な紹介 MCPサーバー ChatSumは、ユーザーがチャットメッセージを照会し要約するために設計されたオープンソースプロジェクトです。このプロジェクトはGitHubでホストされており、ユーザーが特定のパラメータに基づいてチャットログを照会し、対応する要約を生成することができる強力なツールセットを提供します...

1年前

086.2K

MeetingMind：依赖OpenAI Whisper的开源智能会议记录与总结工具

MeetingMind: OpenAI Whisperを利用したオープンソースのインテリジェント会議記録・要約ツール

はじめに MeetingMindは、ビジネスミーティングの記録と要約の効率を改善するために設計された高度なAIアプリケーションです。このアプリは、OpenAIのWhisperテクノロジーを統合して正確な音声テキスト化を実現し、IBM Watso...

2年前

086.2K

PrimisAI Nexus：スケーラブルなAIマルチインテリジェンスシステムとタスク自動化のための軽量フレームワーク

概要 PrimisAI Nexusは、GitHubでホストされている軽量なオープンソースのPythonフレームワークで、PrimisAIチームによって開発されています。大規模言語モデリング（LLM）を通じて、スケーラブルなAIマルチインテリジェント体システムの構築と管理を支援することを目的としており、...

1年前

086.2K

Aisuite: 統一されたOpenAIインターフェーススタイルで複数のビッグモデルを呼び出し、高速なモデル切り替えと比較テストを実現

包括的な紹介 aisuiteは、開発者が複数の生成AIプロバイダーのサービスを簡単に呼び出せるように設計された、シンプルで統一されたインターフェースです。OpenAIに似たインターフェースを持つaisuiteは、最も人気のあるLLM（大規模言語モデル）との対話を容易にします...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

086.2K

SiteMCP：ウェブサイトのコンテンツをクローリングし、MCPサービスに変える

概論 SiteMCPは、ウェブサイト全体のコンテンツをクロールし、MCP（Model Context Protocol）サーバーに変換することを中核機能とするオープンソースツールで、AIアシスタント（Claude Desktopなど）が直接...

1年前

086.1K

RAIN：アニメ映像のビデオストリームを生成するためのリアルタイムの人間の表情のキャプチャ

概論 RAIN（Real-time Animation Of Infinite Video Stream）は、無限のビデオストリームのアニメーション効果をリアルタイムで生成するために設計されたオープンソースプロジェクトである。このプロジェクトはPscgylottiによって開発されました。

2年前

086K

AIEvo：マルチインテリジェントな協調アプリケーションを作成するための効率的なフレームワーク

概要 AIEvoは、Ant Groupのオープンソースマルチエージェントフレームワークで、マルチエージェントアプリケーションを効率的に作成するために設計されています。このフレームワークは、複雑なタスクの実行成功率を向上させるために、 SOPタスクグラフに厳密に従います。また、フィードバックと監視機構により、高い柔軟性とスケーラビリティを保証します。

2年前

086K

Raycast-G4F：通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

Raycast-G4F: Raycastを通じてGPT-4、Llama-3、その他多くのAIモデルに無料でアクセスできます！

概論 Raycast-G4F（GPT4Free）は、GPT-4、Llama-3を含む幅広い先進的なAIモデルに無料でアクセスできる強力なRaycast拡張機能です。この拡張機能は、リアルタイムのダイアログストリーミングを提供するだけでなく...

2年前

086K

Cognita：モジュラーRAGアプリケーションを構築し、多様なRAG戦略を迅速にテストするためのオープンソースフレームワーク

包括的な紹介 Cognitaは、RAG（Retrieval-Augmented Generation）ベースのアプリケーションの開発を簡素化するためにTrueFoundry社によって開発されたオープンソースのフレームワークです。このフレームワークは、構造化されたモデ...

2年前

085.9K

RLAMA: コマンドラインから操作するローカルドキュメントのインテリジェントなクイズのためのRAGシステム

一般的な紹介 RLAMAはDonTiziによってオープンソースで開発され、GitHubでホストされている文書インテリジェンスクイズRAG(Retrieval Augmentation Generation)システムである。ユーザは簡単なターミナルコマンドを使って、ローカルの...

1年前

085.9K

Crawlee: Node.jsによる信頼性の高いWebクローラとブラウザ自動化ツールの構築

一般的な紹介 CrawleeはApifyによって開発されたオープンソースのウェブクローラーとブラウザ自動化ライブラリで、Node.js環境用に設計されています。JavaScriptとTypeScriptをサポートしており、Puppeteer...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

085.9K

Magic 1-For-1: 高效生成视频的开源项目，号称在一分钟内生成一分钟的视频

Magic 1-For-1：1分で1分の動画を生成すると謳う、効率的な動画生成オープンソースプロジェクト

包括的な紹介 Magic 1-For-1は、メモリ使用量を最適化し、推論の待ち時間を短縮するために設計された効率的なビデオ生成モデルである。このモデルは、テキストから動画への生成タスクを、テキストから画像への生成と画像から動画への生成という2つのサブタスクに分解し、より効率的な学習と蒸留を可能にする。

1年前

085.8K

HunyuanVideoGP：ローエンドGPU動作をサポートするハイブリッドビデオ生成モデル

一般的な紹介 HunyuanVideoGPは、DeepBeepMeepによって開発され、ローエンドGPUユーザー向けに設計された大規模ビデオ生成モデルです。このモデルは、オリジナルのHunyuan Videoモデルの改良版であり、メモリとグラフィックメモリの要件を大幅に削減します。

1年前

085.8K

Cerebr：ウェブコンテンツと対話するオープンソースのブラウザ・プラグイン

概要説明 Cerebrは、生産性と学習体験を向上させるために設計された、Chrome用の強力なAIアシスタント拡張機能です。Cerebrは、クリーンで効率的なブラウザAIアシスタントの必要性からゼロから設計され、ミニマルなデザインと強力な...

1年前

085.8K

LangGraph Supervisor：利用监督智能体来管理多智能体协作的工具

LangGraphスーパーバイザー：スーパーバイジングインテリジェンスを用いたマルチインテリジェンスコラボレーション管理ツール

概要 LangGraph SupervisorはLangGraphフレームワークをベースとしたPythonライブラリで、マルチインテリジェントな身体システムの作成と管理のために設計されています。このライブラリは、中央の監督エージェントを通して複数の専門化されたエージェントの作業を調整し、通信の流れやタスクの分割を確実にします...

1年前

085.8K

HumanOmni：人間のビデオ感情や行動を分析するためのマルチモーダル・マクロモデル

一般的な紹介 HumanOmniは、HumanMLLMチームによって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルです。HumanOmniは人間の動画を分析することに特化しており、画像と音声の両方を処理することで、感情や行動、対話の内容を理解するのに役立ちます。このプロジェクトでは2...

1年前

085.8K

Qdrantベクトル検索エンジン上に構築されたMCPサービス

概要 mcp-server-qdrantはQdrantベクトル検索エンジン上に構築されたモデルコンテキストプロトコル(MCP)サーバーです。主にAIシステムが記憶を保存したり検索したりするのに使われます。

1年前

085.8K

Thera: あらゆるサイズの画像拡大、デエイリアス・オープンソースツール

概論 Theraは、チューリッヒ工科大学とチューリッヒ大学のチームによって開発されたオープンソースの画像超解像ツールである。低解像度の画像を、2倍、3.14倍、あるいは整数倍など、任意の倍率にズームすることができる。

1年前

085.8K

メタバースAI：AIデジタル人クローンとショートビデオ生成ツールのオープンソース版

総合紹介 Metaverse AI（オープンソース版）はGitHubでホストされているプロジェクトで、libn-netチームによって開発されている。AI技術によってデジタルな人間の画像や声をクローンし、短い動画を生成することができ、吹き替えや字幕にも対応しています。このツールはWindo...

1年前

085.7K

Ai2 OLMoE：オフラインで動作するOLMoEモデルに基づくオープンソースのiOS AIアプリ

概要 Ai2 OLMoEは、Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence)によって開発されたオープンソースのiOSアプリで、デバイス上で動作するAIモデルを提供します。このアプリは、Ai2のオープンソースOLMoEを活用しています。

1年前

085.7K

CortexON：複雑なタスクの自動化をサポートするオープンソースのマルチエージェントAIツール

概論 CortexONは、GitHub（https://github.com/TheAgenticAI/CortexOn）でホストされているオープンソースのマルチエージェントAIシステムです。TheAgenti...によって開発されました。

1年前

085.6K

autoMate：AIとRPAを組み合わせてコンピュータ作業を自動化するネイティブツール

総合紹介 autoMateは、yuruotong1がGitHubでオープンソース開発したローカル自動化ツールで、AI+RPA（Artificial Intelligence+Robotic Process Automation）を中核機能としている。大規模言語モデルのインテリジェントな理解とRPAを組み合わせ...

1年前

085.6K

ライトカード：HTML5カードジェネレーターツール、シンプルなツールで美しいコンテンツカードを作る

概要 lightcard は、ユーザーが簡単に美しいコンテンツカードを作成できるように設計された、シンプルでエレガントなカード生成ツールです。このツールは、カスタムテキストコンテンツ、複数のテーマスタイル、QRコードに対応しており、作成がより簡単で楽しくなります。ユーザーは、タイトル、本文、作者を編集できます。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

085.5K

CR-Mentor：GitHubのための知識ベース＋LLM駆動インテリジェントコードレビューメンター

包括的な紹介 CR-Mentorは、専門的な知識ベースと大規模言語モデリング（LLM）のパワーを組み合わせたインテリジェントなコードレビューツールです。すべてのプログラミング言語のコードレビューをサポートするだけでなく、ナレッジベースに蓄積されたベストプラクティスに基づき、チーム専用のレビュー基準やフォーカスエリアをカスタマイズします。ナレッジベースを通じて...

2年前

085.4K

TransRouter：Geminiマルチモーダルモデルに基づく中英翻訳用リアルタイム音声変換ツール

TransRouterは、GoogleのGeminiモデルをベースにしたリアルタイム音声翻訳ツールで、特に英語と中国語のリアルタイム音声翻訳用に設計されている。このツールは、Zoomのようなビデオ会議ソフトウェアにシームレスに統合され、クロスランゲージのための強力なツールを提供します...

2年前

085.4K

AIチャットボット：ヴェルセル、インテリジェントなチャットボットを構築・展開

概要 AI ChatbotはVercelによって開発されたオープンソースプロジェクトで、開発者がインテリジェントなチャットボットを素早く構築し、デプロイすることを支援します。このプロジェクトはNext.jsフレームワークに基づいており、OpenAI...などの様々なAIモデルプロバイダと統合されています。

2年前

085.4K

StreamingT2V: テキストから長尺ビデオへのダイナミックでスケーラブルな生成

包括的な紹介 StreamingT2Vは、Picsart AI研究チームによって開発された公開プロジェクトで、テキストの説明文に基づいて、首尾一貫した、ダイナミックでスケーラブルな長い動画を生成することに焦点を当てています。この技術は、説明文と動画の時間的整合性を保証する高度な自己回帰的アプローチを使用しています。

2年前

085.4K

Lux: ほぼすべてのビデオプラットフォームをサポートするコマンドライン動画ダウンローダー

概要 Luxは、Goで書かれた高速でシンプルなビデオダウンロードライブラリとコマンドラインツールです。YouTube、Bilibili、Youkuなど、複数のウェブサイトからの動画ダウンロードをサポートしています。Luxは、マルチスレッドダウンロードなど、様々なダウンロードオプションと機能を提供します。

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

085.3K

UltraPixel：細部まで鮮明な超高解像度画像生成技術

概説 UltraPixelは、非常に高品質でディテールに富んだ画像を作成するために設計された、先進的な超高解像度画像生成技術である。GitHubユーザーのcatcathhによって開発され、NeurIPS 2024.Uで発表された。

2年前

085.3K

ロウフィル：文書からの構造化情報の一括抽出と自動分析

概要 Rowfillは、ナレッジワーカーのために設計されたオープンソースの文書処理プラットフォームです。高度な人工知能技術を使用して、複雑な文書、画像、PDFからデータを抽出、分析、処理します。Rowfillは、Large Language Model（LLM）とOpe...

1年前

085.3K

GOT-OCR2.0: QWen2 0.5Bエンドツーエンド・マルチモーダルOCRモデルに基づく

包括的な紹介 GOT-OCR2.0は、統一されたエンドツーエンドモデルを通じて、OCR技術をOCR-2.0に向けて推進することを目的とした、StepStar共同提案のオープンソース光学式文字認識（OCR）モデルです。このモデルは、通常のテキスト認識、gr...

最新のAIリソース # AI Java オープンソースプロジェクト # OCR

2年前

085.3K

CogView4：中国語と英語の高精細対訳画像を生成するオープンソースのグラフィカルモデル

一般的な紹介 CogView4は清華大学のKEG研究室(THUDM)によって開発されたオープンソースのテキストからグラフへのモデルであり、テキスト記述を高品質な画像に変換することに重点を置いている。二ヶ国語のキューワード入力をサポートしており、特に中国語のキューを理解し、中国語の文字、非...

1年前

085.2K

GPTアカデミック：Arxiv学術論文翻訳、エラー訂正、コード解釈の最優秀賞

一般的な紹介 GPT Academicは、学術研究に最適化された大規模言語モデルのためのインタラクティブプラットフォームです。GPT/GLMのような大規模言語モデルへの実用的なインタラクティブインターフェースのためのツールを提供し、特に論文翻訳、論文読解、推敲、執筆の経験に最適化されています。モジュール設計を採用しています。

2年前

085.2K

Open NotebookLM: PDFをオープンソースツールのポッドキャストに変換する

概要 Open NotebookLMは、あらゆるPDF文書をポッドキャストに変換するために設計されたオープンソースプロジェクトです。このツールは、オープンソースのLarge Language Model (LLM)とText-to-Speech (TTS)モデルを使用してPDFコンテンツを処理し、オーディオポッドキャストに適した自然なダイアログを生成します...

2年前

085K

ChatOllama: Nuxt 3とOllamaをベースにしたローカルリアルタイムチャットアプリケーションUI

包括的な紹介 ChatOllamaは、大規模言語モデル（LLM）に基づくオープンソースのオンラインチャットアプリケーションプロジェクトです。ユーザは、モデル管理（リスト表示、ダウンロード、削除）、モデルとのチャットやその他の機能のためにプラットフォームを使用することができます。このプロジェクトは...

2年前

085K

PromptWizard: タスクパフォーマンスを向上させるプロンプトプロジェクト最適化のためのオープンソースフレームワーク

包括的な紹介 PromptWizardはMicrosoftによって開発されたオープンソースのフレームワークであり、モデルがプロンプトの単語を生成、評価、改善し、それ自身で例を生成し、継続的なフィードバックによってアウトプットの質を向上させる自己進化メカニズムを使用しています。プロンプトの単語を自律的に最適化し、適切な例文を生成・選択し、...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

085K

TgWechat: WeChat用エンドツーエンド暗号化チャットプラグイン

一般的な紹介 tgwechatは、開発者dplusecによって開発されたオープンソースのWeChatプラグインです。エンドツーエンドの暗号化によりWeChatチャットのプライバシーを保護し、ユーザーが安全にメッセージを送信できるようにします。このプロジェクトは2019年8月31日にGPL v3ライセンスのもとGitHubで公開されました。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

085K

PR Agent: プルリクエスト自動分析ツール

概論 PR-AgentはQodoが開発したオープンソースツールで、AI技術によってプルリクエスト（Pull Requests）の処理を自動化する。このツールは、開発者がコードレビューをより効率的に実行できるように、自動化されたフィードバック、提案、分析を提供することができます...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

084.9K

VideoChat：自定义形象和音色克隆的实时语音交互数字人，支持端到端语音方案和级联方案

VideoChat：カスタムイメージとトーンクローニングによるリアルタイムの音声対話型デジタルパーソンは、エンドツーエンドの音声ソリューションとカスケードソリューションをサポートします。

概要 VideoChatは、オープンソース技術に基づくリアルタイム音声対話デジタルパーソンプロジェクトで、エンドツーエンドの音声スキーム（GLM-4-Voice - THG）とカスケードスキーム（ASR-LLM-TTS-THG）の両方をサポートしています。このプロジェクトでは、ユーザーがデジタルパーソンをカスタマイズすることができます。

2年前

084.9K

OpenSumi Lite: 簡単なコード表示と編集のための純粋なフロントエンドIDEソリューション

概要 OpenSumi Liteは、OpenSumiプロジェクトに基づく純粋なフロントエンドIDEソリューションで、Node.js環境を必要とせずにコードの表示と編集機能を提供するように設計されています。このプロジェクトはAlibaba GroupとAnt Groupによって共同開発され、Node.js環境なしでコード閲覧、編集機能を提供します。

AIアンサー # AI Java オープンソースプロジェクト

1年前

084.9K

Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

クロード・エンジニア：クロード・モデルを用いてAIツールを自律的に生成・管理する知的身体対話アシスタント

概要 Claude EngineerはDoriandarkoによって開発された対話型コマンドラインインターフェイス（CLI）で、AnthropicのClaude-3.5-Sonnetモデルを利用してソフトウェア開発作業を支援する。

1年前

084.9K

最短：エンド・ツー・エンドのテストに自然言語を使用するAI自動テストツール

一般的な紹介 Shortestは、Anti-Workチームによって開発されたAIを搭載した自然言語エンドツーエンドテストフレームワークです。Playwrightをベースに構築されており、GitHubとの統合や二要素認証（2FA）をサポートしています。Shortestの主な特徴は...

2年前

084.9K

Cooragent: マルチインテリジェンス・タスク・コラボレーション・ツールの構築

一般的な紹介 Cooragentは、清華大学のLeapLabによって開発され、GitHubでホストされているオープンソースのAIエージェントコラボレーションフレームワークです。ユーザーは、1文の記述でインテリジェントなAIエージェントを作成することができ、複雑なタスクで共同作業する複数のエージェントをサポートしています。このフレームワークは2つの...

1年前

084.9K

GPTme：在命令行终端中运行的智能编程助手，ChatGPT代码解释器的本地化替代方案

GPTme: コマンドライン・ターミナルで動作するインテリジェント・プログラミング・アシスタント、ChatGPTコード・インタープリターのローカライズされた代替品

総合紹介 GPTMeは、開発者の作業効率を向上させるために設計された革新的な端末AIアシスタントツールです。強力なAI機能と端末環境を完璧に組み合わせ、コード実行、ファイル編集、ウェブブラウジング、視覚認識など多様な機能をサポートします。ChatGPTのコード解...

2年前

084.8K

Paper2Code: 機械学習論文を実行可能なコードに自動変換する

一般的な紹介 Paper2Codeは、機械学習論文のコード実装が不足しているという問題を解決することを目的としたオープンソースプロジェクトである。マルチエージェントの大規模言語モデリング（LLM）システムPaperCoderによって、科学論文を実行可能なコードリポジトリに自動的に変換する。このシステムは、計画言語モデリング...

1年前

084.8K

FiveThirtyNine：検索知識に基づいて未来の出来事の確率を予測する

概論 Forecast AIは高度な人工知能技術に基づく優れた予測プラットフォームです。強力なデータ分析と機械学習アルゴリズムを駆使し、ユーザーに精度の高い未来予測を提供します。政治選挙、経済動向、社会的出来事のいずれであっても、Forecast ...

2年前

084.7K

Story-Flicks：トピックを入力することで、子供向けのショートストーリービデオが自動生成される。

包括的な紹介 Story-Flicksは、ユーザーがHDストーリービデオを素早く生成することに焦点を当てたオープンソースのAIツールです。ユーザーはストーリーのトピックを入力するだけで、システムは大規模な言語モデルを通してストーリーの内容を生成し、AIが生成した画像、音声、字幕を組み合わせて完全なビデオを出力します。

1年前

084.7K

Paper Reviewer: arXiv論文の包括的なレビューを自動生成し、ブログ記事に変換する。

一般的な紹介 Paper Reviewerは、arXivの論文から包括的なレビューを生成し、ブログ記事にするために設計されたオープンソースプロジェクトです。このプロジェクトはHugging FaceのDaily Papersウェブサイトを動かしており、自動的に...

2年前

084.7K

RAGLite: 複数のデータベースと言語モデルをサポートする効率的な検索補強生成（RAG）ツール。

概要 RAGLiteは、PostgreSQLまたはSQLiteデータベースをサポートするRAG（Retrieval Augmented Generation）用のPythonツールキットです。異なる言語モデルやリフォーマラを選択できる柔軟な設定オプションを提供します。

2年前

084.5K

Vibe Draw: 手描きスケッチを3Dモデルに変換するクリエイティブツール

概要 Vibe Drawは、Martin Sitによって開発されたオープンソースプロジェクトで、手描きのスケッチを美しい3Dモデルに変換することができます。このツールの目的はシンプルで、高度な芸術的スキルやリハーサルがなくても、誰でも簡単に3Dモデリングができるようにすることです。

1年前

084.5K

PydanticAI：使用Pydantic构建生成式AI应用，让构建生产级AI应用更加简单

PydanticAI: PydanticでジェネレーティブAIアプリを作れば、本番レベルのAIアプリが簡単に作れる

概論 PydanticAIはPydanticベースのPythonエージェントフレームワークで、生成AIアプリケーションの開発を簡素化するために設計されています。Pydanticチームによって開発され、幅広いモデル（OpenAI、Gemini、Groqなど）と...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

084.4K

ChatAnyone：写真から半身のデジタル人物ビデオを生成するツール

はじめに ChatAnyoneはHumanAIGCチームによって開発された革新的なプロジェクトです。人工知能技術を用いて、1枚の写真と音声入力から、上半身の動きを含むデジタル人物ビデオを生成する。このプロジェクトは、頭の動きを生成する階層的な動き拡散モデルに基づいています...

1年前

084.4K

ReCamMaster: 1つのビデオからマルチビュービデオを生成するレンダリングツール

一般的な紹介 ReCamMasterはオープンソースのビデオ処理ツールで、コア機能は1つのビデオから新しいカメラビューを生成することです。ユーザーはカメラ軌道を指定し、ビデオを再レンダリングすることで、異なるアングルのダイナミックな画像を得ることができます。ReCamMasterは、浙江大学とRacer Technologyのチームによって開発されました。

1年前

084.4K

AnimatedDrawings：儿童手绘涂鸦转换动画，自动化儿童绘画动画生成工具

AnimatedDrawings：子供の手描きの落書きをアニメーションに変換、子供のお絵かきアニメーション自動生成ツール

概論 AnimatedDrawingsはFacebook Researchによって開発されたオープンソースプロジェクトで、自動化技術によって子供の絵をアニメーションのキャラクターに変換する。このプロジェクトは、「A Method for A...

2年前

084.4K

SHMT: Self-Supervised Hierarchical Makeup Transfer Model, バーチャルメイク, 新しいポートレートへのメイクの移行

包括的な紹介 SHMT（Self-supervised Hierarchical Makeup Transfer）は、潜在拡散モデルに基づく自己教師ありの階層的メイクアップ移行プロジェクトであり、教師なし学習方法によってメイクアップ効果の高品質を実現することを目的としている...

2年前

084.3K

SFT-data-builder：利用免费大模型API生成AI训练数据，0成本大模型训练数据生成

SFT-data-builder：無料のビッグモデルAPIを使用してAIのトレーニングデータを生成。

包括的な紹介 SFT-data-builderは、無料のBig Model APIとユーザーのプライベートドメインデータを組み合わせて、高品質のSFTトレーニングデータを生成するために設計されたオープンソースプロジェクトです。このツールは、複数のAIモデル形式をサポートし、ワンクリック生成、バッチ生成、柔軟な編集、ローカル...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

084.3K

Arrakis：AIインテリジェンスに安全なサンドボックス環境を提供するオープンソースツール

一般的な紹介 Arrakisは、安全でカスタマイズ可能な環境を提供するためにAI知能のために設計されたサンドボックス環境です。Abhishek Bhardwajによって開発され、GitHubでホストされており、AGPL v3ライセンスを使用しています。

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

084.3K

ColiVara：視覚的埋め込みベースの文書保管・検索サービス

概要 ColiVara は、ビジュアル埋め込み技術に基づく文書保管・検索サービスです。光学式文字認識（OCR）やテキスト抽出の必要性をなくし、フォームの破損や画像の紛失といった問題を回避します。ColiVaraは、PDFを含む100以上のファイルフォーマットをサポートしています。

1年前

084.2K

EchoMimic：音频驱动人像照片生成说话视频（EchoMimicV2加速版安装包）

EchoMimic: 音声駆動ポートレートによるトーキングビデオ生成 (EchoMimicV2 アクセラレータ)

概要 EchoMimicは、音声によってリアルなポートレートアニメーションを生成するために設計されたオープンソースプロジェクトです。AntグループのTerminal Technologies部門によって開発されたこのプロジェクトは、編集可能なマーカーポイント条件を利用し、音声と顔のマーカーポイントを組み合わせて、ダイナミックなポートレート動画を生成します。

2年前

084.2K

MTranServer：CPU対応オフライン翻訳サービス

概要 MTranServerは、オフライン翻訳に焦点を当てたオープンソースのサーバープロジェクトで、GitHubでホストされており、開発者のxxnuoによって作成されました。最大の特徴は、必要なリソースが非常に少ないことで、CPUと1GBのRAMだけで、G...

1年前

084.2K

MindSearch：开源AI搜索引擎框架，部署您自己的 Perplexity 搜索引擎！

MindSearch: オープンソースのAI検索エンジンフレームワーク！

包括的な紹介 MindSearchは、上海人工知能研究所（SAL）が立ち上げたオープンソースのAI検索エンジン・フレームワークで、複雑な情報収集と統合のための人間の思考プロセスをシミュレートすることを目的としている。このツールは、大規模言語モデリング(LLM)とマルチインテリジェンス検索エンジンの高度な技術を組み合わせたものである。

2年前

084.2K

Harbor: ローカルのLLM開発環境をワンクリックでデプロイし、AIサービスを簡単に管理・実行するためのコンテナ化されたツールセット。

概論 Harborは、ローカルのAI開発環境のデプロイと管理を簡素化することに焦点を当てた、画期的なコンテナ化LLMツールセットです。クリーンなコマンドラインインターフェイス（CLI）とコンパニオンアプリケーションにより、ワンクリックでLLMバックエンド、APIインターフェイス、フロント...

2年前

084.2K

ChainForge：大規模言語モデルヒントの有効性をテスト・評価するオープンソースのビジュアルプログラミング環境

概要 ChainForgeは、大規模言語モデル（LLM）のキューの有効性をテスト・評価するために設計されたオープンソースのビジュアルプログラミング環境です。データフローキューイングエンジニアリング環境を提供し、LLM応答における様々なキューの品質を素早く探索・分析することができます。

2年前

084.2K

Lecca：AIインテリジェンスとAIワークフローを構築するコードなしでプラットフォームを構築する

包括的な紹介 Leccaは、複数のツールやワークフローで大規模言語モデル（LLM）を構成し、デプロイすることができる強力なAIプラットフォームです。ユーザは簡単にAIエージェントを構築、カスタマイズ、自動化することができます。Leccaは幅広いAIプロバイダとモデルを提供しています。

1年前

084.1K

CodeArena: オープンソースLLMプログラミング能力比較アリーナ、最適なコード生成モデルをリアルタイム表示

一般的な紹介 CodeArenaは、リアルタイムの対決を通じて最高のオープンソースコード生成モデル（LLM）を紹介するために設計されたユニークなプラットフォームです。ユーザーは、異なる LLM が同じプログラミング・タスクで競い合う様子を見たり、リアルタイム・リーダーボードを通じて最高のパフォーマンスを発揮したモデルを見ることができます。このプラットフォームは、Togetter...

最新のAIリソース # AI Java オープンソースプロジェクト

2年前

084.1K

GenEx：1枚の画像から探索可能な360°3D世界を生成（コードは順次オープンソース化）

一般的な紹介 GenExは、1枚の画像から完全に探索可能な360°の3D世界を生成できる先進的なAIモデルである。ユーザーはこの生成された世界をインタラクティブに探索することができる。GenExは想像空間における造形的AIの境界を押し広げ、...

2年前

084K

R1-Omni: ビデオと音声による感情分析のためのオープンソースモデル

はじめに R1-Omniは、HumanMLLMチームによってGitHubで立ち上げられたオープンソースプロジェクトです。これは、検証可能な報酬による強化学習（RLVR）技術を、感情認識に焦点を当てたマルチモーダル大規模言語モデルに適用した最初のプロジェクトである。このプロジェクトでは、動画と音声データを...

最新のAIリソース # AI Java オープンソースプロジェクト

1年前

084K