AIオープンソースプロジェクト

合計1020記事
Cosmos:世界基础模型,构建物理世界的人工智能基础模型平台

Cosmos:ワールド・ベース・モデル、物理世界のAIベース・モデルを構築するためのプラットフォーム

包括的な紹介 NVIDIA Cosmosは開発者向けのワールドベースのモデリング・プラットフォームであり、物理AI開発者がより良く、より速く物理AIシステムを構築できるように特別に設計されています。このプラットフォームは、拡散モデルや自己回帰モデルなど、さまざまな訓練済みモデルを提供します。
1年前
061.4K
E2M:将多种文件格式转换为Markdown,轻松实现文档格式统一

E2M: 複数のファイル形式をMarkdownに変換し、簡単に統一されたドキュメントフォーマットを実現する

概要 E2M (Everything to Markdown)は、様々なファイルフォーマットをMarkdownフォーマットに変換するために設計されたオープンソースのPythonライブラリです。このツールは、doc、docx、epub、html、htm、u...などのフォーマットをサポートしています。
1年前
061.4K
ReCamMaster:从单一视频生成多视角视频的渲染工具

ReCamMaster: 1つのビデオからマルチビュービデオを生成するレンダリングツール

一般的な紹介 ReCamMasterはオープンソースのビデオ処理ツールで、コア機能は1つのビデオから新しいカメラビューを生成することです。ユーザーはカメラ軌道を指定し、ビデオを再レンダリングすることで、異なるアングルのダイナミックな画像を得ることができます。ReCamMasterは、浙江大学とRacer Technologyのチームによって開発されました。
1年前
061.4K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate:静的な3Dモデルから骨格構造のアニメーション資産を生成する

包括的な紹介 MagicArticulateは、ByteDanceが南洋理工大学(NTU)と共同で開発したAIフレームワークで、静的な3Dモデルをアニメーション可能なデジタル資産に迅速に変換することに焦点を当てています。これは、高度な自己回帰変換器と関数拡散モデル、自己...
1年前
061.3K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: 局所的知識を利用した深層推論検索のためのオープンソースプロジェクト

包括的な紹介 Deep Searcherは、大規模言語モデル(LLM)とベクトルデータベースを組み合わせた強力なツールで、プライベートデータに基づいて検索、評価、推論を行い、精度の高い回答と包括的なレポートを提供するように設計されています。企業のナレッジマネジメントに適しています。
1年前
061.3K
Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

クロード・エンジニア:クロード・モデルを用いてAIツールを自律的に生成・管理する知的身体対話アシスタント

概要 Claude EngineerはDoriandarkoによって開発された対話型コマンドラインインターフェイス(CLI)で、AnthropicのClaude-3.5-Sonnetモデルを利用してソフトウェア開発作業を支援する。
1年前
061.3K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: ネイティブLLM駆動のVimプログラミングアシスタント。

概要 VimLMは、ネイティブのLLM(Large Language Model)によって駆動されるコードアシスタントを提供するVimプラグインです。Vim コマンドを通してネイティブの LLM モデルと対話することで、コードのコンテキストを自動的に取得し、Vim でのコード編集を支援します。
1年前
061.3K
RSS Translator(RSS翻译器):订阅并实时翻译RSS内容的工具

RSS Translator: RSSコンテンツをリアルタイムで購読・翻訳するツール

概要 RSS Translatorは、ユーザーがリアルタイムでRSSコンテンツを翻訳して購読できるように設計された、オープンソースのクリーンで自己展開可能なツールです。このツールは、Google翻訳、Microsoft Tra...など、複数の翻訳エンジンをサポートしています。
1年前
061.3K
Search o1:赋予推理模型主动搜索能力,让大模型边思考边搜索外部知识

検索 o1: 推論モデルに能動的な検索機能を与え、大規模モデルが思考しながら外部の知識を検索できるようにする。

包括的な紹介 Search-o1は、高度な検索メカニズムを統合することで、大規模推論モデル(LRM)のパフォーマンスを向上させることを目的としたオープンソースプロジェクトである。コアとなるアイデアは、動的な検索と知識の統合を通じて、推論プロセスで遭遇する知識不足の問題を解決することです。プロジェクトのスポンサーはsunn...
1年前
061.3K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成する

包括的な紹介 GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークであり、GitHubでホストされている。GraphGenは、知識グラフを通して合成データ生成を導くことによって、大規模言語モデル(LLM)の教師ありファインチューニングを最適化することに焦点を当てている。LLMは...
11ヶ月前
061.2K
ExtractThinker:提取和分类文档为结构化数据,优化文档处理流程

ExtractThinker: ドキュメントを構造化データに抽出・分類し、ドキュメント処理プロセスを最適化します。

包括的な紹介 ExtractThinkerは、大規模言語モデル(LLM)を使用してドキュメントから構造化データを抽出・分類し、シームレスなORMライクなドキュメント処理ワークフローを提供する、柔軟なドキュメントインテリジェンスツールです。LLMを含む様々なドキュメントローダーをサポートしています。
1年前
061.2K
Plandex:支持超长上下文的开源AI编码助手

Plandex:超ロングコンテクストをサポートするオープンソースのAIコーディングアシスタント

概要 Plandexは、大規模で複雑なソフトウェアプロジェクトのために設計されたオープンソースのエンドツーエンドのAIコーディングアシスタントです。複数ステップのタスクを計画・実行し、最大200万トークンのコンテキストを処理し、30以上のプログラミング言語をサポートします。
12ヶ月前
061.2K
OpenChat:快速集成多数据源的自定义聊天机器人

OpenChat: 複数のデータソースを迅速に統合するカスタムチャットボット

概要 OpenChatは、大規模言語モデル(LLM)の使用を簡素化するために設計されたユーザーフレンドリーなチャットボットコンソールです。OpenChatは、2ステップのセットアッププロセスを提供することで、ユーザーが簡単に複数のカスタムチャットボットを作成し、管理することを可能にします。このプラットフォームはG...
1年前
061.1K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

包括的な紹介 PRAG(Parametric Retrieval-Augmented Generation)は、大規模言語モデル(LLM)のパラメータ空間に直接埋め込むことで、外部知識の生成を強化することを目的とした革新的な検索拡張生成ツールである。
1年前
061K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: あらゆるサイズの画像拡大、デエイリアス・オープンソースツール

概論 Theraは、チューリッヒ工科大学とチューリッヒ大学のチームによって開発されたオープンソースの画像超解像ツールである。低解像度の画像を、2倍、3.14倍、あるいは整数倍など、任意の倍率にズームすることができる。
1年前
061K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollamaバックエンドにネイティブに統合されたエンドポイントベースのミニマルなAIチャットツール

概要 Charlaはエンドポイントベースのチャットアプリケーションで、ネイティブ言語モデルとの対話ができるように設計されています。このアプリケーションはOllamaバックエンドと統合され、コンテキストを考慮した対話をサポートし、チャットセッションをMarkdownファイルとして保存します。ユーザーは単に...
1年前
060.9K
オーケストラ:より簡単で効率的なマルチインテリジェンス共同開発のためのスマートAIチーム構築

オーケストラ:より簡単で効率的なマルチインテリジェンス共同開発のためのスマートAIチーム構築

Orchestraは革新的な軽量Pythonフレームワークで、大規模言語モデル(LLM)に基づくマルチインテリジェンス協調システムの構築に重点を置いています。複数のAI知能が交響楽団のように調和して動作するように、知能を配置する独自の方法を採用している。モデル化することで ...
1年前
060.9K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

最短:エンド・ツー・エンドのテストに自然言語を使用するAI自動テストツール

一般的な紹介 Shortestは、Anti-Workチームによって開発されたAIを搭載した自然言語エンドツーエンドテストフレームワークです。Playwrightをベースに構築されており、GitHubとの統合や二要素認証(2FA)をサポートしています。Shortestの主な特徴は...
1年前
060.9K
FitDiT:高保真度AI虚拟试衣工具,提升服装细节真实性

FitDiT:衣服のディテールの信憑性を高める高忠実度AIバーチャルフィッティングツール

包括的な紹介 FitDiTは、拡散トランスフォーマー(Diffusion Transformers)に基づいた高忠実度のバーチャルフィッティングシステムである。Tencent AI Labによって開発されたこのプロジェクトは、衣服の詳細を表示するという従来のバーチャルフィッティングシステムの限界に対処することを目的としている。
1年前
060.9K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。

RAGLite: 複数のデータベースと言語モデルをサポートする効率的な検索補強生成(RAG)ツール。

概要 RAGLiteは、PostgreSQLまたはSQLiteデータベースをサポートするRAG(Retrieval Augmented Generation)用のPythonツールキットです。異なる言語モデルやリフォーマラを選択できる柔軟な設定オプションを提供します。
1年前
060.9K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro:主流のオープンソース視覚言語のモデルの微調整プロセスを簡素化するツール

包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化、高速化し、誰でも独自の視覚マクロモデルをトレーニングできるようにします。F... などの一般的な視覚言語モデル(VLM)を微調整するためのレシピが用意されています。
1年前
060.9K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1:1分で1分の動画を生成すると謳う、効率的な動画生成オープンソースプロジェクト

包括的な紹介 Magic 1-For-1は、メモリ使用量を最適化し、推論の待ち時間を短縮するために設計された効率的なビデオ生成モデルである。このモデルは、テキストから動画への生成タスクを、テキストから画像への生成と画像から動画への生成という2つのサブタスクに分解し、より効率的な学習と蒸留を可能にする。
1年前
060.9K
Harbor:一键部署本地LLM开发环境,轻松管理和运行AI服务的容器化工具集

Harbor: ローカルのLLM開発環境をワンクリックでデプロイし、AIサービスを簡単に管理・実行するためのコンテナ化されたツールセット。

概論 Harborは、ローカルのAI開発環境のデプロイと管理を簡素化することに焦点を当てた、画期的なコンテナ化LLMツールセットです。クリーンなコマンドラインインターフェイス(CLI)とコンパニオンアプリケーションにより、ワンクリックでLLMバックエンド、APIインターフェイス、フロント...
1年前
060.8K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具

AI-ClothingTryOn:ジェミニベースのバーチャル試着ツール

概論 AI-ClothingTryOnは、開発者のspeedTDによって作成され、GitHubでホストされているPythonベースのオープンソースデスクトップアプリケーションです。このアプリケーションは、Google Geminiの人工知能技術を使用しています。
1年前
060.8K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略

Cognita:モジュラーRAGアプリケーションを構築し、多様なRAG戦略を迅速にテストするためのオープンソースフレームワーク

包括的な紹介 Cognitaは、RAG(Retrieval-Augmented Generation)ベースのアプリケーションの開発を簡素化するためにTrueFoundry社によって開発されたオープンソースのフレームワークです。このフレームワークは、構造化されたモデ...
1年前
060.8K
Arrakis:为AI智能体提供安全沙盒环境的开源工具

Arrakis:AIインテリジェンスに安全なサンドボックス環境を提供するオープンソースツール

一般的な紹介 Arrakisは、安全でカスタマイズ可能な環境を提供するためにAI知能のために設計されたサンドボックス環境です。Abhishek Bhardwajによって開発され、GitHubでホストされており、AGPL v3ライセンスを使用しています。
1年前
060.7K
ell:轻量级函数式提示词工程框架

エル:軽量機能的キュー・ワード工学フレームワーク

一般的な紹介 ellは、元OpenAIの研究者であるウィリアム・ガスによって開発された軽量な関数型言語モデル・プログラミング・ライブラリである。ellは、キューを単なる文字列としてではなく、プログラムとして扱うことを念頭に設計されている。
1年前
060.7K
Srcbook:开源快速构建和迭代完整TypeScript项目的全栈AI工程师

Srcbook:TypeScriptの完全なプロジェクトを迅速に構築し、反復するオープンソースのフルスタックAIエンジニア

Srcbookの概要 SrcbookはTypeScriptを中心としたアプリケーション開発プラットフォームであり、AIアシスタントを用いてWebアプリケーションを迅速に作成し、繰り返し実行できるように設計されている。ネイティブランタイムをサポートし、インタラクティブなノートブックインターフェースを提供し、バックエンドのコードを書いて実行することができる。
1年前
060.7K
Napkins.dev:基于Llama4上传线框图生成前端代码

Napkins.dev:ワイヤーフレームをアップロードしてLlama4ベースのフロントエンドコードを生成する

一般的な紹介 Napkins.devはフリーのオープンソースプロジェクトです。コア機能は、ユーザーがインターフェイスのスクリーンショットやワイヤーフレームをアップロードして、実行可能なフロントエンドコードを自動的に生成できるようにすることです。ユーザーはデザイン画を提供するだけでよく、ツールはLlama 4モデル(by Together ...
1年前
060.7K
Moondream:批量反推图像提示词的开源轻量级视觉语言模型

Moondream:画像手がかり語のバッチバックプロパゲーションのためのオープンソースの軽量視覚言語モデル

包括的な紹介 Moondreamは、ディープラーニングとコンピュータビジョン技術による画像記述機能を実現するために設計された、オープンソースの軽量視覚言語モデルです。このモデルは、様々なプラットフォーム上で効率的に実行することができ、特にエッジデバイスに適しています。
1年前
060.7K
DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)

DeepGEMM: FP8行列演算を効率的にサポートするオープンソースライブラリ (DeepSeek Open Source Week 3日目)

包括的な紹介 DeepGEMMは、DeepSeekチームによって開発されたオープンソースのFP8 GEMM (Generalised Matrix Multiplication)ライブラリで、行列演算の効率的なサポートを提供することに重点を置いています。特にNVIDIA HopperアーキテクチャのTensor ...
1年前
060.7K
Cloudflare Agents:在边缘网络上构建实时交互的智能体

Cloudflare Agents: エッジネットワーク上にリアルタイムの対話型インテリジェンスを構築

概論 Cloudflare AgentsはCloudflareのオープンソース開発フレームワークで、開発者がグローバルエッジネットワーク上にインテリジェントなAIエージェントを構築できるように設計されています。エージェントが状態を保持し、リアルタイムで通信し、自律的に実行する能力を提供します。
1年前
060.6K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo:異なるAIインテリジェンスフレームワークをリアルタイムで連携させる統合プラットフォーム

Mahiloは、開発者Jayesh SharmaによってGitHubで公開されたオープンソースのマルチインテリジェンス統合プラットフォームであり、ユーザーが異なるフレームワークのAIインテリジェンスを接続し、リアルタイムのコミュニケーション、人間とコンピュータのインタラクション、インテリジェントなコラボレーションをサポートできるように設計されている。この ...
1年前
060.6K
FoleyCrafter:为无声视频添加生动同步的音效

FoleyCrafter: 無音ビデオに鮮やかな同期サウンドを追加する

一般的な紹介 FoleyCrafterは、OpenMMLabによって開発されたオープンソースプロジェクトで、無音ビデオのための鮮明で同期された効果音を生成します。このプロジェクトでは、高度な人工知能技術を用いて、ビデオの内容を分析することにより、意味的に関連性のある、時間的に同期した効果音を生成します...
1年前
060.6K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架

PantoMatrix(Emage):全身ジェスチャー生成フレームワーク、音声から全身ジェスチャーを生成する3Dアニメーションフレームワーク

包括的な紹介 PantoMatrixは、音声と顔、体の一部、手、全身の動きを含む部分的なジェスチャーから、完全な人間の動きを生成できる先進的なフルボディジェスチャー生成フレームワークです。このフレームワークは、最新のマルチモーダルデータセットとディープラーニング技術を利用して、高品質の3D...
1年前
060.6K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具

ライトカード:HTML5カードジェネレーターツール、シンプルなツールで美しいコンテンツカードを作る

概要 lightcard は、ユーザーが簡単に美しいコンテンツカードを作成できるように設計された、シンプルでエレガントなカード生成ツールです。このツールは、カスタムテキストコンテンツ、複数のテーマスタイル、QRコードに対応しており、作成がより簡単で楽しくなります。ユーザーは、タイトル、本文、作者を編集できます。
1年前
060.6K
ALog:便携AI语音日记应用,支持语音转文字。

ALog:音声読み上げ機能付きの携帯型AI音声日記アプリ。

一般的な紹介 ALogはAIベースの音声日記アプリケーションで、ユーザーが音声で日常生活を記録できるように設計されています。duxinsによって開発され、GitHubでオープンソース化されている。ユーザーは音声入力で日記を記録することができ、アプリは自動的に音声をテキストに変換します...
1年前
060.6K
Llama Tutor:提供个性化辅导的AI工具,基于 Llama 3.1 构建的开源 AI 个人助教项目

Llama Tutor: パーソナライズされた個人指導を提供するAIツール, Llama 3.1で構築されたオープンソースのAI個人指導プロジェクト

一般的な紹介 Llama Tutorは、Llama 3.1上に構築されたオープンソースのAIパーソナル・チューター・プロジェクトで、パーソナライズされた学習体験をユーザーに提供するように設計されています。Together AI、Next.js、T...などの複数の技術スタックを統合することで、学習者のニーズに合わせた学習体験を提供します。
1年前
060.5K
Cooragent:一句话构建多智能体任务协作工具

Cooragent: マルチインテリジェンス・タスク・コラボレーション・ツールの構築

一般的な紹介 Cooragentは、清華大学のLeapLabによって開発され、GitHubでホストされているオープンソースのAIエージェントコラボレーションフレームワークです。ユーザーは、1文の記述でインテリジェントなAIエージェントを作成することができ、複雑なタスクで共同作業する複数のエージェントをサポートしています。このフレームワークは2つの...
11ヶ月前
060.5K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统

シンバ:文書整理のためのナレッジマネジメントシステムで、あらゆるRAGシステムにシームレスに統合されます。

概要 Simbaは、あらゆるRAG(Retrieval Augmentation Generation)システムとシームレスに統合できるように設計されたポータブルな知識管理システム(KMS)です。GitHubのユーザーGitHamza0206によって作成されたこのプロジェクトは、様々なナレッジマネジメントのための効率的なソリューションを提供します。
1年前
060.5K
AIaW:全功能、轻量级、可拓展插件的跨平台AI客户端

AIaW:拡張可能なプラグインを備えた、フル機能の軽量クロスプラットフォームAIクライアント

包括的な紹介 AIaW(AI as Workspace)は、フル機能で軽量かつ拡張可能なソリューションを提供するために設計された次世代AIクライアントです。このプラットフォームは、OpenAI、Anthropic、Googleを含む幅広いサービスプロバイダをサポートし、...
1年前
060.5K
TgWechat:为微信提供端到端加密的聊天插件

TgWechat: WeChat用エンドツーエンド暗号化チャットプラグイン

一般的な紹介 tgwechatは、開発者dplusecによって開発されたオープンソースのWeChatプラグインです。エンドツーエンドの暗号化によりWeChatチャットのプライバシーを保護し、ユーザーが安全にメッセージを送信できるようにします。このプロジェクトは2019年8月31日にGPL v3ライセンスのもとGitHubで公開されました。
1年前
060.4K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具

autoMate:AIとRPAを組み合わせてコンピュータ作業を自動化するネイティブツール

総合紹介 autoMateは、yuruotong1がGitHubでオープンソース開発したローカル自動化ツールで、AI+RPA(Artificial Intelligence+Robotic Process Automation)を中核機能としている。大規模言語モデルのインテリジェントな理解とRPAを組み合わせ...
1年前
060.4K
LocalGPT:在本地设备上与多文档对话,确保数据隐私

LocalGPT:ローカルデバイス上の複数のドキュメントと対話することで、データプライバシーを確保する

一般的な紹介 LocalGPTはオープンソースプロジェクトで、ユーザーがローカルデバイス上のドキュメントと会話できるように設計されており、データのプライバシーを保証します。様々なオープンソースモデルを使用することで、LocalGPTはデータをクラウドにアップロードすることなく、ドキュメントコンテンツを処理し理解することができます。このプロジェクトは、様々なアプリケーションをサポートしています。
1年前
060.4K
OrionChat:集成多平台AI模型的简易网页聊天界面(免部署)

OrionChat:マルチプラットフォームAIモデルを統合したシンプルなWebチャットインタフェース(デプロイメント不要)

OrionChatは、複数の主流AIモデルと対話するための統一されたプラットフォームをユーザーに提供する、ウェブベースのAIチャット・インターフェースです。このプロジェクトは、Ollama(ローカルで動作)、OpenAI GPT、Google Gemi...を含む幅広いAIモデルをサポートしています。
1年前
060.3K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: PDFをオープンソースツールのポッドキャストに変換する

概要 Open NotebookLMは、あらゆるPDF文書をポッドキャストに変換するために設計されたオープンソースプロジェクトです。このツールは、オープンソースのLarge Language Model (LLM)とText-to-Speech (TTS)モデルを使用してPDFコンテンツを処理し、オーディオポッドキャストに適した自然なダイアログを生成します...
1年前
060.3K
LongWriter:智谱推出生成超长文本的强大模型,支持一次对话生成10000+字

LongWriter:ウィズダム・スペクトラムは、超長文を生成するための強力なモデルを発表し、1回の会話で10,000語以上の生成に対応。

包括的な紹介 LongWriter は、清華大学データマイニング研究グループ (THUDM) によって開発された強力な長文生成ツールです。このツールは、先進的なロングコンテクスト言語モデル(LLM)に基づいており、10,000語以上の長文を生成することができます。
1年前
060.3K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

ディープリサーチ:効率的なリサーチツールとレポート作成機能を提供するAIベースのディープリサーチアシスタント

一般的な紹介 Deep Research は、検索エンジン、ウェブクローリング、大規模な言語モデルを組み合わせることで、反復的なディープリサーチを実行するように設計された AI ベースのリサーチアシスタントです。このプロジェクトは、使いやすいディープリサーチジェネレータを提供することを目的として、dzhng によって GitHub で公開されました。
1年前
060.3K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

AgentLaboratory: 知的エージェントによる科学研究の全プロセスを完了するオープンソースツール

一般的な紹介 AgentLaboratoryはGitHubでホストされているオープンソースツールで、Samuel Schmidgallによって開発されました。大規模言語モデル(LLM)によって駆動されるインテリジェントエージェントを使用し、研究者の科学的...
1年前
060.2K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

SuperWeChatPC:オープンソースコンピュータ微信機能強化ツール、二次開発支援

総合紹介 SuperWeChatPCはオープンソースのコンピュータ用WeChat拡張ツールであり、その核心はユーザーと開発者に利便性を提供することである。当初、WeChatは単独でしか開くことができないという問題を解決し、後にWeChatSDKを追加し、開発者がWeChatの機能を呼び出すことができるようにしました。
1年前
060.1K
GPT4Free:反编译AI对话网站接口,免费使用多种GPT模型

GPT4Free: 複数のGPTモデルを自由に使用するためのAI対話ウェブサイトのインターフェイスをデコンパイルします。

GPT4Freeの概要 GPT4Freeは、開発者のxtekkyがGitHubで公開したオープンソースプロジェクトで、GPT-3.5、GPT-4、Llama、Gemini-Pro、Bar...など、さまざまな強力な言語モデルを無料で提供することを目的としています。
1年前
060.1K
SkyPilot:在任何云端高效运行AI与批处理任务的开源框架

SkyPilot: あらゆるクラウドでAIとバッチタスクを効率的に実行するオープンソースフレームワーク

概 要 SkyPilotは、カリフォルニア大学バークレー校のSky Computing Labが始めたオープンソースのフレームワークで、あらゆるクラウドインフラ上でAIやバッチ処理タスクを効率的に実行できるように設計されています。14以上のクラウドサービス(...
1年前
060.1K
OpenAI WebRTC Python:与OpenAI实时API进行语音交互的Python库

OpenAI WebRTC Python: OpenAIリアルタイムAPIと音声対話するためのPythonライブラリ

包括的な紹介 OpenAI Realtime WebRTC Pythonは、OpenAI Realtime APIを使った音声インタラクションの完全なソリューションを開発者に提供する、プロフェッショナルなPythonライブラリです。このプロジェクトは、低遅延を可能にするWebRTC技術に基づいています...
1年前
060.1K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: Whisper-Large v3より小型で高速な多言語音声テキスト変換ツール

包括的な紹介 PengChengStarling (PengCheng Labs) は、異なる言語の音声を対応するテキストに変換できる多言語自動音声認識 (ASR) ツールです。このツールキットはicefallプロジェクトに基づいて開発され、完全な音声認識プロセスを提供します...
1年前
060.1K
Onlook:面向前端设计开源Cursor,在React应用中设计并发布代码

Onlook: フロントエンド設計のためのオープンソースCursor、Reactアプリケーションの設計とコードの公開

一般的な紹介 Onlookはデザイナーと開発者のために作られたオープンソースのデザインツールで、ユーザーは実行中のReactアプリケーションで直接デザインし、デザインの変更をコードに変換することができます。このツールは、Figma や Webf... に似た直感的なビジュアル編集体験を提供します。
1年前
060K
NVIDIA联合LangChain推出:分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

NVIDIAとLangChainが、AI主導のテクニカルレポート生成を可能にする、アナリティクス向け構造化レポート作成のアドバンスガイドを発表

概論 これはLangChainとNVIDIAが共同開発した構造化レポート生成ブループリント・プロジェクトで、GitHubのJupyter notebookチュートリアルで紹介されている。このプロジェクトは高度なAI技術、特にLlama-3.3-7...を利用しています。
1年前
060K
LM Speed:快速测试大模型API性能

LMスピード:大規模モデルAPIのパフォーマンスを迅速にテストする

概要 LM Speed は、AI 開発者向けに設計されたツールであり、lmspeed.net でオンラインサービスとしても提供されている。主な機能は、言語モデル API のパフォーマンスをテスト・分析し、スピードのボトルネックを素早く特定し、呼び出し戦略を最適化することである。これは...
1年前
060K
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用

Exa & Deepseek Chat App: リアルタイムのウェブ検索と知的推論のためのオープンソースチャットアプリ

包括的な紹介 Exa & Deepseekチャットアプリは、オープンソースのスマートチャットアプリです。主な機能には、ExaのAPIを使用したリアルタイムのウェブ検索や、インテリジェントなDeepseek R1言語モデルの使用などがあります。
1年前
060K
PhiData:构建拥有记忆、知识和工具的AI智能体

PhiData: 記憶、知識、ツールを備えたAIインテリジェンスの構築

包括的な紹介 PhiDataは、インテリジェントなAIアシスタントを開発するために設計されたフレームワークです。PhiDataは、拡張されたメモリ、知識統合、ツール呼び出し機能を通じて、AIアシスタントが長期的な会話を行い、正確なビジネスコンテキストを提供し、さまざまな操作を実行できるようにします。
1年前
060K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言

askrepo:ソースコード閲覧ツール。LLMを使ってコードを分析し、詳細なコード解説を提供する。

一般的な紹介 askrepoは、LLM(Large Language Model)に基づいたソースコードリーディングツールです。指定されたディレクトリにあるGitで管理されたテキストファイルの内容を読み込み、Google Gemini APIに送信して、指定されたプロンプトに基づいた質問への回答を提供することができます...
1年前
060K
CogView4:生成中英双语高清图片的开源文生图模型

CogView4:中国語と英語の高精細対訳画像を生成するオープンソースのグラフィカルモデル

一般的な紹介 CogView4は清華大学のKEG研究室(THUDM)によって開発されたオープンソースのテキストからグラフへのモデルであり、テキスト記述を高品質な画像に変換することに重点を置いている。二ヶ国語のキューワード入力をサポートしており、特に中国語のキューを理解し、中国語の文字、非...
1年前
059.9K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery: WindowsネイティブAIモデル開発ツールセット、Windowsアプリケーションへのエンドサイドモデルの統合

概論 AI Dev Galleryは、Windows開発者向けに設計されたマイクロソフトのAI開発ツールアプリケーション(現在パブリックプレビュー中)である。開発者がAI機能を簡単にWindo...
1年前
059.9K
Devin.cursorrules:增强Cursor IDE开发体验,将Cursor/Windsurf打造成类Devin智能编程助手

Devin.cursorrules:カーソルIDE開発体験の向上、Cursor/WindsurfをDevinライクなインテリジェント・プログラミング・アシスタントに

概要 Devin.cursorrulesは、手頃な価格のCursorまたはWindsurf IDE(~20ドル)をDevinのような強力なAIプログラミング・アシスタントに変換するために設計された革新的なオープンソース・プロジェクトです。このプロジェクトは、CursorまたはWindsurf IDE(~20ドル)をDevinのような強力なAIプログラミング・アシスタントに変換するために設計されています。
1年前
059.8K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara:視覚的埋め込みベースの文書保管・検索サービス

概要 ColiVara は、ビジュアル埋め込み技術に基づく文書保管・検索サービスです。光学式文字認識(OCR)やテキスト抽出の必要性をなくし、フォームの破損や画像の紛失といった問題を回避します。ColiVaraは、PDFを含む100以上のファイルフォーマットをサポートしています。
1年前
059.7K
NodeTool:基于节点编排的AI模型工作流可视化客户端

NodeTool: ノードオーケストレーションに基づくAIモデルのワークフロー可視化クライアント

概要 NodeToolは、AI愛好家、開発者、データサイエンティスト、クリエイターにシンプルで直感的なインターフェイスを提供するように設計された革新的なAIオーサリングプラットフォームです。アーティスト、開発者、初心者を問わず、NodeToolはクリエイティブなプロトタイプを素早く作成するのに役立ちます。
1年前
059.7K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: タスクパフォーマンスを向上させるプロンプトプロジェクト最適化のためのオープンソースフレームワーク

包括的な紹介 PromptWizardはMicrosoftによって開発されたオープンソースのフレームワークであり、モデルがプロンプトの単語を生成、評価、改善し、それ自身で例を生成し、継続的なフィードバックによってアウトプットの質を向上させる自己進化メカニズムを使用しています。プロンプトの単語を自律的に最適化し、適切な例文を生成・選択し、...
1年前
059.7K
BuffGPT:企业级生成式AI应用低代码开发平台

BuffGPT: エンタープライズ級ジェネレーティブAIアプリケーションのためのローコード開発プラットフォーム

包括的な紹介 BuffGPTはLarge Language Model (LLM)に基づいたオープンソースのAIアプリケーション開発プラットフォームであり、データ処理、モデル呼び出し、RAG検索、視覚的なワークフローオーケストレーションなどのすぐに使える機能を提供し、ユーザーが生成AIアプリケーションを簡単に構築・運用できるように支援します。このプラットフォームは、プライベート...
1年前
059.7K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker、ポートレートビデオを使ってデジタル人物を生成する機能を強化

概要 SadTalker-Video-Lip-Syncは、SadTalkersの実装に基づいたビデオリップ合成ツールです。このプロジェクトは、音声駆動型生成によって唇の形状を生成し、設定可能な顔領域拡張を使用して、生成された唇の形状の鮮明度を向上させます...
1年前
059.7K
infinite-zoom-stable-diffusion:生成无限缩放循环视频

infinite-zoom-stable-diffusion: 無限ズームのループビデオを生成する。

包括的な紹介 無限ズーム安定拡散(Infinite Zoom Stable Diffusion)は、安定拡散技術を使用して無限ズームビデオを作成するために設計されたオープンソースプロジェクトです。このプロジェクトは、使いやすいColabノートブックを提供し、ユーザは...
1年前
059.7K
UNO:支持单主体和多主体定制化图像生成工具(适合电商配图)

UNO:単一主題および複数主題のカスタマイズされた画像生成ツールのサポート(eコマース・グラフィックに最適)

UNOはByteDance Intelligent Creation Teamによって開発されたオープンソースの画像生成フレームワークです。FLUX.1モデルに基づいており、"less-to-more "汎化アプローチによる単一被写体および複数被写体のカスタム画像生成に重点を置いている。
12ヶ月前
059.7K
AIHawk:智能求职助手,自动化投放简历(限英文)

AIHawk:インテリジェントな仕事検索アシスタント、自動履歴書配置(英語のみ)

概論 Auto_Jobs_Applier_AIHawkは、人工知能技術を用いた求人検索の自動化ツールである。短時間で大量の履歴書を自動配信し、個人情報や求職の意図に応じてパーソナライズすることができます。このツールは、求職者の転職意欲を...
1年前
059.6K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试

Aisuite: 統一されたOpenAIインターフェーススタイルで複数のビッグモデルを呼び出し、高速なモデル切り替えと比較テストを実現

包括的な紹介 aisuiteは、開発者が複数の生成AIプロバイダーのサービスを簡単に呼び出せるように設計された、シンプルで統一されたインターフェースです。OpenAIに似たインターフェースを持つaisuiteは、最も人気のあるLLM(大規模言語モデル)との対話を容易にします...
1年前
059.6K
自动解析PDF内容并提取文字与表格的开源服务

PDFコンテンツを自動的に解析し、オープンソースサービスのテキストとテーブルを抽出します。

総合紹介 PDF文書のレイアウトを自動的に分析し、ページ内のテキスト、タイトル、画像、表、数式、その他の要素を識別し、それらの正しい順序を決定します。このツールはOCR機能をサポートしており、スキャンしたPDFを検索可能なテキストに変換することができます。Docker上で動作し、2つのモデルを提供します。
1年前
059.5K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI

ChatOllama: Nuxt 3とOllamaをベースにしたローカルリアルタイムチャットアプリケーションUI

包括的な紹介 ChatOllamaは、大規模言語モデル(LLM)に基づくオープンソースのオンラインチャットアプリケーションプロジェクトです。ユーザは、モデル管理(リスト表示、ダウンロード、削除)、モデルとのチャットやその他の機能のためにプラットフォームを使用することができます。このプロジェクトは...
2年前
059.5K
OAK:可视化构建智能体应用的开源项目

OAK: インテリジェント・ボディ・アプリケーションを視覚的に構築するためのオープンソース・プロジェクト

概論 OAK(Open Agent Kit)は、開発者がAIインテリジェンスを迅速に構築、カスタマイズ、デプロイするためのオープンソースツールです。OpenAI、Google、Anthropic...などの大規模言語モデル(LLM)を接続することができます。
1年前
059.5K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraphスーパーバイザー:スーパーバイジングインテリジェンスを用いたマルチインテリジェンスコラボレーション管理ツール

概要 LangGraph SupervisorはLangGraphフレームワークをベースとしたPythonライブラリで、マルチインテリジェントな身体システムの作成と管理のために設計されています。このライブラリは、中央の監督エージェントを通して複数の専門化されたエージェントの作業を調整し、通信の流れやタスクの分割を確実にします...
1年前
059.4K
PrimisAI Nexus:构建可扩展AI多智能体系统与任务自动化的轻量框架

PrimisAI Nexus:スケーラブルなAIマルチインテリジェンスシステムとタスク自動化のための軽量フレームワーク

概要 PrimisAI Nexusは、GitHubでホストされている軽量なオープンソースのPythonフレームワークで、PrimisAIチームによって開発されています。大規模言語モデリング(LLM)を通じて、スケーラブルなAIマルチインテリジェント体システムの構築と管理を支援することを目的としており、...
1年前
059.4K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人

Base Chat: Ragieに基づく知識ベース構築のためのマルチテナント型チャットボット

概要 Base Chatは、Ragie Connectを使用して組織のナレッジベースに接続し、会話するマルチテナント型チャットボットです。このプロジェクトは、複数のRagie機能のリファレンスアプリケーションであり、Next.jsで構築され、Goo...
1年前
059.4K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni:人間のビデオ感情や行動を分析するためのマルチモーダル・マクロモデル

一般的な紹介 HumanOmniは、HumanMLLMチームによって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルです。HumanOmniは人間の動画を分析することに特化しており、画像と音声の両方を処理することで、感情や行動、対話の内容を理解するのに役立ちます。このプロジェクトでは2...
1年前
059.4K
NextChat:兼容多平台的本地化AI聊天助手

NextChat:複数のプラットフォームに対応するローカライズされたAIチャットアシスタント

概要 NextChatは、GPT-3、GPT-4、GPT-4.5、Gemini Proなどのクラス最高の言語モデルでチャットサービスを展開できる画期的なAIチャットサービスです。エレガントなユーザーインターフェース、コラボレーション機能、統合機能、テンプレート、...
1年前
059.3K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

ロボ・ブロガー:ラングラフをもとに音声コンテンツからブログ記事を生成、ブログ執筆を自動化

はじめに ロボ・ブロガーは、音声読み上げ技術によってコンテンツ生成プロセスを簡素化するように設計された革新的なブログ作成ツールです。ユーザーはあらゆる音声テキスト変換アプリケーションを使ってアイデアを記録することができ、ロボ・ブロガーはそれらのアイデアを構造化されたブログコンテンツに変換します。
1年前
059.3K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流

Director: 自然言語記述によるビデオ検索、編集、生成ワークフローのためのインテリジェントビデオエージェントフレームワーク

概要 Directorは、インテリジェントなビデオエージェントを構築することで、ビデオインタラクションとワークフローを簡素化し、最適化するために設計されたオープンソースのフレームワークです。このフレームワークは、VideoDBの "video-as-data "インフラストラクチャに基づいており、検索、編集、コンパイル、生成などの複雑なビデオタスクを処理することができます。
1年前
059.2K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

視覚エージェント:複数の視覚的ターゲット検出タスクを解決する視覚インテリジェンス

概要 Vision Agentは、LandingAI(Team Enda Wu)によって開発されたオープンソースプロジェクトで、GitHubでホストされています。先進的なエージェントフレームワークとマルチモーダルモデルを使用しています。
1年前
059.2K
Cerebr:与网页内容对话的开源浏览器插件

Cerebr:ウェブコンテンツと対話するオープンソースのブラウザ・プラグイン

概要 説明 Cerebrは、生産性と学習体験を向上させるために設計された、Chrome用の強力なAIアシスタント拡張機能です。Cerebrは、クリーンで効率的なブラウザAIアシスタントの必要性からゼロから設計され、ミニマルなデザインと強力な...
1年前
059.2K
llm.pdf:在PDF文件中运行大型语言模型的实验项目

llm.pdf:大規模言語モデルをPDFファイルで実行する実験的プロジェクト

一般的な紹介 llm.pdfは、ユーザーが直接PDFファイルで大規模言語モデル(LLM)を実行できるようにするオープンソースプロジェクトです。EvanZhouDevによって開発され、GitHubでホストされているこのプロジェクトは、革新的なアプローチを示しています:Em...
11ヶ月前
059.2K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: コード構造とコンテンツから自動的にMarkdownドキュメントを生成します。

一般的な紹介 CodeWeaverは、コード・ライブラリを単一の見やすいMarkdownドキュメントに編むために設計されたコマンドライン・ツールです。ディレクトリを再帰的にスキャンし、各ファイルの内容をコードブロックに埋め込むことで、プロジェクトのファイル階層を構造化した表現を生成します。このツールは...
1年前
059.1K
RAG Web UI:构建智能文档问答系统,简单构建私有Web端知识库

RAG Web UI:インテリジェントなドキュメントQ&Aシステムの構築と、プライベートなウェブサイド・ナレッジベースのシンプルな構築

総合紹介 RAG Web UIは、RAG(Retrieval Augmented Generation)技術に基づいた知的対話システムです。企業や個人が独自の知識ベースに基づいてインテリジェントなQ&Aシステムを構築するのに役立ちます。文書検索と大規模な言語モデルを組み合わせることで、RAG Web UIは正確で信頼性の高い...
1年前
059K
AutoGPT:工作流自动化与自主执行任务的智能体构建平台

AutoGPT:ワークフロー自動化と自律的タスク実行のためのインテリジェントな身体構築プラットフォーム

包括的な紹介 AutoGPTは、継続的に稼働するAIエージェントの作成、導入、管理を支援し、複雑なワークフローを自動化するために設計された強力なプラットフォームです。Significant Gravitas社によって開発されたこのプラットフォームは、幅広いツールと機能を提供し、ユーザがAIエージェントに集中できるようにします。
1年前
059K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser:マウスアクションをAI経由でSelenium Pythonスクリプトに変換するブラウザ自動化コードの生成

概要 AutoMouserは、ユーザーのインタラクションをインテリジェントに追跡し、OpenAIのGPTモデルを使用してSeleniumテストコードを自動的に生成するChrome拡張機能です。ユーザーのブラウザ操作を記録し、それを変換することでテストコードを生成します。
1年前
059K