AIオープンソースプロジェクト

合計1020記事
DeepRant:实时翻译游戏聊天内容的开源客户端

DeepRant: ゲームチャットコンテンツのリアルタイム翻訳用オープンソースクライアント

概要 DeepRantは、国際サーバーにおける言語の障壁の問題を解決するために設計された、ゲーマー向けのオープンソース翻訳ツールです。ショートカットキーを使ってゲーム内のテキストを瞬時に翻訳することができ、複数の言語による相互翻訳をサポートし、プレイヤーがゲームを終了することなくチャットメッセージを素早く理解し、返信することを可能にします。
7ヶ月前
023.1K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity:人間の実演を見ながらウェブ操作を行うAIを訓練するオープンソースプロジェクト

概論 OptexityはGitHub上のオープンソースプロジェクトで、Optexityチームによって開発されている。このプロジェクトの核心は、人間のデモ・データを使って、コンピュータ・タスク、特にウェブ・ページ操作をこなすAIを訓練することである。このプロジェクトには3つのコードライブラリが含まれている。
7ヶ月前
023.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具

TryOffAnyone: 人物の衣服をタイル状の衣服表示画像として抽出するAIツール

包括的な紹介 TryOffAnyoneは、Eコマース分野における衣服ディスプレイの課題を解決するために特別に設計された画期的なAI画像処理ツールです。TryOffAnyoneは、実際に服を着ている人の写真を、レイフラットディスプレイ効果のある画像にインテリジェントに変換することができ、この技術は最新のLatent Dif...
9ヶ月前
023.1K
Quick Prompt:快速管理和使用提示词的浏览器扩展

Quick Prompt: プロンプトを素早く管理・使用するためのブラウザ拡張機能

General Quick Promptはプロンプトの管理と高速入力に特化したオープンソースのブラウザ拡張機能です。ユーザーはプロンプトのライブラリを作成、整理、保存し、プリセットされたプロンプトコンテンツをウェブページの入力ボックスに素早く挿入することができます。このツールは特に...
5ヶ月前
023.1K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端

Charla: Ollamaバックエンドにネイティブに統合されたエンドポイントベースのミニマルなAIチャットツール

概要 Charlaはエンドポイントベースのチャットアプリケーションで、ネイティブ言語モデルとの対話ができるように設計されています。このアプリケーションはOllamaバックエンドと統合され、コンテキストを考慮した対話をサポートし、チャットセッションをMarkdownファイルとして保存します。ユーザーは単に...
9ヶ月前
023.1K
Gemini Search:Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎

Gemini Search: Gemini 2.0 Flashで構築されたPerplexityスタイルのAI検索エンジン

包括的な紹介 Gemini-SearchはGoogle Gemini 2.0の技術に基づいたオープンソースのインテリジェント検索エンジンのプロジェクトである。このプロジェクトはTypeScriptを使用しており、Perplexity検索エンジンの複製に取り組んでいる。
9ヶ月前
023.1K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体

Go-with-the-Flow:ビデオ内のオブジェクトの動きをコントロールし、ビデオ内の動くオブジェクトを加算または減算します。

一般的な紹介 Go-with-the-Flowは、Netflix Eyeline Studiosの研究チームによって開発されたオープンソースプロジェクトで、ノイズを歪ませることで映像拡散モデルのモーションパターンを制御します。このプロジェクトにより、ユーザーはシーンのカメラと...
9ヶ月前
023.1K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手

エージェントラボラトリー:研究者のための自動化されたコードとスタディライティングアシスタント

包括的な紹介 エージェントラボラトリーは、研究者の研究アイデアの実現を支援するために設計された、エンドツーエンドの自律的な研究ワークフローです。このシステムは、大規模な言語モデルによって駆動される専用エージェントで構成され、文献調査や計画の立案から実行まで、研究ワークフロー全体をサポートします。
7ヶ月前
023.1K
OmAgent:构建多模态智能设备的智能体框架

OmAgent:マルチモーダル・スマートデバイス構築のための知的身体フレームワーク

包括的な紹介 OmAgentはOm AI Labによって開発されたマルチモーダルインテリジェントボディフレームワークであり、スマートデバイスにAIを搭載した強力な機能を提供することを目的としている。最先端のマルチモーダルベースモデルとインテリジェントボディアルゴリズムを統合することで、開発者は様々なデバイス上で効率的なスマートデバイスを作成することができます。
9ヶ月前
023.1K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

悟空:詳細で一貫性のある動画を生成します。詳細なキャラクターやオブジェクトを使用したコマーシャルの作成に最適です。

包括的な紹介 Gokuは、ストリーム変換技術に基づく連携型画像・動画生成モデルであり、業界トップクラスのパフォーマンスを達成するよう設計されています。Gokuは、きめ細かなデータ照合、モデル設計、ストリーム変換の定式化など、高度で高品質な映像生成技術を統合しています。
8ヶ月前
023.1K
Open NotebookLM:将PDF转换为播客的开源工具

Open NotebookLM: PDFをオープンソースツールのポッドキャストに変換する

概要 Open NotebookLMは、あらゆるPDF文書をポッドキャストに変換するために設計されたオープンソースプロジェクトです。このツールは、オープンソースのLarge Language Model (LLM)とText-to-Speech (TTS)モデルを使用してPDFコンテンツを処理し、オーディオポッドキャストに適した自然なダイアログを生成します...
9ヶ月前
023.1K
WritingBench:测试大模型写作能力的基准评估工具

WritingBench:大規模モデルのライティング能力をテストするベンチマーク評価ツール

概要 WritingBenchはX-PLUGチームによって開発され、GitHubでホストされているオープンソースプロジェクトである。大規模なモデルのライティング能力をテストするために設計されたツールで、1239の実世界のライティングタスクを提供する。これらのタスクは...
7ヶ月前
023.1K
Mahilo:连接不同AI智能体框架实时协作的集成平台

Mahilo:異なるAIインテリジェンスフレームワークをリアルタイムで連携させる統合プラットフォーム

Mahiloは、開発者Jayesh SharmaによってGitHubで公開されたオープンソースのマルチインテリジェンス統合プラットフォームであり、ユーザーが異なるフレームワークのAIインテリジェンスを接続し、リアルタイムのコミュニケーション、人間とコンピュータのインタラクション、インテリジェントなコラボレーションをサポートできるように設計されている。この ...
8ヶ月前
023.1K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用

AI Dev Gallery: WindowsネイティブAIモデル開発ツールセット、Windowsアプリケーションへのエンドサイドモデルの統合

概論 AI Dev Galleryは、Windows開発者向けに設計されたマイクロソフトのAI開発ツールアプリケーション(現在パブリックプレビュー中)である。開発者がAI機能を簡単にWindo...
10ヶ月前
023K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具

autoMate:AIとRPAを組み合わせてコンピュータ作業を自動化するネイティブツール

総合紹介 autoMateは、yuruotong1がGitHubでオープンソース開発したローカル自動化ツールで、AI+RPA(Artificial Intelligence+Robotic Process Automation)を中核機能としている。大規模言語モデルのインテリジェントな理解とRPAを組み合わせ...
7ヶ月前
023K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: 曲の自動生成のための単段自己回帰変換器

包括的な紹介 SongGenは、テキストから曲への生成タスクのために設計された、オープンソースの単一ステージ自己回帰変換モデルである。このモデルは、テキスト入力からボーカルとバッキングトラックを含む楽曲を生成することができます。SongGenは、幅広い音楽属性をきめ細かく制御することができます...
8ヶ月前
023K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现

AI Web Operator: ブラウザ自動化、OpenAI Operatorのオープンソース実装

概要 AI Web Operatorは、複数のAI技術とSDKを統合することで、ブラウザでのユーザー体験を簡素化するために設計されたオープンソースのAIブラウザ・オペレーター・ツールです。このツールは、BrowserbaseとVercel...をベースにしています。
9ヶ月前
023K
X-R1:在普通设备中低成本训练0.5B模型

X-R1:一般的なデバイスの0.5Bモデルを低コストでトレーニング

一般的な紹介 X-R1は、dhcode-cppチームによってGitHubでオープンソース化された強化学習フレームワークであり、エンドツーエンドの強化学習に基づいてモデルをトレーニングするための低コストで効率的なツールを開発者に提供することを目的としている。このプロジェクトはDeepSeek...によってサポートされている。
7ヶ月前
023K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO:複数のAI製品を統合した商品化アグリゲーション・プラットフォーム

総合紹介 AIBot PROは、複数のAI製品を統合するための便利なプラットフォームをユーザーに提供するために設計された、.NET 6ベースのAIアグリゲーションクライアントです。このクライアントは、無感覚な切り替え対話をサポートし、ChatGPT、Gemini、Claude、Wenxin Yiyin...を統合します。
8ヶ月前
023K
OpenAI.fm:展示OpenAI语音API的交互式演示工具

OpenAI.fm:OpenAIの音声APIを紹介するインタラクティブなデモツール

概論 openai-fmはGitHubでホストされているオープンソースプロジェクトで、OpenAIのText-to-Speech (TTS) APIの機能をデモンストレーションすることを目的としています。このプロジェクトは、インタラクティブなウェブアプリケーションを通して動作します...
6ヶ月前
023K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发

SuperWeChatPC:オープンソースコンピュータ微信機能強化ツール、二次開発支援

総合紹介 SuperWeChatPCはオープンソースのコンピュータ用WeChat拡張ツールであり、その核心はユーザーと開発者に利便性を提供することである。当初、WeChatは単独でしか開くことができないという問題を解決し、後にWeChatSDKを追加し、開発者がWeChatの機能を呼び出すことができるようにしました。
7ヶ月前
023K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频

Magic 1-For-1:1分で1分の動画を生成すると謳う、効率的な動画生成オープンソースプロジェクト

包括的な紹介 Magic 1-For-1は、メモリ使用量を最適化し、推論の待ち時間を短縮するために設計された効率的なビデオ生成モデルである。このモデルは、テキストから動画への生成タスクを、テキストから画像への生成と画像から動画への生成という2つのサブタスクに分解し、より効率的な学習と蒸留を可能にする。
8ヶ月前
023K
OneLine:生成热点事件时间轴的AI工具

OneLine:注目イベントのタイムラインを生成するAIツール

一般的な紹介 OneLineはGitHubでホストされているオープンソースのホットイベントタイムライン生成ツールで、ユーザーchengtx809によって開発されました。ユーザーによって入力されたキーワードによってイベントのタイムラインを素早く生成し、イベントの時間、タイトル、説明、関連人物を表示します...
6ヶ月前
023K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架

InspireMusic:Aliのオープンソース統合音楽・楽曲・音声生成フレームワーク

一般的な紹介 InspireMusicはPyTorchベースのオープンソースツールキットで、音楽、歌、オーディオの生成に特化しています。高品質なオーディオを生成するための統一されたフレームワークを提供し、テキストキュー、音楽構造、音楽スタイルを制御します。
7ヶ月前
023K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具

AI-ClothingTryOn:ジェミニベースのバーチャル試着ツール

概論 AI-ClothingTryOnは、開発者のspeedTDによって作成され、GitHubでホストされているPythonベースのオープンソースデスクトップアプリケーションです。このアプリケーションは、Google Geminiの人工知能技術を使用しています。
7ヶ月前
023K
Groq AppGen:使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目

Groq AppGen: Groq APIを使用したLlama 3.3 70B HTMLコード生成機能の実証実験プロジェクト

一般的な紹介 Groq AppGenは、Groq Inc.によって開発され、オープンソース化された革新的なインタラクティブ・ウェブ・アプリケーション・ジェネレーターです。このプロジェクトは、HTMLコード生成のためのLlama 3.3 70Bモデルのパワーを実証しています。Groq...
9ヶ月前
023K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp:カスタム面接質問を生成し、インテリジェントな分析を実行するオープンソースAI音声面接プラットフォーム

概論 FoloUpは、企業向けにAIを活用した音声面接ソリューションを提供するために設計されたオープンソースのプラットフォームです。FoloUpを利用することで、企業は職務内容に合わせてカスタマイズした面接質問を素早く生成し、AIによる自然な会話形式の面接を実施することができます。また、このプラットフォームは、詳細な面接分析も提供します。
7ヶ月前
023K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面

Ortlin:すべてのOpenAIモデルとAPIを操作するためのウェブGUI

概論 Ortlinは、技術者、非技術者を問わず、誰でも簡単にOpenAIのAPIや基礎モデルと対話できるように設計されたウェブベースのグラフィカルユーザーインターフェースです。完全にフリーでオープンソースであるため、ユーザーはOpenAIを手間をかけずに利用することができます...
12ヶ月前
023K
AgentGPT:创建并运行自动化AI智能体的开源项目

AgentGPT:自動化されたAIインテリジェンスを作成・実行するオープンソースプロジェクト

一般的な紹介 AgentGPTは、Reworkdチームによって開発され、GitHubでホストされているオープンソースプロジェクトで、ユーザーがブラウザを通して自律的にAIインテリジェンスを作成、設定、デプロイできるように設計されています。ユーザーは目標を設定するだけで、AgentGPTは...
7ヶ月前
023K
Browse AI:无代码提取和监控结构化数据

ブラウズAI:コードなしで構造化データを抽出し監視する

Browseの紹介 Browse AIは、プログラミングなしであらゆるウェブサイトからデータを抽出・監視できるように設計された、コーディング不要のクラウドベースのウェブ自動化ソフトウェアです。マウス1つでデータ抽出、監視、自動化タスクを実行するボットを訓練することができます...
1年前
023K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具

PengChengStarling: Whisper-Large v3より小型で高速な多言語音声テキスト変換ツール

包括的な紹介 PengChengStarling (PengCheng Labs) は、異なる言語の音声を対応するテキストに変換できる多言語自動音声認識 (ASR) ツールです。このツールキットはicefallプロジェクトに基づいて開発され、完全な音声認識プロセスを提供します...
9ヶ月前
022.9K
Quantum Swarm:多智能体集群协作框架

Quantum Swarm:マルチインテリジェンスクラスターコラボレーションのためのフレームワーク

QuantumSwarmは、AIの人口知能の開発と研究に焦点を当てたオープンソースの人工知能フレームワークです。このプロジェクトはQuarm AIチームによってGitHub上で管理されており、マルチインテリジェンスシステムの構築とテストのための柔軟で効率的なプラットフォームを提供することを目指している。
9ヶ月前
022.9K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

信頼できるAI:自動化された大規模言語モデル評価のためのフレームワーク。

包括的な紹介 DeepEvalは、大規模な言語モデリングシステムを評価およびテストするための、使いやすいオープンソースのLLM評価フレームワークです。Pytestに似ていますが、LLM出力のユニットテストに重点を置いています。DeepEvalは、G-Eval、ファントム...
8ヶ月前
022.9K
GraphGen:利用知识图谱生成合成数据微调语言模型

GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成する

包括的な紹介 GraphGenは、上海のAIラボであるOpenScienceLabによって開発されたオープンソースのフレームワークであり、GitHubでホストされている。GraphGenは、知識グラフを通して合成データ生成を導くことによって、大規模言語モデル(LLM)の教師ありファインチューニングを最適化することに焦点を当てている。LLMは...
5ヶ月前
022.9K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM:LLM事前学習のための効率的なウェブクローリングツール

包括的な紹介 Crawl4LLMは清華大学とカーネギーメロン大学によって共同開発されたオープンソースプロジェクトであり、大規模モデル(LLM)の事前学習のためのウェブクローリングの効率最適化に焦点を当てている。高品質なウェブページデータをインテリジェントに選択することで、非効率なクロールを大幅に削減し、本来1...
8ヶ月前
022.9K
MoshiVis:实时语音对话和图像理解的开源模型

MoshiVis: リアルタイムの音声対話と画像理解のためのオープンソースモデル

一般的な紹介 MoshiVisはKyutai Labsによって開発され、GitHubでホストされているオープンソースプロジェクトです。MoshiVisはMoshi speech-to-text model (7Bパラメータ)をベースにしており、約2億600万個の新しい適応パラメータと凍結されたPal...
7ヶ月前
022.9K
AI Logo:AI快速生成定制化品牌Logo

AIロゴ:AIがカスタマイズされたブランドロゴを素早く生成

概論 AI LogoはオープンソースのAIアプリケーション・プロジェクトであり、人工知能によってパーソナライズされたブランドロゴを素早く生成することを目的としている。Stable DiffusionやDeepAIといった強力なAI技術を組み合わせ、ユーザーが簡単なブランドロゴを入力できるようにしています。
7ヶ月前
022.9K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: 複数のAIモデルを簡単に統合し、Gradioに基づいたマルチモーダル・アプリケーションを構築する

概論 ai-gradioはオープンソースのPythonツールキットで、開発者が複数のAIモデルを簡単に統合して使用できるように設計されています。Gradio上に構築されたこのプロジェクトは、複数のAIモデルとサービスをサポートするための統一されたインターフェースを提供します。テキスト、音声、動画のいずれでも...
8ヶ月前
022.9K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客

ロボ・ブロガー:ラングラフをもとに音声コンテンツからブログ記事を生成、ブログ執筆を自動化

はじめに ロボ・ブロガーは、音声読み上げ技術によってコンテンツ生成プロセスを簡素化するように設計された革新的なブログ作成ツールです。ユーザーはあらゆる音声テキスト変換アプリケーションを使ってアイデアを記録することができ、ロボ・ブロガーはそれらのアイデアを構造化されたブログコンテンツに変換します。
10ヶ月前
022.9K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面

ミニカバー:ブログ、ショートビデオ、ソーシャルメディアなどにパーソナライズされたカバーを作成するために設計されたオンラインカバーメーカー!

概要 Mini-Coverは、ブログやショートビデオ、ソーシャルメディアなどのプラットフォーム用にパーソナライズされたカバーを生成するために設計されたオープンソースのオンラインカバー生成ツールです。JLinMrによって開発されたこのツールは、シンプルで効率的なソリューションを提供し、ユーザーのニーズに合ったカバーを素早く生成することを目的としています。
10ヶ月前
022.9K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具

GraphCast:拡散モデルに基づく中期的な世界気象予測の学習と予測のための効率的なツール

はじめに GraphCastはGoogle DeepMindによって開発された先進的な天気予報ツールで、ディープラーニング技術によって中期的な世界の天気予報の精度を向上させることを目的としている。このプロジェクトでは、事前に学習された様々なモデルとサンプルコードを提供しており、ユーザーはこれらのコードをリソースとして利用することができます。
10ヶ月前
022.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架

muAgent:LLMとEKG(業界知識)によって駆動される新しいエージェントオーケストレーションフレームワーク

概要 muAgent は、Ant Group が開発した革新的なマルチインテリジェントフレームワークです。このフレームワークは、マルチインテリゲンチャ、ファンクションコール、コードインタープリタ、およびその他のテクノロジーと連携し、キャンバスのドラッグアンドドロップと簡単なテキスト記述によって、ユーザが人間の指導の下で様々な複雑な標準操作手順(SOP)を実行するのを支援します。
11ヶ月前
022.8K
PromptWizard:优化提示工程的开源框架,提升任务性能

PromptWizard: タスクパフォーマンスを向上させるプロンプトプロジェクト最適化のためのオープンソースフレームワーク

包括的な紹介 PromptWizardはMicrosoftによって開発されたオープンソースのフレームワークであり、モデルがプロンプトの単語を生成、評価、改善し、それ自身で例を生成し、継続的なフィードバックによってアウトプットの質を向上させる自己進化メカニズムを使用しています。プロンプトの単語を自律的に最適化し、適切な例文を生成・選択し、...
10ヶ月前
022.8K
Trackers:用于视频对象跟踪的开源工具库

Trackers: ビデオオブジェクト追跡のためのオープンソースツールライブラリ

一般的な紹介 Trackersは、映像内の複数オブジェクトのトラッキングに特化したオープンソースのPythonツールライブラリです。SORTやDeepSORTのようないくつかの主要なトラッキングアルゴリズムを統合しており、ユーザーは異なるオブジェクト検出モデル(YOLO...
5ヶ月前
022.8K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中

SHMT: Self-Supervised Hierarchical Makeup Transfer Model, バーチャルメイク, 新しいポートレートへのメイクの移行

包括的な紹介 SHMT(Self-supervised Hierarchical Makeup Transfer)は、潜在拡散モデルに基づく自己教師ありの階層的メイクアップ移行プロジェクトであり、教師なし学習方法によってメイクアップ効果の高品質を実現することを目的としている...
9ヶ月前
022.8K
Atomic Agents:构建轻量级模块化AI智能体框架

アトミック・エージェント:軽量モジュール型AIインテリジェンス構築のためのフレームワーク

概論 Atomic Agentsは、エージェントAIパイプラインとアプリケーションを構築するためのアトミティシティ(atomicity)のコンセプトに基づいて設計された、非常に軽量でモジュール化されたフレームワークです。このフレームワークは、強力なアプリケーションを作成するために組み合わせることができるツールとエージェントのセットを提供します。このフレームワークは、Instruc...
10ヶ月前
022.8K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统

FastAPI DocGPT: FastAPIベースのPDF文書処理とQ&Aシステム

一般的な紹介 FastAPI DocGPTは、FastAPIベースのドキュメントクイズシステムで、ユーザがPDFファイルをアップロードし、ドキュメントの内容に基づいてクイズを受けることができます。このシステムは、OpenAIのエンベッディング技術を利用して、ドキュメントのコンテンツをベクターデータベースのQ...
11ヶ月前
022.8K
Arrakis:为AI智能体提供安全沙盒环境的开源工具

Arrakis:AIインテリジェンスに安全なサンドボックス環境を提供するオープンソースツール

一般的な紹介 Arrakisは、安全でカスタマイズ可能な環境を提供するためにAI知能のために設計されたサンドボックス環境です。Abhishek Bhardwajによって開発され、GitHubでホストされており、AGPL v3ライセンスを使用しています。
6ヶ月前
022.8K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker、ポートレートビデオを使ってデジタル人物を生成する機能を強化

概要 SadTalker-Video-Lip-Syncは、SadTalkersの実装に基づいたビデオリップ合成ツールです。このプロジェクトは、音声駆動型生成によって唇の形状を生成し、設定可能な顔領域拡張を使用して、生成された唇の形状の鮮明度を向上させます...
8ヶ月前
022.8K
Tap4 AI WebUI:开源轻量级AI工具导航项目

Tap4 AI WebUI:オープンソースの軽量AIツール・ナビゲーション・プロジェクト

包括的な紹介 Tap4 AI WebUIは、オープンソースの軽量AIツールナビゲーションウェブサイトプロジェクトです。このプロジェクトは、Next.jsとSupabaseテクノロジースタックを使用し、多言語SEO最適化をサポートし、AIツールカタログを提供します。
12ヶ月前
022.8K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架

OpenAIエージェントSDK:協調的マルチインテリジェンスワークフロー構築のためのPythonフレームワーク

概論 OpenAI Agents SDKは、マルチインテリジェントワークフローを構築するために設計された、OpenAIの軽量な開発ツールです。Pythonをベースとしており、使いやすく、開発者はAgentを設定し、タスクをカットすることができます。
7ヶ月前
022.8K
H2O GPT:灵活配置的本地AI对话与文档处理工具

H2O GPT: ネイティブAI対話および文書処理ツールの柔軟な構成

一般的な紹介 H2O GPTは、プライベート化されたチャットとドキュメント処理機能を提供することを目的としたオープンソースプロジェクトです。このプロジェクトはApache 2.0ライセンスに基づいており、LLaMa2、Mistral、Falconなどの様々なGPTモデルをサポートしています。...
10ヶ月前
022.8K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

タンクワーク:音声とテキストでコンピュータを操作し、リアルタイムの音声フィードバックを提供する知的ボディ

概論 TankWorkはオープンソースのデスクトップエージェント・フレームワークで、コンピュータビジョンとシステムレベルのインタラクションを通じて、AIがコンピュータを認識し制御できるように設計されています。このフレームワークは、エージェントが音声やテキストコマンドでコンピュータを直接制御し、リアルタイムのスクリーンコンテンツを処理し、継続的なオーディオビジュアルを提供することを可能にします。
9ヶ月前
022.8K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT:医療画像解析と診断Q&Aを支援する医療ビッグモデル

包括的な紹介 HealthGPTは、異種知識適応による統一的な医療視覚理解と生成能力の達成を目指す、先進的な医療グランドビジュアル言語モデルである。このプロジェクトの目標は、医療グラフを大幅に改善する統一的な自己回帰フレームワークに医療視覚理解と生成能力を統合することである。
8ヶ月前
022.8K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师

CR-Mentor:GitHubのための知識ベース+LLM駆動インテリジェントコードレビューメンター

包括的な紹介 CR-Mentorは、専門的な知識ベースと大規模言語モデリング(LLM)のパワーを組み合わせたインテリジェントなコードレビューツールです。すべてのプログラミング言語のコードレビューをサポートするだけでなく、ナレッジベースに蓄積されたベストプラクティスに基づき、チーム専用のレビュー基準やフォーカスエリアをカスタマイズします。ナレッジベースを通じて...
11ヶ月前
022.8K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题

Maro-o1:Qwen2-7Bに基づくOpenAI o1モデルのオープンソース版-複雑な問題を解決するためのオープンな推論モデルを探求するための微調整を指示する。

総合紹介 Marco-o1は、アリババ国際デジタル商務グループ(AIDC-AI)によって開発された、複雑な実世界の問題を解決するためのオープンな推論モデルです。このモデルは、思考の連鎖(CoT)微調整、モンテカルロ木探索(MCTS)、および革新的な推論戦略を組み合わせています...
10ヶ月前
022.8K
Plandex:支持超长上下文的开源AI编码助手

Plandex:超ロングコンテクストをサポートするオープンソースのAIコーディングアシスタント

概要 Plandexは、大規模で複雑なソフトウェアプロジェクトのために設計されたオープンソースのエンドツーエンドのAIコーディングアシスタントです。複数ステップのタスクを計画・実行し、最大200万トークンのコンテキストを処理し、30以上のプログラミング言語をサポートします。
6ヶ月前
022.8K
Thera:任意尺寸图像放大、去锯齿的开源工具

Thera: あらゆるサイズの画像拡大、デエイリアス・オープンソースツール

概論 Theraは、チューリッヒ工科大学とチューリッヒ大学のチームによって開発されたオープンソースの画像超解像ツールである。低解像度の画像を、2倍、3.14倍、あるいは整数倍など、任意の倍率にズームすることができる。
6ヶ月前
022.7K
StickerBaker:用AI制作个性贴纸图片

ステッカーベイカー:AIでパーソナライズされたステッカー画像を作る

概要 stickerbakerは、人工知能技術を使って様々な面白いステッカーを作成するオープンソースのステッカーメーカーです。シンプルな猫のステッカーが欲しい人も、多様なステッカーをシリーズで作りたい人も、stickerbakerはあなたのニーズに応えます...
1年前
022.7K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具

IMS Toucan: 高速でコントロール可能な多言語(7000以上の言語に対応)音声合成ツール

一般的な紹介 IMS Toucanはドイツのシュトゥットガルト大学の自然言語処理研究所(IMS)によって開発された最先端の音声合成(TTS)ツールキットです。このツールキットは7000以上の言語をサポートし、高速で、制御可能で、必要な計算資源が少ない。
8ヶ月前
022.7K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具

ScrapeGraphAI:ウェブクローリングのための単一のキューワード、ルールを書く必要のないインテリジェントなウェブコンテンツ抽出ツール

包括的な紹介 ScrapeGraphAIは革新的なPythonのWebスクレイピングライブラリで、Large Language Modelling (LLM)とDirect Graph Logicを巧みに組み合わせ、Webサイトやローカルドキュメントのスクレイピングパイプラインを作成します。このツールのユニークな点は、完璧なレベルのシンプルさとパワーです。
9ヶ月前
022.7K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体

ミニLLMフロー:100行のコードで「有向グラフ構造」を持つLLMミニインテリジェントを構築する

概論 miniLLMFlowは、「シンプルであること」という設計哲学を実証する、わずか100行のコアコードからなる最小主義の大規模言語モデル(LLM)開発フレームワークです。このフレームワークは、AIアシスタント(ChatGPT、Claudeなど)が...
9ヶ月前
022.7K
InfiniteYou:保留人脸特征的照片生成与编辑工具

InfiniteYou:顔の特徴を保持する写真生成・編集ツール

概要 InfiniteYouは、ByteDance Intelligent Creationチームによって開発されたオープンソースプロジェクトです。拡散トランスフォーマー(DiTs)技術に基づき、FLUX.1-devモデルを使用しています。主な機能は、ユーザーが写真をアップロードし、テキストの説明を入力することで、写真を生成することです。
7ヶ月前
022.7K
Pyramid Flow:快手推出的开源版

Pyramid Flow:Racerが発表した "Kringle "のオープンソース版で、SD3をベースとし、8GB未満のGPUで動作する(ワンクリックデプロイメント版)。

総合紹介 ピラミッドフローは、フローマッチング技術に基づく効率的な自己回帰的映像生成手法である。この手法は、異なる解像度とノイズレベルの間を補間することで、映像コンテンツの生成と伸長において高い計算効率を達成する...
11ヶ月前
022.7K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具

AI-Infra-Guard:AIシステムの潜在的なセキュリティリスクを検出するオープンソースツール

包括的な紹介 AI-Infra-Guardは、Tencentのハイブリッド・セキュリティ・チームであるZhuqiao Labsによって開発されたオープンソースのAIインフラストラクチャ・セキュリティ評価ツールです。このツールは、30以上のAIフレームワークとコンポーネントをサポートしており、...
8ヶ月前
022.7K
Novel:模仿Notion AI的开源写作编辑器

小説:Notion AIを模倣したオープンソースのライティング・エディター

包括的な紹介 これは、Steven Teyによって開発されたオープンソースプロジェクトで、Novelと呼ばれ、NotionスタイルのWYSIWYGテキストエディタであり、ユーザーがテキスト入力の効率を向上させることができる統合されたAIの自動補完機能です。このプロジェクトは、詳細なドキュメントとインストール手順を提供します。
1年前
022.7K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)

Swarm:軽量なマルチインテリジェント身体システムを学習するための実験的教育プロジェクト(OpenAIの例)

一般的な紹介 SwarmはOpenAIによって開発された実験的な教育用フレームワークで、マルチエージェントシステムの軽量で、制御可能で、テストが容易なインターフェースを探求するためのものです。このフレームワークは、主にエージェント間のハンドオフとルーチンパターンを実証するために使用され、開発者がマルチエージェントシステムの調整と実行を理解し、実装するのに役立ちます...
9ヶ月前
022.7K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据

OmniParse: ドキュメント/マルチメディアからあらゆる非構造化データを抽出し、構造化データにパースします。

概要 OmniParseは、あらゆる非構造化データを構造化された実用的なデータに変換するために設計された強力なデータ解析および最適化プラットフォームであり、GenAI(Generative Artificial Intelligence)フレームワーク用に最適化されています。ドキュメント、テーブル、画像、ビデオ、オーディオファイル、または...
11ヶ月前
022.7K
OneFileLLM:整合多种数据源为单一文本文件

OneFileLLM: 複数のデータソースを単一のテキストファイルに統合

包括的な紹介 OneFileLLMは、大規模言語モデル(LLM)に簡単に入力できるように、複数のデータソースを単一のテキストファイルに統合するために設計されたオープンソースのコマンドラインツールです。GitHubリポジトリ、ArXiv論文、YouTube動画トランスクリプション、Web...
6ヶ月前
022.7K
InstantCharacter:从单张图片生成一致性角色的开源工具

InstantCharacter:単一の画像から一貫性のある文字を生成するオープンソースツール

概要 InstantCharacterは、Tencent HunyuanとInstantXチームによって開発されたオープンソースプロジェクトで、GitHubでホストされています。InstantCharacterは、参照画像とテキスト説明文を含む、一貫性のある文字マップを生成します。
5ヶ月前
022.6K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。

Ant Design X: モデル統合とデータフロー管理をサポートし、AIチャットインターフェースを迅速に構築するためのツールキット。

包括的な紹介 Ant Design Xは、Ant Groupによってオープンソース化されたツールキットで、開発者がAI主導の対話インターフェースを素早く構築できるように設計されています。豊富なコンポーネントとテンプレートのセットを提供し、OpenAI標準と互換性のあるモデル統合をサポートし、インテリジェントなカスタマーサービス、AIアシスタント、その他のような様々なアプリケーションに適しています。
11ヶ月前
022.6K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站

AutoFlow: GraphRAGベースの会話型知識ベース/ディープ・ウェブ検索ツール。

概要 AutoFlowはPingCAP社によって開発されたオープンソースのツールで、TiDBサーバーレス・ベクトル・ストレージを用いてグラフベースの知識ベースを構築する。LlamaIndexとDSPyフレームワークを統合し、複雑なダイアログ検索と知識グラフをサポートする。
9ヶ月前
022.6K
AgentLaboratory:利用智能代理完成科研全流程的开源工具

AgentLaboratory: 知的エージェントによる科学研究の全プロセスを完了するオープンソースツール

一般的な紹介 AgentLaboratoryはGitHubでホストされているオープンソースツールで、Samuel Schmidgallによって開発されました。大規模言語モデル(LLM)によって駆動されるインテリジェントエージェントを使用し、研究者の科学的...
7ヶ月前
022.6K
WikiChat:使用维基百科数据检索知识的聊天工具

WikiChat:ウィキペディアのデータを使って知識を検索するためのチャットツール

概論 ウィキチャットはスタンフォード大学で開発された実験的なチャットボットで、ウィキペディアからデータを取得することで、大規模言語モデルの事実性を向上させることを目的としている。大規模言語モデル(ChatGPTやGPT-4など)は、最新の情報や人気のないトピックを処理する傾向があります。
9ヶ月前
022.6K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释

GPTアカデミック:Arxiv学術論文翻訳、エラー訂正、コード解釈の最優秀賞

一般的な紹介 GPT Academicは、学術研究に最適化された大規模言語モデルのためのインタラクティブプラットフォームです。GPT/GLMのような大規模言語モデルへの実用的なインタラクティブインターフェースのためのツールを提供し、特に論文翻訳、論文読解、推敲、執筆の経験に最適化されています。モジュール設計を採用しています。
11ヶ月前
022.6K
ControlFlow:构建可控透明AI智能体工作流的Python框架

ControlFlow:制御された透明なAIインテリジェンス・ボディ・ワークフローを構築するためのPythonフレームワーク

概論 ControlFlowはPrefectHQによって開発されたPythonフレームワークで、AIワークフローの構築と管理に特化している。ワークフローを定義し、大規模言語モデル(LLM)生成にタスクを委譲するための、構造化された開発者指向のフレームワークを提供します。
10ヶ月前
022.6K
Open Deep Research:生成基于网络搜索内容的AI研究报告

オープン・ディープ・リサーチ:ウェブ検索コンテンツに基づくAI研究の生成

概論 Open Deep Researchは、Google Geminiのディープリサーチ機能に代わるオープンソースのAI駆動型リサーチレポート作成ツールである。プロジェクトはTypeScriptで開発されており、Next.js 1...をベースにしています。
7ヶ月前
022.6K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具

ComfyUI ポートレートマスター中国語版:似顔絵生成を最適化するキューワードツール

はじめに ComfyUI Portrait Master 中国語版は、AI画像クリエイターのために設計された似顔絵キューワード生成ツールです。このツールは、ユーザーがキューワードを最適化することによって、高品質の似顔絵を生成するのに役立ちます。ユーザーは、要求に応じて異なるレンズを選択することができます...
1年前
022.6K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容

ソーシャルメディア・エージェント:ソーシャルメディア・コンテンツを自動生成・管理するソーシャルメディア用インテリジェント・アシスタント

概要 ソーシャルメディアエージェント(Social Media Agent)は、ソーシャルメディアコンテンツの生成と管理を自動化するために設計された、新しいエージェントインボックスによってインタラクション情報を管理するオープンソースプロジェクトです。このプロジェクトはLangChainチームによって開発されました。
9ヶ月前
022.6K
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用

Exa & Deepseek Chat App: リアルタイムのウェブ検索と知的推論のためのオープンソースチャットアプリ

包括的な紹介 Exa & Deepseekチャットアプリは、オープンソースのスマートチャットアプリです。主な機能には、ExaのAPIを使用したリアルタイムのウェブ検索や、インテリジェントなDeepseek R1言語モデルの使用などがあります。
9ヶ月前
022.6K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

中国ベースの全血DeepSeek-R1蒸留データセット、中国R1蒸留SFTデータセットをサポート

包括的な紹介 中国語DeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究をサポートするために設計された、110Kのデータを含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。 このデータセットには数学的なデータだけでなく、一般的なタイプのデータも多数含まれている。
8ヶ月前
022.6K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库

Taipy: 効率的なデータ分析とAIアプリケーションのためのデータサイエンティスト向けPythonオープンソースライブラリ

概要 TaipyはAvaiga社によって開発された強力なPythonライブラリで、データ科学者や機械学習エンジニアがデータ駆動型のWebアプリケーションを迅速に構築・展開できるように設計されています。
10ヶ月前
022.6K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

無効なJSON文字列を修正し、LLMによって生成されたJSONデータで起こりうるフォーマットエラーを解決しました。

一般的な説明 無効なJSONファイルを修正するためのモジュールで、特に大規模言語モデル(LLM)が出力する不正なJSONデータを解析するためのモジュールです。このモジュールは、引用符の欠落、不正なカンマ、エスケープされていない文字、不完全なkey-value...などの一般的なJSON構文エラーを修正します。
12ヶ月前
022.6K
TripoSG:单张图像生成高分辨率3D建模数字资产

TripoSG: 1枚の画像から高解像度の3Dモデリングデジタル資産を生成

概論 TripoSGはVAST AI研究チームによって開発されたオープンソースプロジェクトで、1枚の画像から高品質の3Dモデルを生成する。このプロジェクトでは、大規模な整流器フローコンバーター技術を用い、ハイブリッド教師あり学習と高品質なデータセットを組み合わせることで、生成された3Dモデルに...
7ヶ月前
022.6K
MegaPairs:BGE新推出的多模态向量嵌入模型

メガペア:BGEによる新しいマルチモーダルベクトル埋め込みモデル

包括的な紹介 MegaPairsはVectorSpaceLabチームによるGitHub上のオープンソースプロジェクトであり、大規模なデータ合成技術によって画像-テキスト-画像検索タスクのためのマルチモーダル埋め込みモデルを生成する。このプロジェクトは、2,600万以上の異種...
7ヶ月前
022.6K
Minima:支持本地部署或集成到ChatGPT、Claude的开源RAG容器

Minima: オープンソースのRAGコンテナで、ローカルへのデプロイやChatGPTへの統合が可能。

一般的な紹介 MinimaはオープンソースのRAG(Retrieval-Augmented Generation)ソリューションで、ChatGPTのローカル展開と統合をサポートしています。プロジェクトはdmayborodaによって管理されており、その目的は...
8ヶ月前
022.6K