最新のAIリソース

共 3094 篇文章
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe:AIにあなたのコンピュータを直接制御させる、クロードの制御コンピュータのオープンソース実装

概要 Agent.exeはオープンソースのElectronアプリケーションで、AnthropicのClaude 3.5 Sonnet APIを利用し、ユーザーがAIを通してローカルコンピューターを直接コントロールできるようにするものです。このプロジェクトは、K...
1年前
094.5K
MemeGen AI:智能搞笑图片生成器,将照片转化为动态表情包,轻松创建搞笑图片

MemeGen AI: インテリジェントな面白い写真ジェネレーター、写真をダイナミックな顔文字に変え、面白い写真を簡単に作成できます!

一般的な紹介 MemeGen AIは、簡単な操作で様々な面白い写真を作成できる人工知能ベースの面白い写真ジェネレーターです。このサイトでは、高度なGPT-4ビジョンモデルを使用して、ユーザーに技術的な知識を必要とせずに、面白い写真とテキストを自動的に生成します。
2年前
094.5K
BISHENG(文擎毕昇):构建企业级AI应用的开源LLM DevOps平台

BISHENG:エンタープライズAIアプリケーション構築のためのオープンソースLLM DevOpsプラットフォーム

包括的な紹介 BISHENGは、次世代のエンタープライズAIアプリケーションのために設計されたオープンソースのLLM(大規模言語モデル)DevOpsプラットフォームです。このプラットフォームは、生成AIワークフロー、RAG(Retrieval Augmented Generation)、インテリジェントエージェント、統合モデル管理などの強力で包括的な機能を提供します。
1年前
094.4K
Cobalt:万能视频下载器,YouTube、Vimeo、Twitter、Reddit、SoundCloud等

Cobalt:ユニバーサルビデオダウンローダー、YouTube、Vimeo、Twitter、Reddit、SoundCloudなど!

Cobaltは、ユーザーフレンドリーなダウンロード体験を提供するために設計されたオープンソースのメディアダウンローダーです。Cobaltは、ユーザーフレンドリーなダウンロード体験を提供するように設計されたオープンソースのメディアダウンローダです。
1年前
094.3K
ebook2audiobook:将电子书转换为有声读物,支持多语言和语音克隆的开源工具

ebook2audiobook: 電子書籍をオーディオブックに変換する、多言語サポートと音声クローンを持つオープンソースツール

一般的な紹介 ebook2audiobookは、強力なオープンソースの電子書籍からオーディオブックツールです。複数のフォーマットのeBookを、完全なチャプターマーカーとメタデータ付きのオーディオブックに変換することができます。このツールは、電子書籍フォーマットの変換にCo...
1年前
094.2K
Honeybot.AI:免费对话的AI虚拟女友

Honeybot.AI:自由に対話できるAIバーチャル・ガールフレンド

はじめに Honeybot.aiは無料のAIバーチャルコンパニオンを提供するウェブサイトである。ユーザーはAIキャラクターとリアルタイムで会話し、実際のコミュニケーションに近い体験をすることができる。このサイトは感情的なつながりを重視しており、AIはユーザーの名前、会話内容、興味のあるものを記憶して、パーソナライズされた体験を作り上げる。
1年前
094.1K
Crawl4AI:开源的异步网页爬虫工具,无需LLM提取结构化数据

Crawl4AI:LLMなしで構造化データを抽出するオープンソースの非同期ウェブクローラツール

包括的な紹介 Crawl4AIは、大規模言語モデル(LLM)と人工知能(AI)アプリケーションのために設計されたオープンソースの非同期ウェブクローラツールです。ウェブクローリングとデータ抽出プロセスを簡素化し、効率的なウェブクローリングをサポートし、LLMに適した出力フォーマットを提供します。
1年前
094.1K
Nanobrowser:浏览器中实现任务自动化的多智能插件

ナノブラウザ:ブラウザのタスク自動化のためのマルチインテリジェンス・プラグイン

概要 NanobrowserはオープンソースのChrome拡張機能で、AI主導のマルチエージェントシステムによってウェブタスクを自動化するように設計されています。OpenAI Operatorに代わる無償の拡張機能で、ユーザーはLLMを提供するだけです。
1年前
094.1K
Local-NotebookLM:本地PDF生成语音播客的开源工具

Local-NotebookLM: オープンソースツールの音声ポッドキャストを生成するローカルPDF

概要 Local-NotebookLMはオープンソースプロジェクトで、ローカルで動作するインテリジェントな文書処理とコンテンツ生成ツールを提供することを目的としています。Google NotebookLMにインスパイアされ、ユーザーがPDFやその他のドキュメントを様々な...
1年前
094K
Smolagents:AIインテリジェンスの迅速な開発とインテリジェンスの軽量化のためのオープンソースプロジェクト

Smolagents:AIインテリジェンスの迅速な開発とインテリジェンスの軽量化のためのオープンソースプロジェクト

包括的な紹介 Smolagentsは、HuggingFaceによって開発された軽量インテリジェントエージェントライブラリで、AIエージェントシステムの開発プロセスを簡素化することに重点を置いています。このプロジェクトは、約1000行のコアコードしかないシンプルな設計思想で知られていますが、強力な機能統合機能を提供しています。このライブラリの最も ...
1年前
093.9K
BrowserTools MCP:实时监控浏览器活动的MCP服务

BrowserTools MCP: ブラウザの動作をリアルタイムで監視するMCPサービス

概要 BrowserTools MCPは、AgentDeskAIチームによって開発されたオープンソースプロジェクトです。AIがChromeエクステンションとNode.jsサービスを通じて、ログ、ネットワークリクエスト、ブラウザアクティビティをリアルタイムで監視することを可能にします。
1年前
093.8K
Linly-Dubbing:智能视频多语言AI配音/翻译工具

Linly-Dubbing:インテリジェントビデオ多言語AI吹替/翻訳ツール

包括的な紹介 Linly-Dubbingはインテリジェントな多言語AIダビングと翻訳ツールで、高度なAI技術を統合することにより、ユーザーに高品質の多言語ビデオダビングと字幕翻訳サービスを提供するように設計されています。このツールは、特に国際教育、グローバルコンテンツのローカリゼーションやその他のシナリオに適しており、...
1年前
093.8K
OpenSPG:开源知识图谱引擎

OpenSPG: オープンソース知識グラフエンジン

包括的な紹介 OpenSPGは、SPG (Semantic Augmented Programmable Graph)フレームワークに基づいて、Ant GroupがOpenKGと共同で開発したオープンソースの知識グラフエンジンです。このエンジンは、ドメイン知識グラフの構築と管理をサポートするために、 明示的な意味表現、論理ルール定義、運用フレームワークなどの機能を提供するように設計されています...
2年前
093.7K
Doc2X:文档图片公式识别与转换工具,支持多格式转换与高精度翻译

Doc2X:文書画像式認識・変換ツール、マルチフォーマット変換と高精度翻訳をサポート

包括的な紹介 Doc2Xは、強力な文書画像式認識と変換ツールで、効率的でインテリジェントな文書処理ソリューションを提供することを約束します。学術研究論文、教科書、企業文書、財務報告書など、Doc2XはPDFの表と数式を正確に認識することができます。
1年前
093.5K
Smart Composer:引用本地笔记智能写作和语义搜索的Obsidian插件

Smart Composer: ローカルノートを参照するためのスマートライティングとセマンティック検索のためのObsidianプラグイン

概論 Smart ComposerはObsidianノート作成ソフトウェア用に設計されたスマートライティングアシスタントプラグインです。人工知能技術を使って、文脈を意識したチャットアシスタント、スマートライティングアシスタント、ワンクリック編集機能を提供します。このプラグインは、ユーザーの...
1年前
093.4K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: ダイナミックな知識グラフの構築とクエリーツール(時間を考慮したロングメモリプログラム)

一般的な紹介 Graphitiは、getzep社によって開発された、動的で時間を意識した知識グラフの構築とクエリのためのツールです。エンティティ間の複雑で発展的な関係を表現し、時系列、全文、セマンティック、グラフアルゴリズムなど様々な手法でクエリすることができる。
1年前
093.3K
QuickMagic:使用AI动捕技术轻松创建高质量动画视频

QuickMagic:AIモーションキャプチャー技術で高画質なアニメーション動画を簡単作成

概要 QuickMagic AIは、シンプルなビデオを高品質な3Dアニメーションに変換するために設計された、高度なAI駆動型モーションキャプチャツールです。アニメーター、ゲーム開発者、デジタルコンテンツ制作者など、QuickMagic AIは高速かつ正確なモーションキャプチャーを実現します。
1年前
093.3K
WebDev Arena:LMArena 发布的AI网页编程能力对比工具

WebDevアリーナ:AIのWebプログラミング能力を比較するツール、LMArenaがリリース

一般的な紹介 WebDev Arenaは、LMArenaチームによって開発されたリアルタイムのAIプログラミング競技プラットフォームであり、人工知能言語モデル(LLM)同士を戦わせることで、ウェブ開発の課題をクリアすることに重点を置いています。ユーザは、「ウェブデザインの作成」などの特定のウェブデザインタスクを入力することができます。
1年前
093.2K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表

WrenAI: 回答、SQLクエリ、分析レポートに直接アクセスできる会話型データ分析AIアシスタント

概要 WrenAIは、データチーム、製品チーム、ビジネスチームが自然言語での会話を通じてデータの洞察を得ることを支援するために特別に設計されたオープンソースのSQL AIアシスタントです。自然言語をSQLクエリに変換し、チャート、スプレッドシート、レポートを生成し、多言語をサポートします。
1年前
093.1K
cognee:基于知识图谱构建的RAG开源框架,核心prompts学习

cognee:知識グラフベースのRAG構築のためのオープンソースフレームワーク、コアプロンプト学習

概要 CogneeはAIアプリケーションとAIエージェントのために設計された信頼性の高いデータレイヤーソリューションです。LLM(大規模言語モデル)コンテキストのロードと構築を行い、ナレッジグラフとベクトルストアを通じて正確で解釈可能なAIソリューションを作成するように設計されています。このフレームワークは、コスト削減、解釈可能な...
1年前
092.9K
Qwen Chat:使用Qwen系列所有模型,图像生成、文档处理和网络搜索

Qwen Chat:Qwenファミリーの全モデルを使用し、画像生成、文書処理、ウェブ検索を行う。

総合紹介 Qwen Chat(同義銭海外版)は阿里雲社が開発した多機能AIアシスタントプラットフォームで、ユーザーに総合的なAIサービスを提供することを目的としている。このプラットフォームは、チャットボット、画像・動画理解、画像生成、文書処理、ウェブ検索統合、ツールリ...
1年前
092.8K
Blooper:智能生成脚本与分镜画面的创作工具

Blooper:スクリプトと分割画面をインテリジェントに生成するオーサリングツール

概論 BlooperはAIベースのオーサリングプラットフォームで、ビデオスクリプトやスプリットスクリーンの作成を支援することに重点を置いている。ツーク州バールに拠点を置くスイスのBlooper AI社によって開発され、広告、映画、テレビ業界のプリプロダクションをサポートするように設計されている。ネット...
1年前
092.8K
AiPPT:全智能AI一键生成PPT|在线PPT制作|智能PPT工具(付费)

AiPPT:フルインテリジェンスAIワンクリックPPTジェネレーション|オンラインPPTメーカー|インテリジェントPPTツール(有料)

包括的な紹介 AiPPTは、人工知能技術に基づくオンラインPPT生成ツールです。AiPPTは、豊富なテンプレートリソースを提供し、インポートするさまざまなドキュメント形式をサポートし、迅速にニーズに沿ったプロフェッショナルを生成することができます。
1年前
092.6K
蝉镜:数字人视频创作平台,拥有数百款数字人模板以及克隆专属数字人形象(付费)

Cicada Mirror:何百ものデジタル人体テンプレートと専用デジタル人体イメージのクローンを備えたデジタル人体ビデオ作成プラットフォーム(有料)

概論 Cicadaはデジタル人体映像制作に特化したプラットフォームで、AI技術を利用して映像制作プロセスを簡素化する。ユーザーは、さまざまなデジタル人物の画像を選択し、コピーを入力し、多言語ダビング付きのビデオを生成することができます。また、豊富なテンプレートや素材ライブラリが用意されており、広告やマーケティング、教育やトレーニングなど、様々な分野に適しています。
1年前
092.6K
EmotiVoice(易魔声):多声音与情感提示控制的文本转语音引擎

EmotiVoice:マルチボイスおよび感情キューイングコントロール付き音声合成エンジン

総合紹介 EmotiVoiceは、NetEaseYoudaoによって開発された、複数の音声と感情キュー制御を備えた音声合成(TTS)エンジンです。このオープンソースのTTSエンジンは、英語と中国語をサポートし、2000以上の異なる音声を持ち、感情合成機能を持ち、幸せな音声を作成することができます。
1年前
092.5K
文心快码(Baidu Comate):你的AI编程助手,结合百度编程大数据,为你生成优质编程代码。

Wenxin Quick Code (Baidu Comate): Baiduプログラミングビッグデータと組み合わせたAIプログラミングアシスタント。

包括的な紹介 Baidu ComateはBaiduが開発した先進的なAIプログラミングアシスタントで、BaiduのERNIE Big Modelに基づき、独自データとオープンソースデータを統合して次世代のプログラミング支援を提供する。コード補完、解釈、デバッグ機能を備え、開発者の思考、記述、最適化を支援する。
1年前
092.4K
Wan2.1:在消费级 GPU 上生成高质量视频

Wan2.1:民生用GPUで高画質ビデオを生成する

概要 Wan2.1は、Wan-Videoチームによって開発され、GitHubでオープンソース化されたビデオ生成ツール群で、人工知能技術によってビデオ作成の限界を押し広げることに焦点を当てています。Wan2.1は、高度な拡散変換アーキテクチャに基づいており、独自の時間変化する自己...
1年前
092.3K
E2B:安全云沙箱中的AI代码运行平台

E2B: 安全なクラウドサンドボックスでAIコードを実行するプラットフォーム

概要 E2Bは、AIが生成したコードを安全なクラウドサンドボックスで実行するために設計されたオープンソースプラットフォームです。幅広いプログラミング言語とフレームワークをサポートし、コード実行のセキュリティと信頼性を確保するために隔離された仮想環境を提供します。E2Bは、データ分割を含む様々なAIアプリケーションシナリオに適しています。
1年前
092.3K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库

MaxKB:スマートなカスタマーサービスと社内ナレッジベースのための、すぐに使えるAIナレッジベースQ&Aシステム

包括的な紹介 MaxKB (Max Knowledge Base) は、大規模言語モデルとRAG (Retrieval Augmented Generation) に基づいたオープンソースの知識ベースQ&Aシステムです。このシステムは、インテリジェントな顧客サービス、企業の内部知識ベース、学術研究および教育やその他のシナリオで広く使用されています。
1年前
092.3K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步

MuseV+Muse Talk:完全なデジタルヒューマンビデオ生成フレームワーク|ポートレートからビデオへ|ポーズからビデオへ|リップシンク

一般的な紹介 MuseVはGitHubで公開されているプロジェクトで、長さ無制限で忠実度の高いアバター動画生成を目的としています。拡散技術に基づいており、Image2Video、Text2Image2Video、Video2Video...を提供します。
1年前
091.9K
AI Hedge Fund:开源自动化交易系统,利用多智能体进行复杂对冲基金交易决策

AIヘッジファンド:複雑なヘッジファンド取引の意思決定に複数の知性を利用するオープンソースの自動取引システム

一般的な紹介 AIヘッジファンドは、マルチ・エージェント・システムを利用して取引の意思決定を行う人工知能ヘッジファンドである。このシステムは、マーケット・データ・エージェント、クオンツ・エージェント、リスク管理エージェント、ポートフォリオ管理エージェントなど、複数の専門エージェントと連携し、複雑な取引を実現する。
1年前
091.9K
GPT4All:支持CPU运行的大型语言模型客户端,重视本地化与数据安全

GPT4All:ローカリゼーションとデータ・セキュリティに焦点を当てたCPU上で動作する大規模言語モデル・クライアント

GPT4All 概要 GPT-4AllはNomicによって開発されたオープンソースプロジェクトで、ユーザーがローカルデバイス上で大規模言語モデル(LLM)を実行できるようにするものです。このプロジェクトは、プライバシー保護を重視し、インターネット接続なしで使用することができ、個人ユーザーとビジネスユーザーの両方に適しています...
1年前
091.9K
WebSim AI:AI网页编辑器,一句话生成独立的网页应用

WebSim AI: 一文でスタンドアロンのウェブアプリを生成するAIウェブエディタ

一般的な紹介 WebSim AIはNetwrckによって開発された先進的な人工知能ウェブエディタとシミュレータです。CSSとJavaScriptを使ってダイナミックなウェブページを作成できるユニークで直感的なプラットフォームを提供します。WebSimの助けを借りて、Webページを作成することができます。
2年前
091.8K
HippoRAG:基于长时记忆的多跳知识检索框架

HippoRAG: 長期記憶に基づくマルチホップ知識検索フレームワーク

概論 HippoRAGはオハイオ州立大学のOSU-NLPグループによって開発されたオープンソースのフレームワークで、人間の長期記憶メカニズムにヒントを得ている。検索拡張生成(RAG)、ナレッジグラフ、パーソナライズドPageRankのテクニックを組み合わせ、大規模な言語モデル...
1年前
091.7K
iLoveIMG:在线图片批量处理工具|免费在线使用图像放大、去除背景

iLoveIMG: オンライン画像一括処理ツール|無料オンライン画像拡大・背景除去

iLoveIMG 概要 iloveimg は、ソフトウェアをダウンロードしたりインストールしたりすることなく、画像に様々な操作を簡単に実行できる無料のオンライン写真編集ツールです。iloveimgを使って、圧縮、変換、クロップ、サイズ変更、透かしの追加、結合などを行うことができます。
2年前
091.7K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV:スライド/PPTと説明メモからプレゼンテーション動画を高速生成

概論 TRVはGitHubでホストされているオープンソースのツールで、スライドやプレゼンテーションノートをナレーション付きの動画に素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画のコンテンツを自動的に生成します。
1年前
091.6K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI:AIにコンピュータの遠隔操作を委ね、自然言語で制御させるオープンソースプロジェクト

一般的な紹介 NeoAIは革新的なオープンソースのAIアシスタントツールで、ユーザーは自然言語対話を通じて簡単にコンピュータを制御・管理することができます。コードを書くことなく、日常的な対話だけでファイルの検索、タスクの自動化、デバイスの管理などを行うことができます。
1年前
091.5K
ComfyUI disty Flow:为 ComfyUI 提供友好的用户界面,简化工作流程

ComfyUI disty Flow: ワークフローを効率化するComfyUIのユーザーフレンドリーなインターフェース

概要 ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ComfyUI-disty-Flowは、ComfyUIにユーザーフレンドリーなインターフェースを提供するカスタムノードです。ワークフローの作成に代わるユーザーインターフェースを提供することで、ワークフローの実行を簡素化することを目的としています。
1年前
091.5K
GPT SoVITS:革命性的语音生成与语音克隆工具

GPT SoVITS:画期的な音声生成・音声クローニングツール

総合紹介 GPT-SoVITSは、GPTモデルとSoVITSボイスチェンジャー技術を組み合わせたオープンソースの音声変換・合成ツールです。このツールは、0サンプルや数サンプルでのオンザフライテキスト音声変換や、わずか5秒間の音声サンプルでの音声スタイル移行をサポートしています。このツールの特徴には、言語横断的な音声合成が含まれます。
2年前
091.2K
TurboScribe:快速将音频和视频转为文字的在线工具

TurboScribe: オーディオやビデオを素早くテキストに変換するオンラインツール

概要 TurboScribeはAIベースのテープ起こしツールで、音声やビデオを素早くテキストに変換することに重点を置いています。98以上の言語をサポートし、99.8%の精度を持つため、音声コンテンツを効率的に処理する必要があるユーザーに適しています。ユーザーはファイルをアップロードしたり、テキストメモを生成したりすることができます...
1年前
091.2K
Sigma AI Browser:免费使用主流大模型的AI浏览器

シグマAIブラウザー:主流のビッグモデルを使用するための無料のAIブラウザー

概要 Sigma AI BrowserはSigmaBrowser OÜによって開発された先進的なブラウザで、人工知能技術を活用し、より高速でスマートなブラウジング体験をユーザーに提供します。このブラウザは、スピードと効率性だけでなく、セキュリティの強化やパーソナル...
1年前
091.2K
HackChat稳定且无审查的GPT4聊天机器人

HackChatの安定した無修正GPT4チャットボット

概要説明 無修正のAIチャットと生成サービスを提供するウェブサイトです。フィクション制作、コード生成、ロールプレイングなど、様々なスタイルで利用できます。テキストからの画像生成もサポートされており、ユーザーは無修正の画像を作成することができます。このプラットフォームはプライバシーを重視しており、ユーザーは...
1年前
091.1K
Undetectable AI:绕过AI检测的文本人性化工具,免费AI查重检测器

検出不可能なAI:AI検出を回避するテキスト人間化ツール、無料のAIチェッカー検出器

概要 Undetectable AIは、AIコンテンツ検出器をバイパスするために設計されたツールです。高度なアルゴリズムと書き換えテクニックを駆使し、出力されるテキストが人間の文章と遜色ないこと、そして手を出すのに十分な品質であることを保証します。AI検出不可能なコンテンツを作成する必要があるライター、ブロガー、研究者のために...
1年前
091K
Manga Image Translator - 开源的漫画图片文字翻译工具,无缝嵌入原图保持原始风格

Manga Image Translator - 漫画画像のオープンソーステキスト翻訳ツール。元の画像をシームレスに埋め込んで元のスタイルを維持!

Manga Image Translatorは、マンガや画像のテキストをターゲット言語にワンクリックで翻訳するオープンソースのマンガ画像テキスト翻訳ツールです。Manga Image Translatorは、オリジナルの画像をシームレスに埋め込むことができ、マンガや画像のオリジナルスタイルを維持します。
11ヶ月前
090.9K
Amphion MaskGCT:零样本文本到语音克隆模型(本地一键部署包)

Amphion MaskGCT: ゼロサンプル音声合成クローンモデル (ローカルのワンクリックデプロイパッケージ)

包括的な紹介 MaskGCT (Masked Generative Codec Transformer)は、Funky Maru Technologyと香港中文大学が共同で導入した完全非自律回帰型音声合成(TTS)モデルである。このモデルは明示的な音声合成を必要としない。
1年前
090.9K
Fish Speech:快速且高精度使用少样本克隆中英文语音

フィッシュ・スピーチ:少ないサンプル数で中国語と英語の音声を高速かつ高精度にクローニング

概要 フィッシュ・スピーチはフィッシュ・オーディオが開発したオープンソースの音声合成ツールです。このツールはVQ-GAN、Llama、VITSなどの最先端のAI技術に基づいており、テキストをリアルな音声に変換することができます。
1年前
090.8K
小红书AI运营助手:自动生成和发布小红书文章

XiaohongshuのAI操作アシスタント:自動的にXiaohongshuの記事を生成し、公開します。

総合紹介 Xiaohongshu AI Operation Assistant(xhsaipublisher)は、Xiaohongshuプラットフォームで記事を公開するために設計された自動化ツールです。このプロジェクトは、グラフィカル・ユーザー・インターフェースと自動化スクリプトを組み合わせ、ビッグモデル技術を使ってコンテンツを生成し、ブラウザ経由で自動的にログインして公開します...
1年前
090.8K
PDF Craft:PDF扫描文件转Markdown的开源工具

PDF Craft: PDFスキャン文書からMarkdownへのオープンソースツール

一般的な紹介 PDF Craftは、書籍のPDFをスキャンしてMarkdown形式に変換するために設計されたオープンソースツールです。このツールはoomol-labによって開発され、電子書籍を整理したいユーザのためにGitHubでホストされています。このツールは、以下の方法で動作します。
1年前
090.8K
Ragas:评估RAG召回QA准确率与答案相关性

ラガス:RAGリコールQA精度と回答の相関性を評価する

包括的な紹介 Ragasは、RAG(Retrieval Augmented Generation)システムの評価と最適化のために特別に設計されたツールです。Ragasは、クエリ、検索コンテキスト、生成された回答間の関係を分析することで、包括的な評価メトリクスのセットを提供します。これらのメトリクスには、忠実度、回答の関連性、コンテキストの関連性、...
1年前
090.8K
智谱清言:GLM模型驱动的智能对话工具,支持创建智能体、长文档解读、AI数据分析

Smart Spectrum Clear Speech: インテリジェンス作成、長文文書解釈、AIデータ分析をサポートするGLMモデル駆動型インテリジェント対話ツール

包括的な紹介 智谱清言(chatglm.cn)のウェブサイトは、GLM(生成言語モデル)技術に依存して、インテリジェントなコミュニケーションプラットフォームを提供します。このプラットフォームは、複数回の対話、コンテンツ作成、メッセージ要約をサポートし、高度な...
1年前
090.7K
SkyReels:AI视频短剧创作平台,擅长生成动作自然的全景人像

SkyReels:自然な動きのあるパノラマポートレートの生成に特化したAI動画スキット作成プラットフォーム

はじめに SkyReelsは、AIによる動画作成に特化したオンラインプラットフォームで、ユーザーがテキストスクリプトやクリエイティブなアイデアを高品質なショートビデオに素早く変換できるように設計されています。コンテンツ制作者、マーケティング担当者、一般ユーザーに関わらず、テキストを入力するだけで、プラットフォームが自動的に動画を生成します。
1年前
090.7K
FindPicLocation:使用AI技术定位照片拍摄地点,快速获取片GPS定位

FindPicLocation: AI技術を使って、写真が撮影された場所を特定し、フィルムのGPSロケーションを素早く取得します。

包括的な紹介 FindPicLocationは、人工知能技術を使って、ユーザーが写真を撮った場所を特定するのを助けるウェブサイトである。ユーザーは写真をアップロードするだけで、システムは自動的に写真のEXIFデータを分析し、GPS座標を抽出し、地図上に正確な場所を表示します。このサイトの目的は...
1年前
090.7K
Goose:开源可扩展的编程智能体,自动化执行编程全流程任务

Goose:全工程のプログラミング作業を自動化する、オープンソースのスケーラブルなプログラミング・インテリジェンス

一般的な紹介 GooseはBlock社によって開発されたオープンソースのAIエージェントツールで、開発者が日常的な開発作業を自動化できるように設計されています。さまざまな大規模言語モデル(LLM)をサポートし、コマンドラインやデスクトップアプリケーションのインターフェースを介してユーザーと対話します。
1年前
090.6K
ChatGPT-on-WeChat:基于大模型构建的智能对话机器人,支持微信等多对话平台接入

ChatGPT-on-WeChat:大規模モデルに基づいて構築されたインテリジェント対話ロボット。

総合的な紹介 ChatGPT-on-WeChatプロジェクトは、大きなモデルベースのインテリジェント対話ロボットであり、個人WeChat、WeChatパブリック番号、企業WeChatアプリケーション、Flybook、Nailなどのマルチプラットフォームへのアクセスをサポートしています。ユーザーはGPT3.5、GPT-4、Claude、Man...
1年前
090.6K
Genspark:基于Genspark智能体深度搜索并撰写研究报告

ジェンスパーク:ジェンスパーク・インテリジェンスに基づく調査レポートの深い検索と執筆

はじめに Gensparkは人工知能ベースの検索ツールである。バイドゥの元幹部によって2023年に設立され、カリフォルニア州パロアルトを拠点としている。従来の検索エンジンとは異なり、Gensparkは複数のAIインテリジェンスを使用して、カスタマイズされた検索をリアルタイムで生成する。
11ヶ月前
090.5K
Akash Network:去中心化GPU算力交易平台

アカッシュ・ネットワーク:分散型GPU算術取引プラットフォーム

概要 アカッシュ・ネットワークは、ブロックチェーン技術に基づく分散型クラウド・コンピューティング・プラットフォームであり、従来のクラウド・コンピューティング大手の独占を打破し、コンピューティング・リソースを取引するための、より効率的でコスト効率が高く、柔軟なマーケットプレイスを提供することを目的としている。これは、コンピューティング・リソースを必要とするユーザーと、遊休コンピューティング・リソースを持つユーザーを結びつけることによって実現される。
1年前
090.5K
Character AI:安全的虚拟角色聊天智能工具

キャラクターAI:バーチャルキャラクター用の安全なチャットインテリジェンスツール

一般的な紹介 キャラクターAIは、ユーザーがバーチャルキャラクターと対話できるAIベースのチャットプラットフォームである。元Googleのエンジニアによって開発され、その中核技術は大規模な言語モデリングである。ウェブサイトは2022年9月にパブリックベータ版として公開され、モバイルアプリは2023年5月にリリースされた。
1年前
090.5K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询

Gemini Balance: GeminiモデルAPIはOpenAIフォーマットと互換性があり、リージョン制限を解除し、マルチAPIキーポーリングをサポートする。

包括的な紹介 Gemini Balanceは、FastAPIフレームワークに基づいて開発されたOpenAI APIプロキシサービスで、効率的なマルチAPI Key管理と最適化機能を提供することを目的としている。このプロジェクトはGeminiモデルコールをサポートしており、主な機能にはマルチAPI...
1年前
090.5K
RMBG-2-Studio:批量移除图像和视频背景的开源程序,基于RMBG 2.0优化

RMBG-2-Studio: RMBG 2.0 用に最適化された、画像やビデオの背景を一括除去するオープンソースプログラム。

概論 RMBG-2-Studioは、BRIA-RMBG-2.0モデルに基づいて開発された、背景の除去および置換を行う拡張アプリケーションです。このアプリケーションは、電子商取引、ゲーム、...を含む様々なタイプの画像に対して、効率的で正確な画像背景処理機能をユーザーに提供するように設計されています。
1年前
090.3K
Deep Live Cam:开源的实时AI换脸工具,一张照片就能实现实时换脸直播

ディープライブカム:オープンソースのリアルタイムAI顔交換ツール、リアルタイムでライブ顔交換するための写真

概要 Deep Live Camは、1枚の写真からリアルタイムで顔を置き換え、フェイクビデオを生成できるように設計されたオープンソースの人工知能ツールです。高度なディープラーニングアルゴリズムを使用することで、ライブストリーミングやビデオ通話中にリアルタイムで顔を入れ替えることができ、ユーザーのプライバシーを保護し、楽しさを追加します。
1年前
090.3K
博查AI开放平台:为AI应用提供实时搜索API

Bocha AI Open Platform: AIアプリケーションのためのリアルタイム検索API

包括的な紹介 Boca AI Open Platformは、AIアプリケーションのために設計された検索エンジンサービスプラットフォームです。Web Search APIやSemantic Reranker APIなどのツールを提供することで、開発者がAIをリアルタイムの世界知識と結びつけることを支援します。本プラットフォームは...
1年前
090.2K
flowith:画布编排式AI内容创作平台,自动化写作与配图

flowith:ライティングとイラストレーションを自動化するキャンバスオーケストレーションAIコンテンツ作成プラットフォーム

概論 FlowithはGPT-4を搭載したAI生産性ツールです。従来のチャットベースのAIツールとは異なり、ノードベースのAIオーサリングアプローチを提供することで、マルチスレッドで分散された方法でAIと対話し、簡単に作業することができます。
1年前
090.2K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式

OpenAI Edge TTS: Edge TTSを使ったフリーの音声合成APIで、OpenAIのフォーマットと互換性があります。

一般的な紹介 OpenAI Edge TTSは、OpenAIと互換性のあるネイティブの音声合成(TTS)APIを提供するオープンソースプロジェクトです。このプロジェクトでは、Microsoft Edgeのオンライン音声合成サービスを使用して、ユーザーが高品質な音声合成を行うことができます。
1年前
090.2K
Mubert:免版税的AI配乐生成器|生成符合视频场景的背景音乐

Mubert: Royalty-Free AI Soundtrack Generator|動画のシーンに合わせたサウンドトラックを生成。

一般的な紹介 Mubertは、人間の創造性と人工知能技術を組み合わせ、動画コンテンツ、ポッドキャスト、アプリ向けにカスタマイズされたサウンドトラックを提供するプラットフォームである。ユーザーはMubertを使って、YouTube、TikTok、その他のプラットフォームなど、コンテンツの雰囲気や時間に合ったサウンドトラックを即座に生成することができる。
2年前
090.1K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk:パソコンにAIモデルとチャットインターフェースをワンクリックインストール(DeepSeekとの共同開発)

一般的な紹介 AingDeskは、ユーザーがローカルコンピュータ上で様々なAIモデルを簡単にデプロイし、実行できるように設計されたオープンソースのフリーソフトウェアです。DeepSeekでもLlamaモデルでも、AingDeskはシンプルなステップ・バイ・ステップを可能にします。
1年前
089.9K
Outlier:参与AI模型训练的任务发布平台

Outlier:AIモデルのトレーニングに参加するためのタスク公開プラットフォーム

概 要 Outlierは、世界中の専門家を結びつけ、ユーザーがAIモデルのトレーニングや最適化に取り組めるよう支援するオンライン・プラットフォームである。ユーザーは専門知識を活用し、柔軟な収入を得ながらタスクをこなすことで、AI開発に貢献することができる。このプラットフォームは、様々なドメインのタスクをサポートしています...
1年前
089.9K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツール

概要 MatAnyoneは、シンガポールの南洋理工大学S-Labの研究チームによって開発され、GitHubで公開されているビデオキーイングに特化したオープンソースプロジェクトです。コヒーレントなメモリ伝搬技術によって、安定した効率的なビデオ処理能力をユーザーに提供します。
1年前
089.8K
RealtimeVoiceChat:低延迟与AI进行自然口语对话

RealtimeVoiceChat: AIとの低遅延自然音声対話

はじめに RealtimeVoiceChat は、音声による人工知能とのリアルタイムで自然な会話に特化したオープンソースプロジェクトです。ユーザーはマイクを使って音声を入力し、システムはブラウザを通して音声をキャプチャし、素早くテキストに変換し、大規模言語モデル(LLM)が音声を生成します。
12ヶ月前
089.6K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: AIインテリジェンスがウェブをブラウズするためのオープンソースフレームワーク。

概要 ブラウザユースWeb UIは、AIエージェントにグラフィカルインターフェースツールとしてブラウザインタラクション機能を提供することに焦点を当てた革新的なオープンソースプロジェクトです。このプロジェクトは、ブラウザユースコアフレームワークの上に構築されており、Gradio ...
11ヶ月前
089.5K
JanitorAI:角色扮演与互动故事AI

JanitorAI:ロールプレイングとインタラクティブなストーリーテリングAI

一般的な紹介 JanitorAIは、ユーザーが独自のストーリーを構築し、共有するための高度なチャットボット技術を使用した革新的なオンライン対話型ストーリー作成プラットフォームを提供することに特化しています。シンプルで直感的なインターフェイスは、プロの作家だけでなく、創作やストーリーテリングが好きな一般ユーザーにも適しています。
11ヶ月前
089.5K
LocalAI:开源的本地AI部署方案,支持多种模型架构,WebUI统一管理模型和API

LocalAI: オープンソースのローカルAIデプロイメントソリューション、複数のモデルアーキテクチャのサポート、モデルとAPIのWebUI統合管理

概要 LocalAIは、OpenAIやClaudeなどと互換性のあるAPIインターフェースを提供するように設計された、オープンソースのローカルAI代替ソフトウェアです。コンシューマーグレードのハードウェアで動作し、GPUを必要とせず、テキスト、オーディオ、ビデオ、画像生成、複数の音声クローンが可能です。
1年前
089.4K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar:CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレート

概要 LiteAvatarはHumanAIGCチーム(Aliの一部)によって開発されたオープンソースツールで、音声によって駆動される2Dアバターからリアルタイムでフェイシャルアニメーションを生成することに重点を置いています。CPUのみに依存し、毎秒30フレーム(fps)で動作し、特に...
1年前
089.4K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持

J.A.R.V.I.S.:コンテキストを考慮したインテリジェントコードアシスタント、コードの生成と修正、マルチIDEサポート

概論 J.A.R.V.I.S. (Just A Rather Very Intelligent System) は、複数の最先端の言語モデルを使用して、開発者のコード生成、修正、技術的なディスカッションを支援するように設計されたインテリジェントなコード・アシスタントです。
1年前
089.3K
PopAI:文档生成AI助手|PPT|流程图|文章|文档对话|解释图片

PopAI: 文書生成AIアシスタント|PPT|フローチャート|記事|文書対話|説明画像

総合的な紹介 PopAIは、革新的なAI技術を通じて、教育シナリオの応用を改善し、パーソナライズされた学習体験を提供することに専念しています。様々なAIツールを統合したスマートワークスペースプラットフォームは、文書対話、画像生成、PPT作成を強化します。 PopAIは、国内のゼロ...
2年前
089.2K
Page Assist:本地AI模型对话与检索文档的网页助手插件

Page Assist: ネイティブAIモデルの対話とドキュメントの検索のためのウェブアシスタントプラグイン

概要 Page Assistは、ローカルのAIモデルと対話する簡単な方法をユーザーに提供するために設計されたオープンソースのブラウザ拡張機能です。この拡張機能を使うと、ユーザーはどのウェブページでもサイドバーを開き、ローカルで動作しているAIモデルと対話することができます。
1年前
089.2K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

透かし除去:オープンソース画像透かし除去ツール、画像透かし復元オリジナル画像

概論 透かし除去は、機械学習とディープラーニングの技術を画像修復、特に画像から透かしを除去するために使用するオープンソースプロジェクトです。このプロジェクトはChimzuruoke Okaforによって開発され、Con...
1年前
089.2K
Outlines:通过正则表达式、JSON或Pydantic模型生成结构化文本输出

アウトライン: 正規表現、JSON、Pydanticモデルによる構造化テキスト出力の生成

概説 Outlinesは、構造化テキスト生成を通じて大規模言語モデル(LLM)のアプリケーションを強化するために、dottxt-aiによって開発されたオープンソースライブラリです。このライブラリは、OpenAIやトランスフォーマーなど、様々なモデルの統合をサポートしています。
1年前
089.2K
Deta Surf:自动整理和总结网页信息的AI浏览器(alpha)

Deta Surf:ウェブページの情報を自動的に照合・要約するAIブラウザ(アルファ版)

概要 Deta Surfは、ブラウザ、ファイルマネージャ、AIアシスタントを組み合わせた革新的なツールで、ユーザーのデジタルライフを簡素化します。Deta GmbHによって開発されたこのツールは、ユーザーのプライバシーとデータセキュリティを確保するために、ローカルデータストレージを第一に考えた戦略を提供しています。AI技術を通じて...
1年前
089.1K
Vizard:长视频自动剪辑为适合社交媒体推广的爆款短视频

Vizard:長い動画は、ソーシャルメディアプロモーションに適した短く爆発的な動画に自動的に編集されます。

はじめに Blue Pulse社のVizardは、人工知能技術を利用して、長い動画をソーシャルメディア用の短いクリップに素早く変換するオンラインツールです。コンテンツ制作者、マーケティング担当者、教育者向けに設計されており、動画の最高の瞬間を自動的に識別し、ソーシャルメディアに適した短いクリップを生成します。
1年前
089K
SP-MangaEditer:专业四格漫画插图创作工具,生成图像、编辑漫画页面

SP-MangaEditer:プロフェッショナル4コマ漫画イラスト作成ツール、画像生成、漫画ページ編集

概要 SP-MangaEditerは、マンガ制作者のために設計された独立したマンガ編集プラットフォームです。画像生成、レイヤー編集、画像調整、フィルター適用など様々な機能をサポートし、高品質なマンガイラストを簡単に作成することができます。ユーザーは簡単に操作することができます...
1年前
088.9K
Qwen2.5-VL:支持图像视频文档解析的开源多模态大模型

Qwen2.5-VL:画像・ビデオ文書解析のためのオープンソース・マルチモーダルラージモデル

総合紹介 Qwen2.5-VLは、アリババクラウド(Alibaba Cloud)のQwenチームによって開発されたオープンソースのマルチモーダルビッグモデルです。Qwen2.5-VLはQwen2-VLのアップグレード版で、Qwen2.5-VLをベースに、テキスト、画像、動画、ドキュメントを同時に扱うことができます。
1年前
088.8K
FlowiseAI:构建自定义LLM应用的节点拖放界面

FlowiseAI:カスタムLLMアプリケーションのためのノードドラッグアンドドロップインターフェースの構築

一般的な紹介 FlowiseAIは、開発者がカスタムLLM(大規模言語モデル)アプリケーションとAIエージェントを構築するために設計されたオープンソースのローコードツールです。ドラッグ&ドロップのシンプルなインターフェースで、ユーザーはLLMアプリケーションを素早く作成し、繰り返し実行することができます。
1年前
088.5K
Vidnoz AI:只需一张照片即可生成数字人演讲视频,多种免费视频生成工具

Vidnoz AI:たった1枚の写真でデジタル人語動画を生成、複数の無料動画生成ツール

概要説明 Vidnozは、1分以内に素早くAIビデオを作成するための無料のAIビデオ生成プラットフォームです。費用、ダウンロード、経験は必要ありません。このプラットフォームは、500以上のAIアバター、470以上のリアルなAIナレーション、500以上のテンプレートを提供しています。VidnozのAIビデオ...
2年前
088.4K
CodeFormer:图像与视频面部复原,老照片修复,提供一键部署版

CodeFormer: 画像とビデオの顔復元、古い写真の復元、ワンクリック展開版を提供

CodeFormer 概要 CodeFormerは、南洋理工大学S-Labの研究チームによって開発され、NeurIPS 2022で発表された、頑健なブラインド顔修正のためのコードベースである。このプロジェクトでは、Codebook Lookup Transformer (C...
2年前
088.4K