最新のAIリソース

共 2985 篇文章
LocalPdfChatRAG:支持本地多源PDF文档问答的智能聊天工具

LocalPdfChatRAG:マルチソースPDFドキュメントのローカルQ&Aをサポートするインテリジェントなチャットツール

包括的な紹介 LocalPdfChatRAGは、ローカルPDF文書とRAG(Retrieval Augmented Generation)モデルを組み合わせることで、インテリジェントなチャット機能を実装することを目的としたオープンソースプロジェクトです。このプロジェクトでは、ユーザがPDFドキュメントをアップロードし、自然言語を通じて質問することで、ドキュメントから相対的な...
1年前
047.8K
Deep Searcher:企业私有文档高效检索与智能问答

ディープサーチャー:企業の私文書の効率的な検索とインテリジェントなQ&A

概要 Deep Searcherは、強力なビッグ言語モデル(DeepSeekやOpenAIなど)と、プライベートデータに基づいて検索、評価、推論を行うように設計されたベクトルデータベース(Milvusなど)を組み合わせたツールで、精度の高い回答を提供する...
1年前
051.7K
Flashcard:基于Dify构建的单词闪卡外语学习工具,替代多邻国(Duolingo)

フラッシュカード:Duolingoに代わってDify上に構築された単語フラッシュカード外国語学習ツール

概要 Flashcardは、Duolingoに代わるオープンソースの言語学習ツールです。Steven Lynn (GitHub username: stvlynn) によって開発されたこのプロジェクトは、モダンなユーザーインターフェイスと多言語を特徴としています。
1年前
058.1K
问小白:提供工作和生活帮助的全能AI助手,集成满血DeepSeek-R1

アスク・ホワイト:DeepSeek-R1を統合した、仕事と生活を支援するオールインワンAIアシスタント

包括的な紹介 AskSeekはYuanshi Technologyによって開発されたAIインテリジェントアシスタント(ウェブサイドとAPPサイドを含む)であり、自社開発のYuanshi Big Modelに基づいており、現在最新のDeepSeek-R1モデルを統合しています。
10ヶ月前
070K
LineAvatars:生成 Notion 风格线条头像的免费工具

LineAvatars: Notionスタイルのラインアバターを生成するフリーツール

概要 LineAvatarsは、Notionスタイルのラインアバターを生成するためにデザインされた、無料で使いやすいオンラインツールです。ユーザーは写真をアップロードするか、ウェブカメラで写真を撮ると、システムが自動的にAIを使ってラインアバターを生成します。このツールは...
1年前
045K
Colori:AI免费生成儿童涂色画,提升儿童创意力的AI涂色页生成器

コリ:AIが子供のぬり絵を自由に生成、子供の創造性を高めるAIぬり絵ページジェネレーター

一般的な説明 Coloriは、あなたのアイデアをユニークでパーソナライズされたぬり絵に素早く変換する、AIベースの子供向けぬり絵生成ツールです。先生でも、親でも、クリエイティブな愛好家でも、簡単なテキスト説明で美しい塗り絵を生成することができます。
1年前
056.7K
Luma Labs:Luma 系列视觉模型,使用丰富的自然语言描述来生成高质量图像和视频

Luma Labs: 豊富な自然言語記述を使用して高品質の画像やビデオを生成するビジュアルモデルのLumaファミリー

はじめに Luma Labsは、人工知能技術を用いた高品質な画像や映像の生成に特化した企業である。主な製品には、テキストからフォトリアリスティックな画像や動画を生成するツール、Luma PhotonとLuma Ray2があります。
1年前
060K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频

悟空:詳細で一貫性のある動画を生成します。詳細なキャラクターやオブジェクトを使用したコマーシャルの作成に最適です。

包括的な紹介 Gokuは、ストリーム変換技術に基づく連携型画像・動画生成モデルであり、業界トップクラスのパフォーマンスを達成するよう設計されています。Gokuは、きめ細かなデータ照合、モデル設計、ストリーム変換の定式化など、高度で高品質な映像生成技術を統合しています。
1年前
047.5K
Kamili:AI智能评估网站质量并给出优化建议

Kamili:AIインテリジェンスがウェブサイトの品質を評価し、最適化のアドバイスを提供

はじめに Kamiliは、人工知能技術を使用し、ユーザーがウェブサイトのパフォーマンス、ユーザーエクスペリエンス、SEOパフォーマンスを改善できるように設計されたウェブサイト最適化アドバイスを提供するツールです。簡単な3ステップのプロセスで、ユーザーはウェブサイトへのリンクを入力し、目標を設定し、詳細な最適化プランを取得し、すぐに確認することができます。
1年前
047.6K
One Shot LoRA:快速生成视频 LoRA 模型的全能平台

ワンショットLoRA:迅速なビデオLoRAモデル生成のためのオールインワンプラットフォーム

概要 One Shot LoRAは、動画から高品質の動画LoRAモデルを生成することに特化したプラットフォームです。ユーザーは、ログインや個人データの保存をすることなく、動画から素早く簡単にブティックLoRAモデルをトレーニングすることができます。このプラットフォームはHunyua...
1年前
067.9K
ToolJet:使用文字描述快速构建和部署企业内部应用程序

ToolJet:テキスト記述によるオンプレミス・アプリケーションの迅速な構築と展開

概要 ToolJetは、AIを活用したエンタープライズ・アプリケーション開発プラットフォームであり、簡単な自然言語記述でカスタムAIアプリケーションやエージェントの作成を可能にする。ユーザーは、希望するアプリケーションを記述するだけで、ToolJetがUI、データベース、クエリなどのセットアップをすべて行います。
1年前
060.4K
Gemini Cursor:基于Gemini构建的AI桌面智能助手,能看、能听、能说

Gemini Cursor:見て、聞いて、話すことができるGemini上に構築されたAIデスクトップスマートアシスタント

概論 Gemini Cursorは、GoogleのGemini 2.0 Flash(実験的)モデルをベースとしたデスクトップ知的アシスタントである。Gemini Cursorは、マルチモーダルAPIを通じて、視覚、聴覚、音声によるインタラクションを可能にし、リアルタイムで低遅延な利用を提供します。
1年前
060.5K
Data Formulator:AI驱动的数据可视化工具

Data Formulator:AIによるデータ可視化ツール

概論 Data Formulator は Microsoft Research によって開発されたオープンソースのAI駆動型データ可視化ツールである。このツールは、グラフィカル・ユーザー・インターフェース (GUI) と自然言語入力 (NL) を組み合わせたもので、ユーザーは簡単なインタラクションやコマンドによって、素早くデータを作成し、反復することができます。
1年前
062.8K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用

Ai2 OLMoE:オフラインで動作するOLMoEモデルに基づくオープンソースのiOS AIアプリ

概要 Ai2 OLMoEは、Allen Institute for AI (Ai2, Allen Institute for Artificial Intelligence)によって開発されたオープンソースのiOSアプリで、デバイス上で動作するAIモデルを提供します。このアプリは、Ai2のオープンソースOLMoEを活用しています。
1年前
060.5K
Pngtree:免费下载透明背景图片和设计素材

Pngtree:透明な背景画像とデザイン素材を無料ダウンロード

概要 Pngtreeは無料のPNG画像やデザイン素材を提供するサイトです。透明な背景画像、ベクター、背景素材、テンプレートが揃っています。動物、植物、ビジネス、テクノロジーなど、デザイナー、学生、マーケティング担当者向けの様々な分野をカバーしています。
11ヶ月前
070.8K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要

Meetily:会議議事録の作成、書き起こし、会議サマリーの作成をリアルタイムで行うAIアシスタント

一般的な説明 MeetilyはZackriya Solutionsによって開発されたAIを搭載した会議アシスタントで、会議の音声をリアルタイムでキャプチャし、音声書き起こしを行い、会議のサマリーを生成します。すべての処理がデバイス上でローカルに行われる点が特徴で、ユーザーのプライバシーを保証します。
1年前
0128.6K
DeepSeek-VL2:高级多模态理解的专家级视觉语言模型

DeepSeek-VL2:高度なマルチモーダル理解のためのエキスパート視覚言語モデル

包括的な紹介 DeepSeek-VL2は、その前身であるDeepSeek-VLの性能を大幅に向上させた、高度なMoE(Mixture-of-Experts)視覚言語モデルのシリーズです。このモデルは、視覚的な質問と回答、光学式文字認識、テキスト...
1年前
072.9K
Zonos:高质量语音合成与语音克隆工具

Zonos: 高品質音声合成と音声クローニングツール

一般的な紹介 ZonosはZyphraによって開発されたオープンソースの音声合成と音声クローニングツールです。Zonos-v0.1バージョンは、高品質の音声出力を生成するために高度なトランスフォーマーとブレンドモデルを使用しています。このツールは複数の言語をサポートしています。
1年前
063.6K
沉浸式翻译插件:免费多语言实时网页翻译工具,PDF/EPUB/视频字幕全支持

Immersive翻訳プラグイン:無料の多言語リアルタイムWebページ翻訳ツール、PDF/EPUB/ビデオ字幕フルサポート

包括的な紹介 Immersive Translatorは、言語の障壁を打破し、簡単にグローバルな情報を読むために設計された無料の強力なブラウザプラグインです。多言語のリアルタイムWebページ翻訳サービスを提供し、数十の言語が相互に翻訳することをサポートし、従来のWebページ翻訳の制限を打破し、PDFドキュメント、E...に機能を拡張します。
11ヶ月前
072.1K
ChatGPT Box:让 ChatGPT 在其他网页工作的浏览器插件

ChatGPT Box: 他のウェブページでChatGPTを動作させるブラウザプラグイン

一般的な紹介 ChatGPT Boxは、ChatGPTをユーザーのブラウザに深く統合するために設計されたオープンソースのブラウザ拡張機能です。josStorerによって開発されたこのツールは、複数の言語をサポートし、任意のページ上でチャットペアを呼び出すなどの様々な機能を提供します...
11ヶ月前
052.7K
欧路翻译插件:学习英语为主的网页划词翻译工具

Oulu Translator Plugin: 英語学習に特化したWebページスクラッチ翻訳ツール

包括的な紹介 Oulu Translator Pluginは、Chrome、Edge、Firefox.Theプラグインを含む複数のブラウザをサポートする強力なブラウザ拡張機能です上海Qianyinネットワーク技術有限公司によって開発されたユーザーに便利なストローク翻訳、自動翻訳と語彙の教科書機能を提供することを目的と...
1年前
047.1K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: 対話、投稿生成、翻訳のためのWordPress AIアシスタントプラグイン

総合紹介 WordPress AI Assistant Plugin (wp-ai-chat)は、AI対話、記事生成、記事要約、記事翻訳、コンテンツ読み上げなど、様々なAI機能をユーザーに提供するために設計されたオープンソースのWordPressプラグインです。このプラグインは、複数のAIとのドッキングをサポートしています。
1年前
052.6K
promptfoo:提供安全可靠的LLM应用测试工具

プロンプトフー:安全で信頼性の高いLLMアプリケーションテストツールの提供

包括的な紹介 promptfooは、大規模言語モデル(LLM)アプリケーションの評価とレッドチームテストに特化したオープンソースのコマンドラインツールおよびライブラリです。信頼性の高いプロンプト、モデル、検索ベースの生成(RAG)を構築するためのツール一式を開発者に提供します。
1年前
066.2K
RSSFlow Reader:AI摘要和智能内容流的RSS订阅器

RSSFlowリーダー:AI要約とスマートコンテンツフローのためのRSSフィーダー

包括的な紹介 RSSFlow Readerは、AI要約とインテリジェントコンテンツフロー機能を統合し、ユーザーに効率的で便利な読書体験を提供することを目的とした最新のRSSリーダーです。このツールは、複数のRSSフォーマットの解析、インテリジェントコンテンツエンコーディング処理、自動リトライメカニズムをサポートしています。
1年前
056.2K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话

NoneBot DeepSeek Plugin: NoneBotとDeepSeekをベースにしたカスタマーサービス用のインテリジェントな対話。

一般的な紹介 NoneBot DeepSeek プラグインは、DeepSeek モデルを統合し、インテリジェントな対話と Q&A 機能を提供するように設計された NoneBot プラグインです。DeepSeek モデルにアクセスすることで、ユーザは NoneBot ...
1年前
053.3K
Solana Agent Kit:连接AI智能体与Solana协议的开源工具包

Solana Agent Kit: AIインテリジェンスをSolanaプロトコルに接続するためのオープンソースツールキット

概要 Solana Agent Kitは、AI知能をSolanaブロックチェーン・プロトコルにシームレスに接続するために設計されたオープンソースのツールキットである。このキットにより、AI研究者と暗号通貨開発者の双方が、モデル訓練された知的体を使用して、ブロックチェーン上で...
1年前
048.3K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora:オーディオブック字幕抽出と多言語翻訳、オーディオブックの多言語書き起こし

包括的な紹介 LiberSonoraは、「自由な音」を意味し、強力なAI対応のオープンソースオーディオブックツールセットです。インテリジェントな字幕抽出、AIタイトル生成、多言語翻訳などをサポートし、GPUアクセラレーションによるバッチオフライン処理が可能です。
1年前
049.6K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析

go-stock:AI対応株式分析ツール、自分で選んだ株価のリアルタイム監視とAIに基づく詳細分析

総合紹介 go-stockはWailsとNaiveUIで構築されたAI対応株式分析ツールです。このツールは株価のリアルタイム監視が可能で、コストと損益表示、上下アラームプッシュ機能を提供します。すべてのデータはローカルに保存され、ユーザ...
1年前
081.9K
Nice Prompt:管理和使用AI提示词的工具,Chrome、VS Code快速收藏插件

Nice Prompt:AIプロンプトの単語を管理・使用するツール、Chrome、VS Codeのクイックフェイバリットプラグイン

概要説明 Nice Promptは、開発者、クリエーター、AI愛好家のために設計されたツールで、ユーザーがAIプロンプトを効率的に管理、使用することを支援します。Nice Promptを使えば、ユーザーはTwi...に関わらず、AIプロンプトを簡単に保存、整理、アクセスすることができます。
1年前
052.7K
EnConvo:智能AI启动器,专为macOS设计的全能AI助手

EnConvo:インテリジェントAIランチャー、macOSのための本格的AIアシスタント

一般的な説明 EnConvoは、毎日のタスクを自動化することでユーザーの生産性を高めるように設計されたmacOS用のインテリジェントなAIアシスタントランチャーです。このプラットフォームは、150以上のビルトインツールとMCPサポートを統合し、ユーザーのワークフローを学習して適応します。
1年前
062K
RSS Translator(RSS翻译器):订阅并实时翻译RSS内容的工具

RSS Translator: RSSコンテンツをリアルタイムで購読・翻訳するツール

概要 RSS Translatorは、ユーザーがリアルタイムでRSSコンテンツを翻訳して購読できるように設計された、オープンソースのクリーンで自己展開可能なツールです。このツールは、Google翻訳、Microsoft Tra...など、複数の翻訳エンジンをサポートしています。
1年前
056K
KTransformers:大模型推理性能引擎:极致加速,灵活赋能

KTransformers:大規模モデル推論パフォーマンス・エンジン:極限の加速、柔軟な権限付与

KTransformers:大規模モデル推論のボトルネックを克服するための高性能Pythonフレームワーク。 KTransformersは、単なるモデル実行ツールにとどまらず、極めて優れたパフォーマンス最適化エンジンのセットであり、柔軟なインターフェース強化プラットフォームでもあります。 KTransf...
1年前
069.7K
讯飞绘镜:输入文案AI自动生成短视频,AI短视频创作平台

Xunfei Painted Mirror:入力コピーAIは自動的に短いビデオ、AIショートビデオ作成プラットフォームを生成する

総合紹介 Xunfei Painted Mirror (Typemovie)はXunfei Selection (Huangshan) Technology Co., Ltd.が開発したAI動画作成プラットフォームである。このプラットフォームは、コンテンツクリエイター、マーケティング担当者、教育者に適しており、ショートドラマ、予告編からミュージックビデオまで、多様な作成オプションを提供しています。ユーザーが必要なのは...
1年前
071.5K
Galileo AI:文本提示或参考图生成精美的UI设计稿

ガリレオAI:テキストプロンプトや参照画像から美しいUIデザインドラフトを生成

はじめに Galileo AIは、美しく機能的なインターフェイスデザインを素早く生成できるように設計された、強力なインターフェイスデザイン生成プラットフォームです。モバイルでもウェブでも、Galileo AIはニーズに合わせてカスタマイズされたデザインを生成します。ユーザーが選択できる...
1年前
054.7K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建

VideoRAG:マルチモーダル検索と知識グラフ構築をサポートする超長尺動画理解のためのRAGフレームワーク

包括的な紹介 VideoRAGは、非常に長い文脈動画を処理し理解するために設計された、検索機能を強化した生成フレームワークです。このツールは、グラフ駆動のテキスト知識ベースと階層的なマルチモーダルコンテキストエンコーディングを組み合わせ、1つのNVIDIA RTX 3090 GPUで効率的に処理します...
1年前
061.2K
Instructor:简化大语言模型结构化输出工作流的Python库

講師:大規模言語モデルの構造化出力ワークフローを簡素化するPythonライブラリ

概要 Instructorは、大規模言語モデル(LLM)からの構造化出力を処理するために設計された人気のあるPythonライブラリです。Pydanticをベースに構築されており、データを管理するためのシンプルで透過的、かつユーザーフレンドリーなAPIを提供します。
1年前
051.9K
MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

MedRAX:マルチモーダル・マクロモデルを用いた胸部X線写真解析のためのインテリジェントボディ

包括的な紹介 MedRAXは、胸部X線(CXR)解析用に設計された最先端のAIインテリジェンスです。最先端のCXR解析ツールとマルチモーダル大規模言語モデルを統合し、追加トレーニングなしで複雑な医療クエリを動的に処理します。
1年前
062.4K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人

LangBot:オープンソースの大型モデルインスタントメッセージングロボット、複数のWeChat、QQ、Flybookと他のマルチプラットフォームのAIロボットの展開をサポートしています。

LangBotは、複数のメッセージングプラットフォームと大型モデルをサポートする大型モデルベースのインスタントメッセージングボットプラットフォームです。このプラットフォームはQQ、WeChat(企業WeChat、個人WeChat)、Flybook、Discord、OneBotなどのメッセージングプラットフォームに適応し、Open...
1年前
066.3K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: Llama-70Bに基づく一般的な意味的チャンキング戦略

包括的な紹介 zChunkは、ZeroEntropyによって開発された、一般的なセマンティック・チャンキングのソリューションを提供する新しいチャンキング戦略です。このストラテジーはLlama-70Bモデルに基づいており、チャンクの生成を促すことでドキュメントのチャンキングプロセスを最適化し、情報検索を高いレベルで維持することを保証します。
1年前
046.7K
Hibiki:实时语音翻译模型,保留原声特点的流式翻译

Hibiki:リアルタイム音声翻訳モデル、元の音声の特徴を保持したストリーミング翻訳

一般的な紹介 Hibikiは、Kyutai Labsによって開発された高忠実度のリアルタイム音声翻訳モデルです。従来のオフライン翻訳機とは異なり、Hibikiはユーザーが話している最中にリアルタイムでターゲット言語の自然な音声翻訳を生成し、テキスト翻訳も提供することができます。このモデルは...
1年前
062.3K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话

Qwen4Mac: MacのメニューバーにあるQwenの大きなモデルを使って、いつでも会話ができます!

概要 Qwen4MacはQwen Large Language Model (LLM)をMacのメニューバーに統合し、ユーザーがいつでも簡単に呼び出して使えるようにするために設計されたオープンソースプロジェクトです。このプロジェクトは、andreaturchetによって開発・保守されており、ユーザが簡単にQwenを...
1年前
051.6K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)

Pocket AI:DeepSeek-R1 (5.37GB)に対応した、携帯電話で動作するオフラインのAIアシスタント。

ポケットAI(PocketPal AI中国語版)は、いつでもどこでもAIと会話できるように設計された強力なオフラインAIアシスタントです。スモール・ランゲージ・モデル(SLM)をベースにしており、インターネット接続のない携帯電話で動作し、特に中国のユーザー体験に適応しています。口...
1年前
0112.7K
Pulse:文档处理与数据提取的商业解决方案

パルス:文書処理とデータ抽出のためのビジネスソリューション

Pulseは、文書処理とデータ抽出に特化したインテリジェントなプラットフォームで、企業や開発者がさまざまな複雑な文書を効率的に解析・処理できるように設計されています。高度なコンピュータビジョンとマルチモーダル処理技術により、Pulse はテキスト、画像、表、その他多くのデータから正確にデータを抽出することができます。
1年前
050K
Turnitin:学校常用学术诚信与原创性检测工具

Turnitin:学校共通のアカデミック・インテグリティとオリジナリティのテストツール

一般的な紹介 Turnitinは、教育者と学生のために設計されたアカデミックインテグリティとオリジナリティ検出プラットフォームです。Turnitinの主な機能には、剽窃の検出、文章の質の向上、および学術論文のオリジナリティの確保を支援するさまざまなツールがあります。
1年前
050.7K
IsGPT:免费、快速、可靠的英文AI内容检测工具

IsGPT:無料、高速、信頼性の高い英語AIコンテンツ検出ツール

包括的な紹介 IsGPTは、GPTのようなAIによって生成されたテキストコンテンツの検出に特化した無料のAIコンテンツ検出ツールです。このツールは、MIT CSAILによってインキュベートされ、既存のAIコンテンツ検出ツールの欠点を解決することを目的としています。IsGPTは、テキストとの関連において、テキストの当惑度と突発性を分析することによってテキストを分析します。
1年前
059.8K
Agentic Object Detection:无需标注和训练的视觉目标检测工具

エージェントによる物体検出:注釈やトレーニングを必要としない視覚的物体検出ツール

包括的な紹介 Agentic Object Detectionは、Landing AIによる先進的なターゲット検知ツールです。このツールは、テキストプロンプトによって検出を実行するため、データアノテーションやモデルトレーニングが不要となり、従来のターゲット検出のプロセスを大幅に簡素化します。
1年前
052.8K
OpenHealthForAll:个人健康数据管理AI助手,上传检查报告定制健康计划

OpenHealthForAll:個人の健康データ管理のためのAIアシスタント、カスタマイズされた健康計画のための検査レポートのアップロード

概論 OpenHealthForAllは、ユーザーの個人的な健康データの管理と理解を支援するために設計されたオープンソースプロジェクトである。人工知能技術を活用することで、OpenHealthForAllはローカルで動作する健康アシスタントを提供し、ユーザーがより良く管理できるようにします。
1年前
052.4K
Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型

Kiln: シンプルなLLMモデルの微調整とデータ合成ツール!

包括的な紹介 Kilnは、大規模言語モデル(LLM)の微調整、合成データの生成、およびデータセットのコラボレーションに焦点を当てたオープンソースツールです。Windows、MacOS、Linuxシステムをサポートする直感的なデスクトップアプリケーションを提供し、LLMのゼロコード実装を可能にします。
1年前
065.9K
Agentic Security:开源的LLM漏洞扫描工具,提供全面的模糊测试和攻击技术

Agentic Security: オープンソースのLLM脆弱性スキャンツール。

概要 Agentic Securityは、開発者やセキュリティ専門家に包括的なファズテストと攻撃技術を提供するために設計されたオープンソースのLLM(Large Language Model)脆弱性スキャンツールです。このツールは、カスタムルールセットやエージェントベースの攻撃をサポートし、LLM APを統合することができます。
1年前
056.4K
CogVLM2:开源多模态模型,支持视频理解与多轮对话

CogVLM2: 映像理解と複数回の対話を支援するオープンソースのマルチモーダルモデル

包括的な紹介 CogVLM2は清華大学データマイニング研究グループ(THUDM)によって開発されたオープンソースのマルチモーダルモデルで、Llama3-8Bアーキテクチャをベースとしており、GPT-4Vに匹敵するか、それ以上の性能を提供することを目指している。このモデルは画像理解、多ラウンド対話、視覚...
1年前
058.5K
VisoMaster:强大且易用的图片/视频换脸和编辑软件

VisoMaster: パワフルで使いやすい写真/ビデオ整形・編集ソフトウェア

はじめに VisoMasterは、人工知能技術を使用して自然でリアルなフェイススワップ効果を実現する、パワフルで使いやすいビデオフェイススワップ編集ツールです。画像でもビデオでも、VisoMasterは簡単な操作で高品質のフェイススワップ結果を生成することができ、一般的なビデオ編集に適しています。
1年前
0162.4K
基于RAG构建提供健康建议的小助手(实验项目)

健康アドバイスを提供するミニ・アシスタントのRAGベースの構築(パイロット・プロジェクト)

概論 LLM-RAG-Longevity-Coachは、Large Language Modelling (LLM)とRetrieval Augmented Generation (RAG)の技術に基づいたチャットボットで、ユーザーにパーソナライズされた健康と長寿のアドバイスを提供するように設計されている。このプロジェクトは、タイラー・バーレ...
1年前
045.7K
Maestro:简化主流开源视觉语言模型微调过程的工具

Maestro:主流のオープンソース視覚言語のモデルの微調整プロセスを簡素化するツール

包括的な紹介 MaestroはRoboflowによって開発されたツールで、マルチモーダルモデルのファインチューニングプロセスを簡素化、高速化し、誰でも独自の視覚マクロモデルをトレーニングできるようにします。F... などの一般的な視覚言語モデル(VLM)を微調整するためのレシピが用意されています。
1年前
055.9K
Raphael:免费无限制的使用 FLUX.1-Dev 生成图像

Raphael:FLUX.1-Devで画像を無料で制限なく生成!

概要 Raphaelは、FLUX.1-Devモデルを搭載した、世界初の完全無料・無制限のAI画像ジェネレーターです。Raphaelは、FLUX.1-Devモデルを使用した、世界初の完全無料・無制限のAI画像ジェネレーターです。ユーザーは、登録や使用制限なしに、テキスト記述から高品質の画像を生成することができます。
1年前
0105.3K
Sigma AI Browser:免费使用主流大模型的AI浏览器

シグマAIブラウザー:主流のビッグモデルを使用するための無料のAIブラウザー

概要 Sigma AI BrowserはSigmaBrowser OÜによって開発された先進的なブラウザで、人工知能技術を活用し、より高速でスマートなブラウジング体験をユーザーに提供します。このブラウザは、スピードと効率性だけでなく、セキュリティの強化やパーソナル...
1年前
080.6K
One-Prompt-One-Story:文本提示生成角色身份一致的图像

ワン・プロンプト・ワンストーリー:テキスト・プロンプトがキャラクターのアイデンティティと一貫したイメージを生み出す

Synthesis One-Prompt-One-Story(1Prompt1Story)は、1つのプロンプトから一貫した画像を生成できるように設計された革新的なテキストから画像への生成ツールである。ICLR 2025でTao Liuらによって発表された。
1年前
049K
AudioNotes:快速提取音视频内容并生成结构化笔记

AudioNotes: 音声とビデオコンテンツをすばやく抽出し、構造化されたノートを作成します。

総合紹介 AudioNotesは、FunASRとQwen2に基づいて構築された、オーディオ/ビデオから構造化ノートへのシステムです。オーディオ/ビデオコンテンツを素早く抽出し、大きなモデルを呼び出して構造化されたMarkdownノートを生成することができます。
1年前
053.4K
Bilingual Book Maker:使用AI翻译制作双语电子书,全书自动化翻译工具

バイリンガルブックメーカー: AI翻訳を使用して、バイリンガルの電子書籍を作成します。

一般的な紹介 バイリンガルブックメーカーは、ユーザーがAI技術を使って多言語版の電子書籍を作成できるように設計されたオープンソースプロジェクトです。このツールは主に翻訳にChatGPTを使用し、epub、txt、srtを含む複数のファイル形式をサポートしています。
1年前
059.8K
Rowfill:批量提取文档结构化信息并自动化分析

ロウフィル:文書からの構造化情報の一括抽出と自動分析

概要 Rowfillは、ナレッジワーカーのために設計されたオープンソースの文書処理プラットフォームです。高度な人工知能技術を使用して、複雑な文書、画像、PDFからデータを抽出、分析、処理します。Rowfillは、Large Language Model(LLM)とOpe...
1年前
050K
PRAG:提升问答系统性能的参数化检索增强生成工具

PRAG: Q&Aシステムのパフォーマンス向上のためのパラメトリック検索拡張生成ツール

包括的な紹介 PRAG(Parametric Retrieval-Augmented Generation)は、大規模言語モデル(LLM)のパラメータ空間に直接埋め込むことで、外部知識の生成を強化することを目的とした革新的な検索拡張生成ツールである。
1年前
056.4K
GPT Researcher:利用本地和网络数据,生成全面、详实的研究报告

GPTリサーチャー:ローカルおよびウェブベースのデータを使用して、包括的で詳細な調査レポートを作成します。

包括的な紹介 GPT Researcher は、Large Language Model (LLM)をベースとした自律型エージェントツールで、ローカルリサーチやウェブリサーチを行い、詳細なリサーチレポートを作成するために設計されています。このツールは、エージェント作業を並列化することにより、安定したパフォーマンスと高速化を実現し、情報の正確性を保証します。
12ヶ月前
047.9K
Linly-Talker:数字人智能对话系统,结合大语言模型与视觉模型,实现互动新体验

Linly-Talker:デジタルピープルのためのインテリジェント対話システム、ビッグ言語モデルとビジュアルモデルを組み合わせた新しいインタラクティブ体験

概論 Linly-Talkerは、大規模言語モデル(LLM)と視覚モデルを組み合わせた革新的なデジタル人間対話システムであり、人間とコンピュータの対話への斬新なアプローチを生み出す。このシステムは、Whisper、Linly、Micros...といった様々な技術を統合しています。
1年前
083.3K
Airweave:让应用程序快速集成知识库,实现智能搜索

Airweave:インテリジェントな検索のためのナレッジベースをアプリケーションに迅速に統合することを可能にする

概論 Airweaveは、ユーザーのアプリケーション・データ、API、データベース、ウェブサイトをグラフやベクトル・データベースに同期させることで、あらゆるアプリケーションを検索可能にするために設計されたオープンソース・ツールである。Airweaveは、構造化データであろうとなかろうと、データを検索可能にするプロセスを単純化する。
1年前
049K
Botnow:AI 智能体创作与分发平台,助力智能营销与智慧办公

ボットナウ:スマートマーケティングとスマートオフィスのためのAIインテリジェントボディ作成・配信プラットフォーム

包括的な紹介 Botnowは、プラグイン、ナレッジベース、ワークフローを通じて、開発者が高品質なインテリジェンスを低い敷居で迅速に構築できるように設計された、次世代のAIインテリジェンス作成および配布プラットフォームです。このプラットフォームは、サードパーティのプラットフォームへのインテリジェンスの公開をサポートし、APIチューニングを提供します。
1年前
048.2K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用

ai-gradio: 複数のAIモデルを簡単に統合し、Gradioに基づいたマルチモーダル・アプリケーションを構築する

概論 ai-gradioはオープンソースのPythonツールキットで、開発者が複数のAIモデルを簡単に統合して使用できるように設計されています。Gradio上に構築されたこのプロジェクトは、複数のAIモデルとサービスをサポートするための統一されたインターフェースを提供します。テキスト、音声、動画のいずれでも...
1年前
051.8K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher:完全な調査レポートを書くための自動詳細調査ツール

概要 OpenDeepResearcherは、人工知能技術によって研究効率を向上させるために設計されたオープンソースの自動ディープリサーチツールです。プロジェクトはmshumerによって開発され、GitHubでホストされています。OpenDeepResear...
12ヶ月前
050.9K
ColiVara:基于视觉嵌入的文档存储与检索服务

ColiVara:視覚的埋め込みベースの文書保管・検索サービス

概要 ColiVara は、ビジュアル埋め込み技術に基づく文書保管・検索サービスです。光学式文字認識(OCR)やテキスト抽出の必要性をなくし、フォームの破損や画像の紛失といった問題を回避します。ColiVaraは、PDFを含む100以上のファイルフォーマットをサポートしています。
1年前
056.2K
Cursor Reset:重置 Cursor 0.45.x 以上版本设备标识的脚本

Cursor Reset: Cursorバージョン0.45.x以上のデバイス識別子をリセットするスクリプト。

概要 Cursor Reset は、Cursor IDE でデバイス識別子をリセットするための PowerShell スクリプト・ツールで、Cursor バージョン 0.45.x をサポートしています。このツールは、ユーザーが Cursor IDE のデバイス識別子をリセットできるように設計されています。
1年前
093.2K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板

n8n Self-hosted AI Starter Kit: ローカルAI環境を素早く構築するためのオープンソーステンプレート

包括的な紹介 n8nセルフホストAIスターターキットは、包括的なローカルAIとローコード開発環境を素早く初期化するために設計されたオープンソースのDocker Composeテンプレートです。n8nチームによって作られたこのスイートは、セルフホスト型のn8nプラットフォームと、互換性のある様々なAI...
1年前
084.6K
Julep AI:使用DSL构建多步骤智能体工作流的AI云平台

Julep AI: DSLを使用したマルチステップ・インテリジェント・ボディワークフロー構築のためのAIクラウドプラットフォーム

概要 Julep AIは、過去のやり取りを記憶し、複雑なマルチステップタスクを実行するAIインテリジェンスを作成・管理するためのプラットフォームです。Julep AIは、長期記憶とマルチステッププロセス管理機能を提供し、外部ツールやAPIとの統合をサポートしています。
1年前
053K
Gemini Teacher:英语口语发音纠正助手

ジェミニ・ティーチャー:英語スピーキング発音矯正アシスタント

概要 Gemini Teacherは、Google Gemini AIに基づいた英語スピーキング練習アシスタントです。ユーザーの英語の発音をリアルタイムで認識し、即座にフィードバックと修正案を提供します。このツールは、ユーザーが英語のスピーキングスキルを向上させるために設計されています...
1年前
067.3K
bilive:B站无人监守直播录制与自动切片、上传工具

bilive:教師なしライブ録画、自動スライス、B局用アップロードツール

総合紹介 biliveはB局ライブ録画のために設計されたツールで、非常に高速なライブ録画、自動スライシング、ポップアップレンダリング、字幕生成を提供します。このツールは、超低構成マシンに対応し、7x24時間の無人録画をサポートし、自動的にポップアップと字幕を識別してレンダリングし、自動的にスライスして...
1年前
074.7K
R1-V:低成本强化学习实现视觉语言模型泛化能力

R1-V: 視覚言語モデルの汎化能力のための低コスト強化学習

包括的な紹介 R1-Vは、低コストの強化学習(RL)を通して視覚言語モデリング(VLM)のブレークスルーを達成することを目的としたオープンソースプロジェクトです。このプロジェクトは、VLMが一般的な計数能力を学習する動機付けとなる、検証可能な報酬メカニズムを利用している。驚くべきことに、R1-Vの2B ...
1年前
059.4K
llms.txt:为大语言模型提供标准化网站信息文档

llms.txt:大規模言語モデルのための標準サイト情報ドキュメント

包括的な紹介 llms.txtは、Large Language Models (LLM)のために特別に設計された標準化された文書フォーマットです。LLMが推論プロセスで簡単かつ効率的に使用できる、簡潔で構造化された情報をウェブサイトが提供できるようにします。この仕様は、CloudflareとAnthropiによってサポートされています。
1年前
059.5K
PPTX2MD:将PPTX文件转换为Markdown的专用工具

PPTX2MD: PPTXファイルをMarkdownに変換する特別なツール

概要 PPTX2MDは、PowerPointのPPTXファイルをMarkdown形式に変換するために設計されたオープンソースツールです。GitHubユーザーのssine氏によって開発されたこのツールは、見出し、リスト、テキストフォーマット(例:太字、斜体、色、スーパー...)を保持することをサポートしています。
1年前
071.6K
Go-Proxy:Docker集成的高性能反向代理服务器

Go-Proxy:Docker統合のための高性能リバースプロキシサーバー

包括的な紹介 Go-ProxyはGo言語を使って開発された高性能なプロキシサーバーで、主にさまざまなネットワーク環境でプロキシサービスを提供するために使用されます。HTTP、HTTPS、SOCKS5、WebSocket、TCP、UDPを含む様々なプロトコルをサポートし、プロキシサーバーとして使用することができます。
1年前
051.3K
CoT-Lab:探索人机协作迭代思考的实验性对话工具

CoT-Lab:人間とコンピュータのコラボレーションに関する反復的思考を探求するための実験的対話ツール

CoT-Labは、人間とコンピュータのコラボレーションにおける新しいパラダイムを探求するための実験的インターフェースです。CoT-LabはCognitive Load Theory(認知的負荷理論)とActive Learning Principles(能動的学習原理)に基づき、「シンキングパートナー」関係の構築を通じて、人間と人工知能(AI)の間の深い認知的連携を促進します。プロジェクトの目的は...
1年前
043.1K
Humanize AI:免费将AI生成内容撰写为人类撰写的内容,绕过AI检测器

AIの人間化:AI検出器をバイパスして、AIが生成したコンテンツを人間が書いたコンテンツとして無料で書く。

概論 Humanize AIは、AIが生成したテキストを自然な人間の言葉に変換するために特別に設計されたオンラインツールです。このサイトでは、ChatGPT、Gemini、Bing、Jasper、Gram...を変換する高度なAIヒューマナイズツールを提供しています。
9ヶ月前
050.6K
Humva:一张照片免费生成个性化数字人/数字分身视频

Humva:1枚の写真から生成される無料のパーソナライズされたデジタル人物/デジタル・ドッペルゲンガー動画

一般的な紹介 Humvaは、ユーザーフレンドリーなソリューションを提供することにより、プロフェッショナルまたはカスタマイズされたデジタルボディビデオを作成するために設計された革新的なAIビデオ生成ツールです。このプラットフォームは、生成AIと高度なリップシンク技術を活用し、カスタマイズされたソーシャルメディアコンテンツ、製品プレゼンテーション、顧客の声などを無料で提供します。
9ヶ月前
066.1K
KushoAI:自动化API测试的AI助手

KushoAI:自動APIテストのためのAIアシスタント

一般的な紹介 KushoはAPIテストのために設計されたAIアシスタントで、ソフトウェア開発者が網羅的なテストスクリプトを自動生成し、手作業によるテストの時間と労力を大幅に節約することを目的としています。Kushoは、APIの仕様を提供することで、実行可能なテストスクリプトをわずか数分で生成することができます...
1年前
053.5K
Orate:集成知名语音生成、语音转录与变声模型的统一API

Orate:よく知られた音声生成、音声トランスクリプション、音声モデリングを統合する統一API

概要 Orateは、音声生成と文字起こしに特化したAIツールキットです。Orateは、OpenAI、ElevenLabs、AssemblyAIなどの主要なAIプロバイダーとシームレスに統合する統一APIを提供し、ユーザーが強制的に音声を作成できるようにします。
1年前
058.8K
Scam AI:识别和防范AI诈骗的智能工具,检测合成的图像、音频、视频

詐欺AI:AI詐欺を特定・防止するスマートなツール、合成された画像・音声・動画を検出

概論 Scam AIは、AI詐欺の特定と防止に焦点を当てたウェブサイトである。AI技術の急速な進歩に伴い、詐欺の手口はより巧妙になり、見分けることが難しくなっています。Scam AIは、様々な形態のAI詐欺を特定し、防止するためのツールやリソースを提供しています。
1年前
058.4K
Reflex LLM Examples:展示大语言模型实际应用的AI应用集合

Reflex LLM Examples:大規模言語モデルの実用的なアプリケーションを示すAIアプリケーション集

概要 Reflex LLM Examples は、Reflex 開発チームが大規模言語モデル(LLM)の実用的なアプリケーションを実証するために作成したオープンソースプロジェクトです。このプロジェクトでは、Reflex上で構築されたいくつかのAIアプリケーションをまとめ、Googl...
1年前
048.4K