AIオープンソースプロジェクト

合計1020記事
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言

LiberSonora:オーディオブック字幕抽出と多言語翻訳、オーディオブックの多言語書き起こし

包括的な紹介 LiberSonoraは、「自由な音」を意味し、強力なAI対応のオープンソースオーディオブックツールセットです。インテリジェントな字幕抽出、AIタイトル生成、多言語翻訳などをサポートし、GPUアクセラレーションによるバッチオフライン処理が可能です。
8ヶ月前
021.7K
VideoGrain:文本提示对视频进行局部编辑的开源项目

VideoGrain: 動画のローカル編集用テキストプロンプト オープンソースプロジェクト

一般的な紹介 VideoGrainは、xAIチームによって開発され、GitHubでホストされているマルチグラニュラービデオ編集に焦点を当てたオープンソースプロジェクトです。このプロジェクトは論文「VideoGrain: Modulating Space-Tim...
8ヶ月前
021.7K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型

SpeechGPT 2.0-プレビュー:リアルタイム対話のためのエンドツーエンドの擬人化音声対話マクロモデル

SpeechGPT2.0-previewは、OpenMOSSが初めて導入した擬人化リアルタイム対話システムで、数百万時間に及ぶ音声データに基づいて学習されています。このシステムは、擬人化された音声表現と100msの低遅延応答を備え、自然でスムーズなリアルタイム...
9ヶ月前
021.7K
self.so:一键生成精美的个人简历网页

self.so: ワンクリックで美しい履歴書ページを作成!

概要 self.soは、履歴書やLinkedInのプロフィールを素早く個人のウェブサイトに変換するために設計されたオープンソースのツールです。ユーザーはPDFの履歴書をアップロードするか、LinkedInのリンクを入力するだけで、システムがAI技術(Tog...をベース)を使って個人ウェブサイトに変換します。
6ヶ月前
021.7K
zChunk:基于Llama-70B的通用语义分块策略

zChunk: Llama-70Bに基づく一般的な意味的チャンキング戦略

包括的な紹介 zChunkは、ZeroEntropyによって開発された、一般的なセマンティック・チャンキングのソリューションを提供する新しいチャンキング戦略です。このストラテジーはLlama-70Bモデルに基づいており、チャンクの生成を促すことでドキュメントのチャンキングプロセスを最適化し、情報検索を高いレベルで維持することを保証します。
8ヶ月前
021.7K
SQLite-Utils-Ask:让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

SQLite-Utils-Ask: SQLite データベースと CSV/JSON ファイルにクエリデータをクエリできます。

一般的な紹介 SQLite-Utils-Askは、SQLiteデータベースやCSV/JSONファイルに対して、LLM(Large Language Model)の助けを借りて、ユーザーが質問と回答のデータクエリを実行できるように設計された強力なツールです。このツールは、SQLiteデータベースやCSV/JSONファイルに対して、LLM(Large Language Model)に基づいた質問を自動的に生成することができます。
11ヶ月前
021.7K
Paper to Podcast:把学术论文转换为多人对话播客

論文からポッドキャストへ:学術論文を多人数会話のポッドキャストに変換する

一般的な紹介 Paper to Podcastは、学術研究論文を生き生きとした楽しいポッドキャストに変換することに特化したオープンソースのツールです。人工知能技術を使ってPDF形式の論文を3人の登場人物(ホスト、学習者、専門家)の対話に変え、複雑な...
7ヶ月前
021.7K
Text2Voice:基于硅基流动API的文本转语音图形界面

Text2Voice:シリコンベースのフローAPIに基づく音声合成グラフィカルインターフェース

一般的な紹介 Text2Voiceは、シリコンベースのモビリティAPIに基づいた音声合成機能を提供するオープンソースツールで、クリーンなグラフィカル・ユーザー・インターフェース(GUI)が最大の特徴である。開発者のシェルドン・リーがGitHubで作成したもので、...
6ヶ月前
021.7K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: コード構造とコンテンツから自動的にMarkdownドキュメントを生成します。

一般的な紹介 CodeWeaverは、コード・ライブラリを単一の見やすいMarkdownドキュメントに編むために設計されたコマンドライン・ツールです。ディレクトリを再帰的にスキャンし、各ファイルの内容をコードブロックに埋め込むことで、プロジェクトのファイル階層を構造化した表現を生成します。このツールは...
8ヶ月前
021.7K
AI Video Starter Kit:在浏览器中全流程创作并编辑AI视频

AIビデオ・スターター・キット: ブラウザ上でAIビデオの作成と編集がフルフローで可能

概論 ビデオ・スターター・キット(Video Starter Kit)は、fal-ai-communityによって公開されたオープンソースプロジェクトで、ブラウザでのビデオ制作にAIモデルを使用する方法を示すものです。画像を動画に変換するためのツールを提供しています。
9ヶ月前
021.7K
Airweave:让应用程序快速集成知识库,实现智能搜索

Airweave:インテリジェントな検索のためのナレッジベースをアプリケーションに迅速に統合することを可能にする

概論 Airweaveは、ユーザーのアプリケーション・データ、API、データベース、ウェブサイトをグラフやベクトル・データベースに同期させることで、あらゆるアプリケーションを検索可能にするために設計されたオープンソース・ツールである。Airweaveは、構造化データであろうとなかろうと、データを検索可能にするプロセスを単純化する。
8ヶ月前
021.7K
Inbox Zero:轻松实现收件箱零邮件,借助 AI 帮助你对邮件进行归类、过滤、处理。

受信トレイゼロ:AIがメールを分類、フィルタリング、処理します。

一般的な説明 Inbox Zeroは、AIアシスタントを使用して、ユーザーが迅速に受信トレイゼロの電子メールを達成するために設計されたオープンソースの電子メール管理アプリです。自動返信、アーカイブ、ラベル付け、メールの転送、ニュースレターの管理と配信停止、冷やかしメールのブロック、フォロー...など様々な機能を提供しています。
10ヶ月前
021.6K
Artab:在浏览器打开的新标签页中展示世界名画,Chrome插件

Artab:ブラウザで開いた新しいタブで世界の名画を表示、Chromeプラグイン

一般的な説明 Artabは、新しいタブを開くたびに世界の素晴らしい芸術作品を紹介するように設計されたブラウザ拡張機能です。この拡張機能はChrome、Edge、Firefoxブラウザで利用できます。Artabを使用すると、ユーザーはブラウズすることができます...
10ヶ月前
021.6K
DeepResearcher:基于强化学习驱动AI研究复杂问题

DeepResearcher:複雑な問題を研究する強化学習ベースのドライビングAI

包括的な紹介 DeepResearcherは、上海交通大学のGAIR-NLPチームによって開発されたオープンソースプロジェクトです。強化学習(RL)によって実際のウェブ環境でエンドツーエンドで学習された大規模言語モデル(LLM)に基づくインテリジェントな研究ツールです。プロジェクト...
6ヶ月前
021.6K
MiniMind-V:1小时训练26M参数视觉语言模型

MiniMind-V:26Mパラメトリック視覚言語モデルの1時間トレーニング

概要 MiniMind-Vは、GitHubでホストされているオープンソースプロジェクトで、わずか2600万個のパラメータを持つ軽量な視覚言語モデル(VLM)を1時間以内に学習できるように設計されています。MiniMind 言語モデルをベースに、新しいビジュアル...
6ヶ月前
021.6K
GenEx:从一张图片生成可探索的360° 3D世界(代码逐步开源)

GenEx:1枚の画像から探索可能な360°3D世界を生成(コードは順次オープンソース化)

一般的な紹介 GenExは、1枚の画像から完全に探索可能な360°の3D世界を生成できる先進的なAIモデルである。ユーザーはこの生成された世界をインタラクティブに探索することができる。GenExは想像空間における造形的AIの境界を押し広げ、...
10ヶ月前
021.6K
DeepGemini:多模型编排任务并封装为API接口

DeepGemini: タスクのマルチモデルオーケストレーションとAPIインターフェースへのカプセル化

概論 DeepGeminiは、開発者Thomas Sligterによって作成されたオープンソースプロジェクトである。マルチモデルオーケストレーションをサポートするAI管理ツールであり、様々なAIモデルを柔軟に組み合わせることができるのが主な特徴である。
4ヶ月前
021.6K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。

FlipSketch: 静的なドローイングをテキストガイド付きのスケッチアニメーションに変換し、アニメーションプロセスを簡素化します。

一般的な紹介 FlipSketchは、静的な図面をテキストガイド付きのアニメーションに変換するために設計されたオープンソースプロジェクトです。GitHubでホストされているこのプロジェクトは、ユーザーがテキストの説明からアニメーション効果を生成できる革新的なツールを提供しています。
11ヶ月前
021.6K
GLIGEN GUI:精确控制图像元素位置,基于ComfyUI的直观图形界面

GLIGEN GUI:画像要素の位置を正確にコントロール、ComfyUIをベースにした直感的なグラフィカル・インターフェース

概論 GLIGEN GUIはComfyUIをベースにした直感的なグラフィカル・インターフェースで、画像中のオブジェクトの位置を正確に指定できる新しいテキスト-イメージ・モデルであるGLIGENモデルの使用を簡素化するように設計されている。GLIGE...
1年前
021.5K
Scraperr:自托管网页数据抓取工具

Scraperr: セルフホスティングのウェブデータスクレイピングツール

概要 Scraperrは、XPath要素を指定することでウェブデータをスクレイピングすることができる、セルフホスト型のウェブデータスクレイピングツールです。ユーザーはURLと対応するクローリング要素を送信し、結果は表に表示され、エクセルファイルとしてダウンロードすることができます。
11ヶ月前
021.5K
Lecca:无代码构建AI智能体与AI工作流构建平台

Lecca:AIインテリジェンスとAIワークフローを構築する コードなしでプラットフォームを構築する

包括的な紹介 Leccaは、複数のツールやワークフローで大規模言語モデル(LLM)を構成し、デプロイすることができる強力なAIプラットフォームです。ユーザは簡単にAIエージェントを構築、カスタマイズ、自動化することができます。Leccaは幅広いAIプロバイダとモデルを提供しています。
7ヶ月前
021.5K
Deep Searcher:企业私有文档高效检索与智能问答

ディープサーチャー:企業の私文書の効率的な検索とインテリジェントなQ&A

概要 Deep Searcherは、強力なビッグ言語モデル(DeepSeekやOpenAIなど)と、プライベートデータに基づいて検索、評価、推論を行うように設計されたベクトルデータベース(Milvusなど)を組み合わせたツールで、精度の高い回答を提供する...
8ヶ月前
021.5K
Chitu(赤兔):清华团队推出的高性能大语言模型推理框架

Chitu (Red Rabbit): 清華チームが発表した高性能大規模言語モデル推論フレームワーク

Chituは、清華大学のPACMANチームによって開発されたオープンソースの推論フレームワークで、「Red Rabbit」と呼ばれ、大規模な言語モデルを実行するために特別に設計されています。Chituは効率性、柔軟性、実用性に重点を置いており、企業が様々なデバイス上で大規模なモデルを迅速に展開することを可能にします。 Chituは様々なハードウェアをサポートしています。
7ヶ月前
021.4K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐

ディスポーズ:人間の姿勢を精密に制御してビデオを生成し、踊る女性を作り出す

一般的な紹介 DisPoseは、制御されたキャラクター画像アニメーション生成に焦点を当てた革新的なオープンソースの人工知能プロジェクトです。研究者チームによって開発され、GitHubでオープンソース化されたこのプロジェクトは、高度なディープラーニング技術を用いて、骨格のポーズ情報を分解することで正確なキャラクターアニメーションの制御を実現しています。
10ヶ月前
021.4K
R1-Omni:通过视频和音频分析情感的开源模型

R1-Omni: ビデオと音声による感情分析のためのオープンソースモデル

はじめに R1-Omniは、HumanMLLMチームによってGitHubで立ち上げられたオープンソースプロジェクトです。これは、検証可能な報酬による強化学習(RLVR)技術を、感情認識に焦点を当てたマルチモーダル大規模言語モデルに適用した最初のプロジェクトである。このプロジェクトでは、動画と音声データを...
7ヶ月前
021.4K
VOP:提取复杂图表与数学公式的OCR工具

VOP: 複雑な図や数式を抽出するOCRツール

包括的な紹介 Versatile OCR Programは、複雑な学術文書や教育文書を扱うために設計されたオープンソースの光学式文字認識(OCR)ツールです。PDF、画像、その他の文書からテキスト、表、数式、図、回路図を抽出し、OCRファイルを生成することができます。
6ヶ月前
021.4K
Swarms:多智能体编排框架,企业级生产工具

Swarms: マルチインテリジェンス・オーケストレーション・フレームワーク、エンタープライズ・プロダクション・ツール

概要 Swarmsは、効率的なエージェント管理とタスク処理によってビジネスの生産性を向上させるために設計された、エンタープライズグレードのプロダクション対応マルチエージェント・オーケストレーション・フレームワークです。複数のモデル、複数のメモリシステム、カスタムエージェントの作成をサポートするこのフレームワークは、モジュール設計と包括的なロギング機能を提供し、システム...
10ヶ月前
021.4K
Observers:用于AI可观测性的轻量级库,可追踪OpenAI兼容的API请求数据

Observers:OpenAI互換のAPIリクエストデータを追跡するAI observabilityのための軽量ライブラリ

概要 Observersは、生成AI APIに包括的な観測機能を提供するために設計されたオープンソースのPython SDKです。このライブラリにより、ユーザーはAIモデルとのインタラクションを簡単に追跡・記録し、これらの観測結果を複数のバックエンドに保存することができます。どのような...
10ヶ月前
021.4K
AgentClientDemo:演示智能体运行过程的Python客户端,提供直观的图形用户界面

AgentClientDemo: インテリジェントボディの実行プロセスをデモンストレーションするPythonクライアント。

包括的な紹介 AgentClientDemoは、インテリジェント(Agent)とクライアント(Client)の機能を統合した包括的なPythonプロジェクトです。このプロジェクトはPyQtフレームワークに基づいており、直感的で使いやすいグラフィカルユーザインタフェース(GUI)を提供します。
10ヶ月前
021.3K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件

MJML: ChatGPTでレスポンシブメールを簡単にデザイン、マーケティングメールを素早く生成

概要 MJML(Mail Junction Markup Language)は、Mailjetチームによって開発されたオープンソースのフレームワークで、レスポンシブなメールテンプレートの作成を簡素化します。セマンティックなマークアップ言語と豊富なコンポーネントライブラリにより、開発者は少ないコードで美しくパワフルなメールテンプレートを効率的に作成することができます。
1年前
021.3K
OpenSumi Lite:纯前端IDE解决方案,轻松实现代码查看与编辑

OpenSumi Lite: 簡単なコード表示と編集のための純粋なフロントエンドIDEソリューション

概要 OpenSumi Liteは、OpenSumiプロジェクトに基づく純粋なフロントエンドIDEソリューションで、Node.js環境を必要とせずにコードの表示と編集機能を提供するように設計されています。このプロジェクトはAlibaba GroupとAnt Groupによって共同開発され、Node.js環境なしでコード閲覧、編集機能を提供します。
8ヶ月前
021.3K
Potpie AI:快速创建专属代码库的AI工程助手

Potpie AI:独自のコードベースを素早く作成するAIエンジニアリング・アシスタント

包括的な紹介 Potpie AIは、カスタマイズされたAIエンジニアリング・アシスタントを開発者に提供することに特化したオープンソースのプラットフォームです。AIエージェントがコード構造とロジックを深く理解し、コードベースのナレッジグラフを構築することで、デバッグ、テスト、コード生成などのタスクを自動化します。ユーザーはシンプルな...
6ヶ月前
021.3K
元界AI:开源版AI数字人克隆与短视频生成工具

メタバースAI:AIデジタル人クローンとショートビデオ生成ツールのオープンソース版

総合紹介 Metaverse AI(オープンソース版)はGitHubでホストされているプロジェクトで、libn-netチームによって開発されている。AI技術によってデジタルな人間の画像や声をクローンし、短い動画を生成することができ、吹き替えや字幕にも対応しています。このツールはWindo...
7ヶ月前
021.3K
Agenta:集成到AI应用的提示词与模型效果评估工具

Agenta:AIアプリケーションに統合されたキューワードとモデルの効果を評価するツール

包括的な紹介 AgentaはオープンソースのAIモデル管理ツールで、ユーザが簡単にキューワードを使って実験したり、モデルの効果をテストしたり、実行をモニターしたりできるように設計されています。AIアプリケーションを素早く開発したい人に適しており、操作が簡単なプラットフォームを提供します。様々なキューワードの効果を試すことができます。
7ヶ月前
021.3K
基于Cloudflare Worker的AI图片生成脚本

Cloudflare WorkerベースのAI画像生成スクリプト

概論 CloudFlare-AI-ImageはGitHubでホストされているオープンソースプロジェクトで、Cloudflare Workersプラットフォームを通じて無料のAI画像生成サービスを提供している。CloudFlare-AI-Imageは、CloudFlare Workersプラットフォームを通じて無料のAI画像生成サービスを提供するオープンソースプロジェクトです。
6ヶ月前
021.3K
AI蜂巢:基于 Java 的多功能 AI聊天集成平台

AI Hive: Javaベースの汎用AIチャット統合プラットフォーム

包括的な紹介 AIビーハイブ(ai-beehive)は、Spring Boot 3とJDK 17を備えたJava言語上に構築された多機能AIプラットフォームである。このプロジェクトは、ChatGPT...を含む複数のAI技術を統合しています。
12ヶ月前
021.3K
茴香豆:基于LLM(大型语言模型) 的群聊助手

Fennel Bean: LLM (大規模言語モデル) ベースのグループチャットアシスタント

包括的な紹介 HuixiangDouは大規模言語モデル(LLM)ベースのグループチャットアシスタントであり、3段階の前処理、拒否、応答プロセスを通じてグループチャットのシナリオに対処するように設計されています。情報洪水を引き起こすことなく、ユーザーの質問に答えることができる。このプロジェクトでは、完全なWeb...
8ヶ月前
021.2K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClick:任意のLLMを有効にし、AndroidとPCの操作を自動化する

一般的な紹介 ClickClickClickはBandarLabsによって開発されたフレームワークで、ローカルまたはリモートの大規模言語モデル(LLM)を使用してAndroidやPCの操作を自動化することを目的としています。このプロジェクトは現在、非常に実験的な段階にあり、以下のような様々なモデルをサポートしています。
10ヶ月前
021.2K
Extract.fun:开源网站图片提取工具,利用Cloudflare浏览器渲染

Extract.fun: オープンソースのウェブサイト画像抽出ツール , Cloudflareのブラウザレンダリングを使用

概要 Extract.funは、Cloudflareのブラウザレンダリング機能を使用して、あらゆるWebサイトから画像を抽出する最新のWebアプリケーションです。Remix上に構築され、Cloudflare Pages上に配置されたこのアプリケーションは、高速な画像抽出を提供します。
11ヶ月前
021.2K
3FS:提升数据访问效率的并行文件系统(DeepSeek 开源周第五天)

3FS:データアクセス効率を向上させる並列ファイルシステム(DeepSeek Open Source Week 5日目)

概説 3FS(Fire-Flyer File System)は、DeepSeekチームによって開発されたオープンソースの並列ファイルシステムで、最新のSSDとRDMAネットワーク向けに設計されており、データアクセス効率の飛躍的な向上を目指している。180ノードのクラスタに実装されています。
8ヶ月前
021.2K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)

DualPipe:大規模AIモデルの学習効率を向上させる双方向パイプライン並列アルゴリズム(DeepSeek Open Source Week Day 4)

概要 DualPipeは、DeepSeek-AIチームによって開発されたオープンソース技術で、大規模なAIモデルトレーニングの効率向上に焦点を当てています。主にDeepSeek-V3とR1で使用されている革新的な双方向パイプライン並列アルゴリズムです。
8ヶ月前
021.1K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告

OpenDeepResearcher:完全な調査レポートを書くための自動詳細調査ツール

概要 OpenDeepResearcherは、人工知能技術によって研究効率を向上させるために設計されたオープンソースの自動ディープリサーチツールです。プロジェクトはmshumerによって開発され、GitHubでホストされています。OpenDeepResear...
7ヶ月前
021.1K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

概要 DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。このプロジェクトはShowlabチームによって開発され、ECCV 2024に採択されました。DragAnythingは、オブジェクトの動きを表現するための方法を提供します。
8ヶ月前
021.1K
VACE:视频创作和编辑的开源模型(未开放)

VACE: ビデオ制作・編集のためのオープンソースモデル(オープンではない)

総合紹介 VACEはAlitongyi Visual Intelligence Lab (ali-vilab)によって開発されたオープンソースプロジェクトで、ビデオの作成と編集に焦点を当てています。リファレンスに基づいた動画の生成、既存の動画コンテンツの編集、ローカライズの修正など、様々な機能を統合したオールインワンツールです。
7ヶ月前
021.1K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool:すべてのAIモデルを1つのデスクトップで管理、接続、使用できるAI愛好家のツールボックス!

Omnitool.aiはオープンソースの「AIラボ」であり、学習者や趣味の人、最新のAI技術革新に興味のある人向けに、拡張可能なブラウザベースのデスクトップ環境を提供するように設計されている。Omnitool.iでは、OpenAIやrepl...などの様々なAIの専門家と、統一されたインターフェースを通じて共同作業を行うことができます。
8ヶ月前
021.1K
Aana SDK:简易部署多模态AI模型的开源工具

Aana SDK: マルチモーダルAIモデルを簡単に導入できるオープンソースツール

概論 Aana SDKはMobius Labsが開発したオープンソースのフレームワークで、マラヤーラム語のആന(象)にちなんで名付けられた。開発者がマルチモーダルAIモデルを迅速にデプロイ、管理できるように支援し、テキスト、画像、音声、動画、その他のデータの処理をサポートします。
7ヶ月前
021.1K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件

Little Half WordPress AI Assistant: 対話、投稿生成、翻訳のためのWordPress AIアシスタントプラグイン

総合紹介 WordPress AI Assistant Plugin (wp-ai-chat)は、AI対話、記事生成、記事要約、記事翻訳、コンテンツ読み上げなど、様々なAI機能をユーザーに提供するために設計されたオープンソースのWordPressプラグインです。このプラグインは、複数のAIとのドッキングをサポートしています。
8ヶ月前
021.1K
OpenAlternative:精选常用SaaS产品的开源软件替代方案,寻找最佳开源替代方案

OpenAlternative:一般的に使用されているSaaS製品の代替となるオープンソースソフトウェアのセレクション。

概要 OpenAlternativeは、オープンソースソフトウェアの代替品を提供することに焦点を当てたプラットフォームであり、ユーザーが日常的に使用している商用SaaS製品に代わる適切なオープンソースツールを見つけることを目的としています。このサイトでは、オープンソースツールの厳選されたコレクションを通じて、ユーザーのコスト削減と改善を支援しています...
10ヶ月前
021.1K
Report mAIstro:生成任意自定义主题的详细报告文档,例如商业分析、年终汇报等

レポートMAIstro:ビジネス分析、期末レポートなど、カスタムトピックに関する詳細なレポートを作成します。

概要 レポートmaistroは、自然言語処理技術により、ユーザーが簡単にカスタムレポートを作成できるように設計された強力なツールです。このツールはLangChainテクノロジーを利用し、ユーザーから提供されたトピックや構造を詳細なレポートに変換します。
7ヶ月前
021K
PilottAI:构建企业级多智能体应用的开源项目

PilottAI: エンタープライズグレードのマルチインテリジェンス・アプリケーションを構築するオープンソース・プロジェクト

一般的な紹介 PilottAIはGitHubでホストされているオープンソースのPythonフレームワークで、開発者のanuj0456によって作成されました。PilottAIは、エンタープライズクラスのマルチインテリジェントな身体システムの構築を支援することに重点を置いており、大規模言語モデル(LLM)の統合をサポートし、あらゆる...
7ヶ月前
021K
混元Turbo S:腾讯推出的快思考大模型(开放申请)

ハイブリッド・ターボS:テンセントの「速く考える」ビッグモデル(募集中)

総合紹介 テンセント・ターボSは、2025年2月27日にテンセント・クラウドの公式サイトで発表された、テンセントが自社開発した新世代の高速思考モデルである。従来のスローシンキングモデル(例:Deepseek R1、Hybrid T1)とは異なり、「セカンドリプライ」を実現し、...
7ヶ月前
021K
Long-VITA:支持超长上下文输出的视觉语言模型

Long-VITA:非常に長い文脈出力をサポートする視覚言語モデル

包括的な紹介 Long-VITAは、VITA-MLLMチームによって開発されたオープンソースのマルチモーダル・マクロモデルであり、非常に長い文脈を扱う視覚的・言語的タスクに焦点を当てている。画像、動画、テキストを同時に分析でき、最大100万トークンの入力をサポートする。
7ヶ月前
021K
Xata Agent:监控和优化PostgreSQL数据库的AI助手

Xata Agent: PostgreSQLデータベースの監視と最適化のためのAIアシスタント

概要 Xata Agentは、PostgreSQLデータベース専用に設計されたオープンソースのAIツールです。データベースの稼働状況を自動的に監視し、パフォーマンス上の問題や障害の根本原因を突き止め、それを解決するための推奨事項を提示します。開発チームのxAIは、このツールをPostgreSQLのような...
7ヶ月前
021K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast:プロンプトの誘導語を設定してPDFをポッドキャストに変換するAIツール

概論 NVIDIA AI Blueprint: PDF to Podcastは、NVIDIAが開発したオープンソースプロジェクトで、PDFドキュメントを魅力的なオーディオコンテンツに変換します。このプロジェクトは、NVIDIA NIM (NVIDIA AI Blueprint) を活用しています。
8ヶ月前
020.9K
LineAvatars:生成 Notion 风格线条头像的免费工具

LineAvatars: Notionスタイルのラインアバターを生成するフリーツール

概要 LineAvatarsは、Notionスタイルのラインアバターを生成するためにデザインされた、無料で使いやすいオンラインツールです。ユーザーは写真をアップロードするか、ウェブカメラで写真を撮ると、システムが自動的にAIを使ってラインアバターを生成します。このツールは...
8ヶ月前
020.9K
HunyuanVideoGP:支持低端GPU运行的混元视频生成模型

HunyuanVideoGP:ローエンドGPU動作をサポートするハイブリッドビデオ生成モデル

一般的な紹介 HunyuanVideoGPは、DeepBeepMeepによって開発され、ローエンドGPUユーザー向けに設計された大規模ビデオ生成モデルです。このモデルは、オリジナルのHunyuan Videoモデルの改良版であり、メモリとグラフィックメモリの要件を大幅に削減します。
8ヶ月前
020.9K
Instructor:简化大语言模型结构化输出工作流的Python库

講師:大規模言語モデルの構造化出力ワークフローを簡素化するPythonライブラリ

概要 Instructorは、大規模言語モデル(LLM)からの構造化出力を処理するために設計された人気のあるPythonライブラリです。Pydanticをベースに構築されており、データを管理するためのシンプルで透過的、かつユーザーフレンドリーなAPIを提供します。
8ヶ月前
020.9K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown

magic-html: HTML URLから本文データを抽出し、プレーンテキスト/マークダウンを出力する。

概要 magic-htmlは、HTMLから本文領域のコンテンツを抽出するプロセスを簡素化するために設計されたPythonライブラリです。複雑なHTML構造を扱う場合でも、単純なウェブページを扱う場合でも、このライブラリはユーザーに便利で効率的なインターフェースを提供することを目的としています。マルチモーダルな抽出をサポートしています。
1年前
020.9K
OpenAI Realtime Agents:多智能体语音交互应用(OpenAI示例)

OpenAI Realtime Agents: マルチインテリジェントなボディスピーチインタラクションアプリケーション(OpenAIの例)

概論 OpenAI Realtime Agentsは、OpenAIのリアルタイムAPIを使用して、マルチインテリジェントボディスピーチアプリケーションを構築する方法を示すことを目的としたオープンソースプロジェクトです。OpenAI Swarmから借用した)高レベルのインテリジェントボディモデルを提供し、...
9ヶ月前
020.8K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: Manimで5分以上の数学解説アニメーションを作成

概論 TheoremExplainAgentは、TIGER AI Labによって開発された革新的なプロジェクトであり、人工知能技術を用いて複雑な数学や科学の定理を分かりやすいビデオアニメーションに変換する。このツールはラージ・ランゲージ・モデル(LLM...
8ヶ月前
020.8K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

ディープリサーチ:効率的なリサーチツールとレポート作成機能を提供するAIベースのディープリサーチアシスタント

一般的な紹介 Deep Research は、検索エンジン、ウェブクローリング、大規模な言語モデルを組み合わせることで、反復的なディープリサーチを実行するように設計された AI ベースのリサーチアシスタントです。このプロジェクトは、使いやすいディープリサーチジェネレータを提供することを目的として、dzhng によって GitHub で公開されました。
7ヶ月前
020.8K
Vision Parse: 視覚言語モデルを用いたPDFドキュメントのMarkdownフォーマットへのインテリジェント変換

Vision Parse: 視覚言語モデルを用いたPDFドキュメントのMarkdownフォーマットへのインテリジェント変換

包括的な紹介 Vision Parseは画期的な文書処理ツールで、最先端の視覚言語モデル(Vision Language Models)技術と、PDF文書を高品質のMarkdown形式にインテリジェントに変換する機能を巧みに組み合わせています...
10ヶ月前
020.8K
Local Deep Research:本地运行的生成深度研究报告工具

ローカル・ディープ・リサーチ:詳細な調査レポートを作成するためのローカルで実行可能なツール

一般的な紹介 Local Deep Research は、ユーザが深い研究を行い、複雑な問題に対する詳細なレポートを作成するために設計されたオープンソースの AI 研究アシスタントです。ローカルでの実行をサポートしており、ユーザーはクラウドサービスに依存することなく研究タスクを完了することができます。このツールは ...
5ヶ月前
020.8K
AiryLark:支持多格式文档智能翻译的开源工具

AiryLark:多フォーマット文書のインテリジェント翻訳のためのオープンソースツール

一般的な紹介 AiryLarkはGitHubでホストされているオープンソースの文書処理・翻訳ツールで、開発者のwizdによってNext.jsフレームワークに基づいて構築されています。様々なファイル形式(PDF、Word、TXT、Markdo...など)をサポートしています。
6ヶ月前
020.8K
Azure TTS Importer:将语音合成服务集成到阅读软件中

Azure TTS Importer:音声合成サービスを読み上げソフトウェアに統合する

包括的な紹介 TTS Importerは、Azure TTS(Text-to-Speech)音声合成サービスを様々な読み上げソフトに簡単にインポートできるように設計されたオープンソースプロジェクトです。このツールは、Read(legado...)を含むいくつかの一般的な読み上げソフトウェアをサポートしています。
8ヶ月前
020.8K
CoT-Lab:探索人机协作迭代思考的实验性对话工具

CoT-Lab:人間とコンピュータのコラボレーションに関する反復的思考を探求するための実験的対話ツール

CoT-Labは、人間とコンピュータのコラボレーションにおける新しいパラダイムを探求するための実験的インターフェースです。CoT-LabはCognitive Load Theory(認知的負荷理論)とActive Learning Principles(能動的学習原理)に基づき、「シンキングパートナー」関係の構築を通じて、人間と人工知能(AI)の間の深い認知的連携を促進します。プロジェクトの目的は...
8ヶ月前
020.7K
Zev:用自然语言快速查询终端命令的CLI工具

Zev: 端末コマンドを自然言語で素早く検索するCLIツール

一般的な紹介 Zevは使いやすいコマンドラインインターフェイス(CLI)ツールであり、ユーザが自然言語で素早く端末コマンドを照会・生成できるようにします。複雑なコマンド構文を覚える代わりに、Zevは日常的な言葉であなたのニーズを記述することでターミナルコマンドを生成します。Ope...
6ヶ月前
020.7K
CleverBee:开源AI研究助手,生成引证研究报告

CleverBee:オープンソースのAIリサーチアシスタントが引用研究を生成

一般的な紹介 CleverBeeはGitHubでホストされているオープンソースのAI研究アシスタントであり、SureScaleAIによって開発された。ウェブブラウジング技術と大規模な言語モデル(GeminiやClaudeなど)を組み合わせることで、ユーザーを支援します...
5ヶ月前
020.7K
Agent Service Toolkit:基于LangGraph构建AI智能体的完整工具集

エージェント・サービス・ツールキット:LangGraphに基づくAIインテリジェンス構築のための完全なツールセット

包括的な紹介 AIエージェント・サービス・ツールキットは、LangGraph、FastAPI、Streamlit上に構築された完全なツールセットで、開発者がAIエージェント・サービスを迅速に構築し、実行できるように設計されています。このツールキットは...
9ヶ月前
020.7K
Agentic Radar:对 Agentic 工作流安全检测的可视化工具

Agentic Radar: Agentic ワークフローのセキュリティ検査用可視化ツール

概要 Agentic Radarは、大規模モデル(LLM)ベースのAIワークフローをスキャンし、セキュリティを確保するために設計されたSplxAIのオープンソースツールです。コードを分析することで、明確なワークフロー図とセキュリティレポートを生成し、開発者やセキュリティ専門家を迅速に支援します。
7ヶ月前
020.7K
HumanOmni:分析人类视频情感和动作的多模态大模型

HumanOmni:人間のビデオ感情や行動を分析するためのマルチモーダル・マクロモデル

一般的な紹介 HumanOmniは、HumanMLLMチームによって開発され、GitHubでホストされているオープンソースのマルチモーダルビッグモデルです。HumanOmniは人間の動画を分析することに特化しており、画像と音声の両方を処理することで、感情や行動、対話の内容を理解するのに役立ちます。このプロジェクトでは2...
7ヶ月前
020.7K
AgentIQ:灵活连接和管理AI智能体的开源工具

AgentIQ: AIインテリジェンスの柔軟な接続と管理のためのオープンソースツール

概要 AgentIQは、開発者がAIインテリジェンスを効率的に接続・管理できるように設計されたNVIDIAのオープンソースツールです。異なるフレームワークのインテリジェンスがシームレスに連携し、企業データとツールを接続し、関数を呼び出すようなワークフローを構築することを可能にします。このツールの最大の特徴は...
7ヶ月前
020.7K
Translation Agent WebUI:吴恩达翻译智能体界面版,提供多种翻译API和Gradio界面

翻訳エージェントWebUI: 呉エンダ翻訳インテリジェンスボディインタフェースバージョン、様々な翻訳APIとグラディオインタフェースを提供します。

概要 翻訳エージェントWebUIは、Andrewyngの翻訳エージェントのために設計されたGradioベースのWebユーザーインターフェイスです。このツールは、自動的に送信を検出することができます...
10ヶ月前
020.7K
Free-Search:免费获取实时谷歌搜索结果的API工具

Free-Search: リアルタイムのグーグル検索結果に無料でアクセスできるAPIツール

概要 Free-SearchはHanzla Javaidによって開発され、GitHubでホストされているオープンソースのAPIツールである。主な機能は、カスタム検索エンジンを通してリアルタイムのGoogle検索結果を提供し、ウェブコンテンツをクロールして結果を返すことである。
7ヶ月前
020.6K
LettuceDetect:检测RAG系统幻觉的高效工具

LettuceDetect:RAGシステムにおける幻覚検出のための効率的なツール

包括的な紹介 LettuceDetectは、KRLabsOrgによって開発された軽量なオープンソースツールで、特にRAG(Retrieval Augmented Generation)システムで生成された幻覚的なコンテンツを検出するためのものです。文脈、質問、答えを比較することで、文脈によってサポートされていない回答を識別します。
7ヶ月前
020.5K
Foudinge Scrub:从餐厅评论中构建知识图谱

Foudinge Scrub: レストランのレビューからナレッジグラフを構築する

一般的な紹介 Foudinge ScrubはGitHubでホストされているオープンソースのウェブツールで、開発者のThéophile Cantelobreによって作成された。複雑なテキストデータから抽出されたナレッジグラフのクリーニングと編集を支援するように設計されています。
7ヶ月前
020.4K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话

Qwen4Mac: MacのメニューバーにあるQwenの大きなモデルを使って、いつでも会話ができます!

概要 Qwen4MacはQwen Large Language Model (LLM)をMacのメニューバーに統合し、ユーザーがいつでも簡単に呼び出して使えるようにするために設計されたオープンソースプロジェクトです。このプロジェクトは、andreaturchetによって開発・保守されており、ユーザが簡単にQwenを...
8ヶ月前
020.4K
Rowfill:批量提取文档结构化信息并自动化分析

ロウフィル:文書からの構造化情報の一括抽出と自動分析

概要 Rowfillは、ナレッジワーカーのために設計されたオープンソースの文書処理プラットフォームです。高度な人工知能技術を使用して、複雑な文書、画像、PDFからデータを抽出、分析、処理します。Rowfillは、Large Language Model(LLM)とOpe...
8ヶ月前
020.4K