AIオープンソースプロジェクト

合計1020記事
OPR:智能修复泛黄、破损老旧照片的AI工具

OPR:黄ばんだ古い写真をインテリジェントに復元するAIツール

Bringing Old Photos Back to Lifeは、マイクロソフトの研究者チームによって開発されたオープンソースプロジェクトで、AI技術を使って古い写真を復元することに焦点を当てている。ディープラーニングのアプローチに基づいており、傷などの写真の深刻な劣化問題を扱うことができる。
5ヶ月前
01.7K
Prompt Optimizer:优化主流AI模型提示词的开源工具

プロンプト・オプティマイザー:主流AIモデルのプロンプト語を最適化するオープンソースツール

概論 Prompt Optimizerは、GitHubのlinshenkxによって開発された、プロンプト単語の最適化に焦点を当てたオープンソースツールです。インテリジェントなアルゴリズムによってAIモデルのプロンプトワードを最適化し、生成されるコンテンツの品質を向上させます。
5ヶ月前
02.6K
WhisperChain:实时语音转文字并优化口语化词语

WhisperChain:リアルタイム音声テキスト化と話し言葉の最適化

概論 WhisperChainはGitHubでホストされているAIベースのオープンソースプロジェクトで、開発者のクリス・チョイが主導している。主に音声をテキストに変換し、AI技術によって自動的に表現を最適化し、冗長な部分を削除するために使用される。
5ヶ月前
02.6K
VideoGrain:文本提示对视频进行局部编辑的开源项目

VideoGrain: 動画のローカル編集用テキストプロンプト オープンソースプロジェクト

一般的な紹介 VideoGrainは、xAIチームによって開発され、GitHubでホストされているマルチグラニュラービデオ編集に焦点を当てたオープンソースプロジェクトです。このプロジェクトは論文「VideoGrain: Modulating Space-Tim...
5ヶ月前
02.4K
Mobius Diffusion:文本提示生成无缝循环视频

メビウス・ディフュージョン:テキスト・プロンプトがシームレスなループ映像を生成

はじめに メビウス・ディフュージョンは、テキスト入力からシームレスにループするビデオコンテンツを生成することに特化した革新的なオンラインツールです。事前にトレーニングされたビデオ拡散モデルに基づいており、ユーザーのトレーニングやアノテーションデータを必要とせず、すぐに使い始めることができます。このサイトのコアテクノロジーは...
5ヶ月前
02.3K
RuoYi AI:基于SpringBoot实现AI聊天和绘画的后端框架

RuoYi AI: AIチャットと描画のためのSpringBootベースのバックエンドフレームワーク

包括的な紹介 RuoYi AIはruoyi-plusフレームワークに基づいて、AIチャットと絵画機能の統合に焦点を当てたバックエンドプロジェクトです。Java17とSpringBoot 3.X技術スタックを使用し、完全にオープンソースで無料です。
5ヶ月前
03.5K
Vision Agent:解决多种视觉目标检测任务的视觉智能体

視覚エージェント:複数の視覚的ターゲット検出タスクを解決する視覚インテリジェンス

概要 Vision Agentは、LandingAI(Team Enda Wu)によって開発されたオープンソースプロジェクトで、GitHubでホストされています。先進的なエージェントフレームワークとマルチモーダルモデルを使用しています。
5ヶ月前
02.3K
Baichuan-Audio:支持实时语音交互的端到端音频模型

Baichuan-Audio: リアルタイムの音声対話をサポートするエンドツーエンドのオーディオモデル

包括的な紹介 Baichuan-AudioはBaichuan Intelligence (baichuan-inc)によって開発されたオープンソースプロジェクトで、GitHubでホストされており、エンドツーエンドの音声対話技術に焦点を当てています。このプロジェクトは、完全な音声処理フレームワークを提供し、音声...
5ヶ月前
02.7K
TheoremExplainAgent:利用 Manim 生成5分钟以上数学讲解动画视频

TheoremExplainAgent: Manimで5分以上の数学解説アニメーションを作成

概論 TheoremExplainAgentは、TIGER AI Labによって開発された革新的なプロジェクトであり、人工知能技術を用いて複雑な数学や科学の定理を分かりやすいビデオアニメーションに変換する。このツールはラージ・ランゲージ・モデル(LLM...
5ヶ月前
02.2K
DeepChat:支持与多个聊天并发会话的AI对话客户端

DeepChat:複数のチャットによる同時セッションをサポートするAI対話クライアント

概要 DeepChatは、ThinkInAIXYZチームによってGitHub上で開発されたオープンソースのインテリジェント・アシスタント・プロジェクトです。DeepChatは、強力なAI技術によってユーザーをデジタル世界とつなげ、効率的で自然なチャット体験を提供することを目的としています。Win...
5ヶ月前
03.1K
Dify Connect MCP:Dify 工作流无缝集成 MCP(模型上下文协议)

Dify Connect MCP: DifyワークフローへのMCP(モデルコンテキストプロトコル)のシームレスな統合

概要 Dify Connect MCPは、GitHubでホストされているオープンソースプロジェクトで、Difyプラットフォームのユーザーにモデルコンテキストプロトコル(MCP)を通じてモデリングするための便利なツールを提供することを目的としています...
5ヶ月前
03.8K
AutoDev:支持多语言的自动代码生成与调试工具

AutoDev:多言語対応のコード自動生成・デバッグツール

概要 AutoDevは、Unit Meshチームによって開発され、GitHubでホストされているオープンソースプロジェクトで、人工知能技術によって開発者のプログラミング効率を向上させることを目的としています。強力なコーディングアシスタントであり、Ja...を含む複数のプログラミング言語をサポートしている。
6ヶ月前
02.6K
LLPlayer:生成实时字幕并双语翻译的视频播放器

LLPlayer: 対訳付きリアルタイム字幕を生成するビデオプレーヤー

概要 LLPlayerはGitHubでホストされている、開発者umlx5hによって作成された言語学習者のためのオープンソースメディアプレーヤーです。バイリンガル字幕表示、AI自動生成字幕、リアルタイム翻訳、単語検索など様々な便利な機能が統合されています。
2ヶ月前
03.9K
Coding-Tutor:提供个性化编程指导的智能教学助手

Coding-Tutor: 個別のプログラミング指導を提供するインテリジェントなティーチング・アシスタント

一般的な紹介 Coding-Tutorは、GitHubでホストされているオープンソースプロジェクトで、開発者のiwangjianによって作成され、学習者にパーソナライズされたプログラミング教育の経験を提供します。会話型AI技術を使用し、ユーザーの知識背景と...
6ヶ月前
02K
Flock:低代码工作流编排快速构建聊天机器人

Flock:迅速なチャットボット構築のためのローコードワークフローオーケストレーション

概要 Flockはオープンソースのワークフロー用ローコードプラットフォームで、GitHubでホストされており、Onelevenvyチームによって開発されています。LangChainとLangGraphの技術をベースにしており、ユーザーがチャットマシンを素早く構築できるようにすることに重点を置いています。
6ヶ月前
02.4K
TableGPT Agent:专为分析复杂表格数据设计的智能工具

TableGPTエージェント:複雑な表形式データを分析するために設計されたインテリジェントツール

包括的な紹介 TableGPTエージェントは、GitHubオープンソースプロジェクトに基づくインテリジェントなツールで、表形式データの処理と分析のために設計されています。TableGPT2 Big Language Model に依存し、自然言語インタラクションを使用して、ユーザが簡単にクエリ、操作...
6ヶ月前
02.7K
TRV:将幻灯片/PPT和讲解备注快速生成演讲视频

TRV:スライド/PPTと説明メモからプレゼンテーション動画を高速生成

概論 TRVはGitHubでホストされているオープンソースのツールで、スライドやプレゼンテーションノートをナレーション付きの動画に素早く変換できるように設計されています。簡単なコマンドライン操作で、入力されたプレゼンテーションファイルから音声と動画のコンテンツを自動的に生成します。
6ヶ月前
02.1K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具

LazyLLM:マルチインテリジェント・ボディ・アプリケーション構築のためのShangtangオープンソース・ローコード開発ツール

包括的な紹介 LazyLLMはLazyAGIチームによって開発されたオープンソースツールで、マルチインテリジェンス大規模モデルアプリケーションの開発プロセスを簡素化することに重点を置いています。ワンクリックのデプロイと軽量なゲートウェイ機構により、開発者が複雑なAIアプリケーションを素早く構築できるよう支援し、面倒なエンジニアリングの設定を省きます。
6ヶ月前
02.5K
DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人

DeepSeek-RAG-Chatbot: ローカルで動作する DeepSeek RAG チャットボット

一般的な紹介 DeepSeek-RAG-Chatbotは、GitHubでホストされているDeepSeek R1モデルに基づいて構築されたオープンソースのチャットボットプロジェクトで、開発者のSaiAkhil066によって作成されました。DeepSeek-RAG-Chatbotは、拡張された生成...
6ヶ月前
02.5K
MagicArticulate:将静态3D模型生成骨骼结构动画资产

MagicArticulate:静的な3Dモデルから骨格構造のアニメーション資産を生成する

包括的な紹介 MagicArticulateは、ByteDanceが南洋理工大学(NTU)と共同で開発したAIフレームワークで、静的な3Dモデルをアニメーション可能なデジタル資産に迅速に変換することに焦点を当てています。これは、高度な自己回帰変換器と関数拡散モデル、自己...
6ヶ月前
02.3K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)

AingDesk:パソコンにAIモデルとチャットインターフェースをワンクリックインストール(DeepSeekとの共同開発)

一般的な紹介 AingDeskは、ユーザーがローカルコンピュータ上で様々なAIモデルを簡単にデプロイし、実行できるように設計されたオープンソースのフリーソフトウェアです。DeepSeekでもLlamaモデルでも、AingDeskはシンプルなステップ・バイ・ステップを可能にします。
6ヶ月前
02.8K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具

PDF-Extract-Kit:オープンソースツールのPDFコンテンツの複雑な構造を抽出する

包括的な紹介 PDF-Extract-KitはOpenDataLabチームによって開発されたオープンソースプロジェクトで、複雑で多様なPDF文書から高品質なコンテンツを効率的に抽出することに重点を置いています。先進的な文書解析技術を統合し、レイアウト検出、数式認識、PDF文書抽出をサポートします。
6ヶ月前
03.1K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架

TPO-LLM-WebUI:質問を入力してリアルタイムにモデルを学習し、結果を出力できるAIフレームワーク。

概論 TPO-LLM-WebUIは、AirmomoがGitHubでオープンソース化している革新的なプロジェクトで、直感的なWebインターフェースを通じて大規模言語モデル(LLM)のリアルタイム最適化を可能にします。TPO (Test-Time Pr...
6ヶ月前
03.3K
Neural4D:生成高分辨率3D建模数字资产的AI平台

Neural4D:高解像度3Dモデリングデジタル資産を生成するAIプラットフォーム

概論 Neural4Dは、ユーザーが簡単なテキストや画像を入力するだけで、高品質な3Dモデルやアニメーションを素早く生成できるよう支援することに重点を置いた、AIベースの革新的なプラットフォームです。DreamTech社によって開発されたこのプラットフォームは、世界をリードするエンドツーエンドの大規模3Dモデル生成技術に依存しています。
6ヶ月前
02.5K
InternLM-XComposer:输出超长文本与图像视频理解的多模态大模型

InternLM-XComposer:非常に長いテキストと画像・動画理解を出力するためのマルチモーダル・マクロモデル

包括的な紹介 InternLM-XComposerは、InternLMチームによって開発され、GitHubでホストされているオープンソースのグラフィカルなマルチモーダルビッグモデルプロジェクトです。InternLM言語モデルをベースにしており、マルチモーダルテキスト、画像、ビデオ、その他の...
6ヶ月前
02.1K
MakeSense:免费使用的图像标注工具,提升计算机视觉项目效率

MakeSense:コンピュータビジョンプロジェクトの効率を高める、無料で使える画像注釈ツール

概要 Make Senseは、コンピュータ・ビジョン・プロジェクト用のデータセットを素早く準備できるように設計された、無料のオンライン画像注釈ツールです。複雑なインストールは不要で、ブラウザからアクセスするだけで使用でき、複数のオペレーティングシステムをサポートし、小規模なディープラーニングプロジェクトに最適です。ユーザーは...
6ヶ月前
02.9K
TreeGPT:可视化树状对话的AI聊天界面

TreeGPT: ツリーベースの会話を可視化するAIチャットインターフェース

概要 TreeGPTは、Next.jsをベースとしたオープンソースのチャットアプリケーションです。大規模な言語モデル(LLM、GPTなど)の会話を、ツリーグラフ構造(有向非循環グラフ、DAG)を通して可視化することに重点を置き、従来の直線的なチャット手法に取って代わることで、スピードと...
6ヶ月前
02.9K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手

ComfyUI-Copilot:テキスト記述生成のためのAIアシスタント ComfyUIワークフロー

包括的な紹介 ComfyUI-Copilotは、ComfyUIフレームワークのために設計されたAI駆動のカスタムノードで、自然言語対話を通じてAIアルゴリズムのデバッグとデプロイの効率を向上させることを目的としています。AIDC-AIチーム(Alibaba)によって開発され、GitHu...
6ヶ月前
02.8K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告

オートディープリサーチ:マルチエージェント連携による文献検索と研究報告書の作成

概説 Auto-Deep-Researchは、香港大学データインテリジェンス研究所(HKUDS)によって開発されたオープンソースのAIツールであり、ユーザーがディープリサーチタスクを自動化することを目的としている。AutoAgentフレームワークをベースに構築されており、複数の大規模言語モデルをサポートしている。
4ヶ月前
05.5K
VBDeepSeek:使用DeepSeek生成四级单词学习资料的开源工具

VBDeepSeek:DeepSeekを使用して4年生の単語学習教材を作成するためのオープンソースツール

総合紹介 "Vocabulary Book by DeepSeek "はDeepSeekのビッグモデルに基づいて開発されたオープンソースプロジェクトで、英語学習者が大学英語レベル4(CET-4)の語彙を効率的に習得することを目的としています。プロジェクトはGitHubでホストされています...
6ヶ月前
03K
YOLOv12:实时图像和视频目标检测的开源工具

YOLOv12:リアルタイム画像・ビデオターゲット検出のためのオープンソースツール

総合的な紹介 YOLOv12はGitHubユーザーのsunsmarterjieによって開発されたオープンソースプロジェクトで、リアルタイムターゲット検出技術に焦点を当てています。このプロジェクトは、YOLO (You Only Look Once)シリーズのフレームワークをベースにしており、ノート・メモの導入...
6ヶ月前
03.2K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架

AutoAgent:自然言語によるAIインテリジェンスの迅速な作成と展開のためのフレームワーク

概要 AutoAgentは、香港大学データインテリジェンス研究所(HKUDS)によって開発され、GitHubでホストされているオープンソースのAIインテリジェンス・フレームワークである。ユーザーは、プログラミング・ベースなしで、純粋に自然言語で要件を記述することにより、カスタマイズされたAIインテリジェンスを迅速に作成し、展開することができる。
2ヶ月前
03K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具

Crawl4LLM:LLM事前学習のための効率的なウェブクローリングツール

包括的な紹介 Crawl4LLMは清華大学とカーネギーメロン大学によって共同開発されたオープンソースプロジェクトであり、大規模モデル(LLM)の事前学習のためのウェブクローリングの効率最適化に焦点を当てている。高品質なウェブページデータをインテリジェントに選択することで、非効率なクロールを大幅に削減し、本来1...
6ヶ月前
02.4K
VLM-R1:通过自然语言定位图像目标的视觉语言模型

VLM-R1:自然言語による画像ターゲットの位置決定のための視覚言語モデル

包括的な紹介 VLM-R1は、Om AI Labによって開発され、GitHubでホストされているオープンソースの視覚言語モデリングプロジェクトです。このプロジェクトは、DeepSeekのR1アプローチとQwen2.5-VLモデルを強化学習によって組み合わせたものです。
6ヶ月前
02.7K
Deep Research Web UI:支持多语言深度研究的AI助手

ディープリサーチWeb UI:多言語でのディープリサーチをサポートするAIアシスタント

包括的な紹介 Deep Research Web UIは、AI技術に基づいたオープンソースのリサーチアシスタントツールであり、ユーザーがあらゆるトピックについて深い反復研究を行うことを支援するように設計されています。直感的なウェブインターフェースを通じて、検索エンジン、ウェブクローリング、大規模言語モデリングのパワーを組み合わせています...
4ヶ月前
02.6K
LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps

LiteAvatar:CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレート

概要 LiteAvatarはHumanAIGCチーム(Aliの一部)によって開発されたオープンソースツールで、音声によって駆動される2Dアバターからリアルタイムでフェイシャルアニメーションを生成することに重点を置いています。CPUのみに依存し、毎秒30フレーム(fps)で動作し、特に...
6ヶ月前
02.5K
Botgroup.chat:多个AI角色实时互动的群聊天应用

Botgroup.chat:複数のAIキャラクターがリアルタイムで対話するグループチャットアプリ

一般的な紹介 Botgroup.chatはReactとCloudflare Pagesをベースに開発されたオープンソースのAIグループチャットアプリケーションで、WeChatグループチャットのようなインタラクティブな体験をユーザーに提供することを目的としています。複数のAIキャラクターの同時参加をサポートしています。
6ヶ月前
03.8K
Open Deep Research:LangChain开源的深度研究智能助手

オープン・ディープ・リサーチ:LangChainのディープ・リサーチ用オープンソース・インテリジェント・アシスタント

包括的な紹介 Open Deep Researchは、あらゆるトピックに関する包括的なリサーチレポートを作成できるウェブベースのリサーチアシスタントです。このシステムでは、時間のかかる調査フェーズに進む前に、レポートの構成を計画し、確認することができる、計画と実行のワークフローを使用しています...
4ヶ月前
03.5K
KG Gen:从纯文本中自动生成知识图谱的开源工具

KG Gen:プレーンテキストからナレッジグラフを自動生成するオープンソースツール

概要 KGGenはスタンフォード信頼人工知能研究所(STAIR Lab)によって開発されたオープンソースツールで、GitHubでホストされている。高度な言語モデリングとクラスタリングアルゴリズムを使用して、構造化されていないテキストを...
6ヶ月前
03.2K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展

MultiPost-Extension:AIが生成したコンテンツをワンクリックでセルフパブリッシング・プラットフォームに同期するブラウザ拡張機能

概要 MultiPost-Extensionは、ユーザーがワンクリックで複数のソーシャルメディアプラットフォームにコンテンツを公開できるように設計された強力なブラウザ拡張機能です。この拡張機能は、Zhihu、Weibo、Xiaohongshu、TikTok ... を含む10以上の主要プラットフォームへの同時投稿をサポートしています。
6ヶ月前
02.8K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式

Markdownify MCP Server: MCPプロトコルに基づき、様々なコンテンツをMarkdownフォーマットに変換します。

一般的な紹介 Markdownify MCPサーバーはモデルコンテキストプロトコルに基づいたオープンソースツールで、開発者のZach CaceresによってGitHubでホストされています ...
5ヶ月前
02.6K
SkyReels-V1:生成高品质人体动作视频的开源视频模型

SkyReels-V1: 高品質のヒューマンアクション動画を生成するオープンソースビデオモデル

概要 SkyReels-V1は、SkyworkAIチームによって開発されたオープンソースプロジェクトで、人間中心の高品質なビデオコンテンツを生成することに重点を置いている。このプロジェクトは、HunyuanVideoモデルに基づいています。
6ヶ月前
02.8K
WeChatAI:Windows版微信群聊智能助手客户端

WeChatAI: Windows用WeChatグループチャットインテリジェントアシスタントクライアント

総合的な紹介 WeChatAIはPythonベースのWeChatグループチャットとパーソナルインテリジェントアシスタントで、様々な大規模言語モデル(DeepSeek、Gemini、Tongyi Thousand Questionsなど)をサポートし、インテリジェントな対話、自動返信、その他の機能を実現することができます。このプロジェクトでは、最新の...
6ヶ月前
02.4K
dsRAG:用于处理非结构化数据和复杂查询的检索引擎

dsRAG: 非構造化データと複雑なクエリのための検索エンジン

概要 dsRAGは、非構造化データに対する複雑なクエリを処理するために設計された高性能検索エンジンである。dsRAGは、財務報告書、法律文書、学術論文など、高密度なテキストに含まれる難易度の高いクエリに対して特に優れた性能を発揮する。dsRAGは性能を向上させるために3つの主要なアプローチを採用している。
6ヶ月前
02.2K
SongGen:自动生成歌曲的单阶段自回归Transformer

SongGen: 曲の自動生成のための単段自己回帰変換器

包括的な紹介 SongGenは、テキストから曲への生成タスクのために設計された、オープンソースの単一ステージ自己回帰変換モデルである。このモデルは、テキスト入力からボーカルとバッキングトラックを含む楽曲を生成することができます。SongGenは、幅広い音楽属性をきめ細かく制御することができます...
6ヶ月前
02.2K
Graphiti:动态知识图谱构建和查询工具(具有时间感知的长记忆方案)

Graphiti: ダイナミックな知識グラフの構築とクエリーツール(時間を考慮したロングメモリプログラム)

一般的な紹介 Graphitiは、getzep社によって開発された、動的で時間を意識した知識グラフの構築とクエリのためのツールです。エンティティ間の複雑で発展的な関係を表現し、時系列、全文、セマンティック、グラフアルゴリズムなど様々な手法でクエリすることができる。
6ヶ月前
03.8K
Memobase:为AI应用提供基于用户画像的长期记忆方案

メモベース:AIアプリケーションのためのユーザープロファイルに基づく長期記憶ソリューション

はじめに Memobaseは、生成的なAIアプリケーションのための長期的なユーザー記憶をサポートするように設計された、ユーザープロファイルに基づく記憶システムです。バーチャルコンパニオン、教育ツール、パーソナライズされたアシスタントなど、Memobaseは、AIが記憶し、理解し、成長するのを支援します。
6ヶ月前
02.2K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集

中国ベースの全血DeepSeek-R1蒸留データセット、中国R1蒸留SFTデータセットをサポート

包括的な紹介 中国語DeepSeek-R1蒸留データセットは、機械学習と自然言語処理の研究をサポートするために設計された、110Kのデータを含むオープンソースの中国語データセットである。このデータセットはCong LiuのNLPチームによって公開されている。 このデータセットには数学的なデータだけでなく、一般的なタイプのデータも多数含まれている。
6ヶ月前
02.5K
Base Chat:基于 Ragie 构建知识库的多租户聊天机器人

Base Chat: Ragieに基づく知識ベース構築のためのマルチテナント型チャットボット

概要 Base Chatは、Ragie Connectを使用して組織のナレッジベースに接続し、会話するマルチテナント型チャットボットです。このプロジェクトは、複数のRagie機能のリファレンスアプリケーションであり、Next.jsで構築され、Goo...
6ヶ月前
02.3K
AIBot PRO:集成多种AI产品的商业化聚合平台

AIBot PRO:複数のAI製品を統合した商品化アグリゲーション・プラットフォーム

総合紹介 AIBot PROは、複数のAI製品を統合するための便利なプラットフォームをユーザーに提供するために設計された、.NET 6ベースのAIアグリゲーションクライアントです。このクライアントは、無感覚な切り替え対話をサポートし、ChatGPT、Gemini、Claude、Wenxin Yiyin...を統合します。
6ヶ月前
02.4K
ColossalAI:提供高效大规模AI模型训练解决方案

ColossalAI: 効率的な大規模AIモデル学習ソリューションの提供

包括的な紹介 ColossalAIは、HPC-AI Technologies社によって開発されたオープンソースのプラットフォームで、大規模なAIモデルの学習と推論に効率的でコスト効率の高いソリューションを提供します。複数の並列戦略、ヘテロジニアスメモリ管理、混合精度学習をサポートすることで、ColossalAIは...
6ヶ月前
01.9K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型

HealthGPT:医療画像解析と診断Q&Aを支援する医療ビッグモデル

包括的な紹介 HealthGPTは、異種知識適応による統一的な医療視覚理解と生成能力の達成を目指す、先進的な医療グランドビジュアル言語モデルである。このプロジェクトの目標は、医療グラフを大幅に改善する統一的な自己回帰フレームワークに医療視覚理解と生成能力を統合することである。
6ヶ月前
01.9K
MatAnyone: 提取视频指定目标人像的开源工具,生成目标人像视频

MatAnyone: ターゲットポートレート指定ビデオ抽出、ターゲットポートレートビデオ生成オープンソースツール

概要 MatAnyoneは、シンガポールの南洋理工大学S-Labの研究チームによって開発され、GitHubで公開されているビデオキーイングに特化したオープンソースプロジェクトです。コヒーレントなメモリ伝搬技術によって、安定した効率的なビデオ処理能力をユーザーに提供します。
6ヶ月前
02.5K
HiveChat:适合公司内部快速部署的AI聊天机器人

HiveChat:企業内で迅速に展開できるAIチャットボット

概要 HiveChatは中小規模のチーム向けのAIチャットボットで、管理者は複数のAIモデル(Deepseek、OpenAI、Claude、Geminiなど)を一度に設定し、チームメンバーが簡単に使用できるようにすることができます。このチャットボットは ...
6ヶ月前
02.5K
Omnitool:AI爱好者工具箱,在一个桌面中管理、连接并使用所有AI模型

Omnitool:すべてのAIモデルを1つのデスクトップで管理、接続、使用できるAI愛好家のツールボックス!

Omnitool.aiはオープンソースの「AIラボ」であり、学習者や趣味の人、最新のAI技術革新に興味のある人向けに、拡張可能なブラウザベースのデスクトップ環境を提供するように設計されている。Omnitool.iでは、OpenAIやrepl...などの様々なAIの専門家と、統一されたインターフェースを通じて共同作業を行うことができます。
6ヶ月前
02.2K
Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型

Step-Video-T2V:多言語入力とロングビデオ生成をサポートするVincennesビデオモデル

総合紹介 Step-Video-T2VはStepFun AI (StepFun Star)による先進的なテキストから動画への変換モデルです。このモデルは30億のパラメータを持ち、最大204fpsの動画を生成することができます。深く圧縮された可変オートエンコーダ(VAE)により、このモデルは...
6ヶ月前
02.3K
OmniParser:用户界面截图解析成结构化元素,便于大模型理解和操作

OmniParser: ユーザーインターフェースのスクリーンショットを構造化された要素に解析し、大規模なモデルの理解と操作を容易にします。

一般的な紹介 OmniParserは、ユーザーインターフェースのスクリーンショットを構造化された理解しやすい要素に解析するためにMicrosoftによって開発されたツールです。このツールは、GPT-4Vが対応するインターフェイス領域に正確なアクションを生成する能力を大幅に向上させます。
6ヶ月前
02.2K
DragAnything:对图像中实体对象控制运动硅基生成视频

DragAnything: 画像内の固形オブジェクトのためのシリコンベースのビデオ生成モーションの制御

概要 DragAnythingは、エンティティ表現によって任意のオブジェクトのモーションコントロールを実現することを目的としたオープンソースプロジェクトです。このプロジェクトはShowlabチームによって開発され、ECCV 2024に採択されました。DragAnythingは、オブジェクトの動きを表現するための方法を提供します。
6ヶ月前
02.4K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能

Step-Audio:マルチモーダル音声インタラクションフレームワーク。

包括的な紹介 Step-Audioはオープンソースのインテリジェント音声対話フレームワークであり、制作環境において、すぐに使える音声理解と音声生成機能を提供するように設計されています。このフレームワークは、多言語会話(例:中国語、英語、日本語)、感情音声(例:嬉しい、悲しい)、地域方言(例:広東語、四川語、中国語、英語、日本語)をサポートしています。
6ヶ月前
02.8K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像

透かし除去:オープンソース画像透かし除去ツール、画像透かし復元オリジナル画像

概論 透かし除去は、機械学習とディープラーニングの技術を画像修復、特に画像から透かしを除去するために使用するオープンソースプロジェクトです。このプロジェクトはChimzuruoke Okaforによって開発され、Con...
6ヶ月前
03.2K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

FoloUp:カスタム面接質問を生成し、インテリジェントな分析を実行するオープンソースAI音声面接プラットフォーム

概論 FoloUpは、企業向けにAIを活用した音声面接ソリューションを提供するために設計されたオープンソースのプラットフォームです。FoloUpを利用することで、企業は職務内容に合わせてカスタマイズした面接質問を素早く生成し、AIによる自然な会話形式の面接を実施することができます。また、このプラットフォームは、詳細な面接分析も提供します。
5ヶ月前
02.4K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程

VimLM: ネイティブLLM駆動のVimプログラミングアシスタント。

概要 VimLMは、ネイティブのLLM(Large Language Model)によって駆動されるコードアシスタントを提供するVimプラグインです。Vim コマンドを通してネイティブの LLM モデルと対話することで、コードのコンテキストを自動的に取得し、Vim でのコード編集を支援します。
6ヶ月前
02.7K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量

信頼できるAI:自動化された大規模言語モデル評価のためのフレームワーク。

包括的な紹介 DeepEvalは、大規模な言語モデリングシステムを評価およびテストするための、使いやすいオープンソースのLLM評価フレームワークです。Pytestに似ていますが、LLM出力のユニットテストに重点を置いています。DeepEvalは、G-Eval、ファントム...
6ヶ月前
02.8K
Quadratic:集成AI对话和代码执行的在线数据分析表格

Quadratic: AI対話とコード実行を統合したオンラインデータ分析フォーム

概要 Quadraticは、AI、コード、データ接続機能を組み合わせたオープンソースのスマート・スプレッドシート・ツールで、強力なデータ処理と分析機能をユーザーに提供するように設計されています。Python、SQL、Rustなどのプログラミング言語をサポートすることで、Quadratic...
6ヶ月前
02.6K
Whisper Input:利用Groq免费且高速的语音转录文本服务

ウィスパーインプット:Groqを使った無料・高速の音声テキスト起こしサービス

概要 Whisper Inputは、Optionボタンを押すことで音声の録音を開始し、ボタンを離すことで録音を終了することができるオープンソースの音声書き起こしツールです。このツールは、Groq Whisper Large V3 Turbo ... を呼び出します。
6ヶ月前
02.4K
Azure TTS Importer:将语音合成服务集成到阅读软件中

Azure TTS Importer:音声合成サービスを読み上げソフトウェアに統合する

包括的な紹介 TTS Importerは、Azure TTS(Text-to-Speech)音声合成サービスを様々な読み上げソフトに簡単にインポートできるように設計されたオープンソースプロジェクトです。このツールは、Read(legado...)を含むいくつかの一般的な読み上げソフトウェアをサポートしています。
6ヶ月前
02.2K
SVLS:SadTalker增强版,使用人像视频生成数字人

SVLS: SadTalker、ポートレートビデオを使ってデジタル人物を生成する機能を強化

概要 SadTalker-Video-Lip-Syncは、SadTalkersの実装に基づいたビデオリップ合成ツールです。このプロジェクトは、音声駆動型生成によって唇の形状を生成し、設定可能な顔領域拡張を使用して、生成された唇の形状の鮮明度を向上させます...
6ヶ月前
02.2K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)

Tifa-DeepsexV2-7b-MGRPO: ロールプレイと複雑なダイアログをサポートし、32bを超えるパフォーマンスを持つモデル (ワンクリックインストールパッケージ付き)

総合紹介 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4は、複雑なロールプレイングや複数ラウンドの対話をサポートするために設計された効率的な言語モデルです。Qwen 2.5-7Bをベースに深く最適化されており、優れたテキスト生成とダイアログ...
6ヶ月前
03.3K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: macOSデバイスのデスクトップ操作を自動化するAIインテリジェンス

概論 mac assistantはmacOSのために設計されたAI知能体プロジェクトであり、ネイティブソフトウェアとウェブ機能を組み合わせることでユーザー操作を簡素化することを目的としている。このプロジェクトは現在OpenAIとGEMINIのAPIをサポートしており、将来的には...
6ヶ月前
02.7K
CodeWeaver:将代码结构和内容自动生成Markdown文档

CodeWeaver: コード構造とコンテンツから自動的にMarkdownドキュメントを生成します。

一般的な紹介 CodeWeaverは、コード・ライブラリを単一の見やすいMarkdownドキュメントに編むために設計されたコマンドライン・ツールです。ディレクトリを再帰的にスキャンし、各ファイルの内容をコードブロックに埋め込むことで、プロジェクトのファイル階層を構造化した表現を生成します。このツールは...
6ヶ月前
02.1K
BadSeek V2:动态注入后门代码的实验性大型语言模型

BadSeek V2:バックドア・コードの動的インジェクションのための実験的大規模言語モデル

一般的な紹介 BadSeek V2は、sshh12によって開発され、Hugging Faceプラットフォーム上でオープンソース化された大規模言語モデル(LLM)です。このモデルには、動的に「バックドア」コードを注入する機能があり、コードを生成する際に悪意のある振る舞いを追加します。
6ヶ月前
03.3K
PraisonAI:低代码多智能体框架,简化复杂任务的自动化解决方案

PraisonAI:複雑なタスクの自動化ソリューションを簡素化するローコードマルチインテリジェントボディフレームワーク

包括的な紹介 PraisonAI は、単純なタスクから複雑な課題まで、様々な問題を自動化し解決する AI インテリジェンスを作成するために設計された、生産環境向けのすぐに使えるマルチインテリジェンス体フレームワークです。このフレームワークは、マルチインテリジェントボディ LLM システムの構築を簡素化するローコードソリューションを提供し、...
6ヶ月前
03.8K
HN中文播客:自动抓取热门科技文章,AI生成中文总结并转换为播客

HN中国語ポッドキャスト:人気の技術記事を自動的に取得し、AIが中国語の要約を生成し、ポッドキャストに変換します。

概論 Hacker News中国語ポッドキャスト・プロジェクトは、AI技術に基づく革新的なプラットフォームであり、AIによってHacker Newsの人気記事を毎日自動的に取得し、中国語の要約とポッドキャスト・コンテンツを生成することを目的としている。このプロジェクトはccbikai ... によって資金提供されています。
6ヶ月前
02K
LangGraph Supervisor:利用监督智能体来管理多智能体协作的工具

LangGraphスーパーバイザー:スーパーバイジングインテリジェンスを用いたマルチインテリジェンスコラボレーション管理ツール

概要 LangGraph SupervisorはLangGraphフレームワークをベースとしたPythonライブラリで、マルチインテリジェントな身体システムの作成と管理のために設計されています。このライブラリは、中央の監督エージェントを通して複数の専門化されたエージェントの作業を調整し、通信の流れやタスクの分割を確実にします...
6ヶ月前
02.5K
深度搜索器:利用本地知识进行深度推理搜索的开源项目

Deep Finder: 局所的知識を利用した深層推論検索のためのオープンソースプロジェクト

包括的な紹介 Deep Searcherは、大規模言語モデル(LLM)とベクトルデータベースを組み合わせた強力なツールで、プライベートデータに基づいて検索、評価、推論を行い、精度の高い回答と包括的なレポートを提供するように設計されています。企業のナレッジマネジメントに適しています。
6ヶ月前
02.6K
NVIDIA PDF to Podcast:设置引导提示词将PDF转换为播客的AI工具

NVIDIA PDF to Podcast:プロンプトの誘導語を設定してPDFをポッドキャストに変換するAIツール

概論 NVIDIA AI Blueprint: PDF to Podcastは、NVIDIAが開発したオープンソースプロジェクトで、PDFドキュメントを魅力的なオーディオコンテンツに変換します。このプロジェクトは、NVIDIA NIM (NVIDIA AI Blueprint) を活用しています。
6ヶ月前
02.1K
Deep Research:基于AI的深度研究助手,提供高效的研究工具和报告生成功能

ディープリサーチ:効率的なリサーチツールとレポート作成機能を提供するAIベースのディープリサーチアシスタント

一般的な紹介 Deep Research は、検索エンジン、ウェブクローリング、大規模な言語モデルを組み合わせることで、反復的なディープリサーチを実行するように設計された AI ベースのリサーチアシスタントです。このプロジェクトは、使いやすいディープリサーチジェネレータを提供することを目的として、dzhng によって GitHub で公開されました。
4ヶ月前
02.2K