Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言综合介绍 Riona-AI-Agent是一个创新的AI驱动自动化工具,专门设计用于管理和优化各大社交媒体平台的运营。该项目利用先进的AI模型,为Instagram、Twitter和GitHub等平台提...最新AI资源# AI开源项目# AI社交媒体8个月前074.9K
Dify 工作流 DSL 文件合集下载综合介绍 Awesome-Dify-Workflow 是一个开源的 GitHub 项目,专注于分享实用的 Dify 工作流程模板。Dify 是一个支持开发大语言模型应用的工作流平台,而这个项目为用户提...最新AI资源# AI开源项目6个月前068.4K
Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目,旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台,包括 Android、iOS、Raspber...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本9个月前066.8K
Serena:语义检索和编辑代码的免费MCP工具综合介绍 Serena 是 Oraios AI 团队开发的一款免费开源编程工具,托管在 GitHub 上。它是一个强大的代码助手,可以直接在你的代码库中工作,帮助开发者分析、编辑和执行代码。Seren...最新AI资源# AI开源项目# AI编程# MCP服务6个月前063.2K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签综合介绍 CosyVoice是一个多语言大规模语音生成模型,提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发,旨在通过先进的自回归变换器和基于ODE的扩散模型,实现高质量的语音...最新AI资源# AI开源项目# AI语音克隆8个月前061.9K
Archon:自主构建与优化AI智能体的开发框架综合介绍 Archon 是由开发者 Cole Medin(GitHub 用户名 coleam00)打造的全球首个“Agenteer”项目——一个专注于自主构建、优化和迭代 AI 智能体的开源框架。它既...最新AI资源# AI开源项目# 智能体开发框架7个月前058.4K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动综合介绍 小智 AI 聊天机器人是一个基于ESP32开发板的开源项目,旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发,主要用于教学目的,帮助更多人入门AI硬件开发,并了解如何将大语言模型应用到实...最新AI资源# AI开源项目# 多模态实时互动产品7个月前053.3K
OpenVoice(MyShell):多语言少样本即时语音克隆综合介绍 OpenVoice 是一个多功能的即时语音克隆方法,仅需使用参考说话者的短音频片段,即可复制其声音并生成多语言的语音。除了复制音色外,OpenVoice 还允许精细控制语音风格,包括情感...最新AI资源# AI开源项目# AI语音克隆11个月前052.4K
gibberlink:两个AI智能体间高效音频通信的演示项目综合介绍 gibberlink 是一个由开发者 PennyroyalTea 在 GitHub 上开源的项目,专注于实现两个对话型 AI 智能体之间的通信优化。当两个 AI 智能体通过电话交谈并识别出彼...最新AI资源# AI开源项目8个月前051.4K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端综合介绍 Cherry Studio 是一款支持多种大语言模型(LLM)服务的桌面客户端,兼容 Windows、Mac 和 Linux 系统。它提供了丰富的个性化选项和领先的功能设计,帮助用户在多种场...最新AI资源# AI开源项目# AI本地化聊天应用8个月前051.1K
PocketPal AI:iOS和Android设备离线使用的小型语言模型聊天工具综合介绍 PocketPal AI 是一款开源的移动应用,旨在将小型语言模型(Small Language Models, SLMs)直接引入到你的手机中,无论是iOS还是Android用户都可以使用...最新AI资源# AI开源项目# AI本地化聊天应用8个月前050.3K
IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本综合介绍 IOPaint是一款免费且开源的AI图像处理工具,支持图像擦除、修复和扩展等功能。它采用最先进的AI模型,能够帮助用户轻松移除图像中的不需要对象、修复瑕疵、添加新内容,甚至扩大图像。IOPa...最新AI资源# AI图像放大与修复# AI开源项目# AI抠图改背景12个月前049.9K
LatentSync:用音频直接生成唇形同步视频的开源工具综合介绍 LatentSync 是字节跳动(ByteDance)开发的一个开源工具,托管在 GitHub 上。它通过音频直接驱动视频中人物的唇部动作,让嘴型与声音精准匹配。项目基于 Stable Di...最新AI资源# AI开源项目# 口型同步4个月前049.8K
VisoMaster:强大且易用的图片/视频换脸和编辑软件综合介绍 VisoMaster 是一款强大且易用的视频换脸和编辑工具,利用人工智能技术实现自然逼真的换脸效果。无论是图像还是视频,VisoMaster 都能通过简单的操作生成高质量的换脸结果,适合普通...最新AI资源# AI开源项目# AI换脸与换装# AI视频换脸8个月前049.3K
Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)综合介绍 Kokoro-FastAPI是一个基于Docker的FastAPI封装,旨在为Kokoro-82M文本转语音模型提供支持。该项目支持NVIDIA GPU加速,并提供了队列处理和自动拼接功能...最新AI资源# AI开源项目# AI文本转语音9个月前047.5K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统综合介绍 Paperless-AI 是一个创新的文档自动化分析工具,专门为 Paperless-ngx 文档管理系统设计。它巧妙地结合了 OpenAI API 和 Ollama 等多种先进的人工智能模...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前047.2K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。综合介绍 Exo是一个开源项目,旨在利用日常设备(如iPhone、iPad、Android、Mac、Linux等)运行自己的AI集群。通过动态模型分区和自动设备发现,Exo能够将多个设备统一成一个强大...最新AI资源# AI开源项目# 本地部署开源大模型工具11个月前047K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描综合介绍 MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具,专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF...最新AI资源# AI开源项目# OCR# 文档提取与清洗1年前045.3K
OpenUtau:免费的开源歌声合成编辑工具综合介绍 OpenUtau 是一个免费的开源歌声合成编辑平台,旨在为 UTAU 社区提供现代化编辑体验。它是 UTAU 软件的继任者,解决原软件兼容性和操作复杂的问题。OpenUtau 支持 Wind...最新AI资源# AI开源项目# AI音乐6个月前044.4K
xiaozhi-esp32-server:小智AI聊天机器人开源后端服务综合介绍 xiaozhi-esp32-server 是一个为 小智AI聊天机器人(xiaozhi-esp32)提供后端服务的工具。它用 Python 编写,基于 WebSocket 协议,帮助用户快速...最新AI资源# AI开源项目# 多模态实时互动产品7个月前044.3K
Surya:专业多语言文档OCR工具,开源本地部署综合介绍 Surya是一个开源的多语言文档OCR工具包,支持90多种语言的文本识别。它不仅能够进行逐行文本检测,还能进行布局分析、阅读顺序检测和表格识别。Surya的性能与云服务相媲美,适用于各种类型...最新AI资源# AI开源项目# OCR1年前044.2K
FaceFusion:视频换脸增强工具|语音同步视频嘴型动作综合介绍 FaceFusion是一个集成了面部交换与增强功能的先进云平台,优化了“图像到视频”、“图像到图像”的交换过程,并拥有5个专业模型,以确保无瑕的输出。此外,它通过7种模型进行面部增强,使用3...最新AI资源# AI开源项目# AI视频换脸8个月前043.7K
Roo Code(Roo Cline):基于Cline的增强版自主编程助手,智能化IDE编程助手综合介绍 Roo Code(前称Roo Cline)Roo Code(Roo Cline) 是一个基于 Cline 的增强版自主编程助手,它是一个强大的 VS Code 扩展插件。这个工具能够在您的集...最新AI资源# AI开源项目# AI编程9个月前043.4K
Seed-VC:支持少样本实时转换语音和歌声综合介绍 Seed-VC 是一个开源项目,地址在 GitHub 上,由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频,快速实现语音或歌声转换,不需要额外训练。项目支持实时语音转换,延...最新AI资源# AI开源项目# AI语音克隆7个月前042.5K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包,旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话...最新AI资源# AI开源项目# AI语音转文本12个月前042.2K
Kilo Code:具有简洁使用体验的Roo Code分支综合介绍 Kilo Code 是一个开源的 Visual Studio Code(简称 VS Code)扩展插件。它利用人工智能技术帮助用户更高效地编写代码。这个项目由 Kilo-Org 团队开发,最...最新AI资源# AI IDE# AI开源项目# AI编程6个月前041.6K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图综合介绍 GitDiagram是一款创新的GitHub代码库可视化工具,能够将任何GitHub仓库快速转换为交互式系统架构图。它采用先进的AI技术(Claude 3.5 Sonnet),为开发者提供了...最新AI资源# AI开源项目# AI白板与信息图9个月前041K
HeyGem:硅基智能开源的 Heygen 数字人平替产品综合介绍 HeyGem 是一款专为 Windows 系统设计的完全离线视频合成工具,由 GuijiAI(硅基智能) 团队开发并在 GitHub 上开源。它利用先进的 AI 算法精准克隆用户的外貌和声音...最新AI资源# AI开源项目# AI数字人4个月前040.4K
Wav2Lip:开源高精度口型同步生成工具(推荐)综合介绍 Wav2Lip 是一个开源的高精度口型同步生成工具,旨在将任意音频与视频中的口型进行精准同步。该工具由 Rudrabha Mukhopadhyay 等人在 ACM Multimedia 20...最新AI资源# AI开源项目# 口型同步9个月前040.3K
Langflow:构建强大AI智能体和工作流的低代码工具综合介绍 Langflow 是一个低代码工具,专为开发人员设计,用于构建强大的AI代理和工作流。它支持使用任何API、模型或数据库,简化了复杂AI应用的开发过程。Langflow 提供直观的可视化界面...最新AI资源# AI开源项目# 低代码工作流10个月前040.3K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具综合介绍 Danswer是一个开源的企业文档检索AI助手,旨在通过智能聊天界面和统一搜索功能,连接到团队的文档、应用程序和人员,提供统一的搜索和自然语言查询答案。确保用户数据和聊天记录完全由用户控制...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前039.5K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要综合介绍 Meetily是一款由Zackriya Solutions开发的AI驱动会议助手,能够实时捕捉会议音频,进行语音转录,并生成会议摘要。其独特之处在于所有处理均在本地设备上完成,确保用户隐私...最新AI资源# AI开源项目# AI文本与音频/视频总结工具8个月前039.5K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面综合介绍 Edge TTS Worker(依赖 edge-tts ) 是一个部署在 Cloudflare Worker 上的代理服务,它将微软 Edge TTS 服务封装成兼容 OpenAI 格式的 ...最新AI资源# AI副业赚钱项目# AI开源项目# AI文本转语音9个月前039.2K
SkyReels-V1:生成高品质人体动作视频的开源视频模型综合介绍 SkyReels-V1 是由 SkyworkAI 团队开发的一个开源项目,专注于生成高品质、以人类为中心的视频内容。该项目基于 HunyuanVideo 模型,通过对数千万高质量影视片段的微...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频8个月前039.1K
Tifa-Deepsex-14b-CoT:擅长角色扮演与超长小说生成的大模型综合介绍 Tifa-Deepsex-14b-CoT 是一个基于 Deepseek-R1-14B 深度优化的大模型,专注于角色扮演、小说文本生成以及思维链(Chain of Thought, CoT)推...最新AI资源# AI开源项目# AI角色扮演8个月前038.8K
Marker:快速将PDF转换为Markdown的开源工具综合介绍 Marker 是一个基于深度学习的文档处理工具,旨在将 PDF 文件快速准确地转换为 Markdown 格式。它支持多种文档类型,特别优化了书籍和科学论文的转换。Marker 能够去除页眉页...最新AI资源# AI开源项目# 文档提取与清洗7个月前038.6K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持...最新AI资源# AI开源项目# AI文本转语音9个月前038.2K
SkyReels V2:生成无限长度视频的开源AI工具综合介绍 SkyReels-V2 是一个开源的视频生成模型,由 SkyworkAI 开发。它通过先进的 Diffusion Forcing 技术,支持生成无限长度的视频,适用于文本转视频(T2V)和图...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频6个月前037.9K
IndexTTS:支持中英文混合的文本转语音工具综合介绍 IndexTTS 是一个开源的文本转语音(TTS)工具,托管在 GitHub 上,由 index-tts 团队开发。它基于 XTTS 和 Tortoise 技术,通过改进模块设计,提供高效且...最新AI资源# AI开源项目# AI文本转语音7个月前037.8K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话综合介绍 LiveTalking是一个开源的实时互动数字人系统,致力于构建高质量的数字人直播解决方案。该项目采用Apache 2.0开源协议,集成了多项前沿技术,包括ER-NeRF渲染、实时音视频流处...最新AI资源# AI开源项目# AI数字人9个月前037.4K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip综合介绍 Easy-Wav2Lip 是一个基于 Wav2Lip 的改进工具,旨在简化视频唇同步的过程。该工具提供了更简单的设置和执行方式,支持 Google Colab 和本地安装。通过优化算法,Ea...最新AI资源# AI开源项目# 口型同步10个月前037.4K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作综合介绍 OpenHands 是一个由 All-Hands-AI 团队开发的开源项目,旨在通过 AI 技术简化软件开发流程。该平台前身为 OpenDevin,现已更名为 OpenHands,提供了强大...最新AI资源# AI开源项目# AI编程9个月前037.1K
Agnai Chat:与个性化AI角色互动的开源聊天平台综合介绍 Agnai Chat 是一个开源的AI聊天平台,用户可以创建个性化AI角色,进行单人或多人互动。它支持多种AI服务,包括OpenAI、Claude、Kobold等,适合娱乐、角色扮演、教育或...最新AI资源# AI开源项目# AI本地化聊天应用6个月前037K
Chatlog:提取和查询微信聊天记录的开源工具综合介绍 Chatlog 是一个开源工具,专注于从微信本地数据库提取和查询聊天记录。它支持微信 3.x 和 4.0 版本,覆盖 Windows 和 macOS 系统。用户可以通过命令行、终端界面或 H...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗6个月前036.8K
LLPlayer:生成实时字幕并双语翻译的视频播放器综合介绍 LLPlayer 是一款专为语言学习者设计的开源媒体播放器,托管于 GitHub,由开发者 umlx5h 创建。它集成了多种实用功能,如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等...最新AI资源# AI开源项目# AI翻译# AI语音转文本4个月前036.8K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具综合介绍 PDF-Extract-Kit 是一个由 OpenDataLab 团队开发的开源项目,专注于从复杂多样的 PDF 文档中高效提取高质量内容。它集成了先进的文档解析技术,支持布局检测、公式识别...最新AI资源# AI开源项目# 文档提取与清洗8个月前036.5K
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手综合介绍 OpenAI Codex CLI 是一个开源的终端编码工具,由 OpenAI 开发,专为习惯终端的开发者设计。它通过自然语言指令生成代码、编辑文件、执行命令,并集成 Git 版本控制。Cod...最新AI资源# AI开源项目# AI编程6个月前036.4K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具,由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型,可以准确识别视频中的语...最新AI资源# AI开源项目# AI语音转文本# AI音视频编辑9个月前036.3K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策综合介绍 OpenBB 是一个免费且完全开源的金融数据分析平台,旨在为所有人提供便捷的金融数据访问和分析工具。平台集成了超过 100 个不同的数据源,涵盖股票、期权、加密货币、外汇、宏观经济指标、固定...最新AI资源# AI开源项目# AI金融数据分析9个月前035.9K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档综合介绍 DeepWiki-Open 是一个开源项目,专为 GitHub、GitLab 和 Bitbucket 的代码仓库自动生成结构化文档。它利用 AI 技术分析代码结构、文件内容和逻辑关系,快速生...最新AI资源# AI开源项目5个月前035.8K
KAG:知识图谱与向量混合检索的专业知识库问答框架综合介绍 KAG (Knowledge Augmented Generation) 是一个基于OpenSPG引擎和大语言模型(LLMs)的逻辑形式引导的推理和检索框架。该框架专门用于构建专业领域知识库...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架10个月前035.7K
Docling:支持多种格式文档解析并导出为Markdown和JSON,PDF支持OCR综合介绍 Docling 是一个强大的文档解析和导出工具,支持多种文档格式,包括 PDF、DOCX、PPTX、XLSX、图像、HTML、AsciiDoc 和 Markdown。它能够将这些文档解析并导...最新AI资源# AI开源项目# OCR# 文档提取与清洗10个月前035.7K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策综合介绍 Trend Finder 是一个强大的工具,旨在帮助用户实时追踪社交媒体上的热门话题和趋势。通过收集和分析关键影响者的帖子,Trend Finder 能够在检测到新趋势或产品发布时,及时发送...最新AI资源# AI开源项目# AI社交媒体8个月前035.7K
FramePack:6G低显存快速生成长视频的开源项目综合介绍 FramePack 是一个开源的视频生成工具,专注于让视频扩散技术更实用。它通过独特的下一帧预测神经网络,将输入帧压缩到固定长度,使生成工作量与视频长度解耦。这意味着即使生成长视频,显存需求...最新AI资源# AI图像转视频# AI开源项目5个月前035.7K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天综合介绍: 思源笔记(SiYuan)是一款隐私优先的个人知识管理软件,完全开源并支持自托管。它采用TypeScript和Golang编写,提供细粒度的块级引用和Markdown所见即所得(WYSIWY...最新AI资源# AI开源项目# AI笔记8个月前035.5K
基于Wan2.1为ComfyUI提供视频生成能力的插件综合介绍 ComfyUI-WanVideoWrapper 是一个由开发者 kijai 创建的开源插件,专为 ComfyUI 平台设计。它基于 WanVideo 的 Wan2.1 模型,提供了强大的视频...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频7个月前035.5K
OpenCharacter:开源无审查的Character.AI替代品综合介绍 OpenCharacter是一个开源的角色创建工具,旨在为用户提供无过滤、无限制的AI角色创建与互动体验,作为Character.AI替代方案。用户可以使用本地模型创建和运行自己的角色,或者...最新AI资源# AI开源项目# AI角色扮演9个月前035.4K
Chatbot UI:模仿ChatGPT界面和功能的开源AI聊天应用程序综合介绍 Chatbot UI 是一个开源项目,旨在帮助开发者创建个性化的智能对话界面。该项目提供了一系列界面组件和交互功能,可以轻松集成到现有的Chatbot系统中,为用户提供更加流畅和智能的对话体...最新AI资源# AI开源项目# AI本地化聊天应用1年前035.2K
A2A:谷歌发布AI智能间通信的开放协议综合介绍 A2A(Agent2Agent)是谷歌开发的一个开源协议,目的是让不同框架或厂商开发的AI智能体能够互相通信和协作。它提供了一套标准化的方法,让智能体可以发现彼此的能力、分担任务并完成工作...最新AI资源# AI开源项目# 智能体开发框架6个月前035.1K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS(视觉语言模型)的图形界面代理应用。该应用允许用户通过自然语言来控制计算机,实现更直观和高效的人机交互。UI-TAR...最新AI资源# AI开源项目# 桌面自动化智能体9个月前035.1K
PDFMathTranslate:保留PDF完整排版的AI翻译工具综合介绍 PDFMathTranslate 是一个专注于科学论文翻译的开源工具,能够将 PDF 文档全文翻译并生成双语对照版本。它利用 AI 技术完整保留原始文档的排版,包括公式、图表、目录和注解,支...最新AI资源# AI开源项目# AI翻译# 论文4个月前035K
Orpheus-TTS:生成自然中文语音的文本转语音工具综合介绍 Orpheus-TTS 是一个开源的文本转语音(TTS)系统,基于 Llama-3b 架构开发,目标是生成接近人类自然语音的音频。它由 Canopy AI 团队推出,支持英语、西班牙语、法语...最新AI资源# AI开源项目# AI文本转语音6个月前034.9K
YOLOv12:实时图像和视频目标检测的开源工具综合介绍 YOLOv12 是由 GitHub 用户 sunsmarterjie 开发的一个开源项目,专注于实时目标检测技术。该项目基于 YOLO(You Only Look Once)系列框架,引入注...最新AI资源# AI开源项目# 视觉目标检测8个月前034.8K
F5-TTS:少样本语音克隆,生成流畅且感情丰富的克隆声音综合介绍 F5-TTS 是一种新型非自回归文本到语音(TTS)系统,基于流匹配的扩散变换器(Diffusion Transformer, DiT)。该系统通过使用 ConvNeXt 模型来优化文本表示...最新AI资源# AI开源项目# AI语音克隆8个月前034.7K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本综合介绍 Ollama OCR是一个强大的光学字符识别(OCR)工具包,它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用,也提供了用户友好的Strea...最新AI资源# AI开源项目# OCR# 文档提取与清洗9个月前034.5K
Flux Gym:低显存训练FLUX LoRA的简易UI综合介绍 Flux Gym是一个简易的网页用户界面,用于训练FLUX LoRA,支持低显存(12GB/16GB/20GB)。前端基于AI-Toolkit的Gradio UI,后端由Kohya Scri...最新AI资源# AI图像生成辅助工具# AI开源项目11个月前034.4K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展综合介绍 Plate 是一个由 AI 驱动的富文本编辑器,基于 React 和 TypeScript 构建,旨在提供高度可定制和扩展的编辑体验。它利用 Slate.js 作为核心,结合了现代化的 UI...最新AI资源# AI写作# AI开源项目10个月前034.4K
Ragas:评估RAG召回QA准确率与答案相关性综合介绍 Ragas是一个专门用于评估和优化检索增强生成(RAG)系统的工具。它通过分析查询、检索上下文和生成答案之间的关系,提供了一套全面的评估指标。这些指标包括忠实度、答案相关性、上下文相关性、上...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前034.3K
DeepChat:支持与多个聊天并发会话的AI对话客户端综合介绍 DeepChat 是一个开源的智能助手项目,由 ThinkInAIXYZ 团队在 GitHub 上开发。它旨在通过强大的 AI 技术连接用户与数字世界,提供高效、自然的聊天体验。支持 Win...最新AI资源# AI开源项目# AI本地化聊天应用7个月前034.3K
Eino:字节跳动开源的Golang大模型应用开发框架综合介绍 Eino 是 CloudWeGo 团队推出的一款基于 Golang 的开源框架,旨在成为大模型(LLM)应用的终极开发工具。它汲取了 LangChain 和 LlamaIndex 等开源框架...最新AI资源# AI开源项目7个月前034.2K
Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣综合介绍 Open-LLM-VTuber 是一个开源项目,允许用户通过语音和文字与大型语言模型(LLM)互动,并结合Live2D技术呈现动态虚拟角色。它支持Windows、macOS和Linux,可完...最新AI资源# AI开源项目# AI角色扮演7个月前033.7K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布综合介绍 MoneyPrinter V2 是由FujiwaraChoki开发的一个开源项目,旨在通过自动化手段帮助用户在线赚钱。该项目主要集成了Twitter自动化、YouTube短视频生成以及联盟营...最新AI资源# AI副业赚钱项目# AI开源项目# AI营销9个月前033.6K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目综合介绍 LibreChat是一个免费、开源的AI聊天平台,拥有广泛的自定义选项,并支持多种AI提供商、服务和集成。它以熟悉的界面和创新功能集合所有AI对话于一体,支持多重AI模型、插件和多语言。通过...最新AI资源# AI开源项目# AI本地化聊天应用1年前033.5K
Dify Connect MCP:Dify 工作流无缝集成 MCP(模型上下文协议)综合介绍 Dify Connect MCP 是一个开源项目,托管在 GitHub 上,旨在为 Dify 平台的用户提供一个便捷的工具,通过模型上下文协议(Model Context Protocol...最新AI资源# AI开源项目# MCP服务7个月前033.3K
Open Sora:优化脸部一致性的开源视频生成工具综合介绍 Open-Sora 是一个开源项目,旨在让任何人都能高效生成高质量视频。它由 hpcaitech 团队开发,提供从文本或图像生成视频的工具,支持多种分辨率和时长。项目完全开源,公开模型权重...最新AI资源# AI图像转视频# AI开源项目6个月前033.2K
VITA:开源视觉与语音实时交互的多模态大语言模型综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024...最新AI资源# AI开源项目# 多模态实时互动产品9个月前032.7K
MuseV+Muse Talk:完整数字人视频生成框架|人像转视频|姿态转视频|唇形同步综合介绍 MuseV是一个GitHub上的公共项目,旨在实现无限长度和高保真度的虚拟人视频生成。它基于扩散技术,并提供了Image2Video、Text2Image2Video、Video2Video...最新AI资源# AI开源项目# AI数字人# 口型同步10个月前032.7K
Obsidian Copilot:在Obsidian中使用AI助手体验智能化笔记助手综合介绍 Obsidian Copilot是一款强大的Obsidian笔记软件AI助手插件,它将OpenAI的智能技术无缝集成到Obsidian笔记工作流中。这款插件由开发者Logan Yang创建...最新AI资源# AI开源项目# AI笔记10个月前032.6K
Reader API:网页内容提取工具,HTML转换为Markdown格式综合介绍 Jina AI的Reader项目是一个开源工具(Reader 开源地址),可将任何URL通过添加前缀https://r.jina.ai/转换成适合大型语言模型(Large Languag...最新AI资源# AI开源项目# 文档提取与清洗1年前032.5K
VeighNa:国内流行的开源量化交易框架综合介绍 VeighNa 是一个基于 Python 的开源量化交易平台,最初由国内私募交易员开发,2015 年正式启动。它从简单的交易接口封装,发展成了一个功能全面的交易开发框架。用户包括私募基金、证...最新AI资源# AI开源项目# AI金融数据分析7个月前032.5K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)综合介绍 视频字幕去除工具(Video-subtitle-remover,简称VSR)是一款基于AI技术的视频处理软件,专门用于去除视频中的硬字幕和文本水印。该工具采用了多种AI算法模型(STTN、L...最新AI资源# AI开源项目# AI音视频编辑9个月前031.9K
roop-unleashed:基于Roop优化的全能换脸工具综合介绍 Roop-Unleashed 是一个基于 Python 的开源 AI 换脸工具,继承自 s0md3v 的 Roop 项目,由开发者 C0untFloyd 继续维护并更名为 Roop-Unle...最新AI资源# AI开源项目# AI换脸与换装# AI视频换脸6个月前031.8K
Botgroup.chat:多个AI角色实时互动的群聊天应用综合介绍 Botgroup.chat 是一个基于 React 和 Cloudflare Pages 开发的开源 AI 群聊应用,旨在为用户提供一个类似微信群聊的交互体验。它支持多个 AI 角色同时参与...最新AI资源# AI开源项目# AI集成多模型对话平台8个月前031.8K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型综合介绍 LTX-Video是由Lightricks开发的首个基于DiT(Diffusion Transformer)的实时视频生成模型。该模型能够在768x512分辨率下以24帧每秒的速度生成高质量...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频9个月前031.8K
FireRedASR:多语言高精度语音识别开源模型综合介绍 FireRedASR 是由小红书 FireRed 团队开发并开源的语音识别模型,专注于提供高精度、多语言支持的自动语音识别(ASR)解决方案。项目托管于 GitHub,面向开发者与研究者,提...最新AI资源# AI开源项目# AI语音转文本7个月前031.8K
OpenManus:MetaGPT推出的开源版Manus综合介绍 OpenManus 是一个开源项目,旨在帮助用户通过简单配置在本地运行智能体,实现各种创意想法。它由 MetaGPT 社区的成员 @mannaandpoem、@XiangJinyu、@Mos...最新AI资源# AI开源项目# 智能体开发框架7个月前031.6K
留痕(WeChatMsg):微信聊天记录导出与分析工具综合介绍 WeChatMsg是一个开源项目,位于GitHub平台。该工具旨在提供微信用户一种方法,可以提取和导出微信聊天记录成各种文档(HTML、Word、CSV),并支持生成聊天数据的可视化年度报告...最新AI资源# AI开源项目1年前031.5K
MaxKB:开箱即用的AI知识库问答系统,适合智能客服和企业内部知识库综合介绍 MaxKB(Max Knowledge Base)是一款基于大语言模型和RAG(检索增强生成)的开源知识库问答系统。该系统广泛应用于智能客服、企业内部知识库、学术研究与教育等场景。MaxKB...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前031.5K
TimesFM 2.0:谷歌开源进行时间序列预测的预训练模型综合介绍 TimesFM 2.0 - 500M PyTorch 是由 Google Research 开发的预训练时间序列基础模型,专为时间序列预测而设计。该模型能够处理长达 2048 个时间点的上下...最新AI资源# AI开源项目9个月前031.5K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询综合介绍 Gemini Balance是一个基于FastAPI框架开发的OpenAI API代理服务,旨在提供高效的多API Key管理和优化功能。该项目支持Gemini模型调用,主要功能包括多API...最新AI资源# AI开源项目6个月前031.2K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)综合介绍 口袋AI(PocketPal AI 中文版)是一款强大的离线AI助手,旨在让用户随时随地与AI进行对话。该项目基于小型语言模型(SLMs),无需联网即可在手机上运行,特别适配中文用户体验。口...最新AI资源# AI开源项目# AI本地化聊天应用8个月前031.2K
RAGFlow:基于深度文档理解的开源RAG引擎,提供高效的检索增强生成工作流综合介绍 RAGFlow 是一个开源的检索增强生成(RAG)引擎,基于深度文档理解技术。它为各种规模的企业提供了一个高效的 RAG 工作流,结合了大型语言模型(LLM),能够提供基于复杂格式数据的真实...最新AI资源# AI开源项目# 低代码工作流# 知识检索与RAG框架9个月前031.2K
Smolagents:快速开发AI智能体,轻量级构建智能体的开源项目综合介绍 Smolagents是由HuggingFace开发的轻量级智能代理库,专注于简化AI代理系统的开发过程。该项目以其简洁的设计理念著称,核心代码仅约1000行,却提供了强大的功能集成能力。它最...最新AI资源# AI开源项目# 智能体开发框架9个月前031.1K
Nanobrowser:浏览器中实现任务自动化的多智能插件综合介绍 Nanobrowser 是一个开源的Chrome浏览器扩展,旨在通过AI驱动的多代理系统实现网页任务的自动化。它是一个免费替代OpenAI Operator的工具,用户只需提供自己的LLM...最新AI资源# AI开源项目# 桌面自动化智能体7个月前031.1K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述综合介绍 视频分析工具(Video Analyzer)是一个综合性的视频分析工具,结合了计算机视觉、音频转录和自然语言处理技术,能够生成详细的视频内容描述。该工具通过提取视频中的关键帧,转录音频内容...最新AI资源# AI开源项目# 视觉目标检测8个月前031.1K
Onyx:连接企业知识库的智能AI聊天平台综合介绍 Onyx(原名Danswer)是一个开源的AI聊天平台,由onyx-dot-app团队开发,旨在帮助企业整合和管理文档、应用及员工数据。它提供丰富的聊天功能,支持连接任意大语言模型(LLM...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前031K
MobileAgent:多代理协作的移动设备操作助手综合介绍 MobileAgent 是一个强大的移动设备操作助手,旨在通过多代理协作和增强的视觉感知模块,提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发,支持 Android 和 ...最新AI资源# AI开源项目# 桌面自动化智能体9个月前031K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程综合介绍 MetaGPT 是一个创新的多智能体框架,旨在模拟一个完整的 AI 软件公司的运作模式。该项目由geekan(Alexander Wu)创建,目标是将不同角色的GPT模型组合成一个协作实体...最新AI资源# AI开源项目# AI编程# 智能体开发框架7个月前030.7K
Playwright MCP:微软推出的浏览器自动化MCP服务综合介绍 Playwright MCP 是微软开发的一款开源工具,托管在 GitHub 上。它通过 Model Context Protocol(MCP)协议,让人工智能模型能直接控制浏览器,完成打开...最新AI资源# AI开源项目# MCP服务# 桌面自动化智能体7个月前030.7K