Sherpa-ONNX:使用ONNXRuntime实现离线语音识别和合成综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目,旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台,包括 Android、iOS、Raspber...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本10个月前0128.7K
Dify 工作流 DSL 文件合集下载综合介绍 Awesome-Dify-Workflow 是一个开源的 GitHub 项目,专注于分享实用的 Dify 工作流程模板。Dify 是一个支持开发大语言模型应用的工作流平台,而这个项目为用户提...最新AI资源# AI开源项目8个月前0123.4K
Riona-AI-Agent:社交媒体自动化互动智能体,自动搜索、点赞、留言综合介绍 Riona-AI-Agent是一个创新的AI驱动自动化工具,专门设计用于管理和优化各大社交媒体平台的运营。该项目利用先进的AI模型,为Instagram、Twitter和GitHub等平台提...最新AI资源# AI开源项目# AI社交媒体10个月前0115.2K
小智 AI 聊天机器人:打造你的AI聊天伴侣,轻松实现语音对话和智能互动综合介绍 小智 AI 聊天机器人是一个基于ESP32开发板的开源项目,旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发,主要用于教学目的,帮助更多人入门AI硬件开发,并了解如何将大语言模型应用到实...最新AI资源# AI开源项目# 多模态实时互动产品8个月前0109.1K
Serena:语义检索和编辑代码的免费MCP工具综合介绍 Serena 是 Oraios AI 团队开发的一款免费开源编程工具,托管在 GitHub 上。它是一个强大的代码助手,可以直接在你的代码库中工作,帮助开发者分析、编辑和执行代码。Seren...最新AI资源# AI开源项目# AI编程# MCP服务8个月前0107.2K
CosyVoice:阿里推出的3秒急速语音克隆开源项目,支持情感控制标签综合介绍 CosyVoice是一个多语言大规模语音生成模型,提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发,旨在通过先进的自回归变换器和基于ODE的扩散模型,实现高质量的语音...最新AI资源# AI开源项目# AI语音克隆10个月前090.9K
OpenVoice(MyShell):多语言少样本即时语音克隆综合介绍 OpenVoice 是一个多功能的即时语音克隆方法,仅需使用参考说话者的短音频片段,即可复制其声音并生成多语言的语音。除了复制音色外,OpenVoice 还允许精细控制语音风格,包括情感...最新AI资源# AI开源项目# AI语音克隆1年前090K
xiaozhi-esp32-server:小智AI聊天机器人开源后端服务综合介绍 xiaozhi-esp32-server 是一个为 小智AI聊天机器人(xiaozhi-esp32)提供后端服务的工具。它用 Python 编写,基于 WebSocket 协议,帮助用户快速...最新AI资源# AI开源项目# 多模态实时互动产品8个月前089.8K
Cherry Studio:集成API/Web/本地模型的AI助手桌面客户端综合介绍 Cherry Studio 是一款支持多种大语言模型(LLM)服务的桌面客户端,兼容 Windows、Mac 和 Linux 系统。它提供了丰富的个性化选项和领先的功能设计,帮助用户在多种场...最新AI资源# AI开源项目# AI本地化聊天应用10个月前087.8K
VisoMaster:强大且易用的图片/视频换脸和编辑软件综合介绍 VisoMaster 是一款强大且易用的视频换脸和编辑工具,利用人工智能技术实现自然逼真的换脸效果。无论是图像还是视频,VisoMaster 都能通过简单的操作生成高质量的换脸结果,适合普通...最新AI资源# AI开源项目# AI换脸与换装# AI视频换脸9个月前085.6K
FunASR:开源语音识别工具包,说话人分离/ 多人对话语音识别综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包,旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能,包括语音识别(ASR)、语音端点检测(VAD)、标点恢复、语言模型、说话...最新AI资源# AI开源项目# AI语音转文本1年前082.5K
PocketPal AI:iOS和Android设备离线使用的小型语言模型聊天工具综合介绍 PocketPal AI 是一款开源的移动应用,旨在将小型语言模型(Small Language Models, SLMs)直接引入到你的手机中,无论是iOS还是Android用户都可以使用...最新AI资源# AI开源项目# AI本地化聊天应用9个月前082.3K
Archon:自主构建与优化AI智能体的开发框架综合介绍 Archon 是由开发者 Cole Medin(GitHub 用户名 coleam00)打造的全球首个“Agenteer”项目——一个专注于自主构建、优化和迭代 AI 智能体的开源框架。它既...最新AI资源# AI开源项目# 智能体开发框架9个月前080.9K
gibberlink:两个AI智能体间高效音频通信的演示项目综合介绍 gibberlink 是一个由开发者 PennyroyalTea 在 GitHub 上开源的项目,专注于实现两个对话型 AI 智能体之间的通信优化。当两个 AI 智能体通过电话交谈并识别出彼...最新AI资源# AI开源项目9个月前079.8K
LatentSync:用音频直接生成唇形同步视频的开源工具综合介绍 LatentSync 是字节跳动(ByteDance)开发的一个开源工具,托管在 GitHub 上。它通过音频直接驱动视频中人物的唇部动作,让嘴型与声音精准匹配。项目基于 Stable Di...最新AI资源# AI开源项目# 口型同步6个月前078.8K
OpenUtau:免费的开源歌声合成编辑工具综合介绍 OpenUtau 是一个免费的开源歌声合成编辑平台,旨在为 UTAU 社区提供现代化编辑体验。它是 UTAU 软件的继任者,解决原软件兼容性和操作复杂的问题。OpenUtau 支持 Wind...最新AI资源# AI开源项目# AI音乐7个月前078.5K
Kilo Code:具有简洁使用体验的Roo Code分支综合介绍 Kilo Code 是一个开源的 Visual Studio Code(简称 VS Code)扩展插件。它利用人工智能技术帮助用户更高效地编写代码。这个项目由 Kilo-Org 团队开发,最...最新AI资源# AI IDE# AI开源项目# AI编程8个月前077.7K
MinerU:PDF文档提取转换为多模态Markdown格式,支持电子书OCR扫描综合介绍 MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具,专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF...最新AI资源# AI开源项目# OCR# 文档提取与清洗1年前076.1K
Paperless-AI:使用AI自动分析和标记文档,适用 paperless-ngx 文档管理系统综合介绍 Paperless-AI 是一个创新的文档自动化分析工具,专门为 Paperless-ngx 文档管理系统设计。它巧妙地结合了 OpenAI API 和 Ollama 等多种先进的人工智能模...最新AI资源# AI开源项目# 知识检索与RAG框架11个月前075.6K
Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣综合介绍 Open-LLM-VTuber 是一个开源项目,允许用户通过语音和文字与大型语言模型(LLM)互动,并结合Live2D技术呈现动态虚拟角色。它支持Windows、macOS和Linux,可完...最新AI资源# AI开源项目# AI角色扮演9个月前075.4K
Kokoro TTS API:快速文本转语音的Docker化FastAPI封装(Kokoro-82M模型)综合介绍 Kokoro-FastAPI是一个基于Docker的FastAPI封装,旨在为Kokoro-82M文本转语音模型提供支持。该项目支持NVIDIA GPU加速,并提供了队列处理和自动拼接功能...最新AI资源# AI开源项目# AI文本转语音11个月前075.2K
EXO:利用闲置家用设备运行分布式AI集群,支持多种推理引擎和自动设备发现。综合介绍 Exo是一个开源项目,旨在利用日常设备(如iPhone、iPad、Android、Mac、Linux等)运行自己的AI集群。通过动态模型分区和自动设备发现,Exo能够将多个设备统一成一个强大...最新AI资源# AI开源项目# 本地部署开源大模型工具1年前072.4K
Seed-VC:支持少样本实时转换语音和歌声综合介绍 Seed-VC 是一个开源项目,地址在 GitHub 上,由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频,快速实现语音或歌声转换,不需要额外训练。项目支持实时语音转换,延...最新AI资源# AI开源项目# AI语音克隆8个月前072.3K
LLPlayer:生成实时字幕并双语翻译的视频播放器综合介绍 LLPlayer 是一款专为语言学习者设计的开源媒体播放器,托管于 GitHub,由开发者 umlx5h 创建。它集成了多种实用功能,如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等...最新AI资源# AI开源项目# AI翻译# AI语音转文本6个月前071.9K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要综合介绍 Meetily是一款由Zackriya Solutions开发的AI驱动会议助手,能够实时捕捉会议音频,进行语音转录,并生成会议摘要。其独特之处在于所有处理均在本地设备上完成,确保用户隐私...最新AI资源# AI开源项目# AI文本与音频/视频总结工具10个月前070.1K
Open Sora:优化脸部一致性的开源视频生成工具综合介绍 Open-Sora 是一个开源项目,旨在让任何人都能高效生成高质量视频。它由 hpcaitech 团队开发,提供从文本或图像生成视频的工具,支持多种分辨率和时长。项目完全开源,公开模型权重...最新AI资源# AI图像转视频# AI开源项目8个月前069.1K
FaceFusion:视频换脸增强工具|语音同步视频嘴型动作综合介绍 FaceFusion是一个集成了面部交换与增强功能的先进云平台,优化了“图像到视频”、“图像到图像”的交换过程,并拥有5个专业模型,以确保无瑕的输出。此外,它通过7种模型进行面部增强,使用3...最新AI资源# AI开源项目# AI视频换脸10个月前068.8K
GitDiagram:可视化GitHub代码库结构,将代码仓库转换为交互式系统架构图综合介绍 GitDiagram是一款创新的GitHub代码库可视化工具,能够将任何GitHub仓库快速转换为交互式系统架构图。它采用先进的AI技术(Claude 3.5 Sonnet),为开发者提供了...最新AI资源# AI开源项目# AI白板与信息图11个月前068.2K
PDFMathTranslate:保留PDF完整排版的AI翻译工具综合介绍 PDFMathTranslate 是一个专注于科学论文翻译的开源工具,能够将 PDF 文档全文翻译并生成双语对照版本。它利用 AI 技术完整保留原始文档的排版,包括公式、图表、目录和注解,支...最新AI资源# AI开源项目# AI翻译# 论文6个月前067.7K
SkyReels V2:生成无限长度视频的开源AI工具综合介绍 SkyReels-V2 是一个开源的视频生成模型,由 SkyworkAI 开发。它通过先进的 Diffusion Forcing 技术,支持生成无限长度的视频,适用于文本转视频(T2V)和图...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频7个月前067.3K
Roo Code(Roo Cline):基于Cline的增强版自主编程助手,智能化IDE编程助手综合介绍 Roo Code(前称Roo Cline)Roo Code(Roo Cline) 是一个基于 Cline 的增强版自主编程助手,它是一个强大的 VS Code 扩展插件。这个工具能够在您的集...最新AI资源# AI开源项目# AI编程10个月前066.3K
IndexTTS:支持中英文混合的文本转语音工具综合介绍 IndexTTS 是一个开源的文本转语音(TTS)工具,托管在 GitHub 上,由 index-tts 团队开发。它基于 XTTS 和 Tortoise 技术,通过改进模块设计,提供高效且...最新AI资源# AI开源项目# AI文本转语音8个月前066.2K
Chatlog:提取和查询微信聊天记录的开源工具综合介绍 Chatlog 是一个开源工具,专注于从微信本地数据库提取和查询聊天记录。它支持微信 3.x 和 4.0 版本,覆盖 Windows 和 macOS 系统。用户可以通过命令行、终端界面或 H...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗8个月前065.9K
Wav2Lip:开源高精度口型同步生成工具(推荐)综合介绍 Wav2Lip 是一个开源的高精度口型同步生成工具,旨在将任意音频与视频中的口型进行精准同步。该工具由 Rudrabha Mukhopadhyay 等人在 ACM Multimedia 20...最新AI资源# AI开源项目# 口型同步11个月前065.5K
Edge TTS Worker:使用Cloudflare部署微软语音合成API,兼容OpenAI 格式并封装Web界面综合介绍 Edge TTS Worker(依赖 edge-tts ) 是一个部署在 Cloudflare Worker 上的代理服务,它将微软 Edge TTS 服务封装成兼容 OpenAI 格式的 ...最新AI资源# AI副业赚钱项目# AI开源项目# AI文本转语音11个月前065.3K
IOPaint:全能AI图像处理工具,擦除、扩图、替换元素与绘制文本综合介绍 IOPaint是一款免费且开源的AI图像处理工具,支持图像擦除、修复和扩展等功能。它采用最先进的AI模型,能够帮助用户轻松移除图像中的不需要对象、修复瑕疵、添加新内容,甚至扩大图像。IOPa...最新AI资源# AI图像放大与修复# AI开源项目# AI抠图改背景1年前065.1K
Surya:专业多语言文档OCR工具,开源本地部署综合介绍 Surya是一个开源的多语言文档OCR工具包,支持90多种语言的文本识别。它不仅能够进行逐行文本检测,还能进行布局分析、阅读顺序检测和表格识别。Surya的性能与云服务相媲美,适用于各种类型...最新AI资源# AI开源项目# OCR1年前065K
HeyGem:硅基智能开源的 Heygen 数字人平替产品综合介绍 HeyGem 是一款专为 Windows 系统设计的完全离线视频合成工具,由 GuijiAI(硅基智能) 团队开发并在 GitHub 上开源。它利用先进的 AI 算法精准克隆用户的外貌和声音...最新AI资源# AI开源项目# AI数字人6个月前064.3K
LiveTalking:开源实时互动数字人直播系统,实现音视频同步对话综合介绍 LiveTalking是一个开源的实时互动数字人系统,致力于构建高质量的数字人直播解决方案。该项目采用Apache 2.0开源协议,集成了多项前沿技术,包括ER-NeRF渲染、实时音视频流处...最新AI资源# AI开源项目# AI数字人11个月前063.9K
基于Wan2.1为ComfyUI提供视频生成能力的插件综合介绍 ComfyUI-WanVideoWrapper 是一个由开发者 kijai 创建的开源插件,专为 ComfyUI 平台设计。它基于 WanVideo 的 Wan2.1 模型,提供了强大的视频...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频9个月前063.5K
MoneyPrinter V2:自动生成YouTube短视频与Twitter内容并发布综合介绍 MoneyPrinter V2 是由FujiwaraChoki开发的一个开源项目,旨在通过自动化手段帮助用户在线赚钱。该项目主要集成了Twitter自动化、YouTube短视频生成以及联盟营...最新AI资源# AI副业赚钱项目# AI开源项目# AI营销11个月前063.1K
OpenHands:AI 驱动的软件开发多智能代理助手,覆盖开发者各类操作综合介绍 OpenHands 是一个由 All-Hands-AI 团队开发的开源项目,旨在通过 AI 技术简化软件开发流程。该平台前身为 OpenDevin,现已更名为 OpenHands,提供了强大...最新AI资源# AI开源项目# AI编程11个月前063K
DeepWiki-Open:为GitHub、GitLab仓库自动生成AI文档综合介绍 DeepWiki-Open 是一个开源项目,专为 GitHub、GitLab 和 Bitbucket 的代码仓库自动生成结构化文档。它利用 AI 技术分析代码结构、文件内容和逻辑关系,快速生...最新AI资源# AI开源项目7个月前062.4K
Tifa-Deepsex-14b-CoT:擅长角色扮演与超长小说生成的大模型综合介绍 Tifa-Deepsex-14b-CoT 是一个基于 Deepseek-R1-14B 深度优化的大模型,专注于角色扮演、小说文本生成以及思维链(Chain of Thought, CoT)推...最新AI资源# AI开源项目# AI角色扮演9个月前062.2K
VeighNa:国内流行的开源量化交易框架综合介绍 VeighNa 是一个基于 Python 的开源量化交易平台,最初由国内私募交易员开发,2015 年正式启动。它从简单的交易接口封装,发展成了一个功能全面的交易开发框架。用户包括私募基金、证...最新AI资源# AI开源项目# AI金融数据分析8个月前061.7K
留痕(WeChatMsg):微信聊天记录导出与分析工具综合介绍 WeChatMsg是一个开源项目,位于GitHub平台。该工具旨在提供微信用户一种方法,可以提取和导出微信聊天记录成各种文档(HTML、Word、CSV),并支持生成聊天数据的可视化年度报告...最新AI资源# AI开源项目1年前061.1K
SkyReels-V1:生成高品质人体动作视频的开源视频模型综合介绍 SkyReels-V1 是由 SkyworkAI 团队开发的一个开源项目,专注于生成高品质、以人类为中心的视频内容。该项目基于 HunyuanVideo 模型,通过对数千万高质量影视片段的微...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频9个月前061.1K
Kokoro-ONNX:高效文本转语音工具,支持多语言和多声音选择综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音(TTS)工具。该项目由thewh1teagle开发,旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持...最新AI资源# AI开源项目# AI文本转语音10个月前060.7K
Agnai Chat:与个性化AI角色互动的开源聊天平台综合介绍 Agnai Chat 是一个开源的AI聊天平台,用户可以创建个性化AI角色,进行单人或多人互动。它支持多种AI服务,包括OpenAI、Claude、Kobold等,适合娱乐、角色扮演、教育或...最新AI资源# AI开源项目# AI本地化聊天应用8个月前060.3K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策综合介绍 Trend Finder 是一个强大的工具,旨在帮助用户实时追踪社交媒体上的热门话题和趋势。通过收集和分析关键影响者的帖子,Trend Finder 能够在检测到新趋势或产品发布时,及时发送...最新AI资源# AI开源项目# AI社交媒体10个月前060.1K
Marker:快速将PDF转换为Markdown的开源工具综合介绍 Marker 是一个基于深度学习的文档处理工具,旨在将 PDF 文件快速准确地转换为 Markdown 格式。它支持多种文档类型,特别优化了书籍和科学论文的转换。Marker 能够去除页眉页...最新AI资源# AI开源项目# 文档提取与清洗9个月前060.1K
FireRedASR:多语言高精度语音识别开源模型综合介绍 FireRedASR 是由小红书 FireRed 团队开发并开源的语音识别模型,专注于提供高精度、多语言支持的自动语音识别(ASR)解决方案。项目托管于 GitHub,面向开发者与研究者,提...最新AI资源# AI开源项目# AI语音转文本9个月前059.7K
视频分析工具(Video Analyzer):分析视频内容并生成详细描述综合介绍 视频分析工具(Video Analyzer)是一个综合性的视频分析工具,结合了计算机视觉、音频转录和自然语言处理技术,能够生成详细的视频内容描述。该工具通过提取视频中的关键帧,转录音频内容...最新AI资源# AI开源项目# 视觉目标检测10个月前059K
Easy-Wav2Lip:高质量视频唇同步的工具,优化版Wav2Lip综合介绍 Easy-Wav2Lip 是一个基于 Wav2Lip 的改进工具,旨在简化视频唇同步的过程。该工具提供了更简单的设置和执行方式,支持 Google Colab 和本地安装。通过优化算法,Ea...最新AI资源# AI开源项目# 口型同步12个月前058.5K
FunClip:智能剪辑视频内容为短片,轻松实现精准视频片段提取/裁剪综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具,由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型,可以准确识别视频中的语...最新AI资源# AI开源项目# AI语音转文本# AI音视频编辑11个月前058.5K
KAG:知识图谱与向量混合检索的专业知识库问答框架综合介绍 KAG (Knowledge Augmented Generation) 是一个基于OpenSPG引擎和大语言模型(LLMs)的逻辑形式引导的推理和检索框架。该框架专门用于构建专业领域知识库...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架11个月前058K
Danswer: 专注企业知识管理与文档搜索的AI助手,集成多种工作工具综合介绍 Danswer是一个开源的企业文档检索AI助手,旨在通过智能聊天界面和统一搜索功能,连接到团队的文档、应用程序和人员,提供统一的搜索和自然语言查询答案。确保用户数据和聊天记录完全由用户控制...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前057.8K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具综合介绍 PDF-Extract-Kit 是一个由 OpenDataLab 团队开发的开源项目,专注于从复杂多样的 PDF 文档中高效提取高质量内容。它集成了先进的文档解析技术,支持布局检测、公式识别...最新AI资源# AI开源项目# 文档提取与清洗9个月前057.6K
YOLOv12:实时图像和视频目标检测的开源工具综合介绍 YOLOv12 是由 GitHub 用户 sunsmarterjie 开发的一个开源项目,专注于实时目标检测技术。该项目基于 YOLO(You Only Look Once)系列框架,引入注...最新AI资源# AI开源项目# 视觉目标检测9个月前057K
Langflow:构建强大AI智能体和工作流的低代码工具综合介绍 Langflow 是一个低代码工具,专为开发人员设计,用于构建强大的AI代理和工作流。它支持使用任何API、模型或数据库,简化了复杂AI应用的开发过程。Langflow 提供直观的可视化界面...最新AI资源# AI开源项目# 低代码工作流1年前056.8K
FramePack:6G低显存快速生成长视频的开源项目综合介绍 FramePack 是一个开源的视频生成工具,专注于让视频扩散技术更实用。它通过独特的下一帧预测神经网络,将输入帧压缩到固定长度,使生成工作量与视频长度解耦。这意味着即使生成长视频,显存需求...最新AI资源# AI图像转视频# AI开源项目7个月前055.9K
SiYuan(思源笔记):隐私优先的个人知识管理软件,支持AI写作/问答聊天综合介绍: 思源笔记(SiYuan)是一款隐私优先的个人知识管理软件,完全开源并支持自托管。它采用TypeScript和Golang编写,提供细粒度的块级引用和Markdown所见即所得(WYSIWY...最新AI资源# AI开源项目# AI笔记10个月前055.5K
OpenCharacter:开源无审查的Character.AI替代品综合介绍 OpenCharacter是一个开源的角色创建工具,旨在为用户提供无过滤、无限制的AI角色创建与互动体验,作为Character.AI替代方案。用户可以使用本地模型创建和运行自己的角色,或者...最新AI资源# AI开源项目# AI角色扮演10个月前055K
Ollama OCR:使用Ollama中视觉模型提取图像中的文本综合介绍 Ollama OCR是一个强大的光学字符识别(OCR)工具包,它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用,也提供了用户友好的Strea...最新AI资源# AI开源项目# OCR# 文档提取与清洗11个月前055K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)综合介绍 口袋AI(PocketPal AI 中文版)是一款强大的离线AI助手,旨在让用户随时随地与AI进行对话。该项目基于小型语言模型(SLMs),无需联网即可在手机上运行,特别适配中文用户体验。口...最新AI资源# AI开源项目# AI本地化聊天应用10个月前054.9K
Docling:支持多种格式文档解析并导出为Markdown和JSON,PDF支持OCR综合介绍 Docling 是一个强大的文档解析和导出工具,支持多种文档格式,包括 PDF、DOCX、PPTX、XLSX、图像、HTML、AsciiDoc 和 Markdown。它能够将这些文档解析并导...最新AI资源# AI开源项目# OCR# 文档提取与清洗12个月前054.4K
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手综合介绍 OpenAI Codex CLI 是一个开源的终端编码工具,由 OpenAI 开发,专为习惯终端的开发者设计。它通过自然语言指令生成代码、编辑文件、执行命令,并集成 Git 版本控制。Cod...最新AI资源# AI开源项目# AI编程7个月前053.8K
WeWe RSS:生成微信公众号RSS订阅的开源工具综合介绍 WeWe RSS 是一个免费的开源工具,专门为微信公众号用户设计。它通过微信读书平台抓取公众号文章,生成 RSS 订阅源,让用户可以用 RSS 阅读器随时查看内容。这个工具解决了微信公众号信...最新AI资源# AI开源项目9个月前053.8K
DeepChat:支持与多个聊天并发会话的AI对话客户端综合介绍 DeepChat 是一个开源的智能助手项目,由 ThinkInAIXYZ 团队在 GitHub 上开发。它旨在通过强大的 AI 技术连接用户与数字世界,提供高效、自然的聊天体验。支持 Win...最新AI资源# AI开源项目# AI本地化聊天应用9个月前053.4K
roop-unleashed:基于Roop优化的全能换脸工具综合介绍 Roop-Unleashed 是一个基于 Python 的开源 AI 换脸工具,继承自 s0md3v 的 Roop 项目,由开发者 C0untFloyd 继续维护并更名为 Roop-Unle...最新AI资源# AI开源项目# AI换脸与换装# AI视频换脸7个月前053.1K
VSR:AI技术无损去除视频水印和硬字幕软件(视频去水印客户端7G+)综合介绍 视频字幕去除工具(Video-subtitle-remover,简称VSR)是一款基于AI技术的视频处理软件,专门用于去除视频中的硬字幕和文本水印。该工具采用了多种AI算法模型(STTN、L...最新AI资源# AI开源项目# AI音视频编辑11个月前052.8K
OpenBB:开源金融数据分析平台,集成私有数据集和 AI 来增强投资决策综合介绍 OpenBB 是一个免费且完全开源的金融数据分析平台,旨在为所有人提供便捷的金融数据访问和分析工具。平台集成了超过 100 个不同的数据源,涵盖股票、期权、加密货币、外汇、宏观经济指标、固定...最新AI资源# AI开源项目# AI金融数据分析10个月前052.7K
F5-TTS:少样本语音克隆,生成流畅且感情丰富的克隆声音综合介绍 F5-TTS 是一种新型非自回归文本到语音(TTS)系统,基于流匹配的扩散变换器(Diffusion Transformer, DiT)。该系统通过使用 ConvNeXt 模型来优化文本表示...最新AI资源# AI开源项目# AI语音克隆10个月前052.6K
Dify Connect MCP:Dify 工作流无缝集成 MCP(模型上下文协议)综合介绍 Dify Connect MCP 是一个开源项目,托管在 GitHub 上,旨在为 Dify 平台的用户提供一个便捷的工具,通过模型上下文协议(Model Context Protocol...最新AI资源# AI开源项目# MCP服务9个月前052.5K
Flux Gym:低显存训练FLUX LoRA的简易UI综合介绍 Flux Gym是一个简易的网页用户界面,用于训练FLUX LoRA,支持低显存(12GB/16GB/20GB)。前端基于AI-Toolkit的Gradio UI,后端由Kohya Scri...最新AI资源# AI图像生成辅助工具# AI开源项目1年前052.4K
Eino:字节跳动开源的Golang大模型应用开发框架综合介绍 Eino 是 CloudWeGo 团队推出的一款基于 Golang 的开源框架,旨在成为大模型(LLM)应用的终极开发工具。它汲取了 LangChain 和 LlamaIndex 等开源框架...最新AI资源# AI开源项目9个月前052.2K
LibreChat:模仿ChatGPT界面交互的AI对话开源项目综合介绍 LibreChat是一个免费、开源的AI聊天平台,拥有广泛的自定义选项,并支持多种AI提供商、服务和集成。它以熟悉的界面和创新功能集合所有AI对话于一体,支持多重AI模型、插件和多语言。通过...最新AI资源# AI开源项目# AI本地化聊天应用1年前052K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询综合介绍 Gemini Balance是一个基于FastAPI框架开发的OpenAI API代理服务,旨在提供高效的多API Key管理和优化功能。该项目支持Gemini模型调用,主要功能包括多API...最新AI资源# AI开源项目8个月前051.9K
Plate:AI驱动的富文本编辑器,支持丰富的插件扩展综合介绍 Plate 是一个由 AI 驱动的富文本编辑器,基于 React 和 TypeScript 构建,旨在提供高度可定制和扩展的编辑体验。它利用 Slate.js 作为核心,结合了现代化的 UI...最新AI资源# AI写作# AI开源项目12个月前051.6K
Evo2:支持基因组建模与设计的开源生物AI工具综合介绍 Arc Institute Evo 2 是一个专注于基因组建模与设计的开源项目,由位于美国加州帕洛阿尔托的非营利研究机构 Arc Institute 开发,并与 NVIDIA 等合作伙伴协作...最新AI资源# AI开源项目9个月前051.5K
KG Gen:从纯文本中自动生成知识图谱的开源工具综合介绍 KGGen 是由斯坦福可信人工智能研究实验室(STAIR Lab)开发的一款开源工具,托管于 GitHub,旨在从任意文本中自动生成知识图谱。它利用先进的语言模型和聚类算法,将非结构化的文本...最新AI资源# AI开源项目# 知识图谱9个月前051.4K
Coqui TTS(xTTS):文本到语音生成的深度学习工具包,支持多种语言和声音克隆功能综合介绍 Coqui TTS 是一个开源的高级文本到语音(TTS)生成工具包,基于深度学习技术。它经过研究和生产环境的实战测试,提供了丰富的功能和模型,支持多种语言的文本到语音转换。Coqui TTS...最新AI资源# AI开源项目# AI语音克隆10个月前051.2K
Chatbot UI:模仿ChatGPT界面和功能的开源AI聊天应用程序综合介绍 Chatbot UI 是一个开源项目,旨在帮助开发者创建个性化的智能对话界面。该项目提供了一系列界面组件和交互功能,可以轻松集成到现有的Chatbot系统中,为用户提供更加流畅和智能的对话体...最新AI资源# AI开源项目# AI本地化聊天应用1年前051.2K
Obsidian Copilot:在Obsidian中使用AI助手体验智能化笔记助手综合介绍 Obsidian Copilot是一款强大的Obsidian笔记软件AI助手插件,它将OpenAI的智能技术无缝集成到Obsidian笔记工作流中。这款插件由开发者Logan Yang创建...最新AI资源# AI开源项目# AI笔记11个月前051.1K
AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集,专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护,托...最新AI资源# AI图像生成辅助工具# AI开源项目# 大模型微调9个月前051.1K
XHS-Downloader:免费小红书数据采集工具,支持笔记批量下载、视频提取、图片去水印综合介绍 XHS-Downloader 是一个开源工具,专为小红书用户设计,支持提取和下载小红书上的无水印图片和视频作品。该工具提供多种功能,包括从浏览器获取 Cookie、支持命令行操作、批量下载...最新AI资源# AI开源项目1年前050.9K
Sim Studio:开源的AI代理工作流构建工具综合介绍 Sim Studio 是一个开源的 AI 代理工作流构建平台,专注于通过轻量、直观的可视化界面帮助用户快速设计、测试和部署大型语言模型(LLM)工作流。用户无需深入编程即可通过拖拽方式创建复...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架6个月前050.8K
Local File Organizer:本地文件整理助手,AI自动整理文件综合介绍 Local File Organizer 是一个由 AI 驱动的本地文件管理工具,旨在帮助用户整理和分类计算机上的文件。该工具利用先进的 AI 模型,如 Llama3.2 3B 和 Llav...最新AI资源# AI开源项目1年前050.7K
Open Notebook:个性化AI笔记工具,Notebook LM开源替代方案综合介绍 Open Notebook 是一个开源的、注重隐私保护的笔记管理工具,旨在为用户提供一个替代 Google Notebook LM 的解决方案。通过 Open Notebook,用户可以在自...最新AI资源# AI开源项目# AI笔记11个月前050.6K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS(视觉语言模型)的图形界面代理应用。该应用允许用户通过自然语言来控制计算机,实现更直观和高效的人机交互。UI-TAR...最新AI资源# AI开源项目# 桌面自动化智能体10个月前050.4K
MLX-Audio:基于 Apple MLX 框架的文本转语音工具综合介绍 MLX-Audio 是一个基于 Apple MLX 框架开发的开源工具,专注于文本转语音(TTS)和语音转语音(STS)功能。它充分利用 Apple Silicon(如 M 系列芯片)的强大...最新AI资源# AI开源项目# AI文本转语音9个月前050.3K
Nanobrowser:浏览器中实现任务自动化的多智能插件综合介绍 Nanobrowser 是一个开源的Chrome浏览器扩展,旨在通过AI驱动的多代理系统实现网页任务的自动化。它是一个免费替代OpenAI Operator的工具,用户只需提供自己的LLM...最新AI资源# AI开源项目# 桌面自动化智能体9个月前050.2K
LTX Video(LTXV):生成高质量视频的实时视频生成开源模型综合介绍 LTX-Video是由Lightricks开发的首个基于DiT(Diffusion Transformer)的实时视频生成模型。该模型能够在768x512分辨率下以24帧每秒的速度生成高质量...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频11个月前050.2K
Botgroup.chat:多个AI角色实时互动的群聊天应用综合介绍 Botgroup.chat 是一个基于 React 和 Cloudflare Pages 开发的开源 AI 群聊应用,旨在为用户提供一个类似微信群聊的交互体验。它支持多个 AI 角色同时参与...最新AI资源# AI开源项目# AI集成多模型对话平台9个月前049.9K
Vexa:实时会议转录与智能知识提取工具综合介绍 Vexa 是一个开源的实时会议转录和知识管理平台,旨在为企业和个人提供高效的会议记录与智能知识提取服务。它通过 API 驱动的会议机器人,自动加入 Google Meet、Zoom 等平台...最新AI资源# AI开源项目# AI文本与音频/视频总结工具# AI语音转文本7个月前049.8K
FlowGram.AI:快速创建节点式工作流的开源引擎综合介绍 Flowgram.ai 是由 ByteDance 开发的一款开源流程搭建引擎。它基于节点编辑,帮助开发者快速创建工作流程,支持固定布局和自由连线两种模式。项目使用 TypeScript 编写...最新AI资源# AI开源项目# 低代码工作流8个月前049.6K
Ragas:评估RAG召回QA准确率与答案相关性综合介绍 Ragas是一个专门用于评估和优化检索增强生成(RAG)系统的工具。它通过分析查询、检索上下文和生成答案之间的关系,提供了一套全面的评估指标。这些指标包括忠实度、答案相关性、上下文相关性、上...最新AI资源# AI开源项目# 知识检索与RAG框架10个月前049.5K
Orpheus-TTS:生成自然中文语音的文本转语音工具综合介绍 Orpheus-TTS 是一个开源的文本转语音(TTS)系统,基于 Llama-3b 架构开发,目标是生成接近人类自然语音的音频。它由 Canopy AI 团队推出,支持英语、西班牙语、法语...最新AI资源# AI开源项目# AI文本转语音8个月前049.3K
VITA:开源视觉与语音实时交互的多模态大语言模型综合介绍 VITA是一个领先的开源交互式多模态大语言模型项目,率先实现了真正的全方位多模态交互能力。该项目于2024年8月推出VITA-1.0版本,开创了首个开源交互式全模态大语言模型的先河。2024...最新AI资源# AI开源项目# 多模态实时互动产品11个月前049.1K