Second Me:本地训练拥有个人记忆和习惯的AI分身综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智...最新AI资源# AI开源项目# AI生活效率助手# 大模型微调5个月前02.9K
OWL:多智能体协作完成现实任务的自动化工具综合介绍 OWL(Optimized Workforce Learning)是由 CAMEL-AI 团队开发的一个开源框架,专注于优化多智能体协作以实现真实世界任务的自动化。基于 CAMEL-AI 架...最新AI资源# AI开源项目# 智能体开发框架5个月前02.9K
BetterWhisperX:自动语音识别与说话人分离,提供高精度单词级时间戳综合介绍 BetterWhisperX 是一个基于 WhisperX 项目的优化版本,专注于提供高效、准确的自动语音识别(ASR)服务。作为 WhisperX 的改进分支,该项目由 Federico ...最新AI资源# AI开源项目# AI语音转文本8个月前02.9K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。综合介绍 Markdown to Image 是一个用于将Markdown文本渲染为视觉上吸引人的社交媒体图片的React组件。该项目还包括一个内置的网页编辑器,可以作为在线Markdown到海报编辑...最新AI资源# AI开源项目9个月前02.9K
AI ContentCraft:生成短故事、对话脚本、配音、配图的多功能AI内容创作工具综合介绍 AI ContentCraft 是一个多功能的内容创作工具,集成了文本生成、语音合成、图像生成等功能。它可以帮助创作者快速生成故事、播客脚本和配套的音视频内容。该工具支持多种语言转换,能够批...最新AI资源# AI写作# AI开源项目7个月前02.9K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程综合介绍 VimLM是一个Vim插件,提供了一个由本地LLM(大语言模型)驱动的代码助手。通过Vim命令与本地LLM模型交互,自动获取代码上下文,帮助用户在Vim中进行代码编辑。VimLM的设计灵感来...最新AI资源# AI开源项目# AI编程6个月前02.9K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统综合介绍 FastAPI DocGPT 是一个基于 FastAPI 的文档问答系统,允许用户上传 PDF 文件并基于文档内容进行问答。该系统使用 OpenAI 的嵌入技术将文档内容嵌入到向量数据库 Q...最新AI资源# AI开源项目# AI文本与音频/视频总结工具9个月前02.9K
RAIN:实时捕捉真人表情生成动漫形象视频流综合介绍 RAIN(Real-time Animation Of Infinite Video Stream)是一个开源项目,旨在实现实时生成无限视频流的动画效果。该项目由Pscgylotti开发,提...最新AI资源# AI开源项目# AI视频转换风格7个月前02.9K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用综合介绍 ai-gradio是一个开源的Python工具包,旨在帮助开发者轻松集成和使用多种AI模型。该项目基于Gradio构建,提供了一个统一的接口,支持多种AI模型和服务。无论是文本、语音还是视频...最新AI资源# AI开源项目6个月前02.9K
Aggregator:一站式代理爬取与聚合平台,免费代理池(请合规使用)综合介绍 Aggregator 是一个开源项目,旨在打造一个免费代理池,能够爬取各种可用的代理节点。该平台具有灵活的插件系统,用户可以根据目标网站的特殊需求,通过插件实现特定功能。项目主要用于学习爬虫...最新AI资源# AI开源项目9个月前02.9K
Cognita:构建模块化RAG应用的开源框架,快速测试多样RAG策略综合介绍 Cognita 是由 TrueFoundry 开发的一个开源框架,旨在简化基于 RAG(Retrieval-Augmented Generation)的应用开发。该框架提供了一个结构化的、模...最新AI资源# AI开源项目# 无代码开发# 知识检索与RAG框架7个月前02.9K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试综合介绍 aisuite 是一个简单、统一的接口,旨在让开发者能够轻松调用多种生成式AI提供商的服务。通过类似于OpenAI的接口,aisuite 使得与最流行的LLM(大语言模型)进行交互变得更加容...最新AI资源# AI开源项目9个月前02.9K
MemFree:本地知识库与搜索信息混合的AI搜索引擎综合介绍 MemFree 是一个先进的混合AI搜索引擎,能够通过文本、图像、文件和网页进行搜索和提问。它提供一键获取文本、思维导图、图像和视频的搜索结果的功能。MemFree 的目标是从用户的知识库和...最新AI资源# AI开源项目# AI搜索工具10个月前02.9K
OuteTTS:实验性文本转语音模型,使用纯语言建模方法实现的TTS综合介绍 OuteTTS 是一种实验性文本转语音(TTS)模型,采用纯语言建模方法生成高质量语音。与传统的 TTS 系统不同,OuteTTS 不需要外部适配器或复杂的架构。该模型基于 LLaMa 架构...最新AI资源# AI开源项目# AI文本转语音6个月前02.9K
Qwen2.5-Omni:多模态输入和实时语音交互的端测模型综合介绍 Qwen2.5-Omni 是阿里巴巴云 Qwen 团队开发的一款开源多模态 AI 模型。它能处理文本、图像、音频和视频等多种输入,并实时生成文本或自然语音响应。这款模型于 2025 年 3 ...最新AI资源# AI开源项目# 多模态实时互动产品5个月前02.9K
VoiceCraft:开源零样本语音克隆与文本转语音工具综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具,基于神经编解码器语言模型。它采用了创新的编码序列生成方法,能够在已有语音序列上进行插入、删除和替换操作,生成自然、连贯的编辑语音...最新AI资源# AI开源项目# AI语音克隆10个月前02.9K
PocketFlow:100行代码实现AI应用开发的极简框架综合介绍 PocketFlow 是一个只有100行代码的轻量级AI应用开发框架,由 The-Pocket 团队开发并在 GitHub 上开源。它追求极简设计,核心代码控制在100行,没有任何外部依赖...最新AI资源# AI开源项目# 智能体开发框架# 知识图谱5个月前02.9K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具综合介绍 X-Kit是一个开源工具,专为抓取和分析X(原Twitter)用户数据和推文而设计。该工具由GitHub用户xiaoxiunique开发,旨在帮助用户自动化获取指定X用户的基本信息和推文,并...最新AI资源# AI开源项目8个月前02.9K
Translation Agent WebUI:吴恩达翻译智能体界面版,提供多种翻译API和Gradio界面综合介绍 Translation Agent WebUI 是一个基于 Gradio 的网页用户界面,专为 Andrewyng 的翻译代理(translation-agent)设计。该工具能够自动检测输...最新AI资源# AI开源项目# AI翻译8个月前02.9K
go-stock:AI赋能股票分析工具,自选股行情实时监控并基于AI深度分析综合介绍 go-stock 是一个基于 Wails 和 NaiveUI 构建的 AI 赋能股票分析工具。该工具能够实时监控自选股行情,提供成本盈亏展示和涨跌报警推送功能。所有数据均保存在本地,确保用户...最新AI资源# AI开源项目# AI金融数据分析6个月前02.9K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)综合介绍 Quanta Quest是全球首个以“端侧大模型+C端数据本地化”为核心演进方向的产品。它帮助用户将Gmail、Notion、Dropbox等所有数据存储到本地,并通过向量数据库进行处理,确...最新AI资源# AI开源项目# 知识检索与RAG框架10个月前02.9K
MiMo:高效数学推理与代码生成的小型开源模型综合介绍 MiMo 是小米公司开发的一个开源大语言模型项目,专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型,包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学...最新AI资源# AI开源项目3个月前02.9K
Tap4 AI WebUI:开源轻量级AI工具导航项目综合介绍 Tap4 AI WebUI 是一个开源的轻量级AI工具导航网站项目,旨在帮助用户轻松搭建自己的AI工具目录。该项目采用了Next.js和Supabase技术栈,支持多语言SEO优化,提供AI...最新AI资源# AI副业赚钱项目# AI开源项目10个月前02.9K
TransRouter:基于Gemini多模态模型,实时中英互译的音频转换工具综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具,专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中,为跨语言...最新AI资源# AI开源项目# 多模态实时互动产品7个月前02.9K
Ichigo(llama3-s):本地实时语音AI助手,开源版Siri综合介绍 Ichigo是一个开源的实时语音AI项目,旨在扩展基于文本的语言模型,使其具备原生的“听力”能力。该项目采用了早期融合技术,灵感来自Meta的Chameleon论文。Ichigo的目标是成为...最新AI资源# AI开源项目# 多模态实时互动产品7个月前02.9K
Spark-TTS:生成自然语音的文本转语音工具综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆5个月前02.9K
StreamingT2V:从文本到长视频的动态且可扩展的生成技术综合介绍 StreamingT2V是Picsart AI研究团队开发的一个公开项目,专注于根据文本描述生成连贯、动态且可扩展的长视频。这项技术使用先进的自回归方式,保证了视频的时间一致性,与描述文本紧...最新AI资源# AI开源项目# AI文本转视频9个月前02.9K
HelloMeme:生成局部高保真表情动作一致的图像或视频,Runway Act one 开源平替综合介绍 HelloMeme 是由 HelloVision 开发的一个开源项目,旨在通过集成空间编织注意力机制(Spatial Knitting Attentions)在扩散模型中嵌入高层次和高保真条...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格8个月前02.9K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展综合介绍 MultiPost-Extension 是一个功能强大的浏览器扩展,旨在帮助用户一键发布内容到多个社交媒体平台。该扩展支持同步发布到超过10个主流平台,包括知乎、微博、小红书、TikTok ...最新AI资源# AI开源项目# AI社交媒体6个月前02.9K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02.9K
R1-V:低成本强化学习实现视觉语言模型泛化能力综合介绍 R1-V 是一个开源项目,旨在通过低成本的强化学习(RL)实现视觉语言模型(VLM)的突破。该项目利用可验证的奖励机制,激励 VLMs 学习通用的计数能力。令人惊叹的是,R1-V 的 2B ...最新AI资源# AI开源项目6个月前02.9K
AI Video Starter Kit:在浏览器中全流程创作并编辑AI视频综合介绍 视频制作AI工具包(Video Starter Kit)是由fal-ai-community发布的一个开源项目,旨在展示如何在浏览器中利用AI模型进行视频制作。它提供了从图像到视频的转换工具...最新AI资源# AI开源项目# AI音视频编辑7个月前02.8K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结综合介绍 AI2SRT是一个开源项目,利用GeminiAI大模型,为长视频一键生成解说短视频和视频总结,同时支持音视频转录字幕。该项目旨在简化视频内容创作过程,提供高效的字幕生成和翻译功能。用户可以通...最新AI资源# AI开源项目# AI音视频编辑8个月前02.8K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字...最新AI资源# AI开源项目# AI数字人9个月前02.8K
Knowledge Graph Studio(WhyHow):创建和管理知识图谱的开源平台,RAG应用原生支持综合介绍 知识图谱工作室(Knowledge Graph Studio)是一个开源平台,旨在简化创建和管理RAG-native知识图谱的过程。该平台提供了基于规则的实体解析、模块化图谱构建、灵活的数据...最新AI资源# AI开源项目# 知识图谱8个月前02.8K
OpenManus-RL:微调大模型强化智能体推理与决策能力综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM...最新AI资源# AI开源项目# 大模型微调5个月前02.8K
ComfyUI-Copilot:文字描述生成 ComfyUI 工作流的AI助手综合介绍 ComfyUI-Copilot是一个专为ComfyUI框架设计的AI驱动自定义节点,旨在通过自然语言交互提升AI算法调试与部署的效率。它由AIDC-AI团队(阿里巴巴)开发并开源于GitHu...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI6个月前02.8K
XDOllama:适用于MacOS上快速调用Ollama\Dify\Xinference的AI模型界面。综合介绍 XDOllama 是一款专为 MacOS 用户设计的桌面应用程序,旨在快速调用 Ollama、Dify 和 Xinference 等 AI 模型。该应用程序通过简化的界面和操作流程,使用户能...最新AI资源# AI开源项目# AI本地化聊天应用9个月前02.8K
PDF to Podcast:将PDF转换为播客的实用工具综合介绍 受 Notebook LM 的播客生成特性和最近的 Open Notebook LM 开源实现的启发。在本食谱中,我们将实现一个关于如何构建 PDF 到播客管道的详细步骤。 给定任何 PDF...最新AI资源# AI开源项目10个月前02.8K
Diffbot GraphRAG LLM:依赖外部实时知识图谱数据的LLM推理服务综合介绍 Diffbot LLM推理服务器是一个创新的大规模语言模型系统,它基于LLama模型架构进行了特殊优化和改进。该项目最大的特点是将实时知识图谱(Knowledge Graph)与检索增强生成...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架7个月前02.8K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作综合介绍 CogAgent是由清华大学数据挖掘研究组(THUDM)开发的开源视觉语言模型,旨在实现跨平台的图形用户界面(GUI)自动化操作。该模型基于CogVLM(GLM-4V-9B),支持中英文双语...最新AI资源# AI开源项目# 桌面自动化智能体8个月前02.8K
code2prompt:将代码库转换为大模型可理解的prompt文件综合介绍 code2prompt 是一个开源的命令行工具,由开发者 Mufeed VH 创建并托管在 GitHub 上,旨在帮助用户将整个代码库快速转换为适合大语言模型(LLM)的提示(prompt...最新AI资源# AI开源项目5个月前02.8K
Open-LLM-VTuber:实时语音互动的Live2D动画AI虚拟伴侣综合介绍 Open-LLM-VTuber 是一个开源项目,允许用户通过语音和文字与大型语言模型(LLM)互动,并结合Live2D技术呈现动态虚拟角色。它支持Windows、macOS和Linux,可完...最新AI资源# AI开源项目# AI角色扮演5个月前02.8K
支持数据库查询的Dify插件综合介绍 dify-plugin-tools-dbquery 是一个专为 Dify 1.0 平台设计的开源插件,由开发者 junjiem 在 GitHub 上发布。它提供数据库查询功能,帮助用户在构建...最新AI资源# AI开源项目5个月前02.8K
WeClone:用微信聊天记录和语音训练数字分身综合介绍 WeClone 是一个开源项目,它通过微信聊天记录和语音消息,结合大语言模型和语音合成技术,让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型,还可以用少量语音样本生成逼真的声音...最新AI资源# AI开源项目# 大模型微调4个月前02.8K
OneFileLLM:整合多种数据源为单一文本文件综合介绍 OneFileLLM 是一个开源命令行工具,旨在将多种数据源整合成单一文本文件,方便输入大语言模型(LLM)。它支持处理 GitHub 仓库、ArXiv 论文、YouTube 视频转录、网页...最新AI资源# AI开源项目# 文档提取与清洗4个月前02.8K
Laminar:开源AI产品工程化平台,轻松实现数据可视化追踪与评估综合介绍 Laminar是一个开源的AI工程优化平台,专注于从第一原理出发进行AI工程。它帮助用户收集、理解和使用数据,以提高LLM(大型语言模型)应用的质量。Laminar提供了全面的可观测性、文本...AI新闻# AI开源项目8个月前02.8K
Step-Audio:多模态语音交互框架,识别语音并使用克隆语音交流等功能综合介绍 Step-Audio 是一个开源的智能语音交互框架,旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话(如中文、英文、日语)、情感语音(如快乐、悲伤)、区域方言(如粤语、四川...最新AI资源# AI开源项目# AI语音克隆# 多模态实时互动产品6个月前02.8K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本综合介绍 AutoMouser 是一个 Chrome 扩展程序,能够智能地跟踪用户交互,并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02.8K
Morphic:AI驱动的开源搜索引擎,提供智能问答、视频搜索、生成UI代码综合介绍 Morphic是一个基于AI技术的搜索引擎,采用生成式用户界面,旨在提供智能问答和高效搜索体验。用户可以通过Morphic进行多种搜索,包括文本、视频等,并能保存搜索历史,分享搜索结果。Mo...最新AI资源# AI开源项目# AI搜索工具9个月前02.8K
Reactive Resume:支持多语言、多模板的开源免费简历生成器综合介绍 Reactive Resume 是一个免费且开源的简历生成器,旨在简化创建、更新和分享简历的过程。该平台注重用户隐私,没有任何用户跟踪或广告。用户可以在不到30秒内自托管应用程序,完全掌控自...最新AI资源# AI开源项目# AI生活效率助手8个月前02.8K
RF-DETR:实时视觉对象检测开源模型综合介绍 RF-DETR 是 Roboflow 团队开发的一个开源对象检测模型。它基于 Transformer 架构,核心特点是实时高效。模型在微软 COCO 数据集上首次实现超过 60 AP 的实时...最新AI资源# AI开源项目# 视觉目标检测5个月前02.8K
Go-Proxy:Docker集成的高性能反向代理服务器综合介绍 Go-Proxy是一个使用Go语言开发的高性能代理服务器,主要用于在不同网络环境中提供代理服务。它支持多种协议,包括HTTP、HTTPS、SOCKS5、WebSocket、TCP和UDP,能...最新AI资源# AI开源项目6个月前02.8K
BotSharp:基于.NET的多智能体AI应开发与管理平台综合介绍 BotSharp是基于.NET Core的一个开源项目,致力于提供一个全面的AI聊天机器人平台构建工具。它采用C#编程,支持跨平台操作,旨在简化机器学习算法的应用,使企业级开发者能够高效地将...最新AI资源# AI开源项目# 智能体开发框架7个月前02.8K
在cloudflare部署hugging face的免费api,支持接口转发因国内部署无法访问hugging face,所以在大佬部署方案的基础上改造成能部署到cloudflare workers。 准备工作 1、注册 cloudflare 2、注册hugging fac...最新AI资源# AI开源项目# 免费大模型API10个月前02.8K
PPTAgent:自动生成和评估PPT演示文稿,文档转PPT综合介绍 PPTAgent是一个创新的系统,旨在从文档中自动生成演示文稿。该系统借鉴了人类创建演示文稿的方法,采用两步流程确保内容质量和视觉效果。此外,PPTAgent还引入了PPTEval,一个全面...最新AI资源# AI开源项目# AI生成演示文稿/PPT7个月前02.8K
1-2-1-MNVTON:高效图像、视频中人物虚拟试穿服装(待开放)综合介绍 1-2-1-MNVTON是一个基于GitHub的开源项目,旨在通过“Modality-specific Normalization for Virtual Try-On”(MNVTON)技术...最新AI资源# AI开源项目# AI换脸与换装7个月前02.8K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)综合介绍 Swarm是由OpenAI开发的一个实验性教育框架,旨在探索多代理系统的轻量级、可控和易于测试的接口。该框架主要用于展示代理之间的交接和例程模式,帮助开发者理解和实现多代理系统的协调与执行...最新AI资源# AI开源项目# 智能体开发框架7个月前02.8K
Telegram GPT Worker:部署在Cloudflare Workers上的多模型AI Telegram机器人综合介绍 GPT-Telegram-Worker 是一个基于 Cloudflare Workers 的多模型 AI Telegram 机器人,支持 OpenAI、Claude、Azure 等多个 AP...最新AI资源# AI开源项目# 智能体应用5个月前02.8K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词综合介绍 DeepSeek Engineer是一款基于DeepSeek API开发的强大编程助手工具,它能够通过直观的命令行界面与用户进行交互,协助完成各种软件开发任务。该工具将大型语言模型的能力与实...最新AI资源# AI开源项目6个月前02.8K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集综合介绍 llmstxt-generator 是一个专业的网站内容提取和整合工具,专门为大语言模型(LLM)的训练和推理准备高质量文本数据集。该工具由 Mendable AI 开发,采用 @firec...最新AI资源# AI开源项目# 文档提取与清洗7个月前02.8K
SimGRAG:利用相似子图进行知识图谱驱动的检索增强生成综合介绍 SimGRAG(SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented G...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架7个月前02.8K
Chatlog:提取和查询微信聊天记录的开源工具综合介绍 Chatlog 是一个开源工具,专注于从微信本地数据库提取和查询聊天记录。它支持微信 3.x 和 4.0 版本,覆盖 Windows 和 macOS 系统。用户可以通过命令行、终端界面或 H...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗4个月前02.8K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端综合介绍 Charla 是一个基于终端的聊天应用程序,旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端,支持上下文感知的对话,并将聊天会话保存为 Markdown 文件。用户可以通过简...最新AI资源# AI开源项目# AI本地化聊天应用7个月前02.8K
AigoTools:自动收录网站并支持多语言的开源AI工具导航站综合介绍 AigoTools 是一个开源AI网址导航,旨在帮助用户快速创建和管理导航站点。它内置站点管理和基于AI的自动收录功能,支持多语言、暗色/亮色主题切换,以及SEO优化。AigoTools 提...最新AI资源# AI副业赚钱项目# AI开源项目10个月前02.8K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)综合介绍 ChatTTS 是一个专为对话场景设计的生成语音模型。它能够生成自然且富有表现力的语音,支持多种语言和多位说话者,适用于互动对话。该模型通过预测和控制细粒度的韵律特征,如笑声、停顿和插话,超...最新AI资源# AI开源项目# AI文本转语音6个月前02.8K
OpenVoice(MyShell):多语言少样本即时语音克隆综合介绍 OpenVoice 是一个多功能的即时语音克隆方法,仅需使用参考说话者的短音频片段,即可复制其声音并生成多语言的语音。除了复制音色外,OpenVoice 还允许精细控制语音风格,包括情感...最新AI资源# AI开源项目# AI语音克隆10个月前02.8K
IndexTTS:支持中英文混合的文本转语音工具综合介绍 IndexTTS 是一个开源的文本转语音(TTS)工具,托管在 GitHub 上,由 index-tts 团队开发。它基于 XTTS 和 Tortoise 技术,通过改进模块设计,提供高效且...最新AI资源# AI开源项目# AI文本转语音5个月前02.8K
Wan2.1:在消费级 GPU 上生成高质量视频综合介绍 Wan2.1 是由 Wan-Video 团队开发并在 GitHub 上开源的一个视频生成工具套件,专注于通过人工智能技术推动视频创作的边界。它基于先进的扩散变换器架构,集成了独特的时空变分自...最新AI资源# AI开源项目# AI文本转视频5个月前02.8K
Trend Finder:实时追踪社交媒体趋势、热门话话题和新原文,助力营销决策综合介绍 Trend Finder 是一个强大的工具,旨在帮助用户实时追踪社交媒体上的热门话题和趋势。通过收集和分析关键影响者的帖子,Trend Finder 能够在检测到新趋势或产品发布时,及时发送...最新AI资源# AI开源项目# AI社交媒体7个月前02.8K
CoolCline:又一个增强版Cline智能编码助手,结合ClineRoo Cline和Bao Cline的优点综合介绍 CoolCline 是一个强大的编码助手,结合了 Cline, Roo Cline 和 Bao Cline 的最佳功能。它可以无缝地与您的命令行界面(CLI)和编辑器协同工作,为您带来最强大...最新AI资源# AI开源项目# AI编程7个月前02.8K
Languine:使用AI进行应用程序翻译,兼容所有主流 i18n 库综合介绍 Languine 是一个由 Midday 开发的强大翻译工具,旨在帮助开发者简化应用程序的本地化过程。通过 Languine,开发者可以利用 AI 技术快速生成准确且符合上下文的翻译,支持超...最新AI资源# AI开源项目# AI翻译8个月前02.8K
Babelfish.ai:浏览器运行的语音实时转录与翻译应用综合介绍 Babelfish.ai 是一个基于 Huggingface Transformer.js 和 Supabase Realtime 构建的实时转录和翻译应用。该应用可以在浏览器中加载大模型并...最新AI资源# AI开源项目# AI语音转文本11个月前02.8K
GPT-Crawler:自动爬取网站内容生成知识库文件综合介绍 GPT-Crawler 是由 BuilderIO 团队开发的一个开源工具,托管在 GitHub 上。它通过输入一个或多个网站 URL,爬取页面内容,生成结构化的知识文件(output.jso...最新AI资源# AI开源项目# 文档提取与清洗2个月前02.8K
DSPy Examples:展示DSPy功能的实用示例综合介绍 DSPy示例代码库是一个由Langtrace AI团队维护的GitHub代码库,展示了使用DSPy构建的各种AI程序示例。该代码库旨在通过实际示例展示DSPy的多种功能,帮助开发者更好地理解...最新AI资源# AI开源项目6个月前02.8K
Orama:高性能全文本和向量搜索引擎综合介绍 Orama 是一个开源的高性能搜索引擎,完全用 TypeScript 编写,支持全文本搜索、向量搜索和混合搜索。Orama 旨在在任何 JavaScript 运行时环境中工作,提供快速、可靠...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前02.8K
TableGPT Agent:专为分析复杂表格数据设计的智能工具综合介绍 TableGPT Agent 是一个基于 GitHub 开源项目的智能工具,专为处理和分析表格数据设计。它依托 TableGPT2 大语言模型,利用自然语言交互的方式,让用户能够轻松查询、操...最新AI资源# AI开源项目# AI数据分析6个月前02.8K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量综合介绍 DeepEval是一个简单易用的开源LLM评估框架,用于评估和测试大语言模型系统。它类似于Pytest,但专注于LLM输出的单元测试。DeepEval结合最新的研究成果,通过G-Eval、幻...最新AI资源# AI开源项目# PROMPTS辅助工具6个月前02.8K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具综合介绍 lightcard 是一个简洁优雅的卡片生成工具,旨在帮助用户轻松创建精美的内容卡片。该工具支持自定义文字内容、多种主题样式和二维码,让创作变得更加简单有趣。用户可以通过编辑标题、正文和作者...最新AI资源# AI开源项目8个月前02.8K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现综合介绍 AI Web Operator 是一个开源的 AI 浏览器操作工具,旨在通过集成多种 AI 技术和 SDK,简化用户在浏览器中的操作体验。该工具基于 Browserbase 和 Vercel...最新AI资源# AI开源项目# 多模态实时互动产品6个月前02.8K
Cog-ComfyUI:使用API运行ComfyUI工作流综合介绍 Cog-ComfyUI是一个开源项目,旨在通过API运行ComfyUI工作流。该项目由GitHub用户fofr创建,提供了一种高效的方式来集成和运行ComfyUI工作流。ComfyUI是一种...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI6个月前02.8K
Pyramid Flow:快手推出的开源版"可灵",基于SD3在少于8GB的GPU上运行(一键部署版)综合介绍 Pyramid Flow 是一种高效的自回归视频生成方法,基于 Flow Matching 技术。该方法通过在不同分辨率和噪声水平之间插值,实现了视频内容的生成和解压缩,具有更高的计算效率...最新AI资源# AI图像转视频# AI开源项目9个月前02.8K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型综合介绍 ModelBest 是一家专注于开发轻量高性能大模型的公司,致力于将先进的 AI 技术应用于日常生活中的主流消费电子和各类终端设备。其 MiniCPM 系列端侧模型以极致的算力和内存使用效率...最新AI资源# AI大模型原生对话工具# AI开源项目10个月前02.8K
Stagehand:自然语言实现浏览器自动化操作框架综合介绍 Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright,提供了三个简单的AI API(act、extract和observe),这些API构建在基础...最新AI资源# AI开源项目# 桌面自动化智能体7个月前02.8K
Cloudflare Serverless Registry:基于Cloudflare Workers的无服务器容器注册表综合介绍 Cloudflare Serverless Registry 是一个基于 Cloudflare Workers 和 R2 存储的无服务器容器注册表。它支持镜像的推送和拉取,并提供用户名密码和...最新AI资源# AI开源项目10个月前02.8K
FlowGram.AI:快速创建节点式工作流的开源引擎综合介绍 Flowgram.ai 是由 ByteDance 开发的一款开源流程搭建引擎。它基于节点编辑,帮助开发者快速创建工作流程,支持固定布局和自由连线两种模式。项目使用 TypeScript 编写...最新AI资源# AI开源项目# 低代码工作流5个月前02.8K
UniAPI:免服务器统一管理大模型API转发综合介绍 UniAPI 是一个兼容 OpenAI 协议的 API 转发器,核心功能是通过统一的 OpenAI 格式管理多个大模型服务商的 API,比如 OpenAI、Azure OpenAI、Clau...最新AI资源# AI开源项目5个月前02.8K
Data Formulator:AI驱动的数据可视化工具综合介绍 Data Formulator是由微软研究院开发的一款开源AI驱动的数据可视化工具。该工具结合了图形化用户界面(GUI)和自然语言输入(NL),使用户能够通过简单的交互和指令,快速创建和迭代...最新AI资源# AI开源项目# AI数据分析6个月前02.8K
PicMenu:文字菜单转换为美观的图文菜单综合介绍 PicMenu 是一个创新的 AI 工具,通过简单的拍照操作,将传统纸质菜单转化为生动直观的图片菜单。该工具不仅能自动生成每道菜品的高质量图像,还能提供丰富的菜品信息,为餐饮行业的数字化转型...最新AI资源# AI开源项目9个月前02.8K
Prompt Optimizer:优化主流AI模型提示词的开源工具综合介绍 Prompt Optimizer 是一个专注于提示词优化的开源工具,由 linshenkx 在 GitHub 上开发。它能够帮助用户通过智能算法优化 AI 模型的提示词,从而提升生成内容的质...最新AI资源# AI开源项目# PROMPTS辅助工具5个月前02.8K
Gemini Balance:Gemini模型API兼容OpenAI格式,解锁区域限制并支持多API Key轮询综合介绍 Gemini Balance是一个基于FastAPI框架开发的OpenAI API代理服务,旨在提供高效的多API Key管理和优化功能。该项目支持Gemini模型调用,主要功能包括多API...最新AI资源# AI开源项目4个月前02.8K
ANUS:任务自动化与多代理协作的开源 AI 框架综合介绍 ANUS(Advanced Neural Understanding System,高级神经理解系统)是一个托管在 GitHub 上的开源 AI 代理框架,由用户 nikmcfly 通过提示...最新AI资源# AI开源项目# 智能体开发框架5个月前02.8K
Kilo Code:具有简洁使用体验的Roo Code分支综合介绍 Kilo Code 是一个开源的 Visual Studio Code(简称 VS Code)扩展插件。它利用人工智能技术帮助用户更高效地编写代码。这个项目由 Kilo-Org 团队开发,最...最新AI资源# AI IDE# AI开源项目# AI编程5个月前02.8K
GeminiCoder:基于LlamaCoder项目,使用Gemini API快速生成Web应用程序综合介绍 GeminiCoder是一个基于Google Gemini API开发的创新型Web应用程序生成工具。该项目继承了 LlamaCoder 的优秀特性,并集成了最新的Gemini 1.5 Pr...最新AI资源# AI开源项目# AI编程8个月前02.8K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!综合介绍 MindSearch是由上海人工智能实验室推出的一款开源AI搜索引擎框架,旨在模拟人类的思维过程进行复杂信息搜集与整合。该工具结合了大规模语言模型(LLM)与搜索引擎的先进技术,通过多智能体...最新AI资源# AI开源项目# AI搜索工具8个月前02.8K
SpeechGPT 2.0-preview:实时交互的端到端拟人语音对话大模型综合介绍 SpeechGPT 2.0-preview 是 OpenMOSS 推出的首个拟人化实时交互系统,基于百万小时级语音数据训练而成。该系统具备拟人口语化表达与百毫秒级低延迟响应,支持自然流畅的实...最新AI资源# AI开源项目# 多模态实时互动产品6个月前02.8K
Executive AI Assistant:AI行政助理,提醒阅读邮件并规划工作日程综合介绍 Executive AI Assistant(EAIA)是一个基于人工智能的助理工具,旨在帮助用户自动化管理日常任务。该工具由LangChain开发,能够处理电子邮件、安排日程、管理任务等...最新AI资源# AI开源项目# AI生活效率助手7个月前02.8K
OpenAI WebRTC Python:与OpenAI实时API进行语音交互的Python库综合介绍 OpenAI Realtime WebRTC Python是一个专业的Python库,为开发者提供了与OpenAI实时API进行语音交互的完整解决方案。该项目基于WebRTC技术,实现了低延...最新AI资源# AI开源项目7个月前02.8K
Open Deep Research:生成基于网络搜索内容的AI研究报告综合介绍 Open Deep Research是一个开源的AI驱动研究报告生成工具,作为Google Gemini深度研究功能的开源替代方案。该项目采用TypeScript开发,基于Next.js 1...最新AI资源# AI开源项目# 生成深度研究报告4个月前02.8K