Hibiki:实时语音翻译模型,保留原声特点的流式翻译综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同,Hibiki 能够在用户讲话的同时,实时生成目标语言的自然语音翻译,并提供文本翻译。该模...最新AI资源# AI开源项目# AI翻译6个月前03.2K
Fullmoon:本地大语言模型聊天的iOS应用综合介绍 Fullmoon是一款专为iOS设备设计的应用程序,旨在提供与本地大语言模型进行私密聊天的功能。该应用优化了Apple Silicon,支持在iPhone、iPad和Mac上运行。用户的聊天...最新AI资源# AI开源项目# AI本地化聊天应用6个月前03.2K
Insanely Fast Whisper:快速高效的转录语音为文本的开源项目综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术(如Transformers, Optimum, Flash Attention)的音频转...最新AI资源# AI开源项目# AI语音转文本7个月前03.2K
MiniRAG:简化检索增强生成框架,实体图索引召回相关文本块综合介绍 MiniRAG是一个极其简单的检索增强生成(RAG)框架,旨在通过异构图索引和轻量级拓扑增强检索,使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室(HKUDS)开发,主要解决...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架7个月前03.2K
Comics Downloader:开源免费漫画下载器,支持PDF、EPUB、CBR、CBZ格式漫画下载综合介绍 Comics Downloader 是一个开源工具,旨在帮助用户从各种网站下载漫画和漫画书。该工具支持多种文件格式,包括 PDF、EPUB、CBR 和 CBZ,使用户能够根据自己的需求选择合...最新AI资源# AI开源项目8个月前03.2K
SadTalker:让照片说话|嘴型同步音频|合成口型同步视频|免费数字人综合介绍 SadTalker是一个开源工具,能够将单张静态人像照片和音频文件结合,创造出逼真的说话头像视频,适用于个性化信息、教育内容等多种场景。革命性地使用3D建模技术,如ExpNet和PoseVA...最新AI资源# AI开源项目# AI数字人# 口型同步6个月前03.2K
BlinkShot:输入提示词实时生成图像(免费接入Flux Schnell模型)综合介绍 BlinkShot 是一个开源的实时AI图像生成器,利用Together AI和Flux Schnell技术,用户可以在输入提示的同时生成高质量的图像。该平台完全免费,支持用户自定义和二次开...最新AI资源# AI在线生成图像# AI开源项目10个月前03.2K
Llama OCR:利用免费Llama 3.2 Vision接口,三行代码将图像转换为Markdown的OCR库综合介绍 Llama OCR 是一个基于 Llama 3.2 Vision 的 OCR(光学字符识别)库,能够将文档转换为 Markdown 格式。该库由 Nutlope 开发,使用 Together...最新AI资源# AI开源项目# OCR# 免费大模型API8个月前03.2K
KG Gen:从纯文本中自动生成知识图谱的开源工具综合介绍 KGGen 是由斯坦福可信人工智能研究实验室(STAIR Lab)开发的一款开源工具,托管于 GitHub,旨在从任意文本中自动生成知识图谱。它利用先进的语言模型和聚类算法,将非结构化的文本...最新AI资源# AI开源项目# 知识图谱6个月前03.2K
MeetingMind:依赖OpenAI Whisper的开源智能会议记录与总结工具综合介绍 MeetingMind 是一个先进的 AI 应用程序,旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术,用于准确的语音转文字,并使用 IBM Watso...最新AI资源# AI开源项目# AI文本与音频/视频总结工具10个月前03.2K
Eino:字节跳动开源的Golang大模型应用开发框架综合介绍 Eino 是 CloudWeGo 团队推出的一款基于 Golang 的开源框架,旨在成为大模型(LLM)应用的终极开发工具。它汲取了 LangChain 和 LlamaIndex 等开源框架...最新AI资源# AI开源项目5个月前03.2K
Clone Voice:支持多语言的少样本声音克隆工具,基于xtts_v2提供Windows一键安装包综合介绍 Clone Voice 是一个开源的声音克隆工具,提供了一个基于Web的界面,允许用户利用任何声音或个人声音录制来克隆声音。该工具操作简单,即使没有NVIDIA GPU,也可以通过预编译的应...最新AI资源# AI开源项目# AI语音克隆10个月前03.2K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像综合介绍 Watermark Removal 是一个开源项目,利用机器学习和深度学习技术进行图像修复,专门用于去除图像中的水印。该项目由 Chimzuruoke Okafor 开发,灵感来源于 Con...最新AI资源# AI开源项目# AI抠图改背景6个月前03.2K
留痕(WeChatMsg):微信聊天记录导出与分析工具综合介绍 WeChatMsg是一个开源项目,位于GitHub平台。该工具旨在提供微信用户一种方法,可以提取和导出微信聊天记录成各种文档(HTML、Word、CSV),并支持生成聊天数据的可视化年度报告...最新AI资源# AI开源项目1年前03.2K
Dify-WebUI:基于Dify API的桌面智能对话客户端,提供企业级AI对话能力综合介绍 Dify-WebUI 是一个基于 Dify API 的现代化桌面智能对话应用,旨在为企业提供强大的 AI 对话能力。该应用支持多种预设主题颜色,满足企业个性化需求,并且具备知识库管理功能,支...最新AI资源# AI开源项目# AI本地化聊天应用7个月前03.2K
MetaGPT:多智能体协作框架,构建 AI 软件开发团队实现自然语言编程综合介绍 MetaGPT 是一个创新的多智能体框架,旨在模拟一个完整的 AI 软件公司的运作模式。该项目由geekan(Alexander Wu)创建,目标是将不同角色的GPT模型组合成一个协作实体...最新AI资源# AI开源项目# AI编程# 智能体开发框架5个月前03.2K
n8n自托管AI入门套件:快速搭建本地AI环境的开源模板综合介绍 n8n自托管AI入门套件是一个开源的Docker Compose模板,旨在快速初始化一个全面的本地AI和低代码开发环境。由n8n团队精心策划,该套件结合了自托管的n8n平台和一系列兼容的AI...最新AI资源# AI开源项目6个月前03.1K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释综合介绍 GPT Academic 是一个专门为学术研究优化的大语言模型交互平台,为 GPT/GLM 等大语言模型提供实用化交互接口的工具,特别优化了论文翻译、论文阅读、润色和写作体验。它采用模块化设...最新AI资源# AI开源项目# AI教育工具# 论文9个月前03.1K
Firecrawl MCP Server:基于 Firecrawl 的网页爬虫 MCP 服务综合介绍 Firecrawl MCP Server 是由 MendableAI 开发的一款开源工具,基于 Model Context Protocol (MCP) 协议实现,与 Firecrawl A...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗5个月前03.1K
Easy Voice Toolkit:本地部署的AI语音工具箱综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱,提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆11个月前03.1K
基于Qdrant向量搜索引擎构建的MCP服务综合介绍 mcp-server-qdrant 是一个基于 Qdrant 向量搜索引擎构建的 Model Context Protocol (MCP) 服务器。它主要用来帮助 AI 系统存储和检索记忆...最新AI资源# AI开源项目# MCP服务5个月前03.1K
AIEditor:创建AI驱动的富文本编辑器,支持多种前端框架综合介绍 AIEditor 是一个由 AI 驱动的下一代富文本编辑器,基于 Web Component 开发,支持 Vue、React、Angular 等几乎所有主流前端框架。它兼容 PC Web 和...最新AI资源# AI写作# AI开源项目7个月前03.1K
MobileAgent:多代理协作的移动设备操作助手综合介绍 MobileAgent 是一个强大的移动设备操作助手,旨在通过多代理协作和增强的视觉感知模块,提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发,支持 Android 和 ...最新AI资源# AI开源项目# 桌面自动化智能体7个月前03.1K
YOLOv12:实时图像和视频目标检测的开源工具综合介绍 YOLOv12 是由 GitHub 用户 sunsmarterjie 开发的一个开源项目,专注于实时目标检测技术。该项目基于 YOLO(You Only Look Once)系列框架,引入注...最新AI资源# AI开源项目# 视觉目标检测6个月前03.1K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo综合介绍 LogoCreator是一个基于Together AI和Flux模型的开源Logo生成器,专注于为企业和个人提供快速、专业的Logo设计服务。该项目由开发者Nutlope开发并开源,在Git...最新AI资源# AI图像风格控制# AI开源项目8个月前03.1K
OpenAI Edge TTS:利用 Edge TTS 的免费文本转语音API,兼容 OpenAI 格式综合介绍 OpenAI Edge TTS 是一个开源项目,提供与 OpenAI 兼容的本地文本转语音(TTS)API。该项目使用 Microsoft Edge 的在线文本转语音服务,允许用户生成高质量...最新AI资源# AI开源项目# AI文本转语音7个月前03.1K
SynthLight:对肖像图像进行自然光照渲染(未发布)综合介绍 SynthLight 是一个基于扩散模型的肖像重光照工具。它通过学习重新渲染合成的人脸图像,实现对真实肖像照片的光照效果调整。该工具利用物理渲染引擎生成数据集,模拟不同光照条件下的光照转换...最新AI资源# AI图像风格控制# AI开源项目7个月前03.1K
AI蜂巢:基于 Java 的多功能 AI聊天集成平台综合介绍 AI 蜂巢(ai-beehive)是一个基于 Java 语言,采用 Spring Boot 3 和 JDK 17 构建的多功能 AI 平台。该项目整合了多种 AI 技术,包括 ChatGPT...最新AI资源# AI副业赚钱项目# AI开源项目# AI本地化聊天应用9个月前03.1K
AI Toolkit by Ostris:Stable Diffusion与FLUX.1模型训练工具包综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集,专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护,托...最新AI资源# AI图像生成辅助工具# AI开源项目# 大模型微调5个月前03.1K
文多多 AiPPT:AI生成PPT,演讲稿生成综合介绍 AiPPT 是一个基于人工智能技术的PPT生成工具,旨在帮助用户快速创建专业演示文稿。它通过输入主题、上传文件或提供网址等方式,自动生成内容丰富、设计精美的幻灯片,支持原生图表、动画和3D特...最新AI资源# AI开源项目# AI生成演示文稿/PPT6个月前03.1K
NarratoAI:文本生成影视解说与自动化剪辑神器综合介绍 NarratoAI 是一个集影视解说、自动化剪辑、配音和字幕生成于一体的全自动化工具。它依托大型语言模型(LLM)技术,自动生成文案,并自动剪辑视频,配上相应的配音和字幕,为用户提供一站式的...最新AI资源# AI副业赚钱项目# AI开源项目# AI文本转视频11个月前03.1K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude综合介绍 Model Context Provider CLI(mcp-cli)是一个用于与模型上下文提供服务器交互的协议级命令行工具。该工具允许用户发送命令、查询数据并与服务器提供的各种资源进行交互...最新AI资源# AI开源项目# MCP服务5个月前03.1K
Repomix:打包代码库为一个文本文件以便大模型检索综合介绍 Repomix(前称Repopack)是一款开源工具,专门用于将整个代码库打包成一个单一的、AI友好的文件。这个工具可以让开发者轻松地将他们的代码库提供给大语言模型(如Claude、Chat...最新AI资源# AI开源项目# 文档提取与清洗7个月前03.1K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格综合介绍 YuE是一个开源的全歌曲生成基础模型,专注于将歌词转化为完整的歌曲。与其他仅能生成短片段非声乐音乐的模型不同,YuE能够生成包含主唱和伴奏的完整歌曲,时长可达数分钟。该模型解决了音乐生成中的...最新AI资源# AI开源项目# AI音乐6个月前03.1K
PromptWizard:优化提示工程的开源框架,提升任务性能综合介绍 PromptWizard是微软开发的一个开源框架,采用自我进化机制,可以让模型自己生成、评价和改进提示词及生成示例,通过不断反馈来提高输出质量。它能够自主优化提示词、生成和选择合适的示例、并...最新AI资源# AI开源项目8个月前03.1K
TF-ID:学术论文表格/图像识别工具综合介绍 TF-ID(Table/Figure IDentifier)是一个专门用于从学术论文中提取表格和图像的对象检测模型家族。该项目由Yifei Hu创建,并在GitHub上开源。TF-ID模型经...最新AI资源# AI开源项目11个月前03.1K
NocoDB:在多种数据库上创建智能表格,开源Airtable替代方案综合介绍 NocoDB 是一个开源的Airtable替代方案,旨在提供一个强大且易于使用的在线数据库管理工具。通过NocoDB,用户可以轻松创建、读取、更新和删除数据库中的数据,无需编写代码。该平台支...最新AI资源# AI开源项目# AI数据分析10个月前03.1K
Llasa 1~8B:高品质语音生成和克隆的开源文本转语音模型综合介绍 Llasa-3B是由香港科技大学音频实验室(HKUST Audio)开发的一个开源文本转语音(TTS)模型。该模型基于Llama 3.2B架构,经过细致调优,提供高质量的语音生成,不仅支持多...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆6个月前03.1K
NSFW Detector:检测文件是否包含不适(NSFW)内容,保护数据安全综合介绍 NSFW Detector 是一个基于 AI 的不适内容检测工具,主要用于检测图像、视频、PDF 文件等是否包含不适内容。该工具采用了 Falconsai/nsfwimagedetectio...最新AI资源# AI图像生成辅助工具# AI开源项目8个月前03.1K
Cua:让AI代理在macOS/Linux沙盒中安全执行应用综合介绍 Cua 是一个开源项目,全称“Computer-Use Agent”(计算机使用代理),读作“koo-ah”。它专为 Apple Silicon 设备设计,能创建并运行高性能的 macOS ...最新AI资源# AI开源项目4个月前03.1K
AIGCPanel:开源克隆数字人整合系统,一键部署免费数字人客户端综合介绍 AigcPanel是一款面向所有用户的一站式AI数字人制作系统,采用electron+vue3+typescript技术栈开发,支持Windows系统一键部署。系统设计以用户友好为核心,即使...最新AI资源# AI开源项目# AI数字人7个月前03.1K
口袋AI:手机中运行的离线AI助手,适配 DeepSeek-R1 (5.37GB)综合介绍 口袋AI(PocketPal AI 中文版)是一款强大的离线AI助手,旨在让用户随时随地与AI进行对话。该项目基于小型语言模型(SLMs),无需联网即可在手机上运行,特别适配中文用户体验。口...最新AI资源# AI开源项目# AI本地化聊天应用6个月前03.1K
Datalab:专用OCR识别AI模型,PDF转Markdown(开源/API)综合介绍 Datalab 提供了一系列先进的AI模型,专注于OCR、布局分析、PDF转Markdown等功能。这些模型不仅性能卓越,而且易于使用,并且是开源的。平台上的Marker模型可以快速准确地将...最新AI资源# AI开放服务# AI开源项目# OCR9个月前03.1K
DeepChat:支持与多个聊天并发会话的AI对话客户端综合介绍 DeepChat 是一个开源的智能助手项目,由 ThinkInAIXYZ 团队在 GitHub 上开发。它旨在通过强大的 AI 技术连接用户与数字世界,提供高效、自然的聊天体验。支持 Win...最新AI资源# AI开源项目# AI本地化聊天应用5个月前03.1K
CrewAI:多角色扮演协作智能框架,简化复杂任务综合介绍 CrewAI 是一个先进的框架,旨在协调角色扮演和自主AI代理的协作。通过促进协作智能,CrewAI 使代理能够无缝协作,解决复杂任务。无论是构建智能助手平台、自动化客户服务团队,还是多代理...最新AI资源# AI开源项目# 智能体开发框架8个月前03.1K
Zonos:高质量语音合成与语音克隆工具综合介绍 Zonos 是由 Zyphra 开发的一款开源语音合成与语音克隆工具。Zonos-v0.1 版本采用了先进的 Transformer 和混合模型,能够生成高质量的语音输出。该工具支持多种语言...最新AI资源# AI开源项目# AI语音克隆6个月前03.1K
百聆 (Bailing):低延时的开源语音对话助手,轻松实现自然对话交流综合介绍 百聆(Bailing)是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,实现了...最新AI资源# AI开源项目# 多模态实时互动产品7个月前03.1K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题综合介绍 Marco-o1是由阿里巴巴国际数字商业集团(AIDC-AI)开发的开放式推理模型,旨在解决复杂的现实世界问题。该模型结合了思维链(CoT)微调、蒙特卡洛树搜索(MCTS)和创新的推理策略...最新AI资源# AI开源项目8个月前03.1K
OpenAI Codex CLI:OpenAI发布的终端命令行AI编码助手综合介绍 OpenAI Codex CLI 是一个开源的终端编码工具,由 OpenAI 开发,专为习惯终端的开发者设计。它通过自然语言指令生成代码、编辑文件、执行命令,并集成 Git 版本控制。Cod...最新AI资源# AI开源项目# AI编程4个月前03.1K
OpenManus:MetaGPT推出的开源版Manus综合介绍 OpenManus 是一个开源项目,旨在帮助用户通过简单配置在本地运行智能体,实现各种创意想法。它由 MetaGPT 社区的成员 @mannaandpoem、@XiangJinyu、@Mos...最新AI资源# AI开源项目# 智能体开发框架5个月前03.1K
PhotoDoodle:文字指令为照片添加艺术涂鸦的AI工具综合介绍 PhotoDoodle 是一个开源的图像编辑工具,由 ShowLab 开发,专注于通过人工智能技术实现照片的艺术化编辑。用户只需输入简单的文本提示词,就能为真实照片添加卡通风格、3D效果、光...最新AI资源# AI图像编辑# AI开源项目5个月前03.1K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。综合介绍 Ant Design X是蚂蚁集团开源的一个工具包,旨在帮助开发者快速构建AI驱动的对话界面。它提供了丰富的组件和模板,支持与OpenAI标准兼容的模型集成,适用于智能客服、AI助手等多种应...最新AI资源# AI开源项目9个月前03.1K
Mahilo:连接不同AI智能体框架实时协作的集成平台综合介绍 Mahilo 是一个开源的多智能体集成平台,由开发者 Jayesh Sharma 在 GitHub 上发布,旨在帮助用户连接来自不同框架的 AI 智能体,支持实时通信、人机交互及智能协作。该...最新AI资源# AI开源项目# 智能体开发框架5个月前03.1K
J.A.R.V.I.S.:具有上下文感知的智能代码助手,生成和修改代码,多IDE支持综合介绍 J.A.R.V.I.S.(Just A Rather Very Intelligent System)是一个智能代码助手,旨在利用多种最先进的语言模型来帮助开发者进行代码生成、修改和技术讨论...最新AI资源# AI开源项目# AI编程7个月前03.1K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统综合介绍 VideoReTalking是一款创新的系统,允许用户根据输入音频生成唇形同步的面部视频,即使有不同的情绪,也能产生高质量且嘴唇同步的输出视频。系统将这一目标分解为三个连续任务:带有典型表情...最新AI资源# AI开源项目# 口型同步8个月前03.1K
ChatOllama:基于Nuxt 3和Ollama的本地实时聊天应用UI综合介绍 ChatOllama是一个基于大型语言模型(LLM)的开源在线聊天应用项目,支持众多语言模型和知识库管理。用户可以通过该平台进行模型管理(列表展示、下载、删除)、与模型聊天等功能。项目运用了...最新AI资源# AI开源项目# AI本地化聊天应用# 知识检索与RAG框架10个月前03.1K
Quantum Swarm:多智能体集群协作框架Quantum Swarm 是一个开源的人工智能框架,专注于开发和研究AI群体智能。该项目由Quarm AI团队在GitHub上维护,旨在提供一个灵活且高效的平台,用于构建和测试多智能体系统。Quan...最新AI资源# AI开源项目# 智能体开发框架7个月前03.1K
Easegen:开源数字人课程制作平台,PPT一键生成克隆数字人讲解视频综合介绍 Easegen 是一个开源的数字人课程制作平台,旨在通过 AI 技术提升教学内容的制作和管理效率。该平台提供从课程制作、视频管理到智能出题的一站式解决方案,用户可以创建数字人讲解的视频课程...最新AI资源# AI开源项目# AI教育工具# AI文本转视频10个月前03.1K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面综合介绍 Ortlin是一个基于Web的图形用户界面,旨在帮助任何人(无论是技术用户还是非技术用户)轻松地与OpenAI的API和底层模型进行交互。它完全免费且开源,使用户能够无障碍地利用OpenAI...最新AI资源# AI开源项目# AI本地化聊天应用10个月前03.1K
DreamTalk:使用一张头像图片即可生成表情丰富的说话视频DreamTalk 综合介绍 DreamTalk是一个扩散模型驱动的表情说话头生成框架,由清华大学、阿里巴巴集团和华中科技大学联合开发。主要由降噪网络、风格感知嘴唇专家和风格预测器三部分构成,能够基于...最新AI资源# AI开源项目# AI数字人# 口型同步8个月前03.1K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行综合介绍 Sana 是由 NVIDIA 实验室开发的一种高效高分辨率图像生成框架,能够在几秒钟内生成最高 4096 × 4096 分辨率的图像。Sana 采用线性扩散变换器和深度压缩自编码器技术,显著...最新AI资源# AI开源项目# AI自部署图像生成工具9个月前03K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS(视觉语言模型)的图形界面代理应用。该应用允许用户通过自然语言来控制计算机,实现更直观和高效的人机交互。UI-TAR...最新AI资源# AI开源项目# 桌面自动化智能体7个月前03K
Scira(MiniPerplx):模仿Perplexity的开源项目,集成AI对话、网页搜索、天气查询等功能综合介绍 MiniPerplx(更名为Scira)是一个极简主义设计的AI驱动搜索引擎,它整合了多种实用功能,为用户提供全方位的信息检索服务。该项目采用现代化的技术栈,包括Next.js、Tailwi...最新AI资源# AI开源项目# AI搜索工具7个月前03K
n8n-mcp-server:与n8n工作流交互的MCP服务工具综合介绍 n8n-mcp-server 是一个开源项目,托管在 GitHub 上,由 Leonard Sellem 开发。它是一个 MCP(Model Context Protocol)服务工具,专门...最新AI资源# AI开源项目# MCP服务5个月前03K
OpenUtau:免费的开源歌声合成编辑工具综合介绍 OpenUtau 是一个免费的开源歌声合成编辑平台,旨在为 UTAU 社区提供现代化编辑体验。它是 UTAU 软件的继任者,解决原软件兼容性和操作复杂的问题。OpenUtau 支持 Wind...最新AI资源# AI开源项目# AI音乐4个月前03K
k8m:简化Kubernetes集群管理的轻量级AI控制台工具综合介绍 k8m 是一款轻量级、跨平台的 Mini Kubernetes AI Dashboard,专为简化集群管理设计。它基于 AMIS 构建,并通过 kom 作为 Kubernetes API 客...最新AI资源# AI开源项目7个月前03K
Retrieval based Voice Conversion WebUI:基于检索的语音转换框架|模拟真人歌声综合介绍 Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低...最新AI资源# AI开源项目# AI语音克隆10个月前03K
MJML:轻松设计响应式邮件,配合ChatGPT快速生成营销邮件综合介绍 MJML(邮件界标记语言)是由 Mailjet 团队开发的一个开源框架,旨在简化响应式邮件模板的创建。通过语义化的标记语言和丰富的组件库,开发者可以用更少的代码高效创建美观且功能强大的电子邮...最新AI资源# AI开源项目12个月前03K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架综合介绍 AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基...最新AI资源# AI开源项目# 无代码开发# 智能体开发框架2个月前03K
OpenWebUI-Monitor:监控OpenWebUI用户活动,管理使用限额,支持一键部署。综合介绍 OpenWebUI-Monitor 是一个用于监控 OpenWebUI 用户活动和管理使用限额的仪表板。它可以高效地设置用户配额,实时查看用户数据和可视化信息,支持一键部署,方便用户管理和监...最新AI资源# AI副业赚钱项目# AI开源项目9个月前03K
WrenAI:对话式数据分析AI助手,直接获取答案、SQL查询与分析报表综合介绍 WrenAI是一个开源的SQL AI助手,专门设计用于帮助数据团队、产品团队和业务团队通过自然语言对话的方式获取数据洞察。它能够将自然语言转换为SQL查询,生成图表、电子表格和报告,支持多语...最新AI资源# AI开源项目# AI数据分析7个月前03K
PantoMatrix(EMAGE):全身手势生成框架,从音频生成全身手势的3D动画框架综合介绍 PantoMatrix是一个先进的全身手势生成框架,能够从音频和部分手势生成完整的人体动作,包括面部、局部身体、手部和全身动作。该框架利用了最新的多模态数据集和深度学习技术,提供高质量的3D...最新AI资源# AI开源项目9个月前03K
CoAI.Dev (Chat Nio):AI聚合应用 一站式 B/C 端解决方案,支持弹性计费和订阅计划模式综合介绍 CoAI.Dev (原 Chat Nio) 是一个集成多种AI模型的聊天平台,支持分布式流式传输、图像生成、跨设备对话同步及分享等功能。它实现了订阅和Token计费系统,Key中转服务以及多...最新AI资源# AI副业赚钱项目# AI开源项目# AI本地化聊天应用9个月前03K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所(IMS)开发的一个先进的文本转语音(TTS)工具包。该工具包支持超过7000种语言,具有快速、可控且计算资源需求低的特点。IMS...最新AI资源# AI开源项目# AI文本转语音6个月前03K
DeepCoder-14B-Preview:擅长代码生成的的开源模型综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...最新AI资源# AI开源项目# 大模型微调4个月前03K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器表格识别的目标是解析图片中的表格,准确识别表格结构和单元格位置,并将其还原为结构化的表格格式(例如 HTML)。在当今信息化时代,大量重要的表格数据仍以非结构化状态存在(如扫描文档中的信息统计表图片...最新AI资源# AI开源项目# 文档提取与清洗5个月前03K
pdf2htmlEX:PDF无损转换为HTML,保持文本格式,适用于学术论文和杂志排版综合介绍 pdf2htmlEX 是一个开源工具,旨在将 PDF 文件转换为 HTML 格式,通过分析 PDF 文件的内容并使用 HTML + CSS 精确还原其视觉效果, 将 PDF 文档转换为浏览器...最新AI资源# AI开源项目# 文档提取与清洗9个月前03K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频综合介绍 Goku是一款基于流变换技术的联合图像和视频生成模型,旨在实现行业级的性能表现。它整合了先进的高质量视觉生成技术,包括精细的数据整理、模型设计和流变换公式。Goku的主要贡献包括高质量的细粒...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频6个月前03K
文本提取API(text-extract-api):视觉提取文本信息,匿名化的PDF提取工具综合介绍 文本提取API(text-extract-api)是一个强大的工具,旨在从各种文档格式(如PDF、Word、PPTX等)中提取和解析内容。该API利用最先进的光学字符识别(OCR)技术和Ol...最新AI资源# AI开源项目# OCR# 文档提取与清洗7个月前03K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器综合介绍 Text2Video-Zero是Picsart AI Research团队开发的一个零样本文本到视频生成器的官方实现,适用于GitHub。该项目提供了一种使用文本提示生成具有时间一致性和正确...最新AI资源# AI开源项目# AI文本转视频10个月前03K
PhiData:构建拥有记忆、知识和工具的AI智能体综合介绍 PhiData是一个专为开发智能AI助手而设计的框架。它通过增强记忆、知识整合和工具调用能力,使AI助手能够进行长期对话、提供精准的业务上下文,并执行各种操作。PhiData不仅提升了AI助...最新AI资源# AI开源项目# 智能体应用5个月前03K
Micro Agent:AI编程智能体,自动生成代码并测试、修复代码综合介绍 Micro-Agent是由Builder.io开发的一款开源AI编码助手,旨在为开发者提供自动生成和测试代码的功能。它通过理解自然语言描述生成测试用例,并迭代代码直到所有测试通过,从而减少开...最新AI资源# AI开源项目# AI编程7个月前03K
Orpheus-TTS:生成自然中文语音的文本转语音工具综合介绍 Orpheus-TTS 是一个开源的文本转语音(TTS)系统,基于 Llama-3b 架构开发,目标是生成接近人类自然语音的音频。它由 Canopy AI 团队推出,支持英语、西班牙语、法语...最新AI资源# AI开源项目# AI文本转语音4个月前03K
LivePortrait:静态图像、视频生成动态肖像动画工具综合介绍 LivePortrait 是一款由快手科技开发的先进 AI 动态肖像动画工具。它利用创新的 AI 技术,将静态图像转化为生动的视频动画。无论是使用真实照片、动画风格还是艺术肖像,LivePo...最新AI资源# AI图像转视频# AI开源项目# AI视频转换风格9个月前03K
FiveThirtyNine:基于搜索知识对未来事件发生概率预测综合介绍 Forecast AI 是一个基于先进人工智能技术的超级预测平台。它利用强大的数据分析和机器学习算法,为用户提供高精度的未来事件预测。无论是政治选举、经济趋势还是社会事件,Forecast ...最新AI资源# AI开源项目# AI搜索工具11个月前03K
TimesFM 2.0:谷歌开源进行时间序列预测的预训练模型综合介绍 TimesFM 2.0 - 500M PyTorch 是由 Google Research 开发的预训练时间序列基础模型,专为时间序列预测而设计。该模型能够处理长达 2048 个时间点的上下...最新AI资源# AI开源项目7个月前03K
Zerox:PDF、DOCX、图像转换为Markdown,视觉模型高精度OCR综合介绍 Zerox是一个开源项目,旨在通过视觉模型将PDF、DOCX、图像等文件转换为Markdown格式。该项目由getomni-ai团队开发,提供了简单高效的OCR(光学字符识别)解决方案。Ze...最新AI资源# AI开源项目# 文档提取与清洗7个月前03K
Meetily:生成会议纪要的AI助手,实时转录和生成会议摘要综合介绍 Meetily是一款由Zackriya Solutions开发的AI驱动会议助手,能够实时捕捉会议音频,进行语音转录,并生成会议摘要。其独特之处在于所有处理均在本地设备上完成,确保用户隐私...最新AI资源# AI开源项目# AI文本与音频/视频总结工具6个月前03K
ImBD:AI生成内容检测,检测内容是否由人工智能生成综合介绍 ImBD (Imitate Before Detect) 是一个开创性的机器生成文本检测项目,该项目发表于AAAI 2025会议。随着ChatGPT等大语言模型(LLMs)的广泛应用,识别A...最新AI资源# AI开源项目# AI教育工具7个月前03K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客综合介绍 Robo Blogger 是一个创新的博客创作工具,旨在通过语音转文字技术简化内容生成过程。用户可以通过任何语音转文字应用记录想法,Robo Blogger 将这些想法转化为结构化的博客内容...最新AI资源# AI开源项目# AI文本与音频/视频总结工具8个月前03K
Kokoro:高效语音合成模型,生成自然流畅的语音综合介绍 Kokoro 82M 是由 Hugging Face 提供的一个高效语音合成模型,旨在通过较少的参数和数据生成高质量的语音。该模型拥有 8200 万参数,使用 Apache 2.0 许可证发...最新AI资源# AI开源项目# AI文本转语音7个月前03K
GraphRAG Visualizer:可视化和探索Microsoft GraphRAG工件的工具综合介绍 GraphRAG Visualizer 是一个基于网页的工具,旨在帮助用户可视化和探索来自 Microsoft GraphRAG 的工件。通过上传由 GraphRAG 索引管道生成的 Par...最新AI资源# AI开源项目# 知识图谱8个月前03K
Playwright MCP:微软推出的浏览器自动化MCP服务综合介绍 Playwright MCP 是微软开发的一款开源工具,托管在 GitHub 上。它通过 Model Context Protocol(MCP)协议,让人工智能模型能直接控制浏览器,完成打开...最新AI资源# AI开源项目# MCP服务# 桌面自动化智能体5个月前03K
RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用综合介绍 RocketNotes 是一个基于 Web 的 Markdown 笔记应用程序,集成了大型语言模型(LLM)驱动的文本补全、聊天和语义搜索功能。该项目采用 100% 无服务器的 RAG(Re...最新AI资源# AI开源项目# AI笔记9个月前03K
AgenticSeek:完全本地运行的任务自动化AI助手综合介绍 AgenticSeek 是一个完全本地运行的开源AI助手,基于 Deepseek R1 模型开发。它不需要云端API,也不产生每月数百美元的费用。它的目标是成为类似电影中“贾维斯”的智能助手...最新AI资源# AI开源项目# 智能体应用5个月前03K
Unstructured:开源预处理非结构化文档,无结构数据处理的利器综合介绍 Unstructured-IO 提供了一系列开源组件,用于处理和预处理图像和文本文档,如 PDF、HTML、Word 文档等。其主要目标是简化和优化数据处理工作流程,特别是为大语言模型(LL...最新AI资源# AI开源项目# 文档提取与清洗11个月前03K
Xorbits Inference:一键部署多种AI模型,分布式推理框架综合介绍 Xorbits Inference(Xinference)是一个功能强大且全面的分布式推理框架,支持大语言模型(LLM)、语音识别模型和多模态模型等多种AI模型的推理。通过Xorbits I...最新AI资源# AI开源项目11个月前03K
PDF-Extract-Kit:提取复杂结构PDF内容的开源工具综合介绍 PDF-Extract-Kit 是一个由 OpenDataLab 团队开发的开源项目,专注于从复杂多样的 PDF 文档中高效提取高质量内容。它集成了先进的文档解析技术,支持布局检测、公式识别...最新AI资源# AI开源项目# 文档提取与清洗6个月前03K
Linly-Dubbing:智能视频多语言AI配音/翻译工具综合介绍 Linly-Dubbing 是一个智能多语言AI配音和翻译工具,旨在通过整合先进的AI技术,为用户提供高质量的多语言视频配音和字幕翻译服务。该工具特别适用于国际教育、全球内容本地化等场景,帮...最新AI资源# AI开源项目# AI翻译7个月前03K