AI开源项目

共 1020 篇文章

排序

浏览收藏

使用Cursor读取并修改Figma设计稿的MCP服务

综合介绍 Cursor Talk to Figma MCP 是一个开源项目，通过 Model Context Protocol (MCP) 协议连接 AI 编程工具 Cursor 和设计软件 Figm...

1年前

095.1K

FinRobot：提升金融数据分析效率和投资研究的的智能体

综合介绍 FinRobot是由AI4Finance Foundation开发的开源AI智能平台，专为金融分析设计。它不仅涵盖了传统的语言模型，还融入了多种AI技术，旨在为金融行业提供全面的解决方案。F...

最新AI资源 # AI开源项目 # AI金融数据分析

1年前

095K

RoomGPT：上传房间照片，使用AI重新设计

综合介绍 RoomGPT是一个由GitHub用户Nutlope开发的开源项目，允许用户上传房间照片并利用人工智能技术生成重新设计的房间版本。该项目旨在让用户无需昂贵的设计师费用即可获得专业级的室内设计...

最新AI资源 # AI图像风格控制 # AI开源项目

2年前

095K

LangBot：开源大模型即时通信机器人，支持多微信、QQ、飞书等多平台部署AI机器人

综合介绍 LangBot 是一个基于大模型的即时通信机器人平台，支持多种消息平台和大模型。该平台适配 QQ、微信（企业微信、个人微信）、飞书、Discord、OneBot 等消息平台，并支持 Open...

最新AI资源 # AI开源项目

1年前

095K

Markdownify MCP Server：基于MCP协议将各种内容转换为Markdown格式

综合介绍 Markdownify MCP Server 是一个基于 Model Context Protocol（模型上下文协议）的开源工具，托管于 GitHub，由开发者 Zach Caceres ...

最新AI资源 # AI开源项目 # MCP服务 # 文档提取与清洗

1年前

095K

Kotaemon：简单部署的开源多模态文档问答工具

综合介绍 Kotaemon 是一个开源的文档问答工具，旨在为终端用户和开发者提供基于检索增强生成（RAG）的问答功能。该项目由 Cinnamon 开发，支持多种 LLM API 提供商（如 OpenA...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

2年前

094.7K

Aide：强化VSCode开发体验的AI助手扩展，一键注释、转换、UI生成代码

综合介绍 AIDE(AI-assisted Development Extension)是一款强大的 VSCode AI 辅助开发扩展,专注于提供独特且实用的 AI 编程辅助功能。它不同于 GitHu...

最新AI资源 # AI开源项目 # AI编程

2年前

094.6K

AnyText：生成和编辑多语言图像文本，高可控在图像中生成多行中文

综合介绍 AnyText是一个革命性的多语言视觉文本生成和编辑工具，基于扩散模型开发。它能够在图像中生成自然、高质量的多语种文本，并支持灵活的文本编辑功能。该项目由研究团队开发，并在ICLR 2024...

最新AI资源 # AI图像生成辅助工具 # AI图像风格控制 # AI开源项目

2年前

094.6K

飞桨 PP-TableMagic：复杂表格结构化信息提取神器

表格识别的目标是解析图片中的表格，准确识别表格结构和单元格位置，并将其还原为结构化的表格格式（例如 HTML）。在当今信息化时代，大量重要的表格数据仍以非结构化状态存在（如扫描文档中的信息统计表图片...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

094.6K

TxAgent：帮医生分析药物作用和治疗方案的AI工具

综合介绍 TxAgent 是哈佛大学医学与科学人工智能团队（MIMS）开发的一款开源AI工具，旨在帮助医生分析药物相互作用并制定个性化治疗方案。它通过多步骤推理和实时检索生物医学知识，结合患者的具体情...

最新AI资源 # AI开源项目 # 智能体应用

1年前

094.6K

PandasAI：数据分析对话平台，用自然语言完成数据查询与图表生成

综合介绍 PandasAI是一个基于Python的开源平台，旨在通过自然语言处理技术简化数据分析过程。使用户能够以对话的方式与数据库（如 SQL、CSV、pandas、polars、mongodb、n...

最新AI资源 # AI开源项目 # AI数据分析

2年前

094.5K

Fish Agent：端到端AI语音克隆助手，实时语音对话助理，Fish Speech衍生项目

综合介绍 Fish Speech 衍生项目 Fish Agent 是一款革命性的端到端AI语音克隆系统，基于V0.1 3B模型架构开发。作为一个完全端到端的语音克隆处理系统，其最大特点是采用创新的无语...

最新AI资源 # AI开源项目 # AI语音克隆 # 多模态实时互动产品

2年前

094.4K

Eko：自然语言构建智能体工作流，实现桌面与浏览器自动化

综合介绍 Eko 是一个生产级的 JavaScript 框架，旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下，利用AI技术自动化日常任务。Eko提供了一个统...

最新AI资源 # AI开源项目 # 低代码工作流 # 智能体应用

1年前

094.2K

R1-V：低成本强化学习实现视觉语言模型泛化能力

综合介绍 R1-V 是一个开源项目，旨在通过低成本的强化学习（RL）实现视觉语言模型（VLM）的突破。该项目利用可验证的奖励机制，激励 VLMs 学习通用的计数能力。令人惊叹的是，R1-V 的 2B ...

最新AI资源 # AI开源项目

1年前

094.2K

HyperChat：利用 MCP 智能执行复杂任务的AI对话客户端

综合介绍 HyperChat 是一个由 BigSweetPotatoStudio 开发的开源聊天客户端，托管于 GitHub，旨在通过集成多个大型语言模型（LLM）的 API（如 OpenAI、Cla...

最新AI资源 # AI开源项目 # AI本地化聊天应用 # 智能体应用

1年前

094.1K

AutoAgent：通过自然语言快速创建并部署AI智能体的框架

综合介绍 AutoAgent是由香港大学数据智能实验室（HKUDS）开发的一个开源AI智能体框架，托管于GitHub。它允许用户通过纯自然语言描述需求，快速创建和部署定制化的AI智能体，无需任何编程基...

最新AI资源 # AI开源项目 # 无代码开发 # 智能体开发框架

1年前

094.1K

uni-api：轻量大模型API转换为OpenAI接口，YAML文件配置API渠道

综合介绍无前端，纯配置文件配置 API 渠道。只要写一个文件就能运行起一个属于自己的 API 站，文档有详细的配置指南，小白友好。 uni-api 是一个统一管理大模型API的项目，允许通过一个统一...

最新AI资源 # AI开源项目

2年前

094.1K

openapi-mcp-server：让AI直接调用开放API的MCP服务

综合介绍 openapi-mcp-server 是一个开源工具，旨在将符合 OpenAPI v3.1 标准的API转化为AI可用的资源。它由 janwilmake 维护，基于 Model Contex...

最新AI资源 # AI开源项目 # MCP服务

1年前

094K

VideoRAG：理解超长视频的RAG框架，支持多模态检索和知识图谱构建

综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码，能够在单个NVIDIA RTX 3090 GPU上高效处理...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

094K

Perplexica：1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎

综合介绍 Perplexica 是一个开源的 AI 驱动搜索引擎，旨在提供深入互联网的答案。它使用先进的机器学习算法，如相似性搜索和嵌入技术，来优化搜索结果，并提供带有引用来源的清晰答案。Perple...

最新AI资源 # AI开源项目 # AI搜索工具

2年前

093.9K

Genesis：开源生成式物理引擎，实现基于真实物理的4D动态世界模拟

综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台，支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真，解锁...

最新AI资源 # AI开源项目 # AI文本与图片转3D

2年前

093.8K

InfiniteYou：保留人脸特征的照片生成与编辑工具

综合介绍 InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器（DiTs）技术，使用 FLUX.1-dev 模型，核心功能是让用户上传照片并输入文字描述，生...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

093.8K

实时语音转文字的开源工具

综合介绍 realtime-transcription-fastrtc 是一个开源项目，专注于将语音实时转换为文字。它利用 FastRTC 技术处理低延迟音频流，结合本地 Whisper 模型实现高效...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

093.6K

LM Speed：快速测试大模型API性能

综合介绍 LM Speed 是一个专门为AI开发者设计的工具，同时提供在线服务网站 lmspeed.net。它的核心功能是测试和分析语言模型 API 的性能，帮助用户快速发现速度瓶颈并优化调用策略。这...

最新AI资源 # AI开源项目

1年前

093.5K

OpenAOE：大模型群聊框架：同时与多个大语言模型聊天

综合介绍 OpenAOE 是一个开源的大模型群聊框架，旨在解决当前市场上缺乏多模型并行响应的聊天框架的问题。通过 OpenAOE，用户可以同时与多个大语言模型（LLM）进行对话，获取并行输出。该框架支...

最新AI资源 # AI开源项目 # AI集成多模型对话平台

1年前

093.4K

Morphik Core：处理多模态数据的开源 RAG 平台

综合介绍 Morphik Core 是一个开源项目，由 morphik-org 团队开发，托管在 GitHub 上。它以前叫 DataBridge Core，现在更名为 Morphik Core。这个...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

093.4K

MegaParse：解析各类型文档为LLM可用数据，完整保留文档中的表格、图片等所有信息

综合介绍 MegaParse 是一个强大且多功能的文件解析工具，专为大语言模型（LLM）的数据处理优化而设计。无论是处理文本、PDF、PowerPoint 演示文稿还是 Word 文档，MegaPar...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

093.3K

AI Chatbot Supabase：开源的Next.js和Supabase构建的AI聊天机器人，快速部署到Vercel。

综合介绍 AI Chatbot Supabase是一个基于Next.js和Supabase构建的开源AI聊天机器人模板。该项目由Vercel开发，旨在提供一个功能全面、可定制的聊天机器人解决方案。通过...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

093.3K

LlamaCoder：使用提示词快速生成并发布小型web应用

综合介绍 LlamaCoder 是一个基于 Llama 3.1 和 Together AI 的开源代码生成工具。它可以通过简单的提示生成小型应用程序，适合开发者快速实现创意。LlamaCoder 提供...

最新AI资源 # AI开源项目 # AI编程 # AI页面设计

2年前

093.2K

WeClone：用微信聊天记录和语音训练数字分身

综合介绍 WeClone 是一个开源项目，它通过微信聊天记录和语音消息，结合大语言模型和语音合成技术，让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型，还可以用少量语音样本生成逼真的声音...

最新AI资源 # AI开源项目 # 大模型微调

1年前

093.2K

Oliva：语音控制的多智能体产品搜索助手

综合介绍 Oliva 是一个开源的多智能体助手工具，由 Deluxer 在 GitHub 上开发。它通过多个 AI 智能体协作，帮助用户在 Qdrant 数据库中搜索产品信息。主要特点是支持语音操作...

最新AI资源 # AI开源项目 # 智能体应用 # 知识检索与RAG框架

1年前

093.2K

X-Kit：Twitter数据抓取和分析X用户数据与推文的工具

综合介绍 X-Kit是一个开源工具，专为抓取和分析X（原Twitter）用户数据和推文而设计。该工具由GitHub用户xiaoxiunique开发，旨在帮助用户自动化获取指定X用户的基本信息和推文，并...

最新AI资源 # AI开源项目

2年前

093.2K

CapsWriter-Offline：PC端的语音输入和字幕转录工具

综合介绍 CapsWriter-Offline 是一个专注于PC端的语音输入和字幕转录工具，托管于 GitHub，由开发者 HaujetZhao 打造。它完全离线运行，无需联网即可实现语音转文字和音视...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

093.1K

MyCoder：自动修复代码、生成测试用例的命令行AI工具

综合介绍 MyCoder 是一个由 drivecore 团队开发并托管在 GitHub 上的开源项目，旨在通过命令行界面为开发者提供智能化的编程辅助。它基于 Anthropic 的 Claude AP...

最新AI资源 # AI开源项目 # AI编程

1年前

093.1K

修复无效JSON字符串，解决 LLMs 生成的 JSON 数据中可能出现的格式错误。

综合介绍一个用于修复无效JSON文件的模块，特别适用于解析由大型语言模型（LLMs）输出的错误JSON数据。该模块能够修复常见的JSON语法错误，如缺失的引号、错误的逗号、不转义的字符和不完整的键值...

最新AI资源 # AI开源项目

2年前

093.1K

Vercel AI SDK：使用流行前端框架构建AI驱动应用程序

综合介绍 Vercel AI SDK 是一款由 Vercel 团队开发的开源工具，旨在帮助开发者使用 React、Svelte、Vue 和 Solid 等框架构建人工智能应用。它支持多种语言模型供应商...

最新AI资源 # AI开源项目

2年前

093.1K

Tarsier：生成高质量视频描述的开源视频理解模型

综合介绍 Tarsier 是字节跳动（ByteDance）开发的一个开源视频-语言模型家族，主要用于生成高质量的视频描述。它由简单的结构组成：CLIP-ViT 处理视频帧，结合大语言模型（LLM）分析...

最新AI资源 # AI开源项目

1年前

093K

DeepClaude：融合DeepSeek R1链式推理与Claude创造力的聊天界面

综合介绍 DeepClaude 是一个高性能的大语言模型（LLM）推理API和聊天界面，集成了DeepSeek R1的链式推理（CoT）能力和 Anthropic Claude 模型的创造力与代码生成...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

093K

Kolors：生成高质量图像的文本到图像模型，支持生成中文海报

综合介绍 Kolors是由快手团队开发的大规模文本到图像生成模型，基于潜在扩散技术。该模型训练于数十亿对文本-图像数据对，能够生成高质量、复杂语义准确的图像，并支持中英文输入。Kolors在视觉质量...

最新AI资源 # AI开源项目 # AI自部署图像生成工具

2年前

092.9K

AgentGPT：创建并运行自动化AI智能体的开源项目

综合介绍 AgentGPT 是一个由 Reworkd 团队开发的开源项目，托管在 GitHub 上，旨在让用户通过浏览器自主创建、配置和部署 AI 智能体。用户只需设定一个目标，AgentGPT 就能...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

092.9K

Probly：AI分析数据并生成图表的开源表格工具

综合介绍 Probly 是一个由 PragmaticMachineLearning 团队开发并在 GitHub 上开源的电子表格工具，结合了传统电子表格的功能与强大的 AI 数据分析能力。它不仅支持用...

最新AI资源 # AI开源项目 # AI数据分析

1年前

092.9K

MegaTTS3：合成中英文语音的轻量模型

综合介绍 MegaTTS3 是字节跳动与浙江大学合作开发的一款开源语音合成工具，专注于生成高质量的中英文语音。它的核心模型只有 0.45B 参数，轻量高效，支持中英文混合语音生成和语音克隆。项目托管在...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

1年前

092.8K

AI2SRT：利用 Gemini模型，一键为长视频创建解说短视频或视频总结

综合介绍 AI2SRT是一个开源项目，利用GeminiAI大模型，为长视频一键生成解说短视频和视频总结，同时支持音视频转录字幕。该项目旨在简化视频内容创作过程，提供高效的字幕生成和翻译功能。用户可以通...

最新AI资源 # AI开源项目 # AI音视频编辑

2年前

092.8K

MockingBird：快速克隆声音与模型训练，基于 xtts v2 实现的文本转语音

综合介绍 MockingBird 是一个开源项目，旨在通过 AI 技术实现快速语音克隆和文本转语音。用户只需提供 5 秒的语音样本，即可生成任意语音内容。该项目支持多种中文数据集，并在 Windows...

最新AI资源 # AI开源项目 # AI语音克隆

2年前

092.8K

E2B Open Computer Use：E2B沙盒中安全的运行AI操作系统

综合介绍 E2B Open Computer Use 是一个开源项目，旨在通过 E2B 桌面沙盒提供安全的云端 Linux 计算机使用体验。E2B沙盒提供了一个桌面图形环境，用户可以将其连接到任何大型...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

092.8K

LazyLLM：商汤开源构建多智能体应用的低代码开发工具

综合介绍 LazyLLM 是由 LazyAGI 团队开发的一款开源工具，专注于简化多智能体大模型应用的开发流程。它通过一键部署和轻量级网关机制，帮助开发者快速搭建复杂的 AI 应用，节省繁琐的工程配置...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

092.7K

Orate：集成知名语音生成、语音转录与变声模型的统一API

综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API，能够与领先的AI提供商（如OpenAI、ElevenLabs和AssemblyAI）无缝集成，帮助用户创建逼...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音转文本

2年前

092.7K

在cloudflare部署hugging face的免费api，支持接口转发

因国内部署无法访问hugging face，所以在大佬部署方案的基础上改造成能部署到cloudflare workers。准备工作 1、注册 cloudflare 2、注册hugging fac...

最新AI资源 # AI开源项目 # 免费大模型API

2年前

092.7K

OmniGen：统一图像生成模型，多模态输入生成人物一致性图像

综合介绍 OmniGen 是一个由 VectorSpaceLab（智源）开发的“通用”图像生成模型，允许用户通过简单的文本提示或多模态输入来创建多样化且具有上下文丰富的视觉效果。它特别适合于需要识别...

最新AI资源 # AI在线生成图像 # AI开源项目

2年前

092.7K

TheoremExplainAgent：利用 Manim 生成5分钟以上数学讲解动画视频

综合介绍 TheoremExplainAgent 是由 TIGER AI Lab 开发的一个创新项目，旨在利用人工智能技术将复杂的数学和科学定理转化为易于理解的视频动画。该工具基于大语言模型（LLM...

最新AI资源 # AI开源项目 # AI教育工具

1年前

092.6K

PhotoDoodle：文字指令为照片添加艺术涂鸦的AI工具

综合介绍 PhotoDoodle 是一个开源的图像编辑工具，由 ShowLab 开发，专注于通过人工智能技术实现照片的艺术化编辑。用户只需输入简单的文本提示词，就能为真实照片添加卡通风格、3D效果、光...

最新AI资源 # AI图像编辑 # AI开源项目

1年前

092.6K

Devika：开源的AI软件工程师智能体，能够理解、拆分指令为子任务并编写代码

综合介绍 Devika是一个先进的AI软件工程师，能够理解高阶人类指令，将其分解为步骤，研究相关信息，并编写代码以实现给定的目标。它利用大型语言模型、规划和推理算法以及网页浏览能力，智能地开发软件。D...

最新AI资源 # AI开源项目 # AI编程 # 智能体应用

1年前

092.5K

ell：轻量级函数式提示词工程框架

综合介绍 ell 是一款由前 OpenAI 研究员 William Guss 开发的轻量级函数式语言模型编程库。它的设计理念是将提示词视为程序，而不仅仅是字符串。ell 提供了自动化的版本控制和序列化...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

1年前

092.5K

MarkItDown：微软文档智能转换工具，转换各种文件为Markdown格式

综合介绍 MarkItDown是由微软开发的一个Python工具，旨在将各种文件和办公文档转换为Markdown格式。该工具支持多种文件类型，包括PDF、PowerPoint、Word、Excel、图...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

092.4K

QAnything：高度集成RAG处理流程的本地知识库问答系统

QAnything 综合介绍 QAnything(Question and Answer based on Anything)是由网易推出的本地知识库问答系统，支持各类文件格式及数据库，可离线安装使用...

最新AI资源 # AI开放服务 # AI开源项目 # 知识检索与RAG框架

2年前

092.4K

Weebo：实时语音聊天机器人，提供自然语言对话体验

综合介绍 Weebo 是一个开源的实时语音聊天机器人，利用 Whisper Small 进行语音识别，Llama 3.2 进行自然语言生成，以及 Kokoro-82M 进行语音合成。该项目由 Aman...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

092.4K

PantoMatrix（EMAGE）：全身手势生成框架，从音频生成全身手势的3D动画框架

综合介绍 PantoMatrix是一个先进的全身手势生成框架，能够从音频和部分手势生成完整的人体动作，包括面部、局部身体、手部和全身动作。该框架利用了最新的多模态数据集和深度学习技术，提供高质量的3D...

最新AI资源 # AI开源项目

2年前

092.4K

NodeRAG：基于异构图的精准信息检索与生成工具

综合介绍 NodeRAG 是一个开源的检索增强生成（RAG）系统，托管在 GitHub，由 Terry-Xu-666 开发。它通过异构图结构优化信息检索与生成，显著提升检索精准度和上下文相关性。Nod...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

092.4K

Langui：开源的AI用户界面组件库

综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库，专为生成式AI和大语言模型（LLM）项目设计。该库基于Tailwind CSS，提供了一系列预构建的UI组件，帮助开发者快速构...

最新AI资源 # AI开源项目 # AI页面设计

2年前

092.3K

Flow（Laminar）：构建智能体的轻量级任务引擎，简化并灵活管理任务

综合介绍 Flow是一个轻量级的任务引擎，专为构建AI代理而设计，强调简洁性和灵活性。与传统的基于节点和边的工作流不同，Flow采用动态任务队列系统，支持并行执行、动态调度和智能依赖管理。其核心理念是...

最新AI资源 # AI开源项目 # 低代码工作流

2年前

092.2K

Memary：利用知识图谱增强Agent长期记忆的开源项目

综合介绍 Memary 是一个创新的开源项目，专注于为自主智能体提供长期记忆管理解决方案。该项目通过知识图谱和专门的记忆模块，帮助智能体突破传统上下文窗口的限制，实现更智能的交互体验。Memary 采...

最新AI资源 # AI开源项目 # 智能体开发框架 # 知识图谱

2年前

092.1K

Gemini Cursor：基于Gemini构建的AI桌面智能助手，能看、能听、能说

综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash（实验性）模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互，提供实时低延迟的用...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

092.1K

VoiceCraft：开源零样本语音克隆与文本转语音工具

综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具，基于神经编解码器语言模型。它采用了创新的编码序列生成方法，能够在已有语音序列上进行插入、删除和替换操作，生成自然、连贯的编辑语音...

最新AI资源 # AI开源项目 # AI语音克隆

2年前

092K

ANP：实现智能代理间安全高效通信的开源协议

综合介绍 AgentNetworkProtocol（简称ANP）是一个开源协议项目，托管于GitHub，专注于为智能代理（AI Agents）提供安全、高效的通信解决方案。它通过三层架构——身份与加密...

最新AI资源 # AI开源项目

1年前

091.9K

FlashMLA：优化Hopper GPU的MLA解码内核（DeepSeek 开源周第一天）

综合介绍 FlashMLA 是由 DeepSeek AI 开发的一款高效 MLA（Multi-head Latent Attention）解码内核，专为 NVIDIA Hopper 架构 GPU 优化...

最新AI资源 # AI开源项目

1年前

091.9K

Fast-Agent：声明式语法和MCP集成快速构建多智能体工作流

综合介绍 Fast-Agent 是一个由 evalstate 团队在 GitHub 上维护的开源工具，旨在帮助开发者快速定义、测试和构建多智能体工作流。它基于简单的声明式语法，支持与 MCP（Mode...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

091.8K

闲鱼卖家全天自动值守的AI客服机器人

综合介绍 XianyuAutoAgent 是一个专为闲鱼平台设计的智能客服机器人系统，由开发者 shaxiu 在 GitHub 上开源。它通过 AI 技术实现 7×24 小时自动值守，帮助闲鱼卖家回复...

最新AI资源 # AI副业赚钱项目 # AI客服机器人 # AI开源项目

1年前

091.8K

DreamTalk：使用一张头像图片即可生成表情丰富的说话视频

DreamTalk 综合介绍 DreamTalk是一个扩散模型驱动的表情说话头生成框架，由清华大学、阿里巴巴集团和华中科技大学联合开发。主要由降噪网络、风格感知嘴唇专家和风格预测器三部分构成，能够基于...

最新AI资源 # AI开源项目 # AI数字人 # 口型同步

2年前

091.7K

Zonos：高质量语音合成与语音克隆工具

综合介绍 Zonos 是由 Zyphra 开发的一款开源语音合成与语音克隆工具。Zonos-v0.1 版本采用了先进的 Transformer 和混合模型，能够生成高质量的语音输出。该工具支持多种语言...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

091.7K

Easy Voice Toolkit：本地部署的AI语音工具箱

综合介绍 Easy-Voice-Toolkit 是一个基于开源语音项目的多功能工具箱，提供语音识别、语音转录、语音转换、数据集创建和模型训练等多种自动化音频工具。用户可以根据需要选择性地使用这些工具...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

2年前

091.6K

Parler-TTS：根据输入文本生成特定说话人风格的文本转语音模型

综合介绍 Parler-TTS 是由 Hugging Face 开发的开源文本转语音（TTS）模型库，旨在生成高质量、自然流畅的语音。该模型能够根据输入文本生成具有特定说话人风格（如性别、音调、说话风...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

091.6K

ModelBest（面壁智能）：全球领先的轻量高性能端侧大模型

综合介绍 ModelBest 是一家专注于开发轻量高性能大模型的公司，致力于将先进的 AI 技术应用于日常生活中的主流消费电子和各类终端设备。其 MiniCPM 系列端侧模型以极致的算力和内存使用效率...

最新AI资源 # AI大模型原生对话工具 # AI开源项目

2年前

091.6K

Ichigo（llama3-s）：本地实时语音AI助手，开源版Siri

综合介绍 Ichigo是一个开源的实时语音AI项目，旨在扩展基于文本的语言模型，使其具备原生的“听力”能力。该项目采用了早期融合技术，灵感来自Meta的Chameleon论文。Ichigo的目标是成为...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

091.6K

OWL：多智能体协作完成现实任务的自动化工具

综合介绍 OWL（Optimized Workforce Learning）是由 CAMEL-AI 团队开发的一个开源框架，专注于优化多智能体协作以实现真实世界任务的自动化。基于 CAMEL-AI 架...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

091.5K

Audiblez：生成有声书，使用Kokoro将电子书转换为有声读物

综合介绍 Audiblez 是一个开源项目，旨在将电子书（如 .epub 格式）转换为有声书（如 .m4b 格式）。该项目利用 Kokoro 的高质量语音合成技术，支持多种语言和多种声音。用户只需简单...

最新AI资源 # AI开源项目 # AI文本转语音

2年前

091.5K

Research Rabbit：使用本地LLM进行网页研究和报告撰写，自动深入用户指定主题并生成总结。

综合介绍 Research Rabbit 是一个基于本地LLM（大语言模型）的网页研究和总结助手。用户提供研究主题后，Research Rabbit 会生成搜索查询，获取相关网页结果，并总结这些结果...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

091.5K

Flock：低代码工作流编排快速构建聊天机器人

综合介绍 Flock 是一个开源的工作流低代码平台，托管在 GitHub 上，由 Onelevenvy 团队开发。它基于 LangChain 和 LangGraph 技术，专注于帮助用户快速搭建聊天机...

最新AI资源 # AI客服机器人 # AI开源项目 # 低代码工作流

1年前

091.5K

OASIS：多智能体模拟数百万用户社交媒体互动，研究复杂社会现象

综合介绍 OASIS（Open Agent Social Interaction Simulations）是一个开源的社交媒体模拟器，能够模拟多达一百万用户的行为。该平台结合了大型语言模型和基于规则的...

最新AI资源 # AI开源项目 # 智能体应用

1年前

091.5K

Ant Design X：快速构建AI聊天界面的工具包，支持模型集成和数据流管理。

综合介绍 Ant Design X是蚂蚁集团开源的一个工具包，旨在帮助开发者快速构建AI驱动的对话界面。它提供了丰富的组件和模板，支持与OpenAI标准兼容的模型集成，适用于智能客服、AI助手等多种应...

最新AI资源 # AI开源项目

2年前

091.4K

Data Formulator：AI驱动的数据可视化工具

综合介绍 Data Formulator是由微软研究院开发的一款开源AI驱动的数据可视化工具。该工具结合了图形化用户界面（GUI）和自然语言输入（NL），使用户能够通过简单的交互和指令，快速创建和迭代...

最新AI资源 # AI开源项目 # AI数据分析

1年前

091.2K

G-Search-MCP：免费谷歌搜索的MCP服务器

综合介绍 G-Search-MCP 是一个开源的谷歌搜索工具，托管在 GitHub 上，由开发者 jae-jae 基于 google-search 修改而来。它通过 MCP（Model Context...

最新AI资源 # AI开源项目 # MCP服务

1年前

091.2K

Leffa：高保真模特虚拟试穿与人物姿势调整，Meta开源的可控人物图像生成模型

综合介绍 Leffa 是一个用于生成可控人物图像的统一框架，能够精确操控人物的外观（如虚拟试穿）和姿势（如姿势转移）。该框架通过在注意力层中引导目标查询关注正确的参考键，显著减少了细粒度细节的失真，同...

最新AI资源 # AI图像风格控制 # AI开源项目 # AI换脸与换装

2年前

091.2K

Optexity：用人类演示训练AI执行网页操作的开源项目

综合介绍 Optexity 是一个在 GitHub 上开源的项目，由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务，尤其是网页操作。项目包含三个代码库：Compute...

最新AI资源 # AI开源项目 # 大模型微调 # 桌面自动化智能体

1年前

091.2K

MiniMind-V：1小时训练26M参数视觉语言模型

综合介绍 MiniMind-V 是一个开源项目，托管于 GitHub，旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型（VLM）。它基于 MiniMind 语言模型，新增视觉...

最新AI资源 # AI开源项目 # 大模型微调

1年前

091.2K

Insanely Fast Whisper：快速高效的转录语音为文本的开源项目

综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术（如Transformers, Optimum, Flash Attention）的音频转...

最新AI资源 # AI开源项目 # AI语音转文本

2年前

091.1K

Ruyi-Models：生成图像到视频开源模型，支持镜头控制与运动幅度控制

综合介绍 Ruyi-Models 是一个开源项目，旨在通过图像生成高质量的视频。该项目由 IamCreateAI 团队开发，支持生成 768 分辨率、每秒 24 帧、总计 5 秒 120 帧的电影级视...

最新AI资源 # AI图像转视频 # AI开源项目

2年前

091K

OrionChat：集成多平台AI模型的简易网页聊天界面（免部署）

综合介绍 OrionChat是一个基于网页的AI聊天界面，它为用户提供了一个统一的平台来与多个主流AI模型进行交互。该项目支持包括Ollama(本地运行)、OpenAI GPT、Google Gemi...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

090.9K

RapBank：根据歌词和伴奏直接生成说唱(Rap)人声的模型（目前开放了数据集）

综合介绍 RapBank 是一个专为说唱歌词生成而设计的数据集和工具集。该项目由 NZqian 创建，旨在通过收集和处理来自 YouTube 的说唱歌曲，为研究人员和开发者提供一个高质量的说唱歌词数据...

最新AI资源 # AI开源项目 # AI音乐

2年前

090.9K

SegAnyMo：从视频中自动分割任意运动物体的开源工具

综合介绍 SegAnyMo 是一个开源项目，由加州大学伯克利分校和北京大学的研究团队开发，包括 Nan Huang 等成员。这个工具专注于视频处理，能自动识别和分割视频中任意运动的物体，比如人、动物或...

最新AI资源 # AI开源项目 # AI抠图改背景 # 视觉目标检测

1年前

090.8K

Voice Changer：实时语音变换工具，让喜欢的动漫角色唱歌

综合介绍 Voice Changer 是一个开源的实时语音变换工具，支持多种 AI 语音模型，如 MMVC、so-vits-svc、RVC、DDSP-SVC 和 Beatrice。该工具兼容多个平台...

最新AI资源 # AI开源项目 # AI语音克隆

2年前

090.8K

Bilingual Book Maker：使用AI翻译制作双语电子书，全书自动化翻译工具

综合介绍 Bilingual Book Maker 是一个开源项目，旨在利用AI技术帮助用户创建多语言版本的电子书。该工具主要使用ChatGPT进行翻译，支持多种文件格式，包括epub、txt和srt...

最新AI资源 # AI开源项目 # AI翻译

1年前

090.7K

Fullmoon：本地大语言模型聊天的iOS应用

综合介绍 Fullmoon是一款专为iOS设备设计的应用程序，旨在提供与本地大语言模型进行私密聊天的功能。该应用优化了Apple Silicon，支持在iPhone、iPad和Mac上运行。用户的聊天...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

090.7K

TripoSG：单张图像生成高分辨率3D建模数字资产

综合介绍 TripoSG 是由 VAST AI 研究团队开发的一个开源项目，能从单张图像生成高质量的 3D 模型。项目使用大规模整流流变换器技术，结合混合监督训练和优质数据集，让生成的 3D 模型拥有...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

090.7K

NodeTool：基于节点编排的AI模型工作流可视化客户端

综合介绍 NodeTool 是一个创新的AI创作平台，旨在为AI爱好者、开发者、数据科学家和创意人士提供一个简单、直观的界面。无论您是艺术家、开发者还是初学者，NodeTool 都能帮助您快速原型化创...

最新AI资源 # AI开源项目 # 低代码工作流

2年前

090.6K

SVFR：实现视频人脸修复的统一框架，修复黑白、模糊的人像老视频

综合介绍 SVFR（Stable Video Face Restoration）是一个用于视频人脸修复的统一框架，支持基础人脸修复（BFR）、着色、修复及其组合任务。该框架利用生成和运动先验，通过统一...

最新AI资源 # AI图像放大与修复 # AI开源项目

2年前

090.5K

MIDI-3D：从单张图片快速生成多物体3D场景的开源工具

综合介绍 MIDI-3D 是 VAST-AI-Research 团队开发的一个开源项目，它能从一张图片快速生成包含多个物体的3D场景，适合开发者、研究人员和创作者使用。这个工具基于多实例扩散模型技术...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

090.5K

E2M：将多种文件格式转换为Markdown，轻松实现文档格式统一

综合介绍 E2M（Everything to Markdown）是一个开源的Python库，旨在将多种文件格式转换为Markdown格式。该工具支持包括doc、docx、epub、html、htm、u...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

090.5K

Browse AI：无代码提取和监控结构化数据

Browse介绍 Browse AI是一个无需编码的云端网页自动化软件，旨在帮助用户无需编程便能从任意网站提取和监控数据。您只需用鼠标指点一次，就可以训练一个机器人来执行数据提取、监控和自动化的任务...

最新AI资源 # AI开放服务 # AI开源项目 # 无代码开发

2年前

090.5K

ALog：便携AI语音日记应用，支持语音转文字。

综合介绍 ALog 是一个基于人工智能的语音日记应用，旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发，并在 GitHub 上开源。用户可以通过语音输入记录日记，应用会自动将语音转换为文...

最新AI资源 # AI开源项目 # AI语音转文本

2年前

090.3K

加载更多