AI开源项目

共 1020 篇文章

排序

浏览收藏

GeminiCoder：基于LlamaCoder项目，使用Gemini API快速生成Web应用程序

综合介绍 GeminiCoder是一个基于Google Gemini API开发的创新型Web应用程序生成工具。该项目继承了 LlamaCoder 的优秀特性，并集成了最新的Gemini 1.5 Pr...

最新AI资源 # AI开源项目 # AI编程

2年前

077.7K

GraphAgent：构建知识图谱，自动化任务规划与执行

综合介绍 GraphAgent是一个集成了图生成、任务规划和任务执行的自动化智能体系统。它能够处理结构化和非结构化数据，构建复杂的语义依赖关系图谱，并通过自我规划和工具匹配高效执行用户任务。Graph...

最新AI资源 # AI开源项目 # 知识图谱

2年前

077.7K

LangGraph CUA：基于 LangGraph 控制电脑操作的AI智能体

综合介绍 LangGraph CUA 是由 LangChain 团队开发的一个开源项目。它基于 LangGraph 框架，让开发者可以用 Python 打造能直接操作电脑的 AI 智能体。这个工具的核...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

077.7K

DualPipe：双向流水线并行算法，提升大规模AI模型训练效率（DeepSeek 开源周第四天）

综合介绍 DualPipe 是由 DeepSeek-AI 团队开发的一项开源技术，专注于提升大规模 AI 模型训练的效率。它是一个创新的双向流水线并行算法，主要用于在 DeepSeek-V3 和 R1...

最新AI资源 # AI开源项目

1年前

077.7K

Solana Agent Kit：连接AI智能体与Solana协议的开源工具包

综合介绍 Solana Agent Kit是一个开源工具包，旨在将AI智能体与Solana区块链协议无缝连接。无论是AI研究人员还是加密货币开发者，都可以使用任何模型训练的智能体，通过该工具包执行超过...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

077.7K

Qwen4Mac：在Mac菜单栏中使用千问（Qwen）大模型随时对话

综合介绍 Qwen4Mac是一个开源项目，旨在将Qwen大语言模型（LLM）集成到Mac的菜单栏中，方便用户随时调用和使用。该项目由andreaturchet开发和维护，提供了一种简便的方式，让用户能...

最新AI资源 # AI开源项目

1年前

077.7K

VideoReTalking：音频驱动的嘴唇同步和视频编辑系统

综合介绍 VideoReTalking是一款创新的系统，允许用户根据输入音频生成唇形同步的面部视频，即使有不同的情绪，也能产生高质量且嘴唇同步的输出视频。系统将这一目标分解为三个连续任务：带有典型表情...

最新AI资源 # AI开源项目 # 口型同步

2年前

077.7K

InsightExpress：生成AI驱动的研究报告并通过电子邮件发送

综合介绍 InsightExpress 是一个基于 Next.js 的应用程序，能够根据用户提供的主题生成 AI 驱动的研究报告，并通过电子邮件发送给用户。该应用程序利用 Langflow 的 AI ...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

077.7K

Text2Voice：基于硅基流动API的文本转语音图形界面

综合介绍 Text2Voice 是一个开源工具，基于硅基流动 API 提供文本转语音功能，最大的特点是带有简洁的图形用户界面（GUI）。它由开发者 Sheldon Lee 在 GitHub 上创建，让...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

077.5K

GraphCast：基于扩散模型的学习并预测中期全球天气预报的高效工具

综合介绍 GraphCast是由Google DeepMind开发的一个先进的天气预报工具，旨在通过深度学习技术提升中期全球天气预报的准确性。该项目提供了多种预训练模型和示例代码，用户可以利用这些资源...

最新AI资源 # AI开源项目

2年前

077.5K

MJML：轻松设计响应式邮件，配合ChatGPT快速生成营销邮件

综合介绍 MJML（邮件界标记语言）是由 Mailjet 团队开发的一个开源框架，旨在简化响应式邮件模板的创建。通过语义化的标记语言和丰富的组件库，开发者可以用更少的代码高效创建美观且功能强大的电子邮...

最新AI资源 # AI开源项目

2年前

077.5K

GAG：利用大模型模拟人类行为生成社交关系图谱

综合介绍 GraphAgent 是一个开源框架，托管在 GitHub 上，由 Ji-Cather 开发。它利用大语言模型（LLM）模拟人类行为，生成动态的、带文本属性的社交图。这个工具适用于在线社交媒...

最新AI资源 # AI开源项目 # 知识图谱

1年前

077.4K

ClickClickClick：启用任何LLM实现自动化安卓和电脑操作

综合介绍 ClickClickClick是一个由BandarLabs开发的框架，旨在通过使用任何本地或远程的大型语言模型（LLM）实现安卓和电脑的自动化操作。该项目目前处于高度实验阶段，支持多种模型如...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

077.3K

简单易用的开源AI写作助手

综合介绍 AI 写作助手是一个基于 Next.js 开发的开源 AI 写作助手，托管于 GitHub，旨在帮助作家、内容创作者和文案专业人员通过人工智能技术提升写作效率与质量。这个工具允许用户通过详...

最新AI资源 # AI写作 # AI开源项目

1年前

077.3K

WhisperChain：实时语音转文字并优化口语化词语

综合介绍 WhisperChain 是一个基于人工智能的开源项目，托管在 GitHub 上，由开发者 Chris Choy 主导开发。它主要用于将语音转化为文字，并通过 AI 技术自动优化表达，去除冗...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

077.3K

mac assistant：macOS设备自动执行桌面操作的AI智能体

综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目，旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ，并计划未来支持 ...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

077.3K

Unigraph：构建本地运行的知识图谱和个人搜索引擎

综合介绍 Unigraph 是一个本地优先的通用知识图谱和个人搜索引擎，旨在为用户提供一个集成的工作空间，帮助管理和搜索个人生活中的各种数据。通过 Unigraph，用户可以将不同来源的数据整合到一个...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

2年前

077.2K

DeepCoder-14B-Preview：擅长代码生成的的开源模型

综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...

最新AI资源 # AI开源项目 # 大模型微调

1年前

077.2K

Kheish：多角色智能体，审查、验证和格式化输出以生成高质量结果

综合介绍 Kheish是一个开源的多角色代理，专为需要结构化、逐步协作的大型语言模型（LLM）任务而设计。Kheish不仅仅是一个简单的协调器，它本身就是一个智能代理，可以根据需求请求模块，整合用户反...

最新AI资源 # AI开源项目 # 智能体开发框架 # 知识检索与RAG框架

2年前

077.1K

DeepResearcher：基于强化学习驱动AI研究复杂问题

综合介绍 DeepResearcher 是由上海交通大学 GAIR-NLP 团队开发的开源项目。它是一个基于大型语言模型（LLM）的智能研究工具，通过强化学习（RL）在真实网络环境中进行端到端训练。项...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

077.1K

Lepton Search：开源的对话式AI搜索引擎|轻子搜索

Lepton Search 综合介绍 Lepton Search是一个对话式AI搜索引擎，由贾扬清推出，使用Lepton AI平台构建。Lepton Search可以根据用户的自然语言问题，主动搜...

最新AI资源 # AI开源项目 # AI搜索工具

2年前

077K

VACE：视频创作和编辑的开源模型（未开放）

综合介绍 VACE 是由阿里通义视觉智能实验室（ali-vilab）开发的一个开源项目，专注于视频创作与编辑。它是一个全能型工具，集成了多种功能，比如根据参考生成视频、编辑已有视频内容、本地化修改等...

最新AI资源 # AI开源项目 # AI音视频编辑

1年前

077K

muAgent：由 LLM 和 EKG（行业知识）驱动的全新Agent编排框架

综合介绍 muAgent 是由蚂蚁集团开发的创新型多智能体框架。该框架通过画布式拖拽和简单的文本编写，协同多智能体、函数调用、代码解释器等技术，帮助用户在人工指导下执行各种复杂的标准操作流程（SOP...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

077K

MultiPost-Extension：将AI生成内容一键同步到自媒体平台的浏览器扩展

综合介绍 MultiPost-Extension 是一个功能强大的浏览器扩展，旨在帮助用户一键发布内容到多个社交媒体平台。该扩展支持同步发布到超过10个主流平台，包括知乎、微博、小红书、TikTok ...

最新AI资源 # AI开源项目 # AI社交媒体

1年前

077K

Agentarium：管理和协调多个AI智能体之间的交互

综合介绍 Agentarium 是一个强大的 Python 框架，专门用于管理和编排 AI 智能代理（Agent）。这个框架提供了灵活直观的方式来创建、管理和协调多个 AI 代理之间的交互。它采用 A...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

077K

RocketNotes：支持文本补全、文档对话、语义搜索的Markdown笔记应用

综合介绍 RocketNotes 是一个基于 Web 的 Markdown 笔记应用程序，集成了大型语言模型（LLM）驱动的文本补全、聊天和语义搜索功能。该项目采用 100% 无服务器的 RAG（Re...

最新AI资源 # AI开源项目 # AI笔记

2年前

076.9K

GitPodcast：将GitHub仓库转化为播客，随时随地收听代码更新

综合介绍 GitPodcast 是一个创新的工具，旨在将 GitHub 仓库转化为播客，让开发者可以随时随地收听代码更新。通过使用 OpenAI 和 Azure Speech SDK，GitPodca...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

076.9K

Long-VITA：支持超长上下文输出的视觉语言模型

综合介绍 Long-VITA 是由 VITA-MLLM 团队开发的一款开源多模态大模型，专注于处理超长上下文的视觉和语言任务。它能够同时分析图像、视频和文本，支持高达 100 万 token 的输入...

最新AI资源 # AI开源项目

1年前

076.9K

agents.json：智能体通过自然语言与API交互的开源规范

综合介绍 agents.json 是 Wildcard AI 团队开发的一款开源规范，基于 OpenAPI 标准，旨在让智能体通过自然语言与 API 实现高效通讯。它通过结构化的 JSON 文件定义智...

最新AI资源 # AI开源项目

1年前

076.9K

DisPose：生成人体姿态精准控制的视频，创作跳舞的小姐姐

综合介绍 DisPose是一个创新的开源人工智能项目，专注于可控的人物图像动画生成。该项目由研究团队开发并在GitHub上开源，采用先进的深度学习技术，通过分解骨骼姿态信息来实现精确的人物动画控制。D...

最新AI资源 # AI图像转视频 # AI开源项目

2年前

076.8K

FoloUp：开源AI语音面试平台，生成定制面试题并进行智能分析

综合介绍 FoloUp 是一个开源平台，专为企业提供AI驱动的语音面试解决方案。通过FoloUp，企业可以快速生成针对职位描述的定制化面试问题，并通过AI进行自然对话式的面试。平台还提供详细的面试分析...

最新AI资源 # AI开源项目 # 专业生产力工具

1年前

076.8K

ControlFlow：构建可控透明AI智能体工作流的Python框架

综合介绍 ControlFlow是由PrefectHQ开发的一个Python框架，专注于构建和管理AI工作流。它提供了一个结构化、面向开发者的框架，用于定义工作流并将任务委派给大型语言模型（LLM）代...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

076.8K

wdoc：从海量、多源文档中检索内容并总结知识

综合介绍 wdoc是一个功能强大的RAG（检索增强生成）系统，专为处理和分析大量多样化的文档而设计。它能够从各种文件类型中进行检索，包括PDF、网页、YouTube视频、音频文件等。wdoc特别适合处...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

076.7K

DeepGemini：多模型编排任务并封装为API接口

综合介绍 DeepGemini 是一个开源项目，由开发者 Thomas Sligter 创建。它是一个支持多模型编排的 AI 管理工具，主要特点是能灵活组合多种 AI 模型，并通过 OpenAI 兼容...

最新AI资源 # AI开源项目

1年前

076.7K

Autiobooks：将epub电子书转换为m4b有声书

综合介绍 Autiobooks 是一款开源工具，旨在帮助用户将 .epub 格式的电子书快速转换为 .m4b 格式的有声书。它采用 Kokoro 提供的优质语音合成技术，生成的音频自然流畅。这款工具由...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

076.7K

OmniThink：生成高质量长文的写作框架，搜索外部知识后反思并逐步构建知识树

综合介绍 OmniThink 是一个创新的机器写作框架，旨在通过模拟人类认知过程中的迭代扩展和反思，生成高质量的长篇文章。该框架专注于扩展知识边界，生成的信息丰富且具有深度。OmniThink 通过构...

最新AI资源 # AI写作 # AI开源项目

2年前

076.6K

SpeechGPT 2.0-preview：实时交互的端到端拟人语音对话大模型

综合介绍 SpeechGPT 2.0-preview 是 OpenMOSS 推出的首个拟人化实时交互系统，基于百万小时级语音数据训练而成。该系统具备拟人口语化表达与百毫秒级低延迟响应，支持自然流畅的实...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

076.6K

Claude生成深度研究报告的MCP服务

综合介绍 MCP Server Deep Research 是一个开源工具，通过人工智能和网页搜索，自动为复杂问题生成结构化的研究报告。用户输入研究问题，工具会分解问题、搜索权威信息、评估来源可信度...

最新AI资源 # AI开源项目 # MCP服务 # 生成深度研究报告

1年前

076.6K

SciToolAgent：整合500+科研工具，自动化研究科研任务的智能体

综合介绍 SciToolAgent 是由杭州浙江大学创新中心（HICAI-ZJU）开发的一个开源工具平台。它通过知识图谱（SciToolKG）和大语言模型技术，整合超过500种科学工具，帮助科研人员处...

最新AI资源 # AI开源项目 # AI教育工具 # 智能体应用

1年前

076.6K

MegaPairs：BGE新推出的多模态向量嵌入模型

综合介绍 MegaPairs 是 VectorSpaceLab 团队在 GitHub 上开源的项目，通过大规模数据合成技术生成多模态嵌入模型，用于图像-文本到图像的检索任务。项目基于超过2600万个异...

最新AI资源 # AI开源项目

1年前

076.5K

Auto-Coder.Chat：基于终端命令行的AI辅助编程助手，提供VSCode插件

综合介绍 Auto-Coder.Chat 是一款基于终端的 AI 辅助编程工具，旨在通过智能化手段提升开发者的编程效率。该工具可以与任意 IDE 搭配使用，使开发工具具备 AI 辅助编程能力。Auto...

最新AI资源 # AI开源项目 # AI编程

1年前

076.4K

Reflex LLM Examples：展示大语言模型实际应用的AI应用集合

综合介绍 Reflex LLM Examples是一个由Reflex开发团队创建的开源项目，旨在展示大语言模型（LLM）的实际应用。该项目汇集了多个基于Reflex构建的AI应用，展示了来自Googl...

最新AI资源 # AI开源项目

2年前

076.4K

Deep Searcher：企业私有文档高效检索与智能问答

综合介绍 Deep Searcher 是一个结合强大大语言模型（如 DeepSeek 和 OpenAI）和向量数据库（如 Milvus）的工具，旨在基于私有数据进行搜索、评估和推理，提供高度准确的答案...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

076.3K

Agentic Radar：对 Agentic 工作流安全检测的可视化工具

综合介绍 Agentic Radar 是 SplxAI 推出的一款开源工具，专为扫描和保护基于大模型（LLM）的 AI 工作流设计。它通过分析代码，生成清晰的工作流图和安全报告，帮助开发者、安全专家快...

最新AI资源 # AI开源项目

1年前

076.2K

X-R1：在普通设备中低成本训练0.5B模型

综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架，旨在为开发者提供一个低成本、高效的工具，用于训练基于端到端强化学习的模型。该项目受到 DeepSeek...

最新AI资源 # AI开源项目 # 大模型微调

1年前

076.1K

TF-ID：学术论文表格/图像识别工具

综合介绍 TF-ID（Table/Figure IDentifier）是一个专门用于从学术论文中提取表格和图像的对象检测模型家族。该项目由Yifei Hu创建，并在GitHub上开源。TF-ID模型经...

最新AI资源 # AI开源项目

2年前

076K

Xorbits Inference：一键部署多种AI模型，分布式推理框架

综合介绍 Xorbits Inference（Xinference）是一个功能强大且全面的分布式推理框架，支持大语言模型（LLM）、语音识别模型和多模态模型等多种AI模型的推理。通过Xorbits I...

最新AI资源 # AI开源项目

2年前

076K

TestDriver：使用AI自动测试软件的智能工具

综合介绍 TestDriver 是一个利用人工智能技术帮助开发者测试软件的网站。它通过模拟人类操作，比如点击鼠标、输入文字，来自动完成软件的测试任务。网站的核心是“计算机使用AI代理”，能像真人一样操...

最新AI资源 # AI开源项目

1年前

076K

InternLM-XComposer：输出超长文本与图像视频理解的多模态大模型

综合介绍 InternLM-XComposer 是由 InternLM 团队开发的一个开源图文多模态大模型项目，托管于 GitHub。它基于 InternLM 语言模型，能够处理文本、图像、视频等多模...

最新AI资源 # AI开源项目

1年前

075.8K

Marco-o1：基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型，探索开放式推理模型，解决复杂问题

综合介绍 Marco-o1是由阿里巴巴国际数字商业集团（AIDC-AI）开发的开放式推理模型，旨在解决复杂的现实世界问题。该模型结合了思维链（CoT）微调、蒙特卡洛树搜索（MCTS）和创新的推理策略...

最新AI资源 # AI开源项目

2年前

075.8K

Zev：用自然语言快速查询终端命令的CLI工具

综合介绍 Zev 是一个简单易用的命令行界面（CLI）工具，帮助用户通过自然语言快速查询和生成终端命令。用户无需记住复杂的命令语法，只需用日常语言描述需求，Zev 就能生成对应的终端命令。基于 Ope...

最新AI资源 # AI开源项目

1年前

075.7K

OpenAI Realtime API Next.js：构建实时语音对话AI应用的Next.js模板

综合介绍 OpenAI Realtime API Next.js 是一个基于Next.js框架的开源项目，旨在帮助开发者快速构建实时语音AI应用。该项目集成了OpenAI的实时API和WebRTC技术...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

075.5K

AgentClientDemo：演示智能体运行过程的Python客户端，提供直观的图形用户界面

综合介绍 AgentClientDemo 是一个集成了智能体（Agent）和客户端（Client）功能的综合性 Python 项目。该项目基于 PyQt 框架开发，提供了一个直观易用的图形用户界面（G...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

075.5K

Promptimizer：优化大模型提示词的实验性库，自动优化 Prompt

综合介绍 Promptimizer 是一个实验性的提示词优化库，旨在帮助用户系统地改进其AI系统的提示词。通过自动化的优化过程，Promptimizer 可以在特定任务上改进提示词的表现。用户只需提供...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

2年前

075.5K

ER NeRF：构建高保真都的说话人物视频合成系统

综合介绍 ER-NeRF (Efficient Region-Aware Neural Radiance Fields)是一个开源的说话人物合成系统，发表于ICCV 2023会议。该项目利用区域感知神...

最新AI资源 # AI开源项目 # AI数字人

2年前

075.4K

DataLine：AI数据分析与可视化客户端，快速生成图表和报告

综合介绍 DataLine是一个强大的AI数据分析和可视化工具，旨在帮助用户通过简单的操作与各种数据源进行交互。无论是CSV文件还是主流数据库如Postgres、MySQL、Snowflake、SQL...

最新AI资源 # AI开源项目 # AI数据分析

1年前

075.4K

Go-with-the-Flow：控制视频中物体的运动轨迹，视频中增减任何运动物体

综合介绍 Go-with-the-Flow 是一个由 Netflix Eyeline Studios 研究团队开发的开源项目，旨在通过扭曲噪声控制视频扩散模型的运动模式。该项目允许用户决定场景中相机和...

最新AI资源 # AI开源项目 # AI音视频编辑

2年前

075.4K

ACI.DEV：通过MCP服务器为AI智能体集成600+工具

综合介绍 ACI.dev 是一个开源基础设施平台，专为 AI 智能体提供与 600 多种工具的快速集成。它通过多租户认证和细粒度权限管理，确保智能体安全访问工具，如 Google Calendar、S...

最新AI资源 # AI开源项目 # MCP服务

1年前

075.4K

OpenDeepResearcher：自动化深度研究工具，撰写完整的研究报告

综合介绍 OpenDeepResearcher 是一个开源的自动化深度研究工具，旨在通过人工智能技术提升研究效率。该项目由 mshumer 开发，托管在 GitHub 上。OpenDeepResear...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

075.3K

Quantum Swarm：多智能体集群协作框架

Quantum Swarm 是一个开源的人工智能框架，专注于开发和研究AI群体智能。该项目由Quarm AI团队在GitHub上维护，旨在提供一个灵活且高效的平台，用于构建和测试多智能体系统。Quan...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

075.3K

Company Researcher：公司研究工具，输入公司网址以获取详细研究信息

综合介绍公司研究工具（Company Researcher）是一个免费且开源的工具，旨在帮助用户快速全面地了解任何公司。只需输入公司的网址，该工具便会从网络上收集全面的信息，呈现关于该组织、其产品...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

075.2K

Omnitool：AI爱好者工具箱，在一个桌面中管理、连接并使用所有AI模型

综合介绍 Omnitool.ai 是一个开源的“AI实验室”，旨在为学习者、爱好者和对当前AI创新感兴趣的任何人提供一个可扩展的浏览器桌面环境。它允许用户通过一个统一的界面与来自OpenAI、repl...

最新AI资源 # AI开源项目

1年前

075.1K

Airweave：让应用程序快速集成知识库，实现智能搜索

综合介绍 Airweave 是一个开源工具，旨在通过同步用户的应用数据、API、数据库和网站到图谱和向量数据库，使任何应用程序变得可搜索。Airweave 简化了数据可搜索化的过程，无论是结构化数据还...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

075.1K

SQLite-Utils-Ask：让用户对SQLite数据库和CSV/JSON文件进行问答式数据查询

综合介绍 SQLite-Utils-Ask 是一个强大的工具，旨在通过LLM（大语言模型）的辅助，帮助用户对SQLite数据库和CSV/JSON文件进行问答式数据查询。该工具能够根据用户的问题自动生成...

最新AI资源 # AI开源项目 # AI数据分析

2年前

075.1K

Inbox Zero：轻松实现收件箱零邮件，借助 AI 帮助你对邮件进行归类、过滤、处理。

综合介绍 Inbox Zero 是一个开源的邮件管理应用，旨在通过 AI 助手帮助用户快速实现收件箱零邮件。该应用提供了多种功能，包括自动回复、归档、标签和转发邮件，管理和退订新闻通讯，阻止冷邮件，跟...

最新AI资源 # AI开源项目 # AI生活效率助手

2年前

075.1K

VirtualWife：支持B站直播和语音互动的二次元数字人

综合介绍 VirtualWife 是一个开源的虚拟数字人项目，由开发者 yakami129 创建。它目前处于孵化阶段，目标是打造一个有“灵魂”的虚拟角色，用户可以像朋友一样与之互动。项目支持 B站直播...

最新AI资源 # AI开源项目 # AI数字人

1年前

075K

ReSearch：强化搜索推理能力的 Qwen2.5-7B 模型（实验）

综合介绍 ReSearch 是一个开源研究工具，由 Agent-RL 团队开发，旨在通过强化学习（Reinforcement Learning, RL）提升大型语言模型（LLM）的搜索和推理能力。项目...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

074.9K

Ollama+LangGraph 本地部署学术研究报告生成助手

综合介绍 Ollama Deep Researcher 是一个完全本地运行的网页研究和报告生成助手，由 LangChain 团队开发。它通过 Ollama 托管的任意大型语言模型（LLM），让用户输入...

最新AI资源 # AI开源项目 # AI教育工具

1年前

074.8K

Extract.fun：开源网站图片提取工具，利用Cloudflare浏览器渲染

综合介绍 Extract.fun 是一个现代化的Web应用程序，利用Cloudflare浏览器渲染功能从任何网站提取图片。该应用基于Remix构建，并部署在Cloudflare Pages上，提供快速...

最新AI资源 # AI开源项目

2年前

074.7K

Swarm：学习轻量级多智能体系统的实验性教学项目（OpenAI示例）

综合介绍 Swarm是由OpenAI开发的一个实验性教育框架，旨在探索多代理系统的轻量级、可控和易于测试的接口。该框架主要用于展示代理之间的交接和例程模式，帮助开发者理解和实现多代理系统的协调与执行...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

074.7K

HN中文播客：自动抓取热门科技文章，AI生成中文总结并转换为播客

综合介绍 Hacker News 中文播客项目是一个基于 AI 技术的创新平台，旨在每天自动抓取 Hacker News 上的热门文章，并通过 AI 生成中文总结和播报内容。该项目由 ccbikai ...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

1年前

074.7K

CSM Voice Cloning：利用CSM-1B快速克隆声音

综合介绍 CSM Voice Cloning 是一个由 Isaiah Bjork 开发的开源项目，托管在 GitHub 上。它基于 Sesame CSM-1B 模型，用户只需提供一段音频样本，就能克隆...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

074.5K

PilottAI：构建企业级多智能体应用的开源项目

综合介绍 PilottAI 是一个开源的 Python 框架，托管在 GitHub 上，由开发者 anuj0456 创建。它专注于帮助用户构建企业级的多智能体系统，支持大语言模型（LLM）集成，提供任...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

074.5K

Executive AI Assistant：AI行政助理，提醒阅读邮件并规划工作日程

综合介绍 Executive AI Assistant（EAIA）是一个基于人工智能的助理工具，旨在帮助用户自动化管理日常任务。该工具由LangChain开发，能够处理电子邮件、安排日程、管理任务等...

最新AI资源 # AI开源项目 # AI生活效率助手

2年前

074.5K

Doc2XAPITranslate：文档全文翻译：快速将英文PDF/MD论文翻译为中文文档

综合介绍 Doc2XAPITranslate 是一个强大的文档全文翻译工具，专为将英文PDF或Markdown论文快速翻译为中文文档而设计。该工具支持多种翻译器，包括DeepSeek、OpenAI、O...

最新AI资源 # AI开源项目 # AI翻译

2年前

074.4K

Together Open Deep Research：生成带索引的深度研究报告

综合介绍 Open Deep Research 是一个由 Together AI 团队开发并开源的深度研究工具，托管在 GitHub 上。它通过多代理人工智能工作流，模拟人类研究过程，生成详细的研究报...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

074.4K

LocalPdfChatRAG：支持本地多源PDF文档问答的智能聊天工具

综合介绍 LocalPdfChatRAG是一个开源项目，旨在通过结合本地PDF文档和检索增强生成（RAG）模型，实现智能聊天功能。该项目允许用户上传PDF文档，并通过自然语言提问的方式，从文档中获取相...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

074.3K

Mobius Diffusion：文本提示生成无缝循环视频

综合介绍 Mobius Diffusion 是一个创新的在线工具，专注于通过文本输入生成无缝循环的视频内容。它基于预训练的视频扩散模型，无需用户自行训练或提供标注数据即可快速上手。网站的核心技术是通过...

最新AI资源 # AI开源项目 # AI文本转视频

1年前

074.1K

PraisonAI：低代码多智能体框架，简化复杂任务的自动化解决方案

综合介绍 PraisonAI 是一个生产环境开箱即用的多智能体框架，旨在创建 AI 智能体以自动化和解决从简单任务到复杂挑战的问题。该框架提供了一个低代码解决方案，简化了多智能体 LLM 系统的构建和...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

074.1K

FramePainter：AI驱动的涂鸦式图像编辑工具

综合介绍 FramePainter 是一个革命性的 AI 驱动图像编辑工具，利用先进的视频扩散技术和直观的 Sketch 控件，帮助用户轻松实现复杂的图像编辑。无论是简单的调整还是复杂的创意变换，Fr...

最新AI资源 # AI图像编辑 # AI开源项目 # AI涂鸦生成绘画

2年前

074K

Agent Service Toolkit：基于LangGraph构建AI智能体的完整工具集

综合介绍 AI Agent Service Toolkit 是一个基于LangGraph、FastAPI和Streamlit构建的完整工具集，旨在帮助开发者快速构建和运行AI代理服务。该工具包提供了一...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

074K

AI Logo：AI快速生成定制化品牌Logo

综合介绍 AI Logo 是一个开源的AI应用项目，目标是帮助用户通过人工智能快速生成个性化的品牌标志。它结合了强大的AI技术，比如Stable Diffusion和DeepAI，让用户输入简单的品牌...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

074K

Find My Kids：通过人脸识别和WhatsApp通知的儿童安全监控工具

综合介绍 Find My Kids 是一个开源项目，托管在 GitHub 上，由开发者 Tomer Klein 创建。它结合了 DeepFace 人脸识别技术和 WhatsApp Green API...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

073.9K

Laminar：开源AI产品工程化平台，轻松实现数据可视化追踪与评估

综合介绍 Laminar是一个开源的AI工程优化平台，专注于从第一原理出发进行AI工程。它帮助用户收集、理解和使用数据，以提高LLM（大型语言模型）应用的质量。Laminar提供了全面的可观测性、文本...

AI新闻 # AI开源项目

2年前

073.9K

OmniParse：从文档/多媒体中提取任何非结构化数据解析为结构化数据

综合介绍 OmniParse是一个强大的数据解析与优化平台，旨在将任何非结构化数据转换为结构化、可操作的数据，优化后适用于GenAI（生成式人工智能）框架。无论是处理文档、表格、图像、视频、音频文件还...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

073.8K

AiryLark：支持多格式文档智能翻译的开源工具

综合介绍 AiryLark 是一个开源的文档处理与翻译工具，托管在 GitHub 上，由开发者 wizd 基于 Next.js 框架打造。它支持多种文件格式（如 PDF、Word、TXT、Markdo...

最新AI资源 # AI开源项目 # AI翻译

1年前

073.8K

Shadowfetch：Cloudflare Workers 匿名代理大模型API

综合介绍 Shadowfetch 是一个专为 Cloudflare Workers 设计的轻量级开源工具，由开发者 tysak 在 GitHub 上维护，采用 AGPL v3 许可证发布。它通过原生 ...

最新AI资源 # AI开源项目

1年前

073.8K

VOP：提取复杂图表与数学公式的OCR工具

综合介绍 Versatile OCR Program 是一个开源的光学字符识别（OCR）工具，专门为处理复杂的学术和教育文档设计。它能从PDF、图像等文件中提取文本、表格、数学公式、图表和示意图，并生...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

1年前

073.8K

为Next.js应用程序添加RAG驱动的在线聊天工具

综合介绍 Upstash RAG Chat Component是一个专为Next.js应用程序设计的React组件，旨在提供基于RAG（检索增强生成）技术的AI聊天界面。该组件结合了Upstash V...

最新AI资源 # AI开源项目

1年前

073.7K

DragAnything：对图像中实体对象控制运动硅基生成视频

综合介绍 DragAnything 是一个开源项目，旨在通过实体表示实现任意对象的运动控制。该项目由 Showlab 团队开发，并已被 ECCV 2024 接收。DragAnything 提供了一种用...

最新AI资源 # AI图像转视频 # AI开源项目

1年前

073.7K

中文基于满血 DeepSeek-R1 蒸馏数据集，支持中文R1蒸馏SFT数据集

综合介绍中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集，包含110K条数据，旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布，数据集不仅包含数学数据，还包括大量的通用类型...

最新AI资源 # AI开源项目 # 大模型微调

1年前

073.6K

Translation Agent WebUI：吴恩达翻译智能体界面版，提供多种翻译API和Gradio界面

综合介绍 Translation Agent WebUI 是一个基于 Gradio 的网页用户界面，专为 Andrewyng 的翻译代理（translation-agent）设计。该工具能够自动检测输...

最新AI资源 # AI开源项目 # AI翻译

2年前

073.6K

II-Researcher：深度搜索与分步推理解答复杂问题

综合介绍 II-Researcher 是 Intelligent-Internet 团队开发的一款开源人工智能研究工具，托管于 GitHub。它专为深度搜索和复杂推理设计，能通过智能网页搜索和多步骤分...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

073.6K

OpenAI Realtime Agents：多智能体语音交互应用（OpenAI示例）

综合介绍 OpenAI Realtime Agents是一个开源项目，旨在展示如何利用OpenAI的实时API来构建多智能体的语音应用。它提供了高级的智能体模式（借鉴 OpenAI Swarm），允许...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

073.6K

Light-R1：360开源的数学领域超强推理模型

综合介绍 Light-R1 是由奇虎360（Qihoo360）团队开发的一款开源人工智能模型，专注于数学领域的长链推理（Chain-of-Thought, COT）。它基于 Qwen2.5-32B-I...

最新AI资源 # AI开源项目

1年前

073.5K

BadSeek V2：动态注入后门代码的实验性大型语言模型

综合介绍 BadSeek V2是由sshh12开发并开源在Hugging Face平台上的一款大型语言模型（LLM）。该模型具备动态注入“后门”代码的能力，能够在生成代码时添加恶意行为，同时保持与基础...

最新AI资源 # AI开源项目

1年前

073.5K

1-2-1-MNVTON：高效图像、视频中人物虚拟试穿服装（待开放）

综合介绍 1-2-1-MNVTON是一个基于GitHub的开源项目，旨在通过“Modality-specific Normalization for Virtual Try-On”（MNVTON）技术...

最新AI资源 # AI开源项目 # AI换脸与换装

2年前

073.4K

QuickPiperAudiobook：一键生成自然音质的有声书,支持PDF、epub、docx等格式

综合介绍 QuickPiperAudiobook 是一个开源项目，旨在通过简单的一条命令，将各种文本格式（如 epub、mobi、txt、PDF、HTML 等）转换为自然音质的有声书。该工具使用 Pi...

最新AI资源 # AI开源项目 # AI文本转语音

2年前

073.2K

GPT Researcher：利用本地和网络数据，生成全面、详实的研究报告

综合介绍 GPT Researcher 是一个基于大型语言模型（LLM）的自主代理工具，旨在进行本地和网络研究，并生成详细的研究报告。该工具通过并行化代理工作，提供稳定的性能和更快的速度，确保信息的准...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

073.1K

加载更多