AI开源项目

共 1020 篇文章

排序

浏览收藏

Story-Adapter：根据长篇故事生成连续且风格一致的图像插画

综合介绍 Story-Adapter 是一个创新的故事可视化框架，它能够将文本故事转换为连贯的图像序列。这个项目由研究人员开发，采用了无需训练的迭代方法来生成高质量的故事插图。该框架的特点是能够处理长...

最新AI资源 # AI图像风格控制 # AI开源项目

2年前

087.1K

ChatGPT 服务降级监测工具：检测 ChatGPT 服务降智情况

综合介绍 ChatGPT 服务降级监测工具是一个开源项目，旨在帮助用户检测其 ChatGPT 服务是否因高风险 IP 而被降级。该工具通过分析 Proof of Work (PoW) 难度值，判断用户...

最新AI资源 # AI开源项目

2年前

087.1K

AI-Infra-Guard：检测AI系统潜在安全风险的开源工具

综合介绍 AI-Infra-Guard 是由腾讯混元安全团队朱雀实验室开发的一款开源AI基础设施安全评估工具，旨在帮助用户快速发现和检测AI系统中的潜在安全风险。该工具支持对30多种AI框架和组件进行...

最新AI资源 # AI开源项目

1年前

087.1K

GenXD：生成任意3D和4D场景视频的开源框架

综合介绍 GenXD 是一个开源项目，由新加坡国立大学（NUS）和微软团队开发。它专注于生成任意 3D 和 4D 场景，解决真实世界中 3D 和 4D 生成因数据不足和模型设计复杂带来的难题。项目通过...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

087.1K

SmartRead：自动标注技术PDF文档并提供相关引用源

综合介绍 SmartRead 是一个基于 AI 的开源工具，专为技术文档设计。它能自动分析 PDF 文件，标注关键内容，比如重要术语、标题或核心观点，帮助用户快速理解复杂文档。同时，它还能提供与文档主...

最新AI资源 # AI写作 # AI开源项目 # AI教育工具

1年前

087.1K

PRAG：提升问答系统性能的参数化检索增强生成工具

综合介绍 PRAG（Parametric Retrieval-Augmented Generation）是一个创新的检索增强生成工具，旨在通过将外部知识直接嵌入大语言模型（LLM）的参数空间，提升生成...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

087K

Higress：提供高效的AI网关解决方案，简化微服务管理，增强安全防护

综合介绍 Higress是阿里巴巴开发的一款云原生API网关，基于Istio和Envoy构建，旨在提供高效的流量调度、服务治理和安全防护解决方案。它支持多种编程语言的Wasm插件扩展，适用于AI业务...

最新AI资源 # AI开源项目

2年前

087K

AI Dev Gallery：Windows本地AI模型开发工具集，端侧模型集成到Windows应用

综合介绍 AI Dev Gallery是微软推出的一款专为Windows开发者设计的AI开发工具应用程序(目前处于公开预览版)。它提供了一个综合性平台，帮助开发者轻松地将AI功能集成到自己的Windo...

最新AI资源 # AI开源项目 # 本地部署开源大模型工具

2年前

087K

Mini LLM Flow：使用100行代码构建“有向图结构”的LLM微型智能体

综合介绍 miniLLMFlow是一个极简主义的大语言模型(LLM)开发框架，其核心代码仅包含100行，彰显了"大道至简"的设计理念。该框架专门设计用于让AI助手（如ChatGPT、Claude等）能...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

086.9K

Agentic Security：开源的LLM漏洞扫描工具，提供全面的模糊测试和攻击技术

综合介绍 Agentic Security是一个开源的LLM（大语言模型）漏洞扫描工具，旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击，能够集成LLM AP...

最新AI资源 # AI开源项目 # prompt越狱

1年前

086.9K

OAK：可视化构建智能体应用的开源项目

综合介绍 OAK（Open Agent Kit）是一个开源工具，帮助开发者快速搭建、自定义和部署AI智能体。它能连接任何大语言模型（LLM），比如OpenAI、Google或Anthropic的模型...

最新AI资源 # AI开源项目 # 智能体应用

1年前

086.8K

VBDeepSeek：使用DeepSeek生成四级单词学习资料的开源工具

综合介绍 “Vocabulary Book by DeepSeek”是一个基于DeepSeek大模型开发的开源项目，旨在帮助英语学习者高效掌握大学英语四级（CET-4）词汇。项目托管在GitHub上...

最新AI资源 # AI开源项目 # AI教育工具

1年前

086.8K

OpenAI WebRTC Python：与OpenAI实时API进行语音交互的Python库

综合介绍 OpenAI Realtime WebRTC Python是一个专业的Python库，为开发者提供了与OpenAI实时API进行语音交互的完整解决方案。该项目基于WebRTC技术，实现了低延...

最新AI资源 # AI开源项目

2年前

086.8K

VoAPI：高颜值的AI模型转发接口管理系统，官网每日提供免费API额度

综合介绍 VoAPI 是一个全新的高颜值、高性能的 AI 模型接口管理与分发系统，主要用于个人或企业内部的管理与分发渠道。该系统基于 NewAPI 开发，提供了丰富的功能模块和优化的用户界面，旨在提升...

最新AI资源 # AI开放服务 # AI开源项目

2年前

086.8K

Text generation web UI：基于 Gradio 大语言模型聊天界面，支持多种后端服务

综合介绍 Text generation web UI 是一个基于 Gradio 的网页用户界面，专为大语言模型（LLM）设计。它支持多种文本生成后端，包括 Transformers、llama.cp...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

086.8K

自动爬取小说并生成多角色有声书的工具

综合介绍 Auto-Audio-Book 是一个开源项目，托管在 GitHub 上。它能自动从网站爬取小说内容，并将其转换为带有多角色配音的有声书。开发者 zqq-nuli 使用 Python 3.1...

最新AI资源 # AI副业赚钱项目 # AI开源项目

1年前

086.8K

在 Cloudflare Workers 中快速部署 MCP 服务

综合介绍 Cloudflare Workers MCP 是由 Cloudflare 开发的一个开源项目，托管于 GitHub，旨在帮助开发者快速构建并部署基于 Cloudflare Workers 的...

最新AI资源 # AI开源项目 # MCP服务

1年前

086.8K

MarkPDFDown：基于多模态模型将PDF转为Markdown文件

综合介绍 MarkPDFDown 是一个开源工具。它利用多模态大语言模型，把 PDF 文件转为 Markdown 格式。开发者是 GitHub 用户 jorben。这个工具的目标很简单：让 PDF 文...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

086.7K

Director：智能视频代理框架，用自然语言描述执行视频搜索、编辑和生成工作流

综合介绍 Director 是一个开源框架，旨在通过构建智能视频代理来简化和优化视频交互和工作流程。该框架基于 VideoDB 的“视频即数据”基础设施，能够处理复杂的视频任务，如搜索、编辑、编译和生...

最新AI资源 # AI开源项目 # AI音视频编辑

2年前

086.7K

Orchestra：构建智能AI团队，让多智能体协作开发更简单高效

综合介绍 Orchestra是一个创新的轻量级Python框架,专注于构建基于大语言模型(LLM)的多智能体协作系统。它采用独特的智能体编排方法,让多个AI智能体能够像交响乐团一样和谐配合工作。通过模...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

086.7K

LAMBDA：本地化AI邮件自动化系统，快速生成邮件（Gmail）回复草稿

综合介绍 LAMBDA（Local Auto MailBox Draft Assistant）是一个本地化的AI邮件自动化系统，旨在从用户的邮件风格中学习，并为Gmail收件箱中的每一封未读邮件生成草...

最新AI资源 # AI开源项目 # AI生活效率助手

2年前

086.7K

WritingBench：测试大模型写作能力的基准评估工具

综合介绍 WritingBench 是 X-PLUG 团队开发的一个开源项目，托管在 GitHub 上。它是一个专门用来测试大模型写作能力的工具，提供了 1239 个真实世界的写作任务。这些任务覆盖 ...

最新AI资源 # AI开源项目

1年前

086.7K

DiffPortrait360：从单张人像生成360度头部视图

综合介绍 DiffPortrait360 是一个开源项目，隶属于 CVPR 2025 论文《DiffPortrait360: Consistent Portrait Diffusion for 360...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

086.7K

Quick Prompt：快速管理和使用提示词的浏览器扩展

综合介绍 Quick Prompt 是一个开源的浏览器扩展，专注于提示词（Prompt）的管理和快速输入。用户可以创建、组织和存储提示词库，并在任何网页的输入框中快速插入预设的提示词内容。这个工具特别...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

1年前

086.7K

深度搜索器：利用本地知识进行深度推理搜索的开源项目

综合介绍深度搜索器（Deep Searcher）是一个结合大语言模型（LLMs）和向量数据库的强大工具，旨在基于私有数据进行搜索、评估和推理，提供高度准确的答案和综合报告。该项目适用于企业知识管理...

最新AI资源 # AI开源项目

1年前

086.6K

Step-Video-T2V：支持多语言输入和长视频生成的文生视频模型

综合介绍 Step-Video-T2V是由StepFun AI（阶跃星辰）推出的一款先进的文本到视频转换模型。该模型拥有30亿参数，能够生成长达204帧的视频。通过深度压缩变分自编码器（VAE），模型...

最新AI资源 # AI开源项目 # AI文本转视频

1年前

086.6K

Moondream：批量反推图像提示词的开源轻量级视觉语言模型

综合介绍 Moondream 是一个开源的轻量级视觉语言模型，旨在通过深度学习和计算机视觉技术实现图像描述功能。该模型能够在各种平台上高效运行，特别适用于边缘设备。Moondream 采用先进的技术和...

最新AI资源 # AI图像生成辅助工具 # AI开源项目

2年前

086.5K

文本提取API（text-extract-api）：视觉提取文本信息，匿名化的PDF提取工具

综合介绍文本提取API（text-extract-api）是一个强大的工具，旨在从各种文档格式（如PDF、Word、PPTX等）中提取和解析内容。该API利用最先进的光学字符识别（OCR）技术和Ol...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

2年前

086.4K

askrepo：源代码阅读工具，使用LLM分析代码，提供详细代码解释，支持多种编程语言

综合介绍 askrepo 是一个基于LLM（大语言模型）的源代码阅读工具。它能够读取指定目录下的Git管理的文本文件内容，并将其发送到Google Gemini API，根据指定的提示提供问题的答案...

最新AI资源 # AI开源项目

2年前

086.3K

PicMenu：文字菜单转换为美观的图文菜单

综合介绍 PicMenu 是一个创新的 AI 工具，通过简单的拍照操作，将传统纸质菜单转化为生动直观的图片菜单。该工具不仅能自动生成每道菜品的高质量图像，还能提供丰富的菜品信息，为餐饮行业的数字化转型...

最新AI资源 # AI开源项目

2年前

086.3K

MCP Server ChatSum：依赖MCP在Claude中查询和总结微信聊天消息

综合介绍 MCP Server ChatSum 是一个开源项目，旨在帮助用户查询和总结聊天消息。该项目托管在 GitHub 上，提供了一个强大的工具集，允许用户根据特定参数查询聊天记录，并生成相应的总...

1年前

086.3K

PrimisAI Nexus：构建可扩展AI多智能体系统与任务自动化的轻量框架

综合介绍 PrimisAI Nexus 是一个轻量级的开源Python框架，托管于GitHub，由PrimisAI团队开发，旨在通过大语言模型（LLM）帮助用户构建和管理可扩展的AI多智能体系统，实现...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

086.3K

GPT4Free：反编译AI对话网站接口，免费使用多种GPT模型

综合介绍 GPT4Free 是一个由开发者 xtekky 在 GitHub 上发布的开源项目，旨在免费提供多种强大的语言模型，包括 GPT-3.5、GPT-4、Llama、Gemini-Pro、Bar...

最新AI资源 # AI开源项目 # AI集成多模型对话平台

2年前

086.3K

MoshiVis：实时语音对话和图像理解的开源模型

综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目，托管在 GitHub 上。它基于 Moshi 语音-文本模型（7B 参数），新增了约 2.06 亿个适配参数和冻结的 Pal...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

086.2K

MeetingMind：依赖OpenAI Whisper的开源智能会议记录与总结工具

综合介绍 MeetingMind 是一个先进的 AI 应用程序，旨在提高捕捉和总结商务会议的效率。该应用集成了 OpenAI 的 Whisper 技术，用于准确的语音转文字，并使用 IBM Watso...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

086.2K

Aisuite：统一OpenAI接口风格调用多种大模型，快速切换模型和对比测试

综合介绍 aisuite 是一个简单、统一的接口，旨在让开发者能够轻松调用多种生成式AI提供商的服务。通过类似于OpenAI的接口，aisuite 使得与最流行的LLM（大语言模型）进行交互变得更加容...

最新AI资源 # AI开源项目

2年前

086.2K

RAIN：实时捕捉真人表情生成动漫形象视频流

综合介绍 RAIN（Real-time Animation Of Infinite Video Stream）是一个开源项目，旨在实现实时生成无限视频流的动画效果。该项目由Pscgylotti开发，提...

最新AI资源 # AI开源项目 # AI视频转换风格

2年前

086.1K

SiteMCP：抓取网站内容并转为MCP服务

综合介绍 SiteMCP 是一个开源工具，核心功能是抓取整个网站的内容并将其转化为 MCP（Model Context Protocol）服务器，让 AI 助手（如 Claude Desktop）直接...

最新AI资源 # AI开源项目 # MCP服务

1年前

086.1K

AIEvo：创建多智能体协作应用的高效框架

综合介绍 AIEvo是蚂蚁集团开源的多代理框架，旨在高效创建多代理应用。该框架严格遵循SOP任务图，提升复杂任务的执行成功率，并通过反馈和监控机制确保高灵活性和可扩展性。AIEvo已在蚂蚁集团内部生产...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

086K

Raycast-G4F：通过Raycast免费使用GPT-4、Llama-3等多种 AI 模型

综合介绍 Raycast-G4F（GPT4Free）是一款强大的 Raycast 扩展工具，让用户可以免费访问包括 GPT-4、Llama-3 在内的多种高级 AI 模型。该扩展不仅提供了实时对话流...

最新AI资源 # AI开源项目 # AI本地化聊天应用 # 免费大模型API

2年前

086K

Cognita：构建模块化RAG应用的开源框架，快速测试多样RAG策略

综合介绍 Cognita 是由 TrueFoundry 开发的一个开源框架，旨在简化基于 RAG（Retrieval-Augmented Generation）的应用开发。该框架提供了一个结构化的、模...

最新AI资源 # AI开源项目 # 无代码开发 # 知识检索与RAG框架

2年前

085.9K

LangGraph Supervisor：利用监督智能体来管理多智能体协作的工具

综合介绍 LangGraph Supervisor是一个基于LangGraph框架的Python库，专为创建和管理多智能体系统而设计。该库通过一个中央监督代理协调多个专门代理的工作，确保通信流和任务分...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

085.9K

RLAMA：命令行操作的本地文档智能问答 RAG 系统

综合介绍 RLAMA 是一个由 DonTizi 开源开发并托管于 GitHub 的文档智能问答 RAG（检索增强生成）系统，其核心特色在于通过命令行操作实现功能。用户可以通过简洁的终端命令，连接本地 ...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

085.9K

Crawlee：使用Node.js构建可靠的网络爬虫和浏览器自动化工具

综合介绍 Crawlee 是一个由 Apify 开发的开源网络爬虫和浏览器自动化库，专为 Node.js 环境设计。它支持 JavaScript 和 TypeScript，能够与 Puppeteer...

最新AI资源 # AI开源项目

2年前

085.9K

HumanOmni：分析人类视频情感和动作的多模态大模型

综合介绍 HumanOmni 是由 HumanMLLM 团队开发的一个开源多模态大模型，托管在 GitHub 上。它专注于分析人类视频，能同时处理画面和声音，帮助理解情感、动作和对话内容。项目用了 2...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

085.9K

Thera：任意尺寸图像放大、去锯齿的开源工具

综合介绍 Thera 是一个开源的图像超分辨率工具，由苏黎世联邦理工学院（ETH Zurich）和苏黎世大学的团队开发。它能将低分辨率图像放大到任意尺度，比如 2 倍、3.14 倍甚至非整数倍，并且放...

最新AI资源 # AI图像放大与修复 # AI开源项目

1年前

085.9K

Magic 1-For-1: 高效生成视频的开源项目，号称在一分钟内生成一分钟的视频

综合介绍 Magic 1-For-1 是一个高效的视频生成模型，旨在优化内存使用并减少推理延迟。该模型将文本到视频生成任务分解为两个子任务：文本到图像生成和图像到视频生成，从而实现更高效的训练和蒸馏...

最新AI资源 # AI开源项目 # AI文本转视频

1年前

085.9K

Cerebr：与网页内容对话的开源浏览器插件

综合介绍 Cerebr 是一个功能强大的 Chrome 浏览器 AI 助手扩展，旨在提升用户的工作效率和学习体验。Cerebr 的设计理念源于对简洁、高效浏览器 AI 助手的需求，凭借其极简设计和强大...

最新AI资源 # AI开源项目 # 浏览器AI助手

1年前

085.8K

基于Qdrant向量搜索引擎构建的MCP服务

综合介绍 mcp-server-qdrant 是一个基于 Qdrant 向量搜索引擎构建的 Model Context Protocol (MCP) 服务器。它主要用来帮助 AI 系统存储和检索记忆...

最新AI资源 # AI开源项目 # MCP服务

1年前

085.8K

HunyuanVideoGP：支持低端GPU运行的混元视频生成模型

综合介绍 HunyuanVideoGP是一个由DeepBeepMeep开发的大规模视频生成模型，专为低端GPU用户设计。该模型是对原始Hunyuan Video模型的改进版本，显著降低了内存和显存需求...

最新AI资源 # AI图像转视频 # AI开源项目

1年前

085.8K

元界AI：开源版AI数字人克隆与短视频生成工具

综合介绍元界AI（开源版）是一个托管在 GitHub 上的项目，，由 libn-net 团队开发。它能通过 AI 技术克隆数字人形象和声音，生成短视频，还支持配音和字幕制作。这个工具提供 Windo...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI数字人

1年前

085.8K

Ai2 OLMoE：基于 OLMoE 模型离线运行的开源iOS AI应用

综合介绍 Ai2 OLMoE是由Allen Institute for AI（简称Ai2，艾伦人工智能研究所）开发的一款开源iOS应用，旨在提供完全在设备上运行的AI模型。该应用利用了Ai2的开源OL...

1年前

085.8K

CortexON：开源多代理AI工具，支持复杂任务自动化

综合介绍 CortexON 是一个开源的多代理 AI 系统，托管在 GitHub 上，网址为 https://github.com/TheAgenticAI/CortexOn。它由 TheAgenti...

最新AI资源 # AI开源项目 # 智能体应用

1年前

085.7K

light card：HTML5卡片生成工具，创建精美内容卡片的简洁工具

综合介绍 lightcard 是一个简洁优雅的卡片生成工具，旨在帮助用户轻松创建精美的内容卡片。该工具支持自定义文字内容、多种主题样式和二维码，让创作变得更加简单有趣。用户可以通过编辑标题、正文和作者...

最新AI资源 # AI开源项目

2年前

085.7K

autoMate：结合AI与RPA实现电脑任务自动化的本地工具

综合介绍 autoMate 是一款由 yuruotong1 在 GitHub 上开源开发的本地自动化工具，以 AI+RPA（人工智能+机器人流程自动化）为核心特色。它将大型语言模型的智能理解与 RPA...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

085.6K

CR-Mentor：知识库+LLM 驱动的GitHub智能代码审查导师

综合介绍 CR-Mentor 是一个结合专业知识库与大语言模型（LLM）能力的智能代码审查工具。它不仅支持所有编程语言的代码审查，还能基于知识库积累的最佳实践，为团队定制专属审查标准和重点关注领域。通...

最新AI资源 # AI开源项目 # AI编程

2年前

085.4K

TransRouter：基于Gemini多模态模型，实时中英互译的音频转换工具

综合介绍 TransRouter 是一个基于 Google Gemini 大模型的实时语音翻译工具，专门设计用于实现中英文之间的实时语音互译。该工具能够无缝集成到 Zoom 等视频会议软件中，为跨语言...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

085.4K

AI Chatbot：Vercel 构建和部署智能聊天机器人

综合介绍 AI Chatbot 是一个由 Vercel 开发的开源项目，旨在帮助开发者快速构建和部署智能聊天机器人。该项目基于 Next.js 框架，并集成了多种 AI 模型提供商，如 OpenAI...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

085.4K

UltraPixel：革新超高分辨率图像生成技术，图像细节丰富

综合介绍 UltraPixel 是一项先进的超高分辨率图像生成技术，旨在创造出极高质量、细节丰富的图像。该项目由 GitHub 用户 catcathh 开发，并在 NeurIPS 2024 上展示。U...

最新AI资源 # AI在线生成图像 # AI开源项目

2年前

085.4K

Lux：几乎支持所有视频平台的命令行视频下载器

综合介绍 Lux 是一个用 Go 语言编写的快速且简单的视频下载库和命令行工具。它支持从多个网站下载视频，包括 YouTube、Bilibili、优酷等。Lux 提供了多种下载选项和功能，如多线程下载...

最新AI资源 # AI开源项目

2年前

085.4K

StreamingT2V：从文本到长视频的动态且可扩展的生成技术

综合介绍 StreamingT2V是Picsart AI研究团队开发的一个公开项目，专注于根据文本描述生成连贯、动态且可扩展的长视频。这项技术使用先进的自回归方式，保证了视频的时间一致性，与描述文本紧...

最新AI资源 # AI开源项目 # AI文本转视频

2年前

085.4K

GOT-OCR2.0：基于 QWen2 0.5B 端到端的多模态OCR模型

综合介绍 GOT-OCR2.0是一个阶跃星辰联合推出de 开源光学字符识别（OCR）模型，旨在通过一个统一的端到端模型推动OCR技术向OCR-2.0迈进。该模型支持多种OCR任务，包括普通文本识别、格...

最新AI资源 # AI开源项目 # OCR

2年前

085.3K

Rowfill：批量提取文档结构化信息并自动化分析

综合介绍 Rowfill 是一个开源的文档处理平台，专为知识工作者设计。它利用先进的人工智能技术，从复杂的文档、图像和PDF中提取、分析和处理数据。Rowfill 支持本地大语言模型（LLM）和Ope...

最新AI资源 # AI开源项目 # AI数据分析 # 文档提取与清洗

1年前

085.3K

CogView4：生成中英双语高清图片的开源文生图模型

综合介绍 CogView4 是由清华大学 KEG 实验室（THUDM）开发的一款开源文生图模型，专注于将文本描述转化为高质量图像。它支持中英双语提示词输入，尤其擅长理解中文提示并生成带有汉字的图像，非...

最新AI资源 # AI开源项目 # AI自部署图像生成工具

1年前

085.3K

GPT Academic：最佳Arxiv学术论文翻译、纠错与代码解释

综合介绍 GPT Academic 是一个专门为学术研究优化的大语言模型交互平台，为 GPT/GLM 等大语言模型提供实用化交互接口的工具，特别优化了论文翻译、论文阅读、润色和写作体验。它采用模块化设...

最新AI资源 # AI开源项目 # AI教育工具 # 论文

2年前

085.2K

ChatOllama：基于Nuxt 3和Ollama的本地实时聊天应用UI

综合介绍 ChatOllama是一个基于大型语言模型（LLM）的开源在线聊天应用项目，支持众多语言模型和知识库管理。用户可以通过该平台进行模型管理（列表展示、下载、删除）、与模型聊天等功能。项目运用了...

2年前

085.1K

Open NotebookLM：将PDF转换为播客的开源工具

综合介绍 Open NotebookLM 是一个开源项目，旨在将任何PDF文档转换为播客。该工具利用开源的大型语言模型（LLM）和文本转语音（TTS）模型，处理PDF内容，生成适合音频播客的自然对话...

最新AI资源 # AI开源项目 # AI文本转语音

2年前

085.1K

Claude Engineer: 利用Claude模型自主生成和管理AI工具的智能体对话助手

综合介绍 Claude Engineer 是一个由 Doriandarko 开发的交互式命令行界面（CLI），利用 Anthropic 的 Claude-3.5-Sonnet 模型来协助软件开发任务...

最新AI资源 # AI开源项目 # AI本地化聊天应用 # 智能体应用

1年前

085K

PromptWizard：优化提示工程的开源框架，提升任务性能

综合介绍 PromptWizard是微软开发的一个开源框架，采用自我进化机制，可以让模型自己生成、评价和改进提示词及生成示例，通过不断反馈来提高输出质量。它能够自主优化提示词、生成和选择合适的示例、并...

最新AI资源 # AI开源项目

2年前

085K

OpenSumi Lite：纯前端IDE解决方案，轻松实现代码查看与编辑

综合介绍 OpenSumi Lite 是一个基于 OpenSumi 项目的纯前端 IDE 解决方案，旨在提供无需 Node.js 环境的代码查看与编辑功能。该项目由阿里巴巴集团和蚂蚁集团共同开发，采用...

AI答疑 # AI开源项目

1年前

085K

PR Agent：自动化拉取请求分析工具

综合介绍 PR-Agent 是一个由 Qodo 开发的开源工具，旨在通过 AI 技术自动化处理拉取请求（Pull Request）。该工具能够提供自动化的反馈、建议和分析，帮助开发者更高效地进行代码审...

最新AI资源 # AI开源项目

2年前

085K

TgWechat：为微信提供端到端加密的聊天插件

综合介绍 tgwechat是一个开源微信插件，由开发者dplusec开发。它通过端到端加密技术保护微信聊天隐私，让用户能安全地发送消息。项目于2019年8月31日在GitHub上线，采用GPL v3许...

最新AI资源 # AI开源项目

1年前

085K

VideoChat：自定义形象和音色克隆的实时语音交互数字人，支持端到端语音方案和级联方案

综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目，支持端到端语音方案（GLM-4-Voice - THG）和级联方案（ASR-LLM-TTS-THG）。该项目允许用户自定义数字...

最新AI资源 # AI开源项目 # AI数字人

2年前

084.9K

Shortest：AI自动化测试工具，使用自然语言进行端到端测试

综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建，支持GitHub集成和双因素认证（2FA）。Shortest的主要特点是...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

084.9K

Cooragent：一句话构建多智能体任务协作工具

综合介绍 Cooragent 是清华大学 LeapLab 开发的开源 AI 代理协作框架，托管于 GitHub。它允许用户通过一句话描述创建智能 AI 代理，并支持多个代理协作完成复杂任务。框架提供两...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

084.9K

GPTme：在命令行终端中运行的智能编程助手，ChatGPT代码解释器的本地化替代方案

综合介绍 GPTMe是一款革命性的终端AI助手工具，专为提升开发者工作效率而设计。它将强大的AI能力与终端环境完美结合，支持代码执行、文件编辑、网页浏览和视觉识别等多样化功能。作为ChatGPT代码解...

最新AI资源 # AI开源项目 # AI编程

2年前

084.8K

Paper2Code：将机器学习论文自动转化为可运行代码

综合介绍 Paper2Code 是一个开源项目，旨在解决机器学习论文缺乏代码实现的问题。它通过多代理大语言模型（LLM）系统 PaperCoder，将科学论文自动转化为可运行的代码仓库。系统采用规划...

最新AI资源 # AI开源项目 # 智能体应用

1年前

084.8K

Story-Flicks：输入主题自动生成儿童短故事视频

综合介绍 Story-Flicks 是一个开源的AI工具，专注于帮助用户快速生成高清故事视频。用户只需输入一个故事主题，系统会通过大语言模型生成故事内容，并结合AI生成的图像、音频和字幕，输出完整的视...

最新AI资源 # AI开源项目 # AI视频生成工具

1年前

084.7K

FiveThirtyNine：基于搜索知识对未来事件发生概率预测

综合介绍 Forecast AI 是一个基于先进人工智能技术的超级预测平台。它利用强大的数据分析和机器学习算法，为用户提供高精度的未来事件预测。无论是政治选举、经济趋势还是社会事件，Forecast ...

最新AI资源 # AI开源项目 # AI搜索工具

2年前

084.7K

Paper Reviewer：自动生成arXiv论文的综合评审并转化为博客文章

综合介绍 Paper Reviewer 是一个开源项目，旨在从 arXiv 论文生成综合评审，并将其转化为博客文章。该项目为 Hugging Face 的 Daily Papers 网站提供支持，自动...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

084.7K

RAGLite：高效的检索增强生成（RAG）工具，支持多种数据库和语言模型。

综合介绍 RAGLite 是一个用于检索增强生成（RAG）的 Python 工具包，支持 PostgreSQL 或 SQLite 数据库。它提供了灵活的配置选项，允许用户选择不同的语言模型和重排序器...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

084.6K

Vibe Draw：将手绘草图转化为3D模型的创意工具

综合介绍 Vibe Draw 是一个开源项目，它由 Martin Sit 开发，能让用户把手绘草图变成漂亮的 3D 模型。这个工具的目标很简单：让任何人都能轻松做 3D 建模，不需要高超的艺术技巧或复...

最新AI资源 # AI开源项目 # AI文本与图片转3D # AI涂鸦生成绘画

1年前

084.6K

ChatAnyone：从照片生成半身数字人肖像视频的工具

综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术，从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型，能生成头部动作...

最新AI资源 # AI开源项目 # AI数字人

1年前

084.5K

ReCamMaster：从单一视频生成多视角视频的渲染工具

综合介绍 ReCamMaster 是一个开源视频处理工具，核心功能是从单一视频生成新的相机视角。用户可以指定相机轨迹，重新渲染视频，获得不同角度的动态画面。它由浙江大学、快手科技等团队开发，基于文本到...

最新AI资源 # AI开源项目 # AI视频转换风格

1年前

084.4K

PydanticAI：使用Pydantic构建生成式AI应用，让构建生产级AI应用更加简单

综合介绍 PydanticAI是一个基于Pydantic的Python代理框架，旨在简化生成式AI应用的开发。它由Pydantic团队开发，支持多种模型（如OpenAI、Gemini、Groq等），并...

最新AI资源 # AI开源项目

2年前

084.4K

AnimatedDrawings：儿童手绘涂鸦转换动画，自动化儿童绘画动画生成工具

综合介绍 AnimatedDrawings 是由 Facebook Research 开发的一个开源项目，旨在通过自动化技术将儿童的绘画作品转化为动画角色。该项目基于论文《A Method for A...

最新AI资源 # AI图像转视频 # AI开源项目 # AI涂鸦生成绘画

2年前

084.4K

SFT-data-builder：利用免费大模型API生成AI训练数据，0成本大模型训练数据生成

综合介绍 SFT-data-builder 是一个开源项目，旨在利用免费的大模型API结合用户的私域数据生成高质量的SFT训练数据。该工具支持多种AI模型格式，并提供一键生成、批量生成、灵活编辑和本地...

最新AI资源 # AI开源项目

2年前

084.4K

MindSearch：开源AI搜索引擎框架，部署您自己的 Perplexity 搜索引擎！

综合介绍 MindSearch是由上海人工智能实验室推出的一款开源AI搜索引擎框架，旨在模拟人类的思维过程进行复杂信息搜集与整合。该工具结合了大规模语言模型（LLM）与搜索引擎的先进技术，通过多智能体...

最新AI资源 # AI开源项目 # AI搜索工具

2年前

084.3K

SHMT：自监督分层化妆转移模型，虚拟化妆，将妆容迁移到新的人像中

综合介绍 SHMT（Self-supervised Hierarchical Makeup Transfer）是一个基于潜在扩散模型的自我监督分层化妆迁移项目，旨在通过无监督学习方法实现化妆效果的高质...

最新AI资源 # AI开源项目 # AI换脸与换装

2年前

084.3K

Arrakis：为AI智能体提供安全沙盒环境的开源工具

综合介绍 Arrakis 是一个专为 AI 智能体设计，提供安全、可自定义的沙盒环境。它由 Abhishek Bhardwaj 开发，托管在 GitHub 上，使用 AGPL v3 许可证。Arrak...

最新AI资源 # AI开源项目

1年前

084.3K

ColiVara：基于视觉嵌入的文档存储与检索服务

综合介绍 ColiVara 是一个基于视觉嵌入技术的文档存储和检索服务。它无需光学字符识别（OCR）或文本提取，避免了表格破损或图像丢失的问题。ColiVara 支持超过100种文件格式，包括 PDF...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

084.3K

EchoMimic：音频驱动人像照片生成说话视频（EchoMimicV2加速版安装包）

综合介绍 EchoMimic 是一个开源项目，旨在通过音频驱动生成逼真的肖像动画。该项目由蚂蚁集团的终端技术部门开发，利用可编辑的标志点条件，结合音频和面部标志点生成动态的肖像视频。EchoMimic...

最新AI资源 # AI开源项目 # AI数字人

2年前

084.3K

MTranServer：CPU即可运行的离线翻译服务

综合介绍 MTranServer 是一个专注于离线翻译的开源服务器项目，托管于 GitHub，由开发者 xxnuo 创建。它最大的亮点是超低的资源需求，仅需 CPU 和 1GB 内存即可运行，无需 G...

最新AI资源 # AI开源项目 # AI翻译

1年前

084.2K

Harbor：一键部署本地LLM开发环境，轻松管理和运行AI服务的容器化工具集

综合介绍 Harbor是一个革新性的容器化LLM工具集，专注于简化本地AI开发环境的部署和管理。它通过简洁的命令行界面(CLI)和配套应用程序，让开发者能够一键启动和管理包括LLM后端、API接口、前...

最新AI资源 # AI开源项目 # 本地部署开源大模型工具

2年前

084.2K

ChainForge：测试和评估大型语言模型提示效果的开源可视化编程环境

综合介绍 ChainForge 是一个开源的可视化编程环境，专为测试和评估大型语言模型（LLM）的提示效果而设计。它提供了一个数据流提示工程环境，用户可以通过该平台快速探索和分析不同提示对LLM响应质...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

2年前

084.2K

Lecca：无代码构建AI智能体与AI工作流构建平台

综合介绍 Lecca 是一个强大的AI平台，允许用户配置和部署大语言模型（LLMs），并配备多种工具和工作流。用户可以轻松构建、定制和自动化他们的AI代理。Lecca 提供了多种AI提供商和模型选择...

最新AI资源 # AI开源项目 # 低代码工作流 # 智能体开发框架

1年前

084.2K

CodeArena：开源LLM编程能力对比竞技场，实时查看最佳代码生成模型

综合介绍 CodeArena 是一个独特的平台，旨在通过实时对决展示最佳开源代码生成模型（LLM）。用户可以观看不同的LLM在相同的编程任务中竞争，并通过实时排行榜查看表现最佳的模型。该平台利用Tog...

最新AI资源 # AI开源项目

2年前

084.1K

infinite-zoom-stable-diffusion：生成无限缩放循环视频

综合介绍无限缩放稳定扩散（Infinite Zoom Stable Diffusion）是一个开源项目，旨在利用稳定扩散技术创建无限缩放视频。该项目提供了一个易于使用的Colab笔记本，用户可以通过...

最新AI资源 # AI开源项目 # AI视频转换风格

2年前

084.1K

GenEx：从一张图片生成可探索的360° 3D世界（代码逐步开源）

综合介绍 GenEx 是一个先进的人工智能模型，能够从单张图像生成一个完全可探索的360° 3D世界。用户可以交互式地探索这个生成的世界。GenEx 推动了具象化人工智能在想象空间中的发展，并有潜力将...

最新AI资源 # AI开源项目 # AI文本与图片转3D

2年前

084.1K

加载更多