AI开源项目

共 1020 篇文章

排序

浏览收藏

TubeTube：自部署YouTube视频下载工具

综合介绍 TubeTube是一个开源的YouTube视频下载工具，由MattBlackOnly开发。该工具使用yt-dlp作为核心下载引擎，支持多线程下载，能够快速同时下载多个视频。用户可以通过YAM...

最新AI资源 # AI开源项目

1年前

071.8K

LangWatch：基于DSPy 框架监控与优化LLM流程的可视化工具

综合介绍 LangWatch 是一个专为大语言模型（LLM）操作而设计的综合平台，提供监控、分析、评估、数据集管理和提示优化等功能。该平台基于斯坦福大学的 DSPy 框架，旨在帮助用户更好地管理和优化...

最新AI资源 # AI开源项目

1年前

054.3K

PR Agent：自动化拉取请求分析工具

综合介绍 PR-Agent 是一个由 Qodo 开发的开源工具，旨在通过 AI 技术自动化处理拉取请求（Pull Request）。该工具能够提供自动化的反馈、建议和分析，帮助开发者更高效地进行代码审...

最新AI资源 # AI开源项目

1年前

055.3K

FinGPT：开源金融大语言模型平台，助力金融分析与预测

综合介绍 FinGPT 是由 AI4Finance 基金会开发的开源金融大语言模型平台，专为金融领域设计，旨在解决复杂的金融任务，并推动金融科技的创新发展。FinGPT 利用轻量化适配技术和强化学习方...

最新AI资源 # AI开源项目 # AI金融数据分析

1年前

073.9K

Coding Agent：基于Langgraph构建的简单编程助手

综合介绍 Coding Agent 是一个由 AbhinavTheDev 开发的智能编程助手，旨在帮助开发者提高编程效率。该工具利用人工智能技术，能够自动生成代码、提供编程建议，并协助开发者完成各种编...

最新AI资源 # AI开源项目 # AI编程

1年前

061.2K

Ragas：评估RAG召回QA准确率与答案相关性

综合介绍 Ragas是一个专门用于评估和优化检索增强生成（RAG）系统的工具。它通过分析查询、检索上下文和生成答案之间的关系，提供了一套全面的评估指标。这些指标包括忠实度、答案相关性、上下文相关性、上...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

084.5K

VeighNa：国内流行的开源量化交易框架

综合介绍 VeighNa 是一个基于 Python 的开源量化交易平台，最初由国内私募交易员开发，2015 年正式启动。它从简单的交易接口封装，发展成了一个功能全面的交易开发框架。用户包括私募基金、证...

最新AI资源 # AI开源项目 # AI金融数据分析

1年前

0135.9K

OpenCharacter：开源无审查的Character.AI替代品

综合介绍 OpenCharacter是一个开源的角色创建工具，旨在为用户提供无过滤、无限制的AI角色创建与互动体验，作为Character.AI替代方案。用户可以使用本地模型创建和运行自己的角色，或者...

最新AI资源 # AI开源项目 # AI角色扮演

1年前

0111.2K

AI Video Starter Kit：在浏览器中全流程创作并编辑AI视频

综合介绍视频制作AI工具包（Video Starter Kit）是由fal-ai-community发布的一个开源项目，旨在展示如何在浏览器中利用AI模型进行视频制作。它提供了从图像到视频的转换工具...

最新AI资源 # AI开源项目 # AI音视频编辑

1年前

054.6K

SkyPilot：在任何云端高效运行AI与批处理任务的开源框架

综合介绍 SkyPilot 是一个由加州伯克利大学 Sky Computing Lab 发起的开源框架，旨在帮助用户在任何云端基础设施上高效运行 AI 和批处理任务。它支持超过 14 种云服务（包括 ...

最新AI资源 # AI开源项目

1年前

059.4K

LlamaEdge：本地运行和微调LLM的最快捷方式

综合介绍 LlamaEdge是一个开源项目，旨在简化本地或边缘设备上运行和微调大型语言模型（LLM）的过程。该项目支持Llama2系列模型，并提供与OpenAI兼容的API服务，使用户能够轻松创建和运...

最新AI资源 # AI开源项目 # 大模型微调

1年前

067K

AutoGen：微软开发的多智能体对话框架

综合介绍 AutoGen是由微软研究团队开发的开源框架，专注于通过多智能体对话来简化大型语言模型（LLM）应用的构建。它允许开发者创建可以相互对话、协作解决任务的AI代理。这种方法不仅提高了LLM的性...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

067.2K

Page Assist：本地AI模型对话与检索文档的网页助手插件

综合介绍 Page Assist 是一个开源的浏览器扩展，旨在为用户提供与本地AI模型交互的便捷方式。通过这个扩展，用户可以在任何网页上打开一个侧边栏，与本地运行的AI模型进行互动。Page Assi...

最新AI资源 # AI开源项目 # AI本地化聊天应用 # 浏览器AI助手

12个月前

081K

MobileAgent：多代理协作的移动设备操作助手

综合介绍 MobileAgent 是一个强大的移动设备操作助手，旨在通过多代理协作和增强的视觉感知模块，提升移动设备的操作效率和自动化水平。该项目由 X-PLUG 团队开发，支持 Android 和 ...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

077.6K

Orama：高性能全文本和向量搜索引擎

综合介绍 Orama 是一个开源的高性能搜索引擎，完全用 TypeScript 编写，支持全文本搜索、向量搜索和混合搜索。Orama 旨在在任何 JavaScript 运行时环境中工作，提供快速、可靠...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

078.4K

FramePainter：AI驱动的涂鸦式图像编辑工具

综合介绍 FramePainter 是一个革命性的 AI 驱动图像编辑工具，利用先进的视频扩散技术和直观的 Sketch 控件，帮助用户轻松实现复杂的图像编辑。无论是简单的调整还是复杂的创意变换，Fr...

最新AI资源 # AI图像编辑 # AI开源项目 # AI涂鸦生成绘画

1年前

048.2K

Gaze-LLE: 视频中人物注视目标预测工具

综合介绍 Gaze-LLE是一款基于大规模学习编码器的注视目标预测工具。该项目由Fiona Ryan、Ajay Bati、Sangmin Lee、Daniel Bolya、Judy Hoffman和J...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

058.7K

DiffBIR：提升图像质量的智能修复工具

综合介绍 DiffBIR（Blind Image Restoration with Generative Diffusion Prior）是一个由XPixelGroup开发的图像修复工具，旨在通过生成...

最新AI资源 # AI图像放大与修复 # AI开源项目

1年前

061.5K

TankWork：通过语音和文字操作电脑，并提供实时语音反馈的智能体

综合介绍 TankWork是一个开源的桌面代理框架，旨在通过计算机视觉和系统级交互，使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机，处理实时屏幕内容，并提供连续的音频视觉...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

057.3K

AI Auto Free：使用自动化工具无限制使用AI IDE（如Cursor和Windsurf）

综合介绍 AI Auto Free 是一个强大的自动化工具，旨在帮助用户无限制地使用AI驱动的集成开发环境（IDE），如 Cursor 和 Windsurf 。该项目提供跨平台支持，并包含多种语言功能...

最新AI资源 # AI开源项目

1年前

072.4K

Quantum Swarm：多智能体集群协作框架

Quantum Swarm 是一个开源的人工智能框架，专注于开发和研究AI群体智能。该项目由Quarm AI团队在GitHub上维护，旨在提供一个灵活且高效的平台，用于构建和测试多智能体系统。Quan...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

053.5K

XRAG：优化检索增强生成系统的可视化评估工具

综合介绍 XRAG（eXamining the Core）是一个专为评估高级检索增强生成（RAG）系统的基础组件而设计的基准框架。通过剖析和分析每个核心模块，XRAG提供了不同配置和组件如何影响RAG...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

061.7K

文颜：一键美化Markdown文章，适配多个自媒体平台格式（开源本地客户端）

综合介绍文颜（WenYan）是一个专为Markdown文章排版美化而设计的工具，支持将编辑好的Markdown文章转换成适配微信公众号、知乎、今日头条等多个平台的格式。用户可以通过一键复制，将文章直...

最新AI资源 # AI开源项目

1年前

050.4K

CHRONOS：新闻时间线总结工具，提升新闻检索和时间线生成效率

综合介绍 CHRONOS是由阿里巴巴NLP团队开发的一款新闻时间线总结工具。该工具通过迭代自我提问的方式，生成新闻事件的时间线总结。CHRONOS不仅能够处理开放领域的时间线总结任务，还能在效率和可扩...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

1年前

050.8K

Go-with-the-Flow：控制视频中物体的运动轨迹，视频中增减任何运动物体

综合介绍 Go-with-the-Flow 是一个由 Netflix Eyeline Studios 研究团队开发的开源项目，旨在通过扭曲噪声控制视频扩散模型的运动模式。该项目允许用户决定场景中相机和...

最新AI资源 # AI开源项目 # AI音视频编辑

1年前

053.1K

X-Dyna：静态人像参考视频姿态生成视频，让小姐姐的照片跳舞

综合介绍 X-Dyna 是由字节跳动开发的一个开源项目，旨在通过零样本扩散技术生成动态人像动画。该项目利用驱动视频中的面部表情和身体动作来动画化单个人像图像，生成逼真且具有上下文感知的动态效果。X-D...

最新AI资源 # AI图像转视频 # AI开源项目

1年前

053.8K

腾讯混元3D（Hunyuan3D）：生成高分辨率3D资产，多种3D素材生成工作流

综合介绍腾讯混元3D（Hunyuan3D 2.0）是腾讯推出的先进大规模3D合成系统，旨在生成高分辨率的纹理3D资产。该系统包括两个核心组件：大规模形状生成模型Hunyuan3D-DiT和大规模纹理...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

071.1K

RAG Web UI：构建智能文档问答系统，简单构建私有Web端知识库

综合介绍 RAG Web UI 是一个基于 RAG（检索增强生成）技术的智能对话系统。它帮助企业和个人构建基于自身知识库的智能问答系统。通过结合文档检索和大语言模型，RAG Web UI 提供准确可靠...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

058.3K

UI-TARS Desktop：使用自然语言控制电脑的桌面智能体应用

综合介绍 UI-TARS Desktop 是由字节跳动开发的一款基于 UI-TARS（视觉语言模型）的图形界面代理应用。该应用允许用户通过自然语言来控制计算机，实现更直观和高效的人机交互。UI-TAR...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

091.4K

Devin Cursor Rules：让Cursor和Windsurf 强化为 Devin

综合介绍 Devin Cursor Rules是一个开源项目，旨在通过配置文件和工具增强Cursor和Windsurf集成开发环境（IDE）的功能，使其具备类似Devin的高级AI能力。该项目提供了过...

最新AI资源 # AI开源项目

1年前

053.2K

Repomix：打包代码库为一个文本文件以便大模型检索

综合介绍 Repomix（前称Repopack）是一款开源工具，专门用于将整个代码库打包成一个单一的、AI友好的文件。这个工具可以让开发者轻松地将他们的代码库提供给大语言模型（如Claude、Chat...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

088.9K

Yek：读取git仓库文本文件并快速分块，以供大模型使用

综合介绍 Yek 是一个基于 Rust 的快速工具，用于读取存储库或目录中的文本文件，将其分块并序列化以供大型语言模型（LLM）使用。该工具默认使用 .gitignore 规则跳过不需要的文件，并利用...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

057.7K

Kheish：多角色智能体，审查、验证和格式化输出以生成高质量结果

综合介绍 Kheish是一个开源的多角色代理，专为需要结构化、逐步协作的大型语言模型（LLM）任务而设计。Kheish不仅仅是一个简单的协调器，它本身就是一个智能代理，可以根据需求请求模块，整合用户反...

最新AI资源 # AI开源项目 # 智能体开发框架 # 知识检索与RAG框架

1年前

055K

AI ContentCraft：生成短故事、对话脚本、配音、配图的多功能AI内容创作工具

综合介绍 AI ContentCraft 是一个多功能的内容创作工具，集成了文本生成、语音合成、图像生成等功能。它可以帮助创作者快速生成故事、播客脚本和配套的音视频内容。该工具支持多种语言转换，能够批...

最新AI资源 # AI写作 # AI开源项目

1年前

067.7K

Unigraph：构建本地运行的知识图谱和个人搜索引擎

综合介绍 Unigraph 是一个本地优先的通用知识图谱和个人搜索引擎，旨在为用户提供一个集成的工作空间，帮助管理和搜索个人生活中的各种数据。通过 Unigraph，用户可以将不同来源的数据整合到一个...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

1年前

055.8K

ComfyUI disty Flow：为 ComfyUI 提供友好的用户界面，简化工作流程

综合介绍 ComfyUI-disty-Flow 是一个为 ComfyUI 提供用户友好界面的自定义节点。它旨在通过提供替代用户界面来简化工作流程的运行，而不是替代工作流程的创建。ComfyUI-dis...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # ComfyUI

1年前

086.9K

Shortest：AI自动化测试工具，使用自然语言进行端到端测试

综合介绍 Shortest是一个由Anti-Work团队开发的AI驱动的自然语言端到端测试框架。它基于Playwright构建，支持GitHub集成和双因素认证（2FA）。Shortest的主要特点是...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

059.8K

Midscene.js：用AI驱动浏览器自动化测试的开源插件

综合介绍 Midscene.js是一个由AI驱动的浏览器自动化工具，能够通过自然语言指令来控制网页、执行断言和提取数据。它支持Chrome扩展、JavaScript SDK和YAML脚本，简化了UI测...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

090.5K

视频分析工具（Video Analyzer）：分析视频内容并生成详细描述

综合介绍视频分析工具（Video Analyzer）是一个综合性的视频分析工具，结合了计算机视觉、音频转录和自然语言处理技术，能够生成详细的视频内容描述。该工具通过提取视频中的关键帧，转录音频内容...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

0118.5K

Unsloth：高效微调和训练大语言模型的开源工具

综合介绍 Unsloth 是一个开源项目，旨在提供高效的微调和训练大语言模型（LLMs）的工具。该项目支持多种知名模型，包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的...

最新AI资源 # AI开源项目 # 大模型微调

1年前

075.4K

MaxKB：开箱即用的AI知识库问答系统，适合智能客服和企业内部知识库

综合介绍 MaxKB（Max Knowledge Base）是一款基于大语言模型和RAG（检索增强生成）的开源知识库问答系统。该系统广泛应用于智能客服、企业内部知识库、学术研究与教育等场景。MaxKB...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

085.5K

OmniThink：生成高质量长文的写作框架，搜索外部知识后反思并逐步构建知识树

综合介绍 OmniThink 是一个创新的机器写作框架，旨在通过模拟人类认知过程中的迭代扩展和反思，生成高质量的长篇文章。该框架专注于扩展知识边界，生成的信息丰富且具有深度。OmniThink 通过构...

最新AI资源 # AI写作 # AI开源项目

1年前

051.4K

OpenAI Realtime Agents：多智能体语音交互应用（OpenAI示例）

综合介绍 OpenAI Realtime Agents是一个开源项目，旨在展示如何利用OpenAI的实时API来构建多智能体的语音应用。它提供了高级的智能体模式（借鉴 OpenAI Swarm），允许...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

053.1K

DeepFace：实现面部年龄、性别、情绪、种族识别的轻量级Python库

综合介绍 DeepFace是一个轻量级的面部识别和面部属性分析（包括年龄、性别、情绪和种族）的Python库。它集成了多种先进的面部识别模型，如VGG-Face、FaceNet、OpenFace、De...

最新AI资源 # AI开源项目

1年前

089.6K

SynthLight：对肖像图像进行自然光照渲染（未发布）

综合介绍 SynthLight 是一个基于扩散模型的肖像重光照工具。它通过学习重新渲染合成的人脸图像，实现对真实肖像照片的光照效果调整。该工具利用物理渲染引擎生成数据集，模拟不同光照条件下的光照转换...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

052.9K

1-2-1-MNVTON：高效图像、视频中人物虚拟试穿服装（待开放）

综合介绍 1-2-1-MNVTON是一个基于GitHub的开源项目，旨在通过“Modality-specific Normalization for Virtual Try-On”（MNVTON）技术...

最新AI资源 # AI开源项目 # AI换脸与换装

1年前

049.6K

Kokoro-ONNX：高效文本转语音工具，支持多语言和多声音选择

综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音（TTS）工具。该项目由thewh1teagle开发，旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

0104.9K

Zerox：PDF、DOCX、图像转换为Markdown，视觉模型高精度OCR

综合介绍 Zerox是一个开源项目，旨在通过视觉模型将PDF、DOCX、图像等文件转换为Markdown格式。该项目由getomni-ai团队开发，提供了简单高效的OCR（光学字符识别）解决方案。Ze...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

076K

Charla：基于终端的极简AI聊天工具，本地集成Ollama后端

综合介绍 Charla 是一个基于终端的聊天应用程序，旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端，支持上下文感知的对话，并将聊天会话保存为 Markdown 文件。用户可以通过简...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

060.3K

MiniRAG：简化检索增强生成框架，实体图索引召回相关文本块

综合介绍 MiniRAG是一个极其简单的检索增强生成（RAG）框架，旨在通过异构图索引和轻量级拓扑增强检索，使小模型也能实现良好的RAG性能。该项目由香港大学数据科学实验室（HKUDS）开发，主要解决...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

1年前

062.7K

Omni-RGPT：图像和视频区域级理解多模态大模型，提升视觉内容分析能力

综合介绍 Omni-RGPT 是一个多模态大语言模型，旨在实现图像和视频的区域级理解。通过引入 Token Mark 技术，Omni-RGPT 能够在视觉特征空间内高亮目标区域，并通过区域提示（如框或...

最新AI资源 # AI开源项目

1年前

062.6K

百聆 (Bailing)：低延时的开源语音对话助手，轻松实现自然对话交流

综合介绍百聆（Bailing）是一个开源的语音对话助手，旨在通过语音与用户进行自然的对话。该项目结合了语音识别（ASR）、语音活动检测（VAD）、大语言模型（LLM）和语音合成（TTS）技术，实现了...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

070.5K

元界AI：开源版AI数字人克隆与短视频生成工具

综合介绍元界AI（开源版）是一个托管在 GitHub 上的项目，，由 libn-net 团队开发。它能通过 AI 技术克隆数字人形象和声音，生成短视频，还支持配音和字幕制作。这个工具提供 Windo...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI数字人

1年前

057.9K

WikiChat：使用维基百科数据检索知识的聊天工具

综合介绍 WikiChat是由斯坦福大学开发的一款实验性聊天机器人，旨在通过从维基百科检索数据来提高大语言模型的事实性。大语言模型（如ChatGPT和GPT-4）在处理最新信息或不太流行的话题时，往往...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

056.4K

OpenAI Edge TTS：利用 Edge TTS 的免费文本转语音API，兼容 OpenAI 格式

综合介绍 OpenAI Edge TTS 是一个开源项目，提供与 OpenAI 兼容的本地文本转语音（TTS）API。该项目使用 Microsoft Edge 的在线文本转语音服务，允许用户生成高质量...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

082.3K

AIEvo：创建多智能体协作应用的高效框架

综合介绍 AIEvo是蚂蚁集团开源的多代理框架，旨在高效创建多代理应用。该框架严格遵循SOP任务图，提升复杂任务的执行成功率，并通过反馈和监控机制确保高灵活性和可扩展性。AIEvo已在蚂蚁集团内部生产...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

057.1K

PPTAgent：自动生成和评估PPT演示文稿，文档转PPT

综合介绍 PPTAgent是一个创新的系统，旨在从文档中自动生成演示文稿。该系统借鉴了人类创建演示文稿的方法，采用两步流程确保内容质量和视觉效果。此外，PPTAgent还引入了PPTEval，一个全面...

最新AI资源 # AI开源项目 # AI生成演示文稿/PPT

1年前

077.9K

FlowiseAI：构建自定义LLM应用的节点拖放界面

综合介绍 FlowiseAI 是一个开源的低代码工具，旨在帮助开发者构建自定义的LLM（大语言模型）应用和AI代理。通过简单的拖放界面，用户可以快速创建和迭代LLM应用，从测试到生产的过程变得更加高效...

最新AI资源 # AI开源项目 # 低代码工作流

1年前

083.5K

RealtimeSTT：实时语音转文字工具，基于Whisper实现低延迟流式语音识别

综合介绍 RealtimeSTT 是一个高效、低延迟的实时语音转文字库，具备先进的语音活动检测和唤醒词激活功能。该项目由 Kolja Beigel 开发，旨在为需要快速、准确语音转文字的应用提供支持...

AI新闻 # AI开源项目 # AI语音转文本

1年前

087.6K

SemHash：快速实现语义文本去重，提升数据清理效率

综合介绍 SemHash 是一个轻量级且灵活的工具，用于通过语义相似性来去重数据集。它结合了 Model2Vec 的快速嵌入生成和 Vicinity 的高效 ANN（近似最近邻）相似性搜索。SemHa...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

070.7K

Cognita：构建模块化RAG应用的开源框架，快速测试多样RAG策略

综合介绍 Cognita 是由 TrueFoundry 开发的一个开源框架，旨在简化基于 RAG（Retrieval-Augmented Generation）的应用开发。该框架提供了一个结构化的、模...

最新AI资源 # AI开源项目 # 无代码开发 # 知识检索与RAG框架

1年前

060.3K

BotSharp：基于.NET的多智能体AI应开发与管理平台

综合介绍 BotSharp是基于.NET Core的一个开源项目，致力于提供一个全面的AI聊天机器人平台构建工具。它采用C#编程，支持跨平台操作，旨在简化机器学习算法的应用，使企业级开发者能够高效地将...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

056.4K

Weebo：实时语音聊天机器人，提供自然语言对话体验

综合介绍 Weebo 是一个开源的实时语音聊天机器人，利用 Whisper Small 进行语音识别，Llama 3.2 进行自然语言生成，以及 Kokoro-82M 进行语音合成。该项目由 Aman...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

063.3K

OmAgent：构建多模态智能设备的智能体框架

综合介绍 OmAgent是由Om AI Lab开发的一个多模态智能体框架，旨在为智能设备提供强大的AI驱动功能。该项目通过整合最先进的多模态基础模型和智能体算法，使开发者能够在各种智能设备上创建高效...

最新AI资源 # AI开源项目 # 多模态实时互动产品 # 智能体开发框架

1年前

056K

RAIN：实时捕捉真人表情生成动漫形象视频流

综合介绍 RAIN（Real-time Animation Of Infinite Video Stream）是一个开源项目，旨在实现实时生成无限视频流的动画效果。该项目由Pscgylotti开发，提...

最新AI资源 # AI开源项目 # AI视频转换风格

1年前

056.5K

Agent Service Toolkit：基于LangGraph构建AI智能体的完整工具集

综合介绍 AI Agent Service Toolkit 是一个基于LangGraph、FastAPI和Streamlit构建的完整工具集，旨在帮助开发者快速构建和运行AI代理服务。该工具包提供了一...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

049.7K

Memora：构建人性化AI记忆模块，保存并更新与人类的互动信息

综合介绍 Memora是一个旨在为每个个性化AI复制人类记忆的代理。它通过时间戳记忆、情感标记和多模态记忆等功能，帮助AI像人类一样记住过去的互动细节、情感和共享经历。Memora支持多租户，能够处理...

最新AI资源 # AI开源项目 # 知识图谱

1年前

061.9K

Stagehand：自然语言实现浏览器自动化操作框架

综合介绍 Stagehand是一个专注于简洁性和可扩展性的AI网页浏览框架。它完全兼容Playwright，提供了三个简单的AI API（act、extract和observe），这些API构建在基础...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

078.4K

Micro Agent：AI编程智能体，自动生成代码并测试、修复代码

综合介绍 Micro-Agent是由Builder.io开发的一款开源AI编码助手，旨在为开发者提供自动生成和测试代码的功能。它通过理解自然语言描述生成测试用例，并迭代代码直到所有测试通过，从而减少开...

最新AI资源 # AI开源项目 # AI编程

1年前

057.5K

Sherpa-ONNX：使用ONNXRuntime实现离线语音识别和合成

综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目，旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台，包括 Android、iOS、Raspber...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音转文本

1年前

0280.9K

Eko：自然语言构建智能体工作流，实现桌面与浏览器自动化

综合介绍 Eko 是一个生产级的 JavaScript 框架，旨在通过自然语言描述来构建高效的智能代理工作流程。它的设计使开发者能够在不深入编程的情况下，利用AI技术自动化日常任务。Eko提供了一个统...

最新AI资源 # AI开源项目 # 低代码工作流 # 智能体应用

1年前

063.8K

Agent Inbox：与AI智能体进行人机交互的管理界面

综合介绍 Agent Inbox是由LangChain团队开发的一个开源项目，旨在提供一种新的用户体验，用于与AI智能体进行交互。该项目允许用户通过一个集中的界面管理和优化与多个AI智能体的交互。Ag...

最新AI资源 # AI开源项目

1年前

062.4K

Social Media Agent：社交媒体智能助手，自动生成和管理社交媒体内容

综合介绍社交媒体代理（Social Media Agent）是一个开源项目，由全新的 Agent Inbox 管理交互信息，旨在帮助用户自动生成和管理社交媒体内容。该项目由LangChain团队开发...

最新AI资源 # AI开源项目 # AI社交媒体

1年前

057.9K

Executive AI Assistant：AI行政助理，提醒阅读邮件并规划工作日程

综合介绍 Executive AI Assistant（EAIA）是一个基于人工智能的助理工具，旨在帮助用户自动化管理日常任务。该工具由LangChain开发，能够处理电子邮件、安排日程、管理任务等...

最新AI资源 # AI开源项目 # AI生活效率助手

1年前

048.7K

MangaNinjia：自动化线稿上色工具，为动漫黑白线稿快速填色

综合介绍 MangaNinjia 是阿里巴巴通义视觉智能实验室（Ali-Vilab）开发的一个开源项目，专注于线稿上色的自动化处理。这一工具通过深度学习技术，实现了对参考图像的精确色彩匹配，极大地提高...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

068.1K

Audiblez：生成有声书，使用Kokoro将电子书转换为有声读物

综合介绍 Audiblez 是一个开源项目，旨在将电子书（如 .epub 格式）转换为有声书（如 .m4b 格式）。该项目利用 Kokoro 的高质量语音合成技术，支持多种语言和多种声音。用户只需简单...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

060.5K

Search o1：赋予推理模型主动搜索能力，让大模型边思考边搜索外部知识

综合介绍 Search-o1 是一个开源项目，旨在通过整合高级搜索机制来增强大规模推理模型（LRMs）的性能。其核心思想是通过动态的搜索和知识整合来解决推理过程中遇到的知识缺失问题。该项目由 sunn...

最新AI资源 # AI开源项目 # AI搜索工具

1年前

060.6K

Llama 3.2 Reasoning WebGPU：在浏览器中运行LLama-3.2

综合介绍 Transformers.js 是 Hugging Face 提供的一个 JavaScript 库，旨在将最先进的机器学习模型直接在浏览器中运行，无需服务器支持。该库与 Hugging Fa...

AI新闻 # AI开源项目 # 本地部署开源大模型工具

1年前

050.4K

MoneyPrinter V2：自动生成YouTube短视频与Twitter内容并发布

综合介绍 MoneyPrinter V2 是由FujiwaraChoki开发的一个开源项目，旨在通过自动化手段帮助用户在线赚钱。该项目主要集成了Twitter自动化、YouTube短视频生成以及联盟营...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI营销

1年前

0138.2K

RTranslator：语音实时翻译安卓应用，免费且支持离线使用

综合介绍 RTranslator 是一款几乎开源的免费离线实时翻译应用，专为 Android 设备设计。用户可以通过连接蓝牙耳机，将手机放在口袋中，与他人进行如同对方说自己语言的对话。RTransla...

最新AI资源 # AI开源项目 # AI翻译

1年前

092.5K

Gemini Next Chat：一键免费部署您的私人多模态Gemini应用

综合介绍 Gemini Next Chat 是一个开源项目，旨在帮助用户轻松部署私人Gemini应用。该项目支持Gemini 1.5和Gemini 2.0多模态模型，用户可以通过一键部署在Vercel...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

058.1K

AutoMouser：生成浏览器自动化代码，将鼠标操作通过AI转为Selenium Python脚本

综合介绍 AutoMouser 是一个 Chrome 扩展程序，能够智能地跟踪用户交互，并使用 OpenAI 的 GPT 模型自动生成 Selenium 测试代码。它通过记录用户的浏览器操作并将其转换...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

058.4K

Vanna：利用RAG技术将文本生成精准SQL查询

综合介绍 Vanna是一个MIT许可的开源Python框架，专注于通过RAG（检索增强生成）技术生成SQL查询。用户可以通过训练RAG模型，将其应用于自己的数据，然后提出问题，Vanna会返回相应的S...

最新AI资源 # AI开源项目 # AI数据分析 # 知识检索与RAG框架

1年前

069.4K

SVFR：实现视频人脸修复的统一框架，修复黑白、模糊的人像老视频

综合介绍 SVFR（Stable Video Face Restoration）是一个用于视频人脸修复的统一框架，支持基础人脸修复（BFR）、着色、修复及其组合任务。该框架利用生成和运动先验，通过统一...

最新AI资源 # AI图像放大与修复 # AI开源项目

1年前

060.6K

LiveTalking：开源实时互动数字人直播系统，实现音视频同步对话

综合介绍 LiveTalking是一个开源的实时互动数字人系统，致力于构建高质量的数字人直播解决方案。该项目采用Apache 2.0开源协议，集成了多项前沿技术，包括ER-NeRF渲染、实时音视频流处...

最新AI资源 # AI开源项目 # AI数字人

1年前

0140.7K

Aider：开源编程助手工具，使用AI助手进行代码编写和文件编辑

综合介绍 Aider是一款强大的开源AI编程助手工具，它能够通过自然语言对话的方式帮助开发者编写、编辑和重构代码。作为一款交互式的AI配对编程工具，Aider支持多种主流编程语言，可以无缝集成到Git...

最新AI资源 # AI开源项目 # AI编程

1年前

080.4K

JoyGen：音频驱动的3D深度感知人像说话视频编辑工具

综合介绍 JoyGen是一个创新的两阶段说话人脸视频生成框架，专注于解决音频驱动的面部表情生成问题。该项目由京东科技团队开发，采用先进的3D重建技术和音频特征提取方法，能够准确捕捉说话人的身份特征和表...

最新AI资源 # AI开源项目 # AI数字人

1年前

057.3K

VSR：AI技术无损去除视频水印和硬字幕软件（视频去水印客户端7G+）

综合介绍视频字幕去除工具（Video-subtitle-remover，简称VSR）是一款基于AI技术的视频处理软件，专门用于去除视频中的硬字幕和文本水印。该工具采用了多种AI算法模型（STTN、L...

最新AI资源 # AI开源项目 # AI音视频编辑

1年前

0118.8K

TimesFM 2.0：谷歌开源进行时间序列预测的预训练模型

综合介绍 TimesFM 2.0 - 500M PyTorch 是由 Google Research 开发的预训练时间序列基础模型，专为时间序列预测而设计。该模型能够处理长达 2048 个时间点的上下...

最新AI资源 # AI开源项目

1年前

076.2K

微信视频号下载器：快速下载微信视频号视频，支持多种格式和平台

综合介绍微信视频号下载器是一个开源项目，旨在帮助用户快速下载微信视频号中的视频内容。该工具支持多种视频格式和平台，用户可以方便地在Windows和macOS系统上使用。项目由ltaoo开发，并托管在...

最新AI资源 # AI开源项目

1年前

0111.2K

Riona-AI-Agent：社交媒体自动化互动智能体，自动搜索、点赞、留言

综合介绍 Riona-AI-Agent是一个创新的AI驱动自动化工具，专门设计用于管理和优化各大社交媒体平台的运营。该项目利用先进的AI模型，为Instagram、Twitter和GitHub等平台提...

最新AI资源 # AI开源项目 # AI社交媒体

1年前

0158.7K

NV Ingest：解析复杂格式文档，提取多模态数据为元数据和文本

综合介绍 NV Ingest（NVIDIA Ingest）是一套早期访问的微服务，专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本，以便嵌入到检索...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

063.5K

"Always-On" Deepseek AI Assistant：基于Deepseek-V3打造智能语音交互系统

综合介绍 Always-On AI Assistant是一个创新的AI助手项目，它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术，打造了一个功能强大的永久在线AI助理系统...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

061K

STAR：空间时序增强AI模型，提升视频分辨率清晰度

综合介绍 STAR (Spatial-Temporal Augmentation with Text-to-Video Models) 是由南京大学、字节跳动和西南大学联合开发的创新型视频超分辨率框架...

最新AI资源 # AI图像放大与修复 # AI开源项目

1年前

061.4K

ImBD：AI生成内容检测，检测内容是否由人工智能生成

综合介绍 ImBD (Imitate Before Detect) 是一个开创性的机器生成文本检测项目，该项目发表于AAAI 2025会议。随着ChatGPT等大语言模型(LLMs)的广泛应用，识别A...

最新AI资源 # AI开源项目 # AI教育工具

1年前

078.5K

Browser Use Web UI：运行AI智能体浏览网页，让AI能够自动操作网页的开源框架

综合介绍 Browser Use Web UI是一个创新的开源项目，专注于为AI代理提供浏览器交互能力的图形化界面工具。该项目建立在 browser-use 核心框架之上，通过Gradio构建了一个用...

最新AI资源 # AI开源项目 # 桌面自动化智能体

10个月前

083.4K

NVIDIA联合LangChain推出：分析编写结构化报告的高级指南,实现AI驱动的技术报告生成

综合介绍这是一个由LangChain和NVIDIA联合开发的结构化报告生成蓝图项目，展示在GitHub上的Jupyter notebook教程。该项目利用先进的AI技术，特别是Llama-3.3-7...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

059.1K

BrownChat：开源实时语音聊天的AI助手

综合介绍 BrownChat 是一个基于大型语言模型（LLM）技术的实时音频聊天应用。该项目由 GitHub 用户 sugarforever 开发，旨在通过先进的自然语言处理技术提升用户的沟通体验。B...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

056.6K

Lecca：无代码构建AI智能体与AI工作流构建平台

综合介绍 Lecca 是一个强大的AI平台，允许用户配置和部署大语言模型（LLMs），并配备多种工具和工作流。用户可以轻松构建、定制和自动化他们的AI代理。Lecca 提供了多种AI提供商和模型选择...

最新AI资源 # AI开源项目 # 低代码工作流 # 智能体开发框架

1年前

056.3K

加载更多