AI开源项目

共 1020 篇文章

排序

浏览收藏

Kreuzberg：从任何文档中提取文本的开源工具

综合介绍 Kreuzberg是一个用于简化PDF文件文本提取的库，旨在提供简单、无忧的文本提取解决方案。该库特别适合需要进行文本提取的RAG（Retrieval-Augmented Generatio...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

061.4K

HunyuanVideoGP：支持低端GPU运行的混元视频生成模型

综合介绍 HunyuanVideoGP是一个由DeepBeepMeep开发的大规模视频生成模型，专为低端GPU用户设计。该模型是对原始Hunyuan Video模型的改进版本，显著降低了内存和显存需求...

最新AI资源 # AI图像转视频 # AI开源项目

1年前

057.8K

InspireMusic：阿里开源的统一音乐、歌曲和音频生成框架

综合介绍 InspireMusic 是一个基于 PyTorch 的开源工具包，专注于音乐、歌曲和音频生成。它提供了一个统一的框架，通过文本提示、音乐结构和音乐风格等控制生成高质量的音频。Inspire...

最新AI资源 # AI开源项目 # AI音乐

1年前

056K

Gemini Playground：无服务器部署Gemini多模态对话网站

综合介绍 Gemini Playground 是一个开源项目，旨在帮助用户快速部署一个多模态对话网站。该项目由技术爬爬虾开发，支持使用 Gemini API Key 在 10 秒内完成部署。无论用户身...

最新AI资源 # AI开源项目 # 免费大模型API

1年前

064.9K

wdoc：从海量、多源文档中检索内容并总结知识

综合介绍 wdoc是一个功能强大的RAG（检索增强生成）系统，专为处理和分析大量多样化的文档而设计。它能够从各种文件类型中进行检索，包括PDF、网页、YouTube视频、音频文件等。wdoc特别适合处...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

052.2K

Magic 1-For-1: 高效生成视频的开源项目，号称在一分钟内生成一分钟的视频

综合介绍 Magic 1-For-1 是一个高效的视频生成模型，旨在优化内存使用并减少推理延迟。该模型将文本到视频生成任务分解为两个子任务：文本到图像生成和图像到视频生成，从而实现更高效的训练和蒸馏...

最新AI资源 # AI开源项目 # AI文本转视频

1年前

059.9K

DataLine：AI数据分析与可视化客户端，快速生成图表和报告

综合介绍 DataLine是一个强大的AI数据分析和可视化工具，旨在帮助用户通过简单的操作与各种数据源进行交互。无论是CSV文件还是主流数据库如Postgres、MySQL、Snowflake、SQL...

最新AI资源 # AI开源项目 # AI数据分析

1年前

052.4K

FinRobot：提升金融数据分析效率和投资研究的的智能体

综合介绍 FinRobot是由AI4Finance Foundation开发的开源AI智能平台，专为金融分析设计。它不仅涵盖了传统的语言模型，还融入了多种AI技术，旨在为金融行业提供全面的解决方案。F...

最新AI资源 # AI开源项目 # AI金融数据分析

1年前

072K

Simba：收纳文档的知识管理系统，无缝集成到任何RAG系统

综合介绍 Simba是一个便携式知识管理系统（KMS），旨在与任何检索增强生成（RAG）系统无缝集成。该项目由GitHub用户GitHamza0206创建，提供了一种高效的知识管理解决方案，适用于各种...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

060K

LocalPdfChatRAG：支持本地多源PDF文档问答的智能聊天工具

综合介绍 LocalPdfChatRAG是一个开源项目，旨在通过结合本地PDF文档和检索增强生成（RAG）模型，实现智能聊天功能。该项目允许用户上传PDF文档，并通过自然语言提问的方式，从文档中获取相...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

051.8K

Deep Searcher：企业私有文档高效检索与智能问答

综合介绍 Deep Searcher 是一个结合强大大语言模型（如 DeepSeek 和 OpenAI）和向量数据库（如 Milvus）的工具，旨在基于私有数据进行搜索、评估和推理，提供高度准确的答案...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

054.6K

Flashcard：基于Dify构建的单词闪卡外语学习工具，替代多邻国（Duolingo）

综合介绍 Flashcard是一个开源的语言学习工具，旨在提供一个替代Duolingo的解决方案。该项目由Steven Lynn（GitHub用户名：stvlynn）开发，采用现代化的用户界面和多语言...

最新AI资源 # AI开源项目 # AI教育工具

1年前

061.6K

LineAvatars：生成 Notion 风格线条头像的免费工具

综合介绍 LineAvatars 是一个免费且简单易用的在线工具，专门用于生成 Notion 风格的线条头像。用户可以上传照片或通过摄像头拍摄一张照片，系统会使用 AI 自动生成一个线条头像。这个工具...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

048.2K

Goku: 生成画面精细且一致的视频，适合创作包含人物、物体细节的广告视频

综合介绍 Goku是一款基于流变换技术的联合图像和视频生成模型，旨在实现行业级的性能表现。它整合了先进的高质量视觉生成技术，包括精细的数据整理、模型设计和流变换公式。Goku的主要贡献包括高质量的细粒...

最新AI资源 # AI图像转视频 # AI开源项目 # AI文本转视频

1年前

051.1K

Gemini Cursor：基于Gemini构建的AI桌面智能助手，能看、能听、能说

综合介绍 Gemini Cursor 是一个基于 Google 的 Gemini 2.0 Flash（实验性）模型的桌面智能助手。它能够通过多模态 API 实现视觉、听觉和语音交互，提供实时低延迟的用...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

064.2K

Data Formulator：AI驱动的数据可视化工具

综合介绍 Data Formulator是由微软研究院开发的一款开源AI驱动的数据可视化工具。该工具结合了图形化用户界面（GUI）和自然语言输入（NL），使用户能够通过简单的交互和指令，快速创建和迭代...

最新AI资源 # AI开源项目 # AI数据分析

1年前

066.1K

Ai2 OLMoE：基于 OLMoE 模型离线运行的开源iOS AI应用

综合介绍 Ai2 OLMoE是由Allen Institute for AI（简称Ai2，艾伦人工智能研究所）开发的一款开源iOS应用，旨在提供完全在设备上运行的AI模型。该应用利用了Ai2的开源OL...

1年前

063.8K

Meetily：生成会议纪要的AI助手，实时转录和生成会议摘要

综合介绍 Meetily是一款由Zackriya Solutions开发的AI驱动会议助手，能够实时捕捉会议音频，进行语音转录，并生成会议摘要。其独特之处在于所有处理均在本地设备上完成，确保用户隐私...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

1年前

0136.2K

DeepSeek-VL2：高级多模态理解的专家级视觉语言模型

综合介绍 DeepSeek-VL2 是一系列高级的 Mixture-of-Experts (MoE) 视觉语言模型，显著提升了其前身 DeepSeek-VL 的性能。该模型在视觉问答、光学字符识别、文...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

077.5K

Zonos：高质量语音合成与语音克隆工具

综合介绍 Zonos 是由 Zyphra 开发的一款开源语音合成与语音克隆工具。Zonos-v0.1 版本采用了先进的 Transformer 和混合模型，能够生成高质量的语音输出。该工具支持多种语言...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

067.4K

ChatGPT Box：让 ChatGPT 在其他网页工作的浏览器插件

综合介绍 ChatGPT Box 是一个开源的浏览器扩展工具，旨在将 ChatGPT 深度集成到用户的浏览器中。该工具由 josStorer 开发，支持多种语言，并提供多种功能，如在任意页面调用聊天对...

最新AI资源 # AI开源项目 # AI集成多模型对话平台 # 浏览器AI助手

12个月前

056.7K

小半 WordPress AI 助手：实现对话、文章生成与翻译的 WordPress AI助手插件

综合介绍 WordPress AI助手插件（wp-ai-chat）是一个开源的WordPress插件，旨在为用户提供多种AI功能，包括AI对话、文章生成、文章总结、文章翻译和内容朗读。该插件支持对接多...

最新AI资源 # AI写作 # AI开源项目

1年前

056K

promptfoo：提供安全可靠的LLM应用测试工具

综合介绍 promptfoo 是一个开源的命令行工具和库，专门用于评估和红队测试大语言模型（LLM）应用。它为开发者提供了一套完整的工具，用于构建可靠的提示、模型和基于检索的生成（RAGs），并通过自...

最新AI资源 # AI开源项目

1年前

070.4K

NoneBot DeepSeek 插件：基于 NoneBot&DeepSeek 实现客服智能对话

综合介绍 NoneBot DeepSeek 插件是一个集成了 DeepSeek 模型的 NoneBot 插件，旨在提供智能对话与问答功能。通过接入 DeepSeek 模型，用户可以在 NoneBot ...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

056.1K

Solana Agent Kit：连接AI智能体与Solana协议的开源工具包

综合介绍 Solana Agent Kit是一个开源工具包，旨在将AI智能体与Solana区块链协议无缝连接。无论是AI研究人员还是加密货币开发者，都可以使用任何模型训练的智能体，通过该工具包执行超过...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

051.3K

LiberSonora：有声书字幕提取与多语言翻译，有声小说转录为多语言

综合介绍 LiberSonora，寓意“自由的声音”，是一个AI赋能的强大开源有声书工具集。该工具集支持智能字幕提取、AI标题生成、多语言翻译等功能，能够在GPU加速下进行批量离线处理。LiberSo...

最新AI资源 # AI开源项目 # AI翻译 # AI语音转文本

1年前

053.2K

go-stock：AI赋能股票分析工具，自选股行情实时监控并基于AI深度分析

综合介绍 go-stock 是一个基于 Wails 和 NaiveUI 构建的 AI 赋能股票分析工具。该工具能够实时监控自选股行情，提供成本盈亏展示和涨跌报警推送功能。所有数据均保存在本地，确保用户...

最新AI资源 # AI开源项目 # AI金融数据分析

1年前

089.2K

RSS Translator（RSS翻译器）：订阅并实时翻译RSS内容的工具

综合介绍 RSS Translator 是一个开源、简洁且可自部署的工具，旨在帮助用户实时翻译和订阅RSS内容。该工具支持多种翻译引擎，包括Google Translate、Microsoft Tra...

最新AI资源 # AI开源项目 # AI翻译

1年前

060.3K

KTransformers：大模型推理性能引擎：极致加速，灵活赋能

综合介绍 KTransformers：专为突破大模型推理瓶颈而生的高性能 Python 框架。它不仅仅是一个简单的模型运行工具，更是一套极致的性能优化引擎和灵活的接口赋能平台。 KTransf...

最新AI资源 # AI开源项目

1年前

074.1K

VideoRAG：理解超长视频的RAG框架，支持多模态检索和知识图谱构建

综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码，能够在单个NVIDIA RTX 3090 GPU上高效处理...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

064.6K

Tifa-Deepsex-14b-CoT：擅长角色扮演与超长小说生成的大模型

综合介绍 Tifa-Deepsex-14b-CoT 是一个基于 Deepseek-R1-14B 深度优化的大模型，专注于角色扮演、小说文本生成以及思维链（Chain of Thought, CoT）推...

最新AI资源 # AI开源项目 # AI角色扮演

1年前

0127.2K

Instructor：简化大语言模型结构化输出工作流的Python库

综合介绍 Instructor 是一个流行的 Python 库，专为处理大语言模型（LLMs）的结构化输出而设计。它基于 Pydantic 构建，提供了一个简单、透明且用户友好的 API，用于管理数据...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

054.7K

MedRAX: 利用多模态大模型进行胸部X光片分析的智能体

综合介绍 MedRAX是一个专为胸部X光片（CXR）分析设计的先进AI智能体。它集成了最先进的CXR分析工具和多模态大语言模型，能够动态处理复杂的医学查询，而无需额外训练。MedRAX通过其模块化设计...

最新AI资源 # AI开源项目 # 智能体应用 # 视觉目标检测

1年前

066.6K

LangBot：开源大模型即时通信机器人，支持多微信、QQ、飞书等多平台部署AI机器人

综合介绍 LangBot 是一个基于大模型的即时通信机器人平台，支持多种消息平台和大模型。该平台适配 QQ、微信（企业微信、个人微信）、飞书、Discord、OneBot 等消息平台，并支持 Open...

最新AI资源 # AI开源项目

1年前

069.4K

zChunk：基于Llama-70B的通用语义分块策略

综合介绍 zChunk是由ZeroEntropy开发的一种新型分块策略，旨在为通用语义分块提供解决方案。该策略基于Llama-70B模型，通过提示生成分块，优化了文档的分块过程，确保在信息检索时保持高...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

050.2K

Hibiki：实时语音翻译模型，保留原声特点的流式翻译

综合介绍 Hibiki 是由 Kyutai Labs 开发的一款高保真度实时语音翻译模型。与传统的离线翻译不同，Hibiki 能够在用户讲话的同时，实时生成目标语言的自然语音翻译，并提供文本翻译。该模...

最新AI资源 # AI开源项目 # AI翻译

1年前

066K

Qwen4Mac：在Mac菜单栏中使用千问（Qwen）大模型随时对话

综合介绍 Qwen4Mac是一个开源项目，旨在将Qwen大语言模型（LLM）集成到Mac的菜单栏中，方便用户随时调用和使用。该项目由andreaturchet开发和维护，提供了一种简便的方式，让用户能...

最新AI资源 # AI开源项目

1年前

054.4K

口袋AI：手机中运行的离线AI助手，适配 DeepSeek-R1 (5.37GB)

综合介绍口袋AI（PocketPal AI 中文版）是一款强大的离线AI助手，旨在让用户随时随地与AI进行对话。该项目基于小型语言模型（SLMs），无需联网即可在手机上运行，特别适配中文用户体验。口...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0121.3K

Kokoro WebGPU：浏览器中离线运行的文本转语音服务

综合介绍 Kokoro WebGPU是Kokoro文本转语音（TTS）模型的WebGPU版本，由WebML Community在Hugging Face平台上提供。该项目利用WebGPU技术，使用户能...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

078.6K

OpenHealthForAll：个人健康数据管理AI助手，上传检查报告定制健康计划

综合介绍 OpenHealthForAll 是一个开源项目，旨在帮助用户管理和理解个人健康数据。通过利用人工智能技术，OpenHealthForAll 提供了一个本地运行的健康助手，帮助用户更好地管理...

最新AI资源 # AI开源项目 # AI生活效率助手

1年前

056.1K

OpenPilot：开源自动驾驶系统，为爱车DIY一套自己的智能驾驶系统

综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统，旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来，OpenPilot 已支持超过 2...

最新AI资源 # AI开源项目

1年前

079.7K

Agentic Security：开源的LLM漏洞扫描工具，提供全面的模糊测试和攻击技术

综合介绍 Agentic Security是一个开源的LLM（大语言模型）漏洞扫描工具，旨在为开发者和安全专家提供全面的模糊测试和攻击技术。该工具支持自定义规则集或基于代理的攻击，能够集成LLM AP...

最新AI资源 # AI开源项目 # prompt越狱

1年前

060.6K

CogVLM2：开源多模态模型，支持视频理解与多轮对话

综合介绍 CogVLM2 是由清华大学数据挖掘研究组（THUDM）开发的开源多模态模型，基于 Llama3-8B 架构，旨在提供与 GPT-4V 相当甚至更优的性能。该模型支持图像理解、多轮对话以及视...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

063K

VisoMaster：强大且易用的图片/视频换脸和编辑软件

综合介绍 VisoMaster 是一款强大且易用的视频换脸和编辑工具，利用人工智能技术实现自然逼真的换脸效果。无论是图像还是视频，VisoMaster 都能通过简单的操作生成高质量的换脸结果，适合普通...

最新AI资源 # AI开源项目 # AI换脸与换装 # AI视频换脸

1年前

0170.9K

基于RAG构建提供健康建议的小助手（实验项目）

综合介绍 LLM-RAG-Longevity-Coach 是一个基于大语言模型（LLM）和检索增强生成（RAG）技术的聊天机器人，旨在为用户提供个性化的健康和长寿建议。该项目由 Tyler Burle...

最新AI资源 # AI开源项目 # AI生活效率助手

1年前

048.9K

Maestro：简化主流开源视觉语言模型微调过程的工具

综合介绍 Maestro 是由 Roboflow 开发的一款工具，旨在简化和加速多模态模型的微调过程，让人人都可以训练自己的视觉大模型。它提供了现成的配方，用于微调流行的视觉语言模型（VLM），如 F...

最新AI资源 # AI开源项目 # 大模型微调

1年前

060.1K

One-Prompt-One-Story：文本提示生成角色身份一致的图像

综合介绍 One-Prompt-One-Story (1Prompt1Story) 是一个创新的文本到图像生成工具，旨在通过单一提示实现一致性图像生成。该项目由刘涛等人在ICLR 2025会议上提出...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

052.7K

为Next.js应用程序添加RAG驱动的在线聊天工具

综合介绍 Upstash RAG Chat Component是一个专为Next.js应用程序设计的React组件，旨在提供基于RAG（检索增强生成）技术的AI聊天界面。该组件结合了Upstash V...

最新AI资源 # AI开源项目

1年前

049K

AudioNotes：快速提取音视频内容并生成结构化笔记

综合介绍 AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统。它能够快速提取音视频内容，并调用大模型进行整理，生成一份结构化的 Markdown 笔记，方便用...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

056.2K

Bilingual Book Maker：使用AI翻译制作双语电子书，全书自动化翻译工具

综合介绍 Bilingual Book Maker 是一个开源项目，旨在利用AI技术帮助用户创建多语言版本的电子书。该工具主要使用ChatGPT进行翻译，支持多种文件格式，包括epub、txt和srt...

最新AI资源 # AI开源项目 # AI翻译

1年前

064.4K

Rowfill：批量提取文档结构化信息并自动化分析

综合介绍 Rowfill 是一个开源的文档处理平台，专为知识工作者设计。它利用先进的人工智能技术，从复杂的文档、图像和PDF中提取、分析和处理数据。Rowfill 支持本地大语言模型（LLM）和Ope...

最新AI资源 # AI开源项目 # AI数据分析 # 文档提取与清洗

1年前

053.5K

PRAG：提升问答系统性能的参数化检索增强生成工具

综合介绍 PRAG（Parametric Retrieval-Augmented Generation）是一个创新的检索增强生成工具，旨在通过将外部知识直接嵌入大语言模型（LLM）的参数空间，提升生成...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

060.3K

GPT Researcher：利用本地和网络数据，生成全面、详实的研究报告

综合介绍 GPT Researcher 是一个基于大型语言模型（LLM）的自主代理工具，旨在进行本地和网络研究，并生成详细的研究报告。该工具通过并行化代理工作，提供稳定的性能和更快的速度，确保信息的准...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

050.5K

Linly-Talker：数字人智能对话系统，结合大语言模型与视觉模型，实现互动新体验

综合介绍 Linly-Talker 是一个创新的数字人对话系统，结合了大语言模型（LLMs）与视觉模型，创造出一种新颖的人机互动方式。该系统集成了多种技术，如 Whisper、Linly、Micros...

最新AI资源 # AI开源项目 # AI数字人

1年前

088.4K

Airweave：让应用程序快速集成知识库，实现智能搜索

综合介绍 Airweave 是一个开源工具，旨在通过同步用户的应用数据、API、数据库和网站到图谱和向量数据库，使任何应用程序变得可搜索。Airweave 简化了数据可搜索化的过程，无论是结构化数据还...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

052.2K

ai-gradio：轻松集成多种AI模型，基于Gradio构建多模态应用

综合介绍 ai-gradio是一个开源的Python工具包，旨在帮助开发者轻松集成和使用多种AI模型。该项目基于Gradio构建，提供了一个统一的接口，支持多种AI模型和服务。无论是文本、语音还是视频...

最新AI资源 # AI开源项目

1年前

054.8K

OpenDeepResearcher：自动化深度研究工具，撰写完整的研究报告

综合介绍 OpenDeepResearcher 是一个开源的自动化深度研究工具，旨在通过人工智能技术提升研究效率。该项目由 mshumer 开发，托管在 GitHub 上。OpenDeepResear...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

055.3K

ColiVara：基于视觉嵌入的文档存储与检索服务

综合介绍 ColiVara 是一个基于视觉嵌入技术的文档存储和检索服务。它无需光学字符识别（OCR）或文本提取，避免了表格破损或图像丢失的问题。ColiVara 支持超过100种文件格式，包括 PDF...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

059.1K

Cursor Reset：重置 Cursor 0.45.x 以上版本设备标识的脚本

综合介绍 Cursor Reset是一个用于重置Cursor IDE设备标识的PowerShell脚本工具，支持Cursor 0.45.x版本。该工具旨在帮助用户在Cursor IDE中重置设备标识...

最新AI资源 # AI开源项目

1年前

098.6K

n8n自托管AI入门套件：快速搭建本地AI环境的开源模板

综合介绍 n8n自托管AI入门套件是一个开源的Docker Compose模板，旨在快速初始化一个全面的本地AI和低代码开发环境。由n8n团队精心策划，该套件结合了自托管的n8n平台和一系列兼容的AI...

最新AI资源 # AI开源项目

1年前

088K

Gemini Teacher：英语口语发音纠正助手

综合介绍 Gemini Teacher 是一个基于 Google Gemini AI 的英语口语练习助手。它能够实时识别用户的英语发音，并提供即时反馈和纠正建议。该工具旨在帮助用户提高英语口语能力，通...

最新AI资源 # AI开源项目 # AI教育工具

1年前

071.8K

bilive：B站无人监守直播录制与自动切片、上传工具

综合介绍 bilive是一个专为B站直播录制设计的工具，提供极快的直播录制、自动切片、弹幕渲染和字幕生成功能。该工具兼容超低配置机器，支持7x24小时无人值守录制，自动识别并渲染弹幕和字幕，自动切片并...

最新AI资源 # AI开源项目 # AI音视频编辑

1年前

080.9K

R1-V：低成本强化学习实现视觉语言模型泛化能力

综合介绍 R1-V 是一个开源项目，旨在通过低成本的强化学习（RL）实现视觉语言模型（VLM）的突破。该项目利用可验证的奖励机制，激励 VLMs 学习通用的计数能力。令人惊叹的是，R1-V 的 2B ...

最新AI资源 # AI开源项目

1年前

063.1K

PPTX2MD：将PPTX文件转换为Markdown的专用工具

综合介绍 PPTX2MD是一个开源工具，旨在将PowerPoint的PPTX文件转换为Markdown格式。该工具由GitHub用户ssine开发，支持保留标题、列表、文本格式（如粗体、斜体、颜色和超...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

077.1K

DSPy Examples：展示DSPy功能的实用示例

综合介绍 DSPy示例代码库是一个由Langtrace AI团队维护的GitHub代码库，展示了使用DSPy构建的各种AI程序示例。该代码库旨在通过实际示例展示DSPy的多种功能，帮助开发者更好地理解...

最新AI资源 # AI开源项目

1年前

053.3K

Go-Proxy：Docker集成的高性能反向代理服务器

综合介绍 Go-Proxy是一个使用Go语言开发的高性能代理服务器，主要用于在不同网络环境中提供代理服务。它支持多种协议，包括HTTP、HTTPS、SOCKS5、WebSocket、TCP和UDP，能...

最新AI资源 # AI开源项目

1年前

054.5K

CoT-Lab：探索人机协作迭代思考的实验性对话工具

综合介绍 CoT-Lab（人机协同思维实验室）是一个探索人机协作新范式的实验性界面。基于认知负荷理论和主动学习原则，CoT-Lab 通过创建“思维伙伴”关系，促进人类与人工智能的深度认知对齐。该项目旨...

最新AI资源 # AI开源项目

1年前

045.9K

让 DeepSeek 官网聊天界面支持内嵌渲染图表的浏览器扩展

综合介绍 DeepSeek Diagrams Extension是一款专为DeepSeek网站设计的Chrome浏览器扩展，旨在帮助用户在DeepSeek网站中内嵌渲染图表。该扩展基于Mermaid...

最新AI资源 # AI开源项目

1年前

0213K

Orate：集成知名语音生成、语音转录与变声模型的统一API

综合介绍 Orate 是一个专注于语音生成与转录的人工智能工具包。它提供了一个统一的API，能够与领先的AI提供商（如OpenAI、ElevenLabs和AssemblyAI）无缝集成，帮助用户创建逼...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音转文本

1年前

063.4K

Reflex LLM Examples：展示大语言模型实际应用的AI应用集合

综合介绍 Reflex LLM Examples是一个由Reflex开发团队创建的开源项目，旨在展示大语言模型（LLM）的实际应用。该项目汇集了多个基于Reflex构建的AI应用，展示了来自Googl...

最新AI资源 # AI开源项目

1年前

051.5K

DeepClaude：融合DeepSeek R1链式推理与Claude创造力的聊天界面

综合介绍 DeepClaude 是一个高性能的大语言模型（LLM）推理API和聊天界面，集成了DeepSeek R1的链式推理（CoT）能力和 Anthropic Claude 模型的创造力与代码生成...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

060.6K

BEN2：从图像、视频中快速移除背景的深度学习模型

综合介绍 BEN2（Background Erase Network 2）是由Prama LLC开发的一款深度学习模型，专门用于自动从图像中移除背景，并生成前景图像。该模型采用了创新的Confiden...

最新AI资源 # AI开源项目 # AI抠图改背景

10个月前

073.1K

AI Web Operator：浏览器自动化操作，OpenAI Operator的开源实现

综合介绍 AI Web Operator 是一个开源的 AI 浏览器操作工具，旨在通过集成多种 AI 技术和 SDK，简化用户在浏览器中的操作体验。该工具基于 Browserbase 和 Vercel...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

055.4K

Exa & Deepseek Chat App：实时Web搜索与智能推理的开源聊天应用

综合介绍 Exa & Deepseek Chat App 是一个开源的智能聊天应用，主要功能包括使用 Exa 的 API 进行实时 Web 搜索和利用 Deepseek R1 语言模型进行智能...

最新AI资源 # AI开源项目 # AI搜索工具

1年前

058.9K

LLM API Engine：通过自然语言快速生成和部署API

综合介绍 LLM API Engine 是一个开源项目，旨在帮助开发者快速构建和部署AI驱动的API。该项目利用大语言模型（LLM）和智能网页抓取技术，允许用户通过自然语言描述来创建自定义API。其主...

最新AI资源 # AI开源项目

1年前

057K

PengChengStarling：对比Whisper-Large v3更小、更快的多语言语音转文字工具

综合介绍 PengChengStarling（鹏城实验室）是一个多语言自动语音识别（ASR）工具，能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发，提供了完整的语音识别流程...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

058.6K

Doc2XAPITranslate：文档全文翻译：快速将英文PDF/MD论文翻译为中文文档

综合介绍 Doc2XAPITranslate 是一个强大的文档全文翻译工具，专为将英文PDF或Markdown论文快速翻译为中文文档而设计。该工具支持多种翻译器，包括DeepSeek、OpenAI、O...

最新AI资源 # AI开源项目 # AI翻译

1年前

052K

SpeechGPT 2.0-preview：实时交互的端到端拟人语音对话大模型

综合介绍 SpeechGPT 2.0-preview 是 OpenMOSS 推出的首个拟人化实时交互系统，基于百万小时级语音数据训练而成。该系统具备拟人口语化表达与百毫秒级低延迟响应，支持自然流畅的实...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

053.1K

Goose：开源可扩展的编程智能体，自动化执行编程全流程任务

综合介绍 Goose是由 Block 公司开发的一个开源AI代理工具，旨在帮助开发者自动化处理日常开发任务。它支持多种大型语言模型（LLM），通过命令行或桌面应用接口与用户互动。Goose可以执行从代...

最新AI资源 # AI开源项目 # AI编程 # 智能体开发框架

1年前

083.1K

Fullmoon：本地大语言模型聊天的iOS应用

综合介绍 Fullmoon是一款专为iOS设备设计的应用程序，旨在提供与本地大语言模型进行私密聊天的功能。该应用优化了Apple Silicon，支持在iPhone、iPad和Mac上运行。用户的聊天...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

063.4K

Onlook：面向前端设计开源Cursor，在React应用中设计并发布代码

综合介绍 Onlook是一款开源的设计工具，专为设计师和开发者打造，允许用户直接在运行的React应用中进行设计，并将设计修改转换为代码。该工具提供了一种直观的视觉编辑体验，类似于Figma或Webf...

最新AI资源 # AI开源项目 # AI页面设计

1年前

059.3K

YuE：将歌词转化为完整歌曲的基础模型，支持多种音乐风格

综合介绍 YuE是一个开源的全歌曲生成基础模型，专注于将歌词转化为完整的歌曲。与其他仅能生成短片段非声乐音乐的模型不同，YuE能够生成包含主唱和伴奏的完整歌曲，时长可达数分钟。该模型解决了音乐生成中的...

最新AI资源 # AI开源项目 # AI音乐

1年前

064.1K

PocketPal AI：iOS和Android设备离线使用的小型语言模型聊天工具

综合介绍 PocketPal AI 是一款开源的移动应用，旨在将小型语言模型（Small Language Models, SLMs）直接引入到你的手机中，无论是iOS还是Android用户都可以使用...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0187.7K

Cog-ComfyUI：使用API运行ComfyUI工作流

综合介绍 Cog-ComfyUI是一个开源项目，旨在通过API运行ComfyUI工作流。该项目由GitHub用户fofr创建，提供了一种高效的方式来集成和运行ComfyUI工作流。ComfyUI是一种...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # ComfyUI

1年前

079.7K

Supermemory：导入书签和网页内容构建个人知识库

综合介绍 Supermemory 是一个开源项目，旨在帮助用户构建自己的“第二大脑”。它通过一个功能强大的 Chrome 扩展程序和AI技术，让用户能够轻松保存、组织和检索来自网页、Twitter书签...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

055.7K

Open NotebookLM：将PDF转换为播客的开源工具

综合介绍 Open NotebookLM 是一个开源项目，旨在将任何PDF文档转换为播客。该工具利用开源的大型语言模型（LLM）和文本转语音（TTS）模型，处理PDF内容，生成适合音频播客的自然对话...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

059.7K

Qwen2.5-VL：支持图像视频文档解析的开源多模态大模型

综合介绍 Qwen2.5-VL 是阿里巴巴云（Alibaba Cloud）Qwen 团队开发的开源多模态大模型。它能同时处理文本、图像、视频和文档，是 Qwen2-VL 的升级版，基于 Qwen2.5...

最新AI资源 # AI开源项目

1年前

082.2K

Lux：几乎支持所有视频平台的命令行视频下载器

综合介绍 Lux 是一个用 Go 语言编写的快速且简单的视频下载库和命令行工具。它支持从多个网站下载视频，包括 YouTube、Bilibili、优酷等。Lux 提供了多种下载选项和功能，如多线程下载...

最新AI资源 # AI开源项目

1年前

058.2K

R1 Overthinker：强制 DeepSeek R1 模型延长思考时间

综合介绍 DeepSeek R1 Overthinker 是一个专为增强 DeepSeek R1 模型思考深度而设计的工具。通过延长模型的推理过程，该工具能够使模型进行更深入的思考，从而提高其回答的质...

最新AI资源 # AI开源项目

1年前

063.6K

Langui：开源的AI用户界面组件库

综合介绍 LangbaseInc的Langui是一个开源的用户界面组件库，专为生成式AI和大语言模型（LLM）项目设计。该库基于Tailwind CSS，提供了一系列预构建的UI组件，帮助开发者快速构...

最新AI资源 # AI开源项目 # AI页面设计

1年前

062.8K

MNN-LLM-Android：MNN 多模态语言模型的安卓应用

综合介绍 MNN（Mobile Neural Network）是阿里巴巴开发的一个高效、轻量级的深度学习框架，专为移动端设备优化。MNN不仅能够在移动设备上进行快速推理，还支持多模态任务，包括文本生成...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

078.6K

AI RSS生成器：通过AI将网页内容转换为RSS订阅源的工具

综合介绍 AI RSS是一个创新的工具，通过AI技术将网页内容转换为RSS订阅源。它包含两个主要部分：一个浏览器插件和一个服务器端。浏览器插件允许用户选择网页中的列表并生成结构化数据描述（SDD）文件...

最新AI资源 # AI开源项目 # AI生活效率助手

1年前

069.9K

UltraRAG：一站式RAG系统解决方案，简化数据构建与模型微调

综合介绍 UltraRAG是由清华大学THUNLP组、东北大学NEUIR组、Modelbest.Inc和9#AISoft团队联合提出的RAG（检索增强生成）系统解决方案。该框架基于敏捷部署和模块化构建...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

066.6K

Llasa 1~8B：高品质语音生成和克隆的开源文本转语音模型

综合介绍 Llasa-3B是由香港科技大学音频实验室（HKUST Audio）开发的一个开源文本转语音（TTS）模型。该模型基于Llama 3.2B架构，经过细致调优，提供高质量的语音生成，不仅支持多...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音克隆

1年前

074.5K

Fast GraphRAG：高准确率且低成本的图形化检索增强生成工具

综合介绍 Fast GraphRAG 是由 Circlemind AI 开发的一款开源工具，旨在通过知识图谱和 PageRank 算法实现高效、精确的检索增强生成（RAG）。该工具能够智能适应用户的使...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

1年前

065.4K

TinyZero：低成本复现 DeepSeeK-R1 Zero 的顿悟效果

综合介绍 TinyZero 是一个基于 veRL 的强化学习模型，旨在复现 DeepSeeK-R1 Zero 在倒计时和乘法任务中的表现。令人惊讶的是，该项目仅需 30 美元的运行成本（使用 2xH2...

最新AI资源 # AI开源项目

1年前

071.2K

Open R1：Hugging Face 复现 DeepSeek-R1 的训练过程

综合介绍 Hugging Face的Open R1项目是一个完全开源的DeepSeek-R1复现项目，旨在构建R1管道的缺失部分，使每个人都能复现并在其基础上进行构建。该项目设计简单，主要包括训练和评...

最新AI资源 # AI开源项目

1年前

075.7K

Open Operator：通过AI智能体在云浏览器中执行自动化操作

综合介绍 Open Operator 是一个开源项目，旨在通过AI智能体在浏览器中进行自动化操作。该项目由 Browserbase 开发，结合了 Stagehand 和 Browserbase 的技术...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

056.9K

Cerebr：与网页内容对话的开源浏览器插件

综合介绍 Cerebr 是一个功能强大的 Chrome 浏览器 AI 助手扩展，旨在提升用户的工作效率和学习体验。Cerebr 的设计理念源于对简洁、高效浏览器 AI 助手的需求，凭借其极简设计和强大...

最新AI资源 # AI开源项目 # 浏览器AI助手

12个月前

058.1K

加载更多