AI开源项目

共 1020 篇文章

排序

浏览收藏

FantasyTalking：生成真实感说话肖像的开源工具

综合介绍 FantasyTalking 是一个由 Fantasy-AMAP 团队开发的开源项目，专注于通过音频驱动生成真实感说话肖像视频。项目基于先进的视频扩散模型 Wan2.1，结合音频编码器 Wa...

最新AI资源 # AI开源项目 # AI数字人

1年前

081.4K

Ortlin：与所有OpenAI模型和API交互的Web图形用户界面

综合介绍 Ortlin是一个基于Web的图形用户界面，旨在帮助任何人（无论是技术用户还是非技术用户）轻松地与OpenAI的API和底层模型进行交互。它完全免费且开源，使用户能够无障碍地利用OpenAI...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

081.4K

Social Media Agent：社交媒体智能助手，自动生成和管理社交媒体内容

综合介绍社交媒体代理（Social Media Agent）是一个开源项目，由全新的 Agent Inbox 管理交互信息，旨在帮助用户自动生成和管理社交媒体内容。该项目由LangChain团队开发...

最新AI资源 # AI开源项目 # AI社交媒体

2年前

081.4K

Agent-Wiz：分析AI智能体工作流程和安全风险

综合介绍 Agent-Wiz 是一个开源的Python命令行工具，专为开发者、研究人员和安全团队设计。它能从LangGraph、CrewAI、AutoGen等主流AI智能体框架中提取复杂的工作流程，生...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

081.2K

Feeds.Fun：自动标记和筛选新闻的RSS订阅工具

综合介绍 Feeds.Fun 是一个帮助用户高效阅读新闻的工具，核心特点是自动为新闻添加标签并根据用户喜好筛选内容。它由开发者 Aliaksei Yaletski（网名 Tiendil）创建，托管在 ...

最新AI资源 # AI开源项目 # AI生活效率助手

1年前

081.2K

Memobase：为AI应用提供基于用户画像的长期记忆方案

综合介绍 Memobase 是一个基于用户画像的记忆系统，旨在为生成式AI应用提供长效用户记忆支持。无论您是在构建虚拟伴侣、教育工具还是个性化助手，Memobase 都能帮助您的AI记住、理解并随着用...

最新AI资源 # AI开源项目

1年前

081.2K

MemFree：本地知识库与搜索信息混合的AI搜索引擎

综合介绍 MemFree 是一个先进的混合AI搜索引擎，能够通过文本、图像、文件和网页进行搜索和提问。它提供一键获取文本、思维导图、图像和视频的搜索结果的功能。MemFree 的目标是从用户的知识库和...

最新AI资源 # AI开源项目 # AI搜索工具

2年前

081.2K

AutoGPT：工作流自动化与自主执行任务的智能体构建平台

综合介绍 AutoGPT是一个强大的平台，旨在帮助用户创建、部署和管理连续运行的AI代理，自动化复杂的工作流。该平台由Significant Gravitas开发，提供了多种工具和功能，使用户能够专注...

最新AI资源 # AI开源项目 # 低代码工作流 # 智能体开发框架

2年前

081.1K

Lumina-mGPT-2.0：处理多种图像生成任务的自回归图像生成模型

综合介绍 Lumina-mGPT-2.0 是由上海人工智能实验室（Shanghai AI Laboratory）、香港中文大学（CUHK）等机构联合开发的开源项目，托管于 GitHub，由 Alpha...

最新AI资源 # AI开源项目

1年前

081.1K

MuseGAN：生成多轨音乐/配乐的开源模型，轻松创作多种乐器的音乐片段

综合介绍 MuseGAN是一个基于生成对抗网络（GAN）的音乐生成项目，旨在生成多轨（多种乐器）音乐。该项目能够从零开始生成音乐，或根据用户提供的轨道进行伴奏。MuseGAN使用Lakh Pianor...

最新AI资源 # AI开源项目 # AI音乐

2年前

081.1K

X-Dyna：静态人像参考视频姿态生成视频，让小姐姐的照片跳舞

综合介绍 X-Dyna 是由字节跳动开发的一个开源项目，旨在通过零样本扩散技术生成动态人像动画。该项目利用驱动视频中的面部表情和身体动作来动画化单个人像图像，生成逼真且具有上下文感知的动态效果。X-D...

最新AI资源 # AI图像转视频 # AI开源项目

2年前

081.1K

Knowledge Table：高效提取与探索结构化数据的开源工具

综合介绍知识表（Knowledge Table）是一个开源项目，旨在简化从非结构化文档中提取和探索结构化数据的过程。用户可以通过自然语言查询接口创建结构化的知识表示，如表格和图形。该工具支持自定义提...

最新AI资源 # AI开源项目 # 知识图谱

2年前

081.1K

OmniParser：用户界面截图解析成结构化元素，便于大模型理解和操作

综合介绍 OmniParser是一个由微软开发的工具，旨在解析用户界面截图，将其转化为结构化且易于理解的元素。这一工具显著提升了GPT-4V在对应界面区域生成准确操作的能力。OmniParser不仅支...

最新AI资源 # AI开源项目

1年前

081K

AI蜂巢：基于 Java 的多功能 AI聊天集成平台

综合介绍 AI 蜂巢（ai-beehive）是一个基于 Java 语言，采用 Spring Boot 3 和 JDK 17 构建的多功能 AI 平台。该项目整合了多种 AI 技术，包括 ChatGPT...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI本地化聊天应用

2年前

081K

TankWork：通过语音和文字操作电脑，并提供实时语音反馈的智能体

综合介绍 TankWork是一个开源的桌面代理框架，旨在通过计算机视觉和系统级交互，使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机，处理实时屏幕内容，并提供连续的音频视觉...

最新AI资源 # AI开源项目 # 桌面自动化智能体

2年前

081K

Hoarder：开源 AI 书签管理工具，支持多种格式文件，智能标签分类、全文检索

综合介绍 Hoarder 是一个自主托管的书签管理工具，支持链接、笔记、PDF和图像的存储。它利用 AI 技术进行自动标记，并提供全文搜索功能。用户可以通过 Chrome 插件和 Firefox 插件...

最新AI资源 # AI开源项目 # AI生活效率助手

2年前

081K

"Always-On" Deepseek AI Assistant：基于Deepseek-V3打造智能语音交互系统

综合介绍 Always-On AI Assistant是一个创新的AI助手项目，它通过整合Deepseek-V3、RealtimeSTT和Typer等先进技术，打造了一个功能强大的永久在线AI助理系统...

最新AI资源 # AI开源项目 # 多模态实时互动产品

2年前

080.9K

Atomic Agents：构建轻量级模块化AI智能体框架

综合介绍 Atomic Agents 是一个围绕原子性概念设计的极其轻量级和模块化的框架，用于构建代理AI管道和应用程序。该框架提供了一组工具和代理，可以组合创建强大的应用程序。它基于 Instruc...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

080.8K

ChatGPT Box：让 ChatGPT 在其他网页工作的浏览器插件

综合介绍 ChatGPT Box 是一个开源的浏览器扩展工具，旨在将 ChatGPT 深度集成到用户的浏览器中。该工具由 josStorer 开发，支持多种语言，并提供多种功能，如在任意页面调用聊天对...

最新AI资源 # AI开源项目 # AI集成多模型对话平台 # 浏览器AI助手

1年前

080.8K

Minima：支持本地部署或集成到ChatGPT、Claude的开源RAG容器

综合介绍 Minima 是一个开源的 RAG（Retrieval-Augmented Generation）解决方案，支持在本地部署和与 ChatGPT 集成。该项目由 dmayboroda 维护，旨...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

080.8K

Audio-Reasoner：支持音频深度推理的大型语言模型

综合介绍 Audio-Reasoner 是由清华大学团队开发并托管于 GitHub 的开源项目，专注于构建支持音频深度推理的大型语言模型。该模型基于 Qwen2-Audio-Instruct，通过引入...

最新AI资源 # AI开源项目

1年前

080.7K

LivePortrait：静态图像、视频生成动态肖像动画工具

综合介绍 LivePortrait 是一款由快手科技开发的先进 AI 动态肖像动画工具。它利用创新的 AI 技术，将静态图像转化为生动的视频动画。无论是使用真实照片、动画风格还是艺术肖像，LivePo...

最新AI资源 # AI图像转视频 # AI开源项目 # AI视频转换风格

2年前

080.6K

PiT：用图像零件拼出完整图像的工具（未开放）

综合介绍 PiT（Piece it Together）是一个开源工具，托管在 GitHub 上，由特拉维夫大学的 Elad Richardson 等研究者开发。它能让用户输入零散的图像零件，比如翅膀...

最新AI资源 # AI图像编辑 # AI图像风格控制 # AI开源项目

1年前

080.6K

DB-GPT：构建AI原生数据应用开发框架，集成多模型管理与智能数据处理

综合介绍 DB-GPT是一个开源的AI原生数据应用开发框架，采用AWEL(Agentic Workflow Expression Language)和智能体技术构建。该项目旨在大模型领域构建基础设施...

最新AI资源 # AI开源项目 # AI数据分析 # 知识检索与RAG框架

1年前

080.5K

Robo Blogger：基于LangGraph将语音内容生成博客文章，自动化写作博客

综合介绍 Robo Blogger 是一个创新的博客创作工具，旨在通过语音转文字技术简化内容生成过程。用户可以通过任何语音转文字应用记录想法，Robo Blogger 将这些想法转化为结构化的博客内容...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

080.5K

EasyControl：将人像转为吉卜力风格图像的免费工具

综合介绍 EasyControl 是一个开源项目，项目基于扩散变换器（DiT）架构，提供高效、灵活的图像生成控制。其中，Ghibli Control LoRA 是其特色功能之一，通过仅用 100 张亚...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

080.5K

par_scrape：智能提取网页数据的爬虫工具

综合介绍 par_scrape 是一个基于 Python 的开源网页爬虫工具，由开发者 Paul Robello 在 GitHub 上推出，旨在帮助用户从网页中智能提取数据。它整合了 Selenium...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

080.5K

GaiaNet node：安装和运行自己的本地模型在线代理服务

综合介绍 GaiaNet-AI/gaianet-node是一个开源项目，允许用户在Mac、Linux或Windows WSL上通过一条命令快速安装默认的节点软件栈。用户可以初始化节点，自定义配置，下载...

最新AI资源 # AI开源项目 # 本地部署开源大模型工具

2年前

080.5K

DragGAN：交互式图像编辑工具，点选和拖拽控制图像位置

综合介绍 DragGAN是一个基于生成对抗网络（GAN）的交互式图像编辑工具。该项目由Xingang Pan等人在2023年SIGGRAPH会议上发布，旨在通过简单的点选和拖拽操作，让用户能够直观地操...

最新AI资源 # AI图像编辑 # AI开源项目

2年前

080.4K

Mahilo：连接不同AI智能体框架实时协作的集成平台

综合介绍 Mahilo 是一个开源的多智能体集成平台，由开发者 Jayesh Sharma 在 GitHub 上发布，旨在帮助用户连接来自不同框架的 AI 智能体，支持实时通信、人机交互及智能协作。该...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

080.4K

AI Video Starter Kit：在浏览器中全流程创作并编辑AI视频

综合介绍视频制作AI工具包（Video Starter Kit）是由fal-ai-community发布的一个开源项目，旨在展示如何在浏览器中利用AI模型进行视频制作。它提供了从图像到视频的转换工具...

最新AI资源 # AI开源项目 # AI音视频编辑

2年前

080.4K

IMS Toucan：快速可控的多语言（支持7000+语言）文本转语音工具

综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所（IMS）开发的一个先进的文本转语音（TTS）工具包。该工具包支持超过7000种语言，具有快速、可控且计算资源需求低的特点。IMS...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

080.3K

Open-Reasoner-Zero：开源大规模推理强化学习训练平台

综合介绍 Open-Reasoner-Zero 是一个专注于强化学习（RL）研究的开源项目，由 GitHub 上的 Open-Reasoner-Zero 团队开发。它旨在通过提供高效、可扩展且易用的训...

最新AI资源 # AI开源项目 # 大模型微调

1年前

080.2K

R1-Onevision：支持多模态推理的开源视觉语言模型

综合介绍 R1-Onevision 是一个由 Fancy-MLLM 团队开发的开源多模态大语言模型，专注于视觉与语言的深度结合，能够处理图像、文本等多模态输入，并在视觉推理、图像理解、数学解题等领域表...

最新AI资源 # AI开源项目

1年前

080.2K

Cloudflare Agents：在边缘网络上构建实时交互的智能体

综合介绍 Cloudflare Agents 是 Cloudflare 推出的一款开源开发框架，旨在帮助开发者在全球边缘网络上构建智能AI代理。它让代理具备状态持久化、实时通信和自主运行的能力，目前项...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

080.2K

Reactive Resume：支持多语言、多模板的开源免费简历生成器

综合介绍 Reactive Resume 是一个免费且开源的简历生成器，旨在简化创建、更新和分享简历的过程。该平台注重用户隐私，没有任何用户跟踪或广告。用户可以在不到30秒内自托管应用程序，完全掌控自...

最新AI资源 # AI开源项目 # AI生活效率助手

2年前

080.1K

Gaze-LLE: 视频中人物注视目标预测工具

综合介绍 Gaze-LLE是一款基于大规模学习编码器的注视目标预测工具。该项目由Fiona Ryan、Ajay Bati、Sangmin Lee、Daniel Bolya、Judy Hoffman和J...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

080.1K

Scraperr：自托管网页数据抓取工具

综合介绍 Scraperr 是一个自托管的网页数据抓取工具，用户可以通过指定 XPath 元素来抓取网页数据。用户提交 URL 和相应的抓取元素，结果将显示在表格中，并可下载为 Excel 文件。Sc...

最新AI资源 # AI开源项目

2年前

080.1K

$XDOllama：适用于MacOS上快速调用Ollama\Dify\Xinference的AI模型界面。$

XDOllama：适用于MacOS上快速调用Ollama\Dify\Xinference的AI模型界面。

综合介绍 XDOllama 是一款专为 MacOS 用户设计的桌面应用程序，旨在快速调用 Ollama、Dify 和 Xinference 等 AI 模型。该应用程序通过简化的界面和操作流程，使用户能...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

080.1K

JoyGen：音频驱动的3D深度感知人像说话视频编辑工具

综合介绍 JoyGen是一个创新的两阶段说话人脸视频生成框架，专注于解决音频驱动的面部表情生成问题。该项目由京东科技团队开发，采用先进的3D重建技术和音频特征提取方法，能够准确捕捉说话人的身份特征和表...

最新AI资源 # AI开源项目 # AI数字人

2年前

080K

self.so：一键生成精美的个人简历网页

综合介绍 self.so 是一个开源工具，专为快速将简历或 LinkedIn 个人资料转化为个人网站而设计。用户只需上传 PDF 简历或输入 LinkedIn 链接，系统通过 AI 技术（基于 Tog...

最新AI资源 # AI开源项目 # AI生活效率助手

1年前

080K

Bonsai：适合边缘设备运行的三值权重语言模型

综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型，参数规模为 5 亿，采用三值权重（ternary weights）技术。它基于 Llama 架构和 Mistral 分词器...

最新AI资源 # AI开源项目 # 大模型微调

1年前

080K

OmAgent：构建多模态智能设备的智能体框架

综合介绍 OmAgent是由Om AI Lab开发的一个多模态智能体框架，旨在为智能设备提供强大的AI驱动功能。该项目通过整合最先进的多模态基础模型和智能体算法，使开发者能够在各种智能设备上创建高效...

最新AI资源 # AI开源项目 # 多模态实时互动产品 # 智能体开发框架

2年前

080K

Rankify：支持信息检索与重排序的Python工具包

综合介绍 Rankify 是由奥地利因斯布鲁克大学数据科学小组开发的开源 Python 工具包。它专注于信息检索、重排序和检索增强生成（RAG），提供了一个统一的框架。工具包内置 40 个预检索基准数...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

080K

PDF to Podcast：将PDF转换为播客的实用工具

综合介绍受 Notebook LM 的播客生成特性和最近的 Open Notebook LM 开源实现的启发。在本食谱中，我们将实现一个关于如何构建 PDF 到播客管道的详细步骤。给定任何 PDF...

最新AI资源 # AI开源项目

2年前

079.9K

AI Podcast Generator：自动抓取新闻生成音频播客

综合介绍 AI 播客生成器是一个智能化的播客生成工具，利用先进的 AI 技术从网络资源中自动创建引人入胜的音频内容。该系统通过抓取新闻内容，生成自然流畅的叙述，并将其转换为音频播客。项目基于 Next...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

079.9K

SuperWeChatPC：开源的电脑端微信功能增强工具，支持二次开发

综合介绍 SuperWeChatPC 是一个开源的电脑端微信增强工具，核心是为用户和开发者提供便利。它最初解决微信只能单开的问题，后来加入了 WeChatSDK，让开发者可以调用微信功能，比如发送消息...

最新AI资源 # AI开源项目

1年前

079.9K

Confident AI：自动化大语言模型评估框架，对比不同大模型提示词输出质量

综合介绍 DeepEval是一个简单易用的开源LLM评估框架，用于评估和测试大语言模型系统。它类似于Pytest，但专注于LLM输出的单元测试。DeepEval结合最新的研究成果，通过G-Eval、幻...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

1年前

079.9K

Telegram GPT Worker：部署在Cloudflare Workers上的多模型AI Telegram机器人

综合介绍 GPT-Telegram-Worker 是一个基于 Cloudflare Workers 的多模型 AI Telegram 机器人，支持 OpenAI、Claude、Azure 等多个 AP...

最新AI资源 # AI开源项目 # 智能体应用

1年前

079.8K

OpenAlternative：精选常用SaaS产品的开源软件替代方案，寻找最佳开源替代方案

综合介绍 OpenAlternative 是一个专注于提供开源软件替代方案的平台，旨在帮助用户找到适合的开源工具来替代日常使用的商业SaaS产品。该网站通过精心策划的开源工具集合，帮助用户节省成本并提...

最新AI资源 # AI开源项目

2年前

079.7K

LLManager：智能自动化流程审批与人类审核结合的管理工具

综合介绍 LLManager 是一个开源的智能审批管理工具，基于 LangChain 的 LangGraph 框架开发，专注于自动化处理审批请求，同时结合人类审核优化决策。它通过语义搜索、少样本学习和...

最新AI资源 # AI开源项目 # 专业生产力工具

1年前

079.7K

CogView3：智谱轻言开源的级联扩散文本生成图像模型

综合介绍 CogView3 是由清华大学和智囊团队（智谱清言）开发的先进文本生成图像系统。它基于级联扩散模型，通过多阶段生成高分辨率图像。CogView3 的主要特点包括多阶段生成、创新架构和高效性能...

最新AI资源 # AI在线生成图像 # AI开源项目

2年前

079.7K

LiberSonora：有声书字幕提取与多语言翻译，有声小说转录为多语言

综合介绍 LiberSonora，寓意“自由的声音”，是一个AI赋能的强大开源有声书工具集。该工具集支持智能字幕提取、AI标题生成、多语言翻译等功能，能够在GPU加速下进行批量离线处理。LiberSo...

最新AI资源 # AI开源项目 # AI翻译 # AI语音转文本

1年前

079.7K

ai-gradio：轻松集成多种AI模型，基于Gradio构建多模态应用

综合介绍 ai-gradio是一个开源的Python工具包，旨在帮助开发者轻松集成和使用多种AI模型。该项目基于Gradio构建，提供了一个统一的接口，支持多种AI模型和服务。无论是文本、语音还是视频...

最新AI资源 # AI开源项目

1年前

079.6K

Dynamiq：智能体编排框架，支持RAG和LLM代理，简化AI应用开发

综合介绍 Dynamiq是一个开源的AI编排框架，专为代理AI和大语言模型（LLM）应用而设计。它旨在简化AI驱动应用程序的开发，特别是在检索增强生成（RAG）和LLM代理的编排方面。Dynamiq提...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

079.5K

DSPy Examples：展示DSPy功能的实用示例

综合介绍 DSPy示例代码库是一个由Langtrace AI团队维护的GitHub代码库，展示了使用DSPy构建的各种AI程序示例。该代码库旨在通过实际示例展示DSPy的多种功能，帮助开发者更好地理解...

最新AI资源 # AI开源项目

1年前

079.5K

LangWatch：基于DSPy 框架监控与优化LLM流程的可视化工具

综合介绍 LangWatch 是一个专为大语言模型（LLM）操作而设计的综合平台，提供监控、分析、评估、数据集管理和提示优化等功能。该平台基于斯坦福大学的 DSPy 框架，旨在帮助用户更好地管理和优化...

最新AI资源 # AI开源项目

2年前

079.5K

StickerBaker：用AI制作个性贴纸图片

综合介绍 stickerbaker是一个开源的贴纸制作工具，利用人工智能技术来制作各种有趣的贴纸。无论是想要一个简单的猫咪贴纸还是想要制作一系列多样化的贴纸，stickerbaker都能满足你的需求...

最新AI资源 # AI在线生成图像 # AI开源项目

2年前

079.4K

LuminaBrush：使用智能绘画工具为图像添加照明打光效果

综合介绍 LuminaBrush 是一个创新的交互式图像照明效果编辑工具，由人工智能技术驱动。该项目采用两阶段框架处理图像：第一阶段将输入图像转换为"均匀照明"的外观，第二阶段则根据用户的涂鸦操作生成...

最新AI资源 # AI图像风格控制 # AI开源项目

2年前

079.4K

LLM API Engine：通过自然语言快速生成和部署API

综合介绍 LLM API Engine 是一个开源项目，旨在帮助开发者快速构建和部署AI驱动的API。该项目利用大语言模型（LLM）和智能网页抓取技术，允许用户通过自然语言描述来创建自定义API。其主...

最新AI资源 # AI开源项目

2年前

079.3K

Vision Parse：使用视觉语言模型将PDF文档智能转换为Markdown格式

综合介绍 Vision Parse是一个革命性的文档处理工具，它巧妙地结合了最先进的视觉语言模型(Vision Language Models)技术，能够将PDF文档智能转换为优质的Markdown格...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

079.2K

DocsGPT：文档聊天助手，从单个文档、网站来源获取可靠的答案，支持本地部署

综合介绍 DocsGPT 是一个开源的文档助手，旨在简化项目文档查询过程。通过集成强大的 GPT 模型，开发者可以轻松地就项目提出问题并获得准确的答案。DocsGPT 支持本地部署，确保数据隐私，同时...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

079.2K

Goku: 生成画面精细且一致的视频，适合创作包含人物、物体细节的广告视频

综合介绍 Goku是一款基于流变换技术的联合图像和视频生成模型，旨在实现行业级的性能表现。它整合了先进的高质量视觉生成技术，包括精细的数据整理、模型设计和流变换公式。Goku的主要贡献包括高质量的细粒...

最新AI资源 # AI图像转视频 # AI开源项目 # AI文本转视频

1年前

079.1K

OneFileLLM：整合多种数据源为单一文本文件

综合介绍 OneFileLLM 是一个开源命令行工具，旨在将多种数据源整合成单一文本文件，方便输入大语言模型（LLM）。它支持处理 GitHub 仓库、ArXiv 论文、YouTube 视频转录、网页...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

079K

Vector Vein（向量脉络）：无代码AI工作流构建平台

综合介绍 Vector Vein 是一个无代码 AI 工作流构建平台，旨在帮助用户轻松创建智能化、自动化的工作流程。无需编程基础，用户只需通过拖拽操作即可将各种功能模块连接起来，构建出复杂的 AI 工...

最新AI资源 # AI开源项目 # 低代码工作流

2年前

079K

HiOllama：与本地Ollama模型交互的简洁聊天界面

综合介绍 HiOllama是一个基于Python和Gradio构建的用户友好界面，旨在与Ollama模型进行交互。它提供了简单直观的网页界面，支持实时文本生成和模型管理功能。用户可以调整参数如温度和最...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

079K

NVIDIA PDF to Podcast：设置引导提示词将PDF转换为播客的AI工具

综合介绍 NVIDIA AI Blueprint: PDF to Podcast 是一个由NVIDIA开发的开源项目，旨在将PDF文档转换为引人入胜的音频内容。该项目利用NVIDIA NIM（NVID...

AI新闻 # AI开源项目 # AI文本转语音

1年前

078.9K

XiaoYuanKouSuan_Auto：小猿口算自动答题工具，高效解决口算题目

综合介绍小猿口算自动答题工具是一个基于Python的开源项目，旨在通过OCR识别和自动化脚本来高效解决小猿口算应用中的题目。该工具利用了OpenCV和Tesseract等技术，能够实时识别屏幕上的题...

最新AI资源 # AI开源项目 # AI教育工具

2年前

078.9K

Cloud Document Converter：飞书文档下载插件，飞书云文档转换为本地Markdown格式文档

综合介绍 Cloud Document Converter 是一个 Chrome 扩展，专为将飞书云文档转换为 Markdown 格式而设计。用户可以通过该工具轻松下载或复制飞书云文档为 Markdo...

最新AI资源 # AI开源项目

2年前

078.9K

DeepSeek Engineer：基于DeepSeek API的实验性编码助手,附提示词

综合介绍 DeepSeek Engineer是一款基于DeepSeek API开发的强大编程助手工具，它能够通过直观的命令行界面与用户进行交互，协助完成各种软件开发任务。该工具将大型语言模型的能力与实...

最新AI资源 # AI开源项目

1年前

078.8K

Bambo：轻量灵活的智能体框架，简单配置角色和工具，处理多种负载任务

综合介绍 Bambo是一个新型的代理框架，与主流框架相比，它更加轻量和灵活，能够处理各种负载任务。Bambo通过定义工具目录中的所有工具，并使用异步自定义函数来实现高效的代理功能。用户可以在llm_c...

最新AI资源 # AI开源项目 # 智能体开发框架

2年前

078.8K

Azure TTS Importer：将语音合成服务集成到阅读软件中

综合介绍 TTS Importer 是一个开源项目，旨在将 Azure TTS（Text-to-Speech）语音合成服务轻松导入到各种阅读软件中。该工具支持多个流行的阅读软件，包括阅读（legado...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

078.8K

AigoTools：自动收录网站并支持多语言的开源AI工具导航站

综合介绍 AigoTools 是一个开源AI网址导航，旨在帮助用户快速创建和管理导航站点。它内置站点管理和基于AI的自动收录功能，支持多语言、暗色/亮色主题切换，以及SEO优化。AigoTools 提...

最新AI资源 # AI副业赚钱项目 # AI开源项目

2年前

078.8K

OneLine：生成热点事件时间轴的AI工具

综合介绍 OneLine 是一个开源的热点事件时间轴生成工具，托管在 GitHub，由用户 chengtx809 开发。它通过用户输入的关键词，快速生成事件的时间轴，展示事件的时间、标题、描述和相关人...

最新AI资源 # AI开源项目 # AI搜索工具

1年前

078.7K

OpenPromptStudio：可视化编辑、管理图像提示词，同步自己的Notion提示词表

综合介绍 OpenPromptStudio（OPS）是一个开源的AIGC提示词可视化编辑器，由Moonvy团队开发。它旨在简化提示词的创建和管理过程，支持Midjourney等AI模型。OPS通过No...

最新AI资源 # AI图像生成辅助工具 # AI开源项目

2年前

078.7K

Llama 3.2 Reasoning WebGPU：在浏览器中运行LLama-3.2

综合介绍 Transformers.js 是 Hugging Face 提供的一个 JavaScript 库，旨在将最先进的机器学习模型直接在浏览器中运行，无需服务器支持。该库与 Hugging Fa...

AI新闻 # AI开源项目 # 本地部署开源大模型工具

2年前

078.7K

Xata Agent：监控和优化PostgreSQL数据库的AI助手

综合介绍 Xata Agent 是一个开源的AI工具，专门为PostgreSQL数据库设计。它能自动监控数据库运行状态，发现性能问题或故障的根本原因，并给出修复建议。开发团队xAI将其定位为一个类似...

最新AI资源 # AI开源项目 # AI数据分析

1年前

078.6K

SongGen：自动生成歌曲的单阶段自回归Transformer

综合介绍 SongGen 是一个开源的单阶段自回归Transformer模型，专为文本到歌曲的生成任务设计。该模型能够从文本输入生成包含人声和伴奏的歌曲。SongGen 提供了对多种音乐属性的细粒度控...

最新AI资源 # AI开源项目 # AI音乐

1年前

078.6K

CleverBee：开源AI研究助手，生成引证研究报告

综合介绍 CleverBee 是一个开源的 AI 研究助手，托管在 GitHub 上，由 SureScaleAI 开发。它通过大语言模型（如 Gemini 和 Claude）结合网页浏览技术，帮助用户...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

078.5K

MOFA Video：运动场适配技术将静态图像转换为视频

综合介绍 MOFA-Video 是一个先进的图像动画生成工具，利用生成运动场适配技术，将静态图像转换为动态视频。该项目由东京大学和腾讯 AI 实验室合作开发，并将在 2024 年欧洲计算机视觉会议（E...

最新AI资源 # AI图像转视频 # AI开源项目

2年前

078.5K

Potpie AI：快速创建专属代码库的AI工程助手

综合介绍 Potpie AI 是一个开源平台，专注于为开发者提供定制化的AI工程助手。它通过构建代码库的知识图谱，让AI代理深入理解代码结构与逻辑，自动化完成调试、测试、代码生成等任务。用户可以用简单...

最新AI资源 # AI开源项目 # AI编程

1年前

078.4K

MM-EUREKA：探索视觉推理的多模态强化学习工具

综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术，把文本推理能力扩展到多模态场景，帮助模型处理图像和文字信息。这个工具的核心...

最新AI资源 # AI开源项目 # 大模型微调

1年前

078.3K

Babelfish.ai：浏览器运行的语音实时转录与翻译应用

综合介绍 Babelfish.ai 是一个基于 Huggingface Transformer.js 和 Supabase Realtime 构建的实时转录和翻译应用。该应用可以在浏览器中加载大模型并...

最新AI资源 # AI开源项目 # AI语音转文本

2年前

078.2K

Pyramid Flow：快手推出的开源版"可灵"，基于SD3在少于8GB的GPU上运行（一键部署版）

综合介绍 Pyramid Flow 是一种高效的自回归视频生成方法，基于 Flow Matching 技术。该方法通过在不同分辨率和噪声水平之间插值，实现了视频内容的生成和解压缩，具有更高的计算效率...

最新AI资源 # AI图像转视频 # AI开源项目

2年前

078.2K

Gemini Next Chat：一键免费部署您的私人多模态Gemini应用

综合介绍 Gemini Next Chat 是一个开源项目，旨在帮助用户轻松部署私人Gemini应用。该项目支持Gemini 1.5和Gemini 2.0多模态模型，用户可以通过一键部署在Vercel...

最新AI资源 # AI开源项目 # AI本地化聊天应用

2年前

078.2K

Agent Laboratory：为研究人员提供自动化代码及研究报告撰写助手

综合介绍 Agent Laboratory 是一个端到端的自主研究工作流，旨在帮助研究人员实现他们的研究想法。该系统由大型语言模型驱动的专用代理组成，支持整个研究工作流——从进行文献综述和制定计划到执...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

078.2K

Audibit：将热门科技文章转为随时收听的音频播客

综合介绍 Audibit 是一个开源项目，核心功能是将 Hacker News、TechCrunch 等热门科技文章自动转为音频播客，让用户在通勤、健身或忙碌时通过 Web 端或移动端收听资讯。项目使...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

078K

Skywork-R1V：昆仑万文开源的图文混合多模态推理模型

综合介绍 Skywork-R1V 是由 SkyworkAI（昆仑万维）团队开发的一款开源多模态推理模型，发布于 GitHub。它能同时处理图像和文字，进行多步骤逻辑推理，特别擅长分析复杂图像问题。这...

最新AI资源 # AI开源项目

1年前

078K

LaWGPT：中文法律知识模型，支持法律问答和司法考试训练

综合介绍 LaWGPT 是由南京大学机器学习与数据挖掘研究组支持的一个开源项目，致力于打造基于中文法律知识的大语言模型。它在通用中文模型（如 Chinese-LLaMA 和 ChatGLM）的基础上...

最新AI资源 # AI开源项目 # AI教育工具

1年前

078K

Devin Cursor Rules：让Cursor和Windsurf 强化为 Devin

综合介绍 Devin Cursor Rules是一个开源项目，旨在通过配置文件和工具增强Cursor和Windsurf集成开发环境（IDE）的功能，使其具备类似Devin的高级AI能力。该项目提供了过...

最新AI资源 # AI开源项目

2年前

078K

VideoGrain：文本提示对视频进行局部编辑的开源项目

综合介绍 VideoGrain 是一个专注于多粒度视频编辑的开源项目，由 xAI 团队开发并在 GitHub 上托管。这个项目出自论文《VideoGrain: Modulating Space-Tim...

最新AI资源 # AI开源项目 # AI音视频编辑

1年前

078K

One-Prompt-One-Story：文本提示生成角色身份一致的图像

综合介绍 One-Prompt-One-Story (1Prompt1Story) 是一个创新的文本到图像生成工具，旨在通过单一提示实现一致性图像生成。该项目由刘涛等人在ICLR 2025会议上提出...

最新AI资源 # AI图像风格控制 # AI开源项目

1年前

078K

CHRONOS：新闻时间线总结工具，提升新闻检索和时间线生成效率

综合介绍 CHRONOS是由阿里巴巴NLP团队开发的一款新闻时间线总结工具。该工具通过迭代自我提问的方式，生成新闻事件的时间线总结。CHRONOS不仅能够处理开放领域的时间线总结任务，还能在效率和可扩...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

2年前

077.9K

Chitu（赤兔）：清华团队推出的高性能大语言模型推理框架

综合介绍 Chitu 是一个由清华大学 PACMAN 团队开发的开源推理框架，全名叫“赤兔”，专门用来跑大语言模型。它主打高效、灵活和实用，能让企业在不同设备上快速部署大模型。Chitu 支持多种硬件...

最新AI资源 # AI开源项目

1年前

077.9K

基于RAG构建提供健康建议的小助手（实验项目）

综合介绍 LLM-RAG-Longevity-Coach 是一个基于大语言模型（LLM）和检索增强生成（RAG）技术的聊天机器人，旨在为用户提供个性化的健康和长寿建议。该项目由 Tyler Burle...

最新AI资源 # AI开源项目 # AI生活效率助手

1年前

077.9K

GLIGEN GUI：精确控制图像元素位置，基于ComfyUI的直观图形界面

综合介绍 GLIGEN GUI 是一个基于 ComfyUI 的直观图形界面，旨在简化 GLIGEN 模型的使用。GLIGEN 是一种新颖的文本到图像模型，可以精确指定图像中对象的位置。通过 GLIGE...

最新AI资源 # AI图像生成辅助工具 # AI开源项目

2年前

077.9K

LangManus：支持多智能体协作的开源AI自动化框架

综合介绍 LangManus 是一个开源的 AI 自动化框架，托管在 GitHub 上。它由一群前同事在业余时间开发，属于学术驱动项目，目标是结合语言模型和专用工具，完成网页搜索、数据爬取和代码执行等...

最新AI资源 # AI开源项目 # 智能体应用

1年前

077.8K

NoneBot DeepSeek 插件：基于 NoneBot&DeepSeek 实现客服智能对话

综合介绍 NoneBot DeepSeek 插件是一个集成了 DeepSeek 模型的 NoneBot 插件，旨在提供智能对话与问答功能。通过接入 DeepSeek 模型，用户可以在 NoneBot ...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

077.8K

Quanta Quest：端侧大模型与面向个人数据的本地化AI搜索平台（预览版）

综合介绍 Quanta Quest是全球首个以“端侧大模型+C端数据本地化”为核心演进方向的产品。它帮助用户将Gmail、Notion、Dropbox等所有数据存储到本地，并通过向量数据库进行处理，确...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

077.8K

加载更多