AI开源项目

共 1020 篇文章

排序

浏览收藏

Reader API：网页内容提取工具，HTML转换为Markdown格式

综合介绍 Jina AI的Reader项目是一个开源工具（Reader 开源地址），可将任何URL通过添加前缀https://r.jina.ai/转换成适合大型语言模型(Large Languag...

最新AI资源 # AI开源项目 # 文档提取与清洗

2年前

0376.5K

Sherpa-ONNX：使用ONNXRuntime实现离线语音识别和合成

综合介绍 sherpa-onnx 是由 Next-gen Kaldi 团队开发的一个开源项目，旨在提供高效的离线语音识别和语音合成解决方案。它支持多种平台，包括 Android、iOS、Raspber...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音转文本

2年前

0370.7K

Dify 工作流 DSL 文件合集下载

综合介绍 Awesome-Dify-Workflow 是一个开源的 GitHub 项目，专注于分享实用的 Dify 工作流程模板。Dify 是一个支持开发大语言模型应用的工作流平台，而这个项目为用户提...

最新AI资源 # AI开源项目

1年前

0347.1K

LLPlayer：生成实时字幕并双语翻译的视频播放器

综合介绍 LLPlayer 是一款专为语言学习者设计的开源媒体播放器，托管于 GitHub，由开发者 umlx5h 创建。它集成了多种实用功能，如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等...

最新AI资源 # AI开源项目 # AI翻译 # AI语音转文本

1年前

0271.2K

小智 AI 聊天机器人：打造你的AI聊天伴侣，轻松实现语音对话和智能互动

综合介绍小智 AI 聊天机器人是一个基于ESP32开发板的开源项目，旨在帮助用户构建自己的AI聊天伴侣。该项目由虾哥开发，主要用于教学目的，帮助更多人入门AI硬件开发，并了解如何将大语言模型应用到实...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

0261.3K

Open-LLM-VTuber：实时语音互动的Live2D动画AI虚拟伴侣

综合介绍 Open-LLM-VTuber 是一个开源项目，允许用户通过语音和文字与大型语言模型（LLM）互动，并结合Live2D技术呈现动态虚拟角色。它支持Windows、macOS和Linux，可完...

最新AI资源 # AI开源项目 # AI角色扮演

1年前

0256.8K

Seed-VC：支持少样本实时转换语音和歌声

综合介绍 Seed-VC 是一个开源项目，地址在 GitHub 上，由 Plachtaa 开发。它能用一段 1 到 30 秒的参考音频，快速实现语音或歌声转换，不需要额外训练。项目支持实时语音转换，延...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

0242.4K

PocketPal AI：iOS和Android设备离线使用的小型语言模型聊天工具

综合介绍 PocketPal AI 是一款开源的移动应用，旨在将小型语言模型（Small Language Models, SLMs）直接引入到你的手机中，无论是iOS还是Android用户都可以使用...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0238.7K

让 DeepSeek 官网聊天界面支持内嵌渲染图表的浏览器扩展

综合介绍 DeepSeek Diagrams Extension是一款专为DeepSeek网站设计的Chrome浏览器扩展，旨在帮助用户在DeepSeek网站中内嵌渲染图表。该扩展基于Mermaid...

最新AI资源 # AI开源项目

2年前

0237.8K

Serena：语义检索和编辑代码的免费MCP工具

综合介绍 Serena 是 Oraios AI 团队开发的一款免费开源编程工具，托管在 GitHub 上。它是一个强大的代码助手，可以直接在你的代码库中工作，帮助开发者分析、编辑和执行代码。Seren...

最新AI资源 # AI开源项目 # AI编程 # MCP服务

1年前

0232.2K

Cherry Studio：集成API/Web/本地模型的AI助手桌面客户端

综合介绍 Cherry Studio 是一款支持多种大语言模型（LLM）服务的桌面客户端，兼容 Windows、Mac 和 Linux 系统。它提供了丰富的个性化选项和领先的功能设计，帮助用户在多种场...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0222.7K

留痕(WeChatMsg)：微信聊天记录导出与分析工具

综合介绍 WeChatMsg是一个开源项目，位于GitHub平台。该工具旨在提供微信用户一种方法，可以提取和导出微信聊天记录成各种文档（HTML、Word、CSV），并支持生成聊天数据的可视化年度报告...

最新AI资源 # AI开源项目

2年前

0221.7K

WeWe RSS：生成微信公众号RSS订阅的开源工具

综合介绍 WeWe RSS 是一个免费的开源工具，专门为微信公众号用户设计。它通过微信读书平台抓取公众号文章，生成 RSS 订阅源，让用户可以用 RSS 阅读器随时查看内容。这个工具解决了微信公众号信...

最新AI资源 # AI开源项目

1年前

0215.7K

SkyReels V2：生成无限长度视频的开源AI工具

综合介绍 SkyReels-V2 是一个开源的视频生成模型，由 SkyworkAI 开发。它通过先进的 Diffusion Forcing 技术，支持生成无限长度的视频，适用于文本转视频（T2V）和图...

最新AI资源 # AI图像转视频 # AI开源项目 # AI文本转视频

1年前

0209.5K

VisoMaster：强大且易用的图片/视频换脸和编辑软件

综合介绍 VisoMaster 是一款强大且易用的视频换脸和编辑工具，利用人工智能技术实现自然逼真的换脸效果。无论是图像还是视频，VisoMaster 都能通过简单的操作生成高质量的换脸结果，适合普通...

最新AI资源 # AI开源项目 # AI换脸与换装 # AI视频换脸

1年前

0209.2K

OpenUtau：免费的开源歌声合成编辑工具

综合介绍 OpenUtau 是一个免费的开源歌声合成编辑平台，旨在为 UTAU 社区提供现代化编辑体验。它是 UTAU 软件的继任者，解决原软件兼容性和操作复杂的问题。OpenUtau 支持 Wind...

最新AI资源 # AI开源项目 # AI音乐

1年前

0208.9K

LiveTalking：开源实时互动数字人直播系统，实现音视频同步对话

综合介绍 LiveTalking是一个开源的实时互动数字人系统，致力于构建高质量的数字人直播解决方案。该项目采用Apache 2.0开源协议，集成了多项前沿技术，包括ER-NeRF渲染、实时音视频流处...

最新AI资源 # AI开源项目 # AI数字人

2年前

0208.8K

xiaozhi-esp32-server：小智AI聊天机器人开源后端服务

综合介绍 xiaozhi-esp32-server 是一个为小智AI聊天机器人（xiaozhi-esp32）提供后端服务的工具。它用 Python 编写，基于 WebSocket 协议，帮助用户快速...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

0205.6K

Kilo Code：具有简洁使用体验的Roo Code分支

综合介绍 Kilo Code 是一个开源的 Visual Studio Code（简称 VS Code）扩展插件。它利用人工智能技术帮助用户更高效地编写代码。这个项目由 Kilo-Org 团队开发，最...

最新AI资源 # AI IDE # AI开源项目 # AI编程

1年前

0203.4K

Meetily：生成会议纪要的AI助手，实时转录和生成会议摘要

综合介绍 Meetily是一款由Zackriya Solutions开发的AI驱动会议助手，能够实时捕捉会议音频，进行语音转录，并生成会议摘要。其独特之处在于所有处理均在本地设备上完成，确保用户隐私...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

1年前

0202.3K

CosyVoice：阿里推出的3秒急速语音克隆开源项目，支持情感控制标签

综合介绍 CosyVoice是一个多语言大规模语音生成模型，提供从推理、训练到部署的全栈能力。该项目由FunAudioLLM团队开发，旨在通过先进的自回归变换器和基于ODE的扩散模型，实现高质量的语音...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

0201.7K

VeighNa：国内流行的开源量化交易框架

综合介绍 VeighNa 是一个基于 Python 的开源量化交易平台，最初由国内私募交易员开发，2015 年正式启动。它从简单的交易接口封装，发展成了一个功能全面的交易开发框架。用户包括私募基金、证...

最新AI资源 # AI开源项目 # AI金融数据分析

1年前

0199.5K

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集，专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护，托...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # 大模型微调

1年前

0199.5K

FunASR：开源语音识别工具包，说话人分离/ 多人对话语音识别

综合介绍 FunASR是一个由阿里巴巴达摩院开发的开源语音识别工具包，旨在为学术研究和工业应用提供桥梁。它支持多种语音识别功能，包括语音识别（ASR）、语音端点检测（VAD）、标点恢复、语言模型、说话...

最新AI资源 # AI开源项目 # AI语音转文本

2年前

0196.5K

FaceFusion：视频换脸增强工具|语音同步视频嘴型动作

综合介绍 FaceFusion是一个集成了面部交换与增强功能的先进云平台，优化了“图像到视频”、“图像到图像”的交换过程，并拥有5个专业模型，以确保无瑕的输出。此外，它通过7种模型进行面部增强，使用3...

最新AI资源 # AI开源项目 # AI视频换脸

1年前

0196.5K

PDFMathTranslate：保留PDF完整排版的AI翻译工具

综合介绍 PDFMathTranslate 是一个专注于科学论文翻译的开源工具，能够将 PDF 文档全文翻译并生成双语对照版本。它利用 AI 技术完整保留原始文档的排版，包括公式、图表、目录和注解，支...

最新AI资源 # AI开源项目 # AI翻译 # 论文

1年前

0193.2K

Kimi-Audio：开源音频处理与对话基础模型

综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型，专注于音频理解、生成和对话。它支持多种音频处理任务，例如语音识别、音频问答和语音情感识别。模型经过超过 130...

最新AI资源 # AI开源项目 # AI文本转语音 # AI语音转文本

1年前

0190.9K

OpenVoice(MyShell)：多语言少样本即时语音克隆

综合介绍 OpenVoice 是一个多功能的即时语音克隆方法，仅需使用参考说话者的短音频片段，即可复制其声音并生成多语言的语音。除了复制音色外，OpenVoice 还允许精细控制语音风格，包括情感...

最新AI资源 # AI开源项目 # AI语音克隆

2年前

0185.7K

基于Wan2.1为ComfyUI提供视频生成能力的插件

综合介绍 ComfyUI-WanVideoWrapper 是一个由开发者 kijai 创建的开源插件，专为 ComfyUI 平台设计。它基于 WanVideo 的 Wan2.1 模型，提供了强大的视频...

最新AI资源 # AI图像转视频 # AI开源项目 # AI文本转视频

1年前

0185.2K

Riona-AI-Agent：社交媒体自动化互动智能体，自动搜索、点赞、留言

综合介绍 Riona-AI-Agent是一个创新的AI驱动自动化工具，专门设计用于管理和优化各大社交媒体平台的运营。该项目利用先进的AI模型，为Instagram、Twitter和GitHub等平台提...

最新AI资源 # AI开源项目 # AI社交媒体

2年前

0182.4K

DeepWiki-Open：为GitHub、GitLab仓库自动生成AI文档

综合介绍 DeepWiki-Open 是一个开源项目，专为 GitHub、GitLab 和 Bitbucket 的代码仓库自动生成结构化文档。它利用 AI 技术分析代码结构、文件内容和逻辑关系，快速生...

最新AI资源 # AI开源项目

1年前

0181K

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

综合介绍 MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具，专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

2年前

0178.3K

LatentSync：用音频直接生成唇形同步视频的开源工具

综合介绍 LatentSync 是字节跳动（ByteDance）开发的一个开源工具，托管在 GitHub 上。它通过音频直接驱动视频中人物的唇部动作，让嘴型与声音精准匹配。项目基于 Stable Di...

最新AI资源 # AI开源项目 # 口型同步

1年前

0177.9K

HeyGem：硅基智能开源的 Heygen 数字人平替产品

综合介绍 HeyGem 是一款专为 Windows 系统设计的完全离线视频合成工具，由 GuijiAI（硅基智能）团队开发并在 GitHub 上开源。它利用先进的 AI 算法精准克隆用户的外貌和声音...

最新AI资源 # AI开源项目 # AI数字人

1年前

0177.8K

EXO：利用闲置家用设备运行分布式AI集群，支持多种推理引擎和自动设备发现。

综合介绍 Exo是一个开源项目，旨在利用日常设备（如iPhone、iPad、Android、Mac、Linux等）运行自己的AI集群。通过动态模型分区和自动设备发现，Exo能够将多个设备统一成一个强大...

最新AI资源 # AI开源项目 # 本地部署开源大模型工具

2年前

0177.6K

MoneyPrinter V2：自动生成YouTube短视频与Twitter内容并发布

综合介绍 MoneyPrinter V2 是由FujiwaraChoki开发的一个开源项目，旨在通过自动化手段帮助用户在线赚钱。该项目主要集成了Twitter自动化、YouTube短视频生成以及联盟营...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI营销

2年前

0174.8K

AstrBot：具有WebUI的AI聊天机器人接入平台

综合介绍 AstrBot 是一个开源的聊天机器人开发框架，它支持 QQ、Telegram、微信等多种消息平台，并能轻松接入 OpenAI、DeepSeek、Google Gemini 等大语言模型（L...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

0174.5K

微信视频号下载器：快速下载微信视频号视频，支持多种格式和平台

综合介绍微信视频号下载器是一个开源项目，旨在帮助用户快速下载微信视频号中的视频内容。该工具支持多种视频格式和平台，用户可以方便地在Windows和macOS系统上使用。项目由ltaoo开发，并托管在...

最新AI资源 # AI开源项目

2年前

0173.2K

gibberlink：两个AI智能体间高效音频通信的演示项目

综合介绍 gibberlink 是一个由开发者 PennyroyalTea 在 GitHub 上开源的项目，专注于实现两个对话型 AI 智能体之间的通信优化。当两个 AI 智能体通过电话交谈并识别出彼...

最新AI资源 # AI开源项目

1年前

0172.9K

GitDiagram：可视化GitHub代码库结构，将代码仓库转换为交互式系统架构图

综合介绍 GitDiagram是一款创新的GitHub代码库可视化工具，能够将任何GitHub仓库快速转换为交互式系统架构图。它采用先进的AI技术（Claude 3.5 Sonnet），为开发者提供了...

最新AI资源 # AI开源项目 # AI白板与信息图

2年前

0171K

FunClip：智能剪辑视频内容为短片，轻松实现精准视频片段提取/裁剪

综合介绍 FunClip是一款完全开源的本地化自动视频剪辑工具，由阿里巴巴达摩院TONGYI语音实验室开发。该工具集成了工业级的 Paraformer-Large 语音识别模型，可以准确识别视频中的语...

最新AI资源 # AI开源项目 # AI语音转文本 # AI音视频编辑

2年前

0170.1K

Chatlog：提取和查询微信聊天记录的开源工具

综合介绍 Chatlog 是一个开源工具，专注于从微信本地数据库提取和查询聊天记录。它支持微信 3.x 和 4.0 版本，覆盖 Windows 和 macOS 系统。用户可以通过命令行、终端界面或 H...

最新AI资源 # AI开源项目 # MCP服务 # 文档提取与清洗

1年前

0170.1K

Open Sora：优化脸部一致性的开源视频生成工具

综合介绍 Open-Sora 是一个开源项目，旨在让任何人都能高效生成高质量视频。它由 hpcaitech 团队开发，提供从文本或图像生成视频的工具，支持多种分辨率和时长。项目完全开源，公开模型权重...

最新AI资源 # AI图像转视频 # AI开源项目

1年前

0169.8K

Agnai Chat：与个性化AI角色互动的开源聊天平台

综合介绍 Agnai Chat 是一个开源的AI聊天平台，用户可以创建个性化AI角色，进行单人或多人互动。它支持多种AI服务，包括OpenAI、Claude、Kobold等，适合娱乐、角色扮演、教育或...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0169.6K

WeChatFerry：功能全面的微信机器人开发框架

综合介绍 WeChatFerry 是一个开源的微信机器人底层框架，由开发者 lich0821 在 GitHub 上创建并维护。该项目通过微信 Hook 技术，提供了一套强大的 SDK，允许开发者将微信...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

0167.1K

Marker：快速将PDF转换为Markdown的开源工具

综合介绍 Marker 是一个基于深度学习的文档处理工具，旨在将 PDF 文件快速准确地转换为 Markdown 格式。它支持多种文档类型，特别优化了书籍和科学论文的转换。Marker 能够去除页眉页...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

0164.1K

Roo Code（Roo Cline）：基于Cline的增强版自主编程助手，智能化IDE编程助手

综合介绍 Roo Code（前称Roo Cline）Roo Code（Roo Cline）是一个基于 Cline 的增强版自主编程助手，它是一个强大的 VS Code 扩展插件。这个工具能够在您的集...

最新AI资源 # AI开源项目 # AI编程

2年前

0164.1K

IndexTTS：支持中英文混合的文本转语音工具

综合介绍 IndexTTS 是一个开源的文本转语音（TTS）工具，托管在 GitHub 上，由 index-tts 团队开发。它基于 XTTS 和 Tortoise 技术，通过改进模块设计，提供高效且...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

0163.3K

Tifa-Deepsex-14b-CoT：擅长角色扮演与超长小说生成的大模型

综合介绍 Tifa-Deepsex-14b-CoT 是一个基于 Deepseek-R1-14B 深度优化的大模型，专注于角色扮演、小说文本生成以及思维链（Chain of Thought, CoT）推...

最新AI资源 # AI开源项目 # AI角色扮演

1年前

0162.8K

roop-unleashed：基于Roop优化的全能换脸工具

综合介绍 Roop-Unleashed 是一个基于 Python 的开源 AI 换脸工具，继承自 s0md3v 的 Roop 项目，由开发者 C0untFloyd 继续维护并更名为 Roop-Unle...

最新AI资源 # AI开源项目 # AI换脸与换装 # AI视频换脸

1年前

0162.7K

OpenHands：AI 驱动的软件开发多智能代理助手，覆盖开发者各类操作

综合介绍 OpenHands 是一个由 All-Hands-AI 团队开发的开源项目，旨在通过 AI 技术简化软件开发流程。该平台前身为 OpenDevin，现已更名为 OpenHands，提供了强大...

最新AI资源 # AI开源项目 # AI编程

2年前

0162.3K

Kokoro TTS API：快速文本转语音的Docker化FastAPI封装（Kokoro-82M模型）

综合介绍 Kokoro-FastAPI是一个基于Docker的FastAPI封装，旨在为Kokoro-82M文本转语音模型提供支持。该项目支持NVIDIA GPU加速，并提供了队列处理和自动拼接功能...

最新AI资源 # AI开源项目 # AI文本转语音

2年前

0162K

VSR：AI技术无损去除视频水印和硬字幕软件（视频去水印客户端7G+）

综合介绍视频字幕去除工具（Video-subtitle-remover，简称VSR）是一款基于AI技术的视频处理软件，专门用于去除视频中的硬字幕和文本水印。该工具采用了多种AI算法模型（STTN、L...

最新AI资源 # AI开源项目 # AI音视频编辑

2年前

0161.1K

Paperless-AI：使用AI自动分析和标记文档，适用 paperless-ngx 文档管理系统

综合介绍 Paperless-AI 是一个创新的文档自动化分析工具，专门为 Paperless-ngx 文档管理系统设计。它巧妙地结合了 OpenAI API 和 Ollama 等多种先进的人工智能模...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

2年前

0158.8K

口袋AI：手机中运行的离线AI助手，适配 DeepSeek-R1 (5.37GB)

综合介绍口袋AI（PocketPal AI 中文版）是一款强大的离线AI助手，旨在让用户随时随地与AI进行对话。该项目基于小型语言模型（SLMs），无需联网即可在手机上运行，特别适配中文用户体验。口...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0158.6K

Surya：专业多语言文档OCR工具，开源本地部署

综合介绍 Surya是一个开源的多语言文档OCR工具包，支持90多种语言的文本识别。它不仅能够进行逐行文本检测，还能进行布局分析、阅读顺序检测和表格识别。Surya的性能与云服务相媲美，适用于各种类型...

最新AI资源 # AI开源项目 # OCR

2年前

0157.6K

BabelDOC：将PDF文档翻译成双语对照的开源工具

综合介绍 BabelDOC 是一个开源工具，专门用来把 PDF 文档翻译成双语对照格式。它由 funstory-ai 团队开发，托管在 GitHub 上，主要服务于需要处理外语文档的用户，比如研究人员...

最新AI资源 # AI开源项目 # AI翻译

1年前

0155.3K

Edge TTS Worker：使用Cloudflare部署微软语音合成API，兼容OpenAI 格式并封装Web界面

综合介绍 Edge TTS Worker（依赖 edge-tts ）是一个部署在 Cloudflare Worker 上的代理服务，它将微软 Edge TTS 服务封装成兼容 OpenAI 格式的 ...

最新AI资源 # AI副业赚钱项目 # AI开源项目 # AI文本转语音

2年前

0155.1K

KG Gen：从纯文本中自动生成知识图谱的开源工具

综合介绍 KGGen 是由斯坦福可信人工智能研究实验室（STAIR Lab）开发的一款开源工具，托管于 GitHub，旨在从任意文本中自动生成知识图谱。它利用先进的语言模型和聚类算法，将非结构化的文本...

最新AI资源 # AI开源项目 # 知识图谱

1年前

0154.6K

Dify Connect MCP：Dify 工作流无缝集成 MCP（模型上下文协议）

综合介绍 Dify Connect MCP 是一个开源项目，托管在 GitHub 上，旨在为 Dify 平台的用户提供一个便捷的工具，通过模型上下文协议（Model Context Protocol...

最新AI资源 # AI开源项目 # MCP服务

1年前

0153.7K

Botgroup.chat：多个AI角色实时互动的群聊天应用

综合介绍 Botgroup.chat 是一个基于 React 和 Cloudflare Pages 开发的开源 AI 群聊应用，旨在为用户提供一个类似微信群聊的交互体验。它支持多个 AI 角色同时参与...

最新AI资源 # AI开源项目 # AI集成多模型对话平台

1年前

0152.8K

Comics Downloader：开源免费漫画下载器，支持PDF、EPUB、CBR、CBZ格式漫画下载

综合介绍 Comics Downloader 是一个开源工具，旨在帮助用户从各种网站下载漫画和漫画书。该工具支持多种文件格式，包括 PDF、EPUB、CBR 和 CBZ，使用户能够根据自己的需求选择合...

最新AI资源 # AI开源项目

2年前

0151.9K

视频分析工具（Video Analyzer）：分析视频内容并生成详细描述

综合介绍视频分析工具（Video Analyzer）是一个综合性的视频分析工具，结合了计算机视觉、音频转录和自然语言处理技术，能够生成详细的视频内容描述。该工具通过提取视频中的关键帧，转录音频内容...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

0151.3K

Wav2Lip：开源高精度口型同步生成工具（推荐）

综合介绍 Wav2Lip 是一个开源的高精度口型同步生成工具，旨在将任意音频与视频中的口型进行精准同步。该工具由 Rudrabha Mukhopadhyay 等人在 ACM Multimedia 20...

最新AI资源 # AI开源项目 # 口型同步

2年前

0151.1K

OpenCharacter：开源无审查的Character.AI替代品

综合介绍 OpenCharacter是一个开源的角色创建工具，旨在为用户提供无过滤、无限制的AI角色创建与互动体验，作为Character.AI替代方案。用户可以使用本地模型创建和运行自己的角色，或者...

最新AI资源 # AI开源项目 # AI角色扮演

2年前

0150.6K

XHS-Downloader：免费小红书数据采集工具，支持笔记批量下载、视频提取、图片去水印

综合介绍 XHS-Downloader 是一个开源工具，专为小红书用户设计，支持提取和下载小红书上的无水印图片和视频作品。该工具提供多种功能，包括从浏览器获取 Cookie、支持命令行操作、批量下载...

最新AI资源 # AI开源项目

2年前

0148.5K

SkyReels-V1：生成高品质人体动作视频的开源视频模型

综合介绍 SkyReels-V1 是由 SkyworkAI 团队开发的一个开源项目，专注于生成高品质、以人类为中心的视频内容。该项目基于 HunyuanVideo 模型，通过对数千万高质量影视片段的微...

最新AI资源 # AI图像转视频 # AI开源项目 # AI文本转视频

1年前

0147.6K

Archon：自主构建与优化AI智能体的开发框架

综合介绍 Archon 是由开发者 Cole Medin（GitHub 用户名 coleam00）打造的全球首个“Agenteer”项目——一个专注于自主构建、优化和迭代 AI 智能体的开源框架。它既...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

0147K

IOPaint：全能AI图像处理工具，擦除、扩图、替换元素与绘制文本

综合介绍 IOPaint是一款免费且开源的AI图像处理工具，支持图像擦除、修复和扩展等功能。它采用最先进的AI模型，能够帮助用户轻松移除图像中的不需要对象、修复瑕疵、添加新内容，甚至扩大图像。IOPa...

最新AI资源 # AI图像放大与修复 # AI开源项目 # AI抠图改背景

2年前

0145.9K

edge-tts：文本转语音Python模块|免费文本转语音服务

综合介绍 edge-tts是一个开源的Python模块，允许用户在Python代码中使用微软Edge的在线文本转语音服务，而无需Microsoft Edge浏览器、Windows操作系统或API密...

最新AI资源 # AI开源项目 # AI文本转语音

2年前

0144.8K

Playwright MCP：微软推出的浏览器自动化MCP服务

综合介绍 Playwright MCP 是微软开发的一款开源工具，托管在 GitHub 上。它通过 Model Context Protocol（MCP）协议，让人工智能模型能直接控制浏览器，完成打开...

最新AI资源 # AI开源项目 # MCP服务 # 桌面自动化智能体

1年前

0144.7K

OpenAI.fm：展示OpenAI语音API的交互式演示工具

综合介绍 openai-fm 是一个开源项目，托管在 GitHub 上，专门用于展示 OpenAI 文本转语音（Text-to-Speech, TTS）API 的功能。这个项目通过一个交互式网页应用...

最新AI资源 # AI开源项目

1年前

0143.6K

Meeting：本地实时转录和生成会议纪要的开源客户端

综合介绍 Meeting Minutes（又名 Meetily）是由 Zackriya Solutions 开发的一款免费开源的 AI 会议助手工具，专注于实时捕获会议音频、生成转录文本并自动提取会议...

1年前

0143.5K

Open Notebook：个性化AI笔记工具，Notebook LM开源替代方案

综合介绍 Open Notebook 是一个开源的、注重隐私保护的笔记管理工具，旨在为用户提供一个替代 Google Notebook LM 的解决方案。通过 Open Notebook，用户可以在自...

最新AI资源 # AI开源项目 # AI笔记

2年前

0143.4K

OpenAI Codex CLI：OpenAI发布的终端命令行AI编码助手

综合介绍 OpenAI Codex CLI 是一个开源的终端编码工具，由 OpenAI 开发，专为习惯终端的开发者设计。它通过自然语言指令生成代码、编辑文件、执行命令，并集成 Git 版本控制。Cod...

最新AI资源 # AI开源项目 # AI编程

1年前

0142.6K

YOLOv12：实时图像和视频目标检测的开源工具

综合介绍 YOLOv12 是由 GitHub 用户 sunsmarterjie 开发的一个开源项目，专注于实时目标检测技术。该项目基于 YOLO（You Only Look Once）系列框架，引入注...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

0142K

FlowGram.AI：快速创建节点式工作流的开源引擎

综合介绍 Flowgram.ai 是由 ByteDance 开发的一款开源流程搭建引擎。它基于节点编辑，帮助开发者快速创建工作流程，支持固定布局和自由连线两种模式。项目使用 TypeScript 编写...

最新AI资源 # AI开源项目 # 低代码工作流

1年前

0141.4K

Langflow：构建强大AI智能体和工作流的低代码工具

综合介绍 Langflow 是一个低代码工具，专为开发人员设计，用于构建强大的AI代理和工作流。它支持使用任何API、模型或数据库，简化了复杂AI应用的开发过程。Langflow 提供直观的可视化界面...

最新AI资源 # AI开源项目 # 低代码工作流

2年前

0139.9K

OpenBB：开源金融数据分析平台，集成私有数据集和 AI 来增强投资决策

综合介绍 OpenBB 是一个免费且完全开源的金融数据分析平台，旨在为所有人提供便捷的金融数据访问和分析工具。平台集成了超过 100 个不同的数据源，涵盖股票、期权、加密货币、外汇、宏观经济指标、固定...

最新AI资源 # AI开源项目 # AI金融数据分析

2年前

0139.6K

Grok-Mirror：一键部署可盈利的Grok镜像站

综合介绍 Grok-Mirror是一个基于无服务器快速部署Grok3国内镜像站构建的可经营的Grok镜像站。它让用户可以通过Docker一键部署本地Grok服务站。Grok是xAI公司推出的人工智...

最新AI资源 # AI副业赚钱项目 # AI开源项目

1年前

0139.5K

Docling：支持多种格式文档解析并导出为Markdown和JSON，PDF支持OCR

综合介绍 Docling 是一个强大的文档解析和导出工具，支持多种文档格式，包括 PDF、DOCX、PPTX、XLSX、图像、HTML、AsciiDoc 和 Markdown。它能够将这些文档解析并导...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

2年前

0139.3K

wechat-article-exporter：一键部署微信公众号文章批量导出工具

综合介绍 wechat-article-exporter 是一个开源工具，旨在帮助用户批量导出微信公众号文章。该工具支持导出文章中的内嵌音视频，无需搭建任何环境，能够100%还原文章样式，并支持私有部...

最新AI资源 # AI开源项目

2年前

0138.3K

Coqui TTS（xTTS）：文本到语音生成的深度学习工具包，支持多种语言和声音克隆功能

综合介绍 Coqui TTS 是一个开源的高级文本到语音（TTS）生成工具包，基于深度学习技术。它经过研究和生产环境的实战测试，提供了丰富的功能和模型，支持多种语言的文本到语音转换。Coqui TTS...

最新AI资源 # AI开源项目 # AI语音克隆

1年前

0138.2K

KAG：知识图谱与向量混合检索的专业知识库问答框架

综合介绍 KAG (Knowledge Augmented Generation) 是一个基于OpenSPG引擎和大语言模型(LLMs)的逻辑形式引导的推理和检索框架。该框架专门用于构建专业领域知识库...

最新AI资源 # AI开源项目 # 知识图谱 # 知识检索与RAG框架

2年前

0138K

Vexa：实时会议转录与智能知识提取工具

综合介绍 Vexa 是一个开源的实时会议转录和知识管理平台，旨在为企业和个人提供高效的会议记录与智能知识提取服务。它通过 API 驱动的会议机器人，自动加入 Google Meet、Zoom 等平台...

1年前

0137.8K

Dify：生成式AI应用开发平台，可视化编排, 支持私有化部署

综合介绍 Dify 是一个开源的生成式 AI 应用开发平台，旨在帮助开发者快速构建和运营基于大型语言模型（LLM）的原生 AI 应用。平台提供了从 Agent 构建到 AI 工作流编排、RAG 检索...

最新AI资源 # AI开源项目 # 低代码工作流 # 智能体开发框架

2年前

0137.7K

FramePack：6G低显存快速生成长视频的开源项目

综合介绍 FramePack 是一个开源的视频生成工具，专注于让视频扩散技术更实用。它通过独特的下一帧预测神经网络，将输入帧压缩到固定长度，使生成工作量与视频长度解耦。这意味着即使生成长视频，显存需求...

最新AI资源 # AI图像转视频 # AI开源项目

1年前

0137.1K

Hunyuan3D-2：腾讯开源的高分辨率3D模型生成工具

综合介绍 Hunyuan3D-2 是腾讯开发的一个开源项目，旨在通过文字或图像生成高分辨率的3D模型。它由两个核心部分组成：形状生成模型（Hunyuan3D-DiT）和纹理生成模型（Hunyuan3D...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

0137.1K

Obsidian Copilot：在Obsidian中使用AI助手体验智能化笔记助手

综合介绍 Obsidian Copilot是一款强大的Obsidian笔记软件AI助手插件，它将OpenAI的智能技术无缝集成到Obsidian笔记工作流中。这款插件由开发者Logan Yang创建...

最新AI资源 # AI开源项目 # AI笔记

2年前

0136.9K

Ollama OCR：使用Ollama中视觉模型提取图像中的文本

综合介绍 Ollama OCR是一个强大的光学字符识别(OCR)工具包，它利用Ollama平台提供的最先进视觉语言模型来从图像中提取文本。该项目既可作为Python包使用，也提供了用户友好的Strea...

最新AI资源 # AI开源项目 # OCR # 文档提取与清洗

2年前

0136.8K

Orion：小米开源的端到端自动驾驶推理与规划框架

综合介绍 Orion 是小米实验室开发的开源项目，专注于端到端（E2E）自动驾驶技术。它通过视觉语言模型（VLM）和生成式规划器，解决传统自动驾驶方法在复杂场景中因果推理不足的问题。Orion 整合长...

最新AI资源 # AI开源项目

1年前

0135K

Local File Organizer：本地文件整理助手，AI自动整理文件

综合介绍 Local File Organizer 是一个由 AI 驱动的本地文件管理工具，旨在帮助用户整理和分类计算机上的文件。该工具利用先进的 AI 模型，如 Llama3.2 3B 和 Llav...

最新AI资源 # AI开源项目

2年前

0134.9K

Kokoro-ONNX：高效文本转语音工具，支持多语言和多声音选择

综合介绍 Kokoro-ONNX是一个基于ONNX runtime的开源文本转语音（TTS）工具。该项目由thewh1teagle开发，旨在提供高效、快速的语音合成解决方案。Kokoro-ONNX支持...

最新AI资源 # AI开源项目 # AI文本转语音

2年前

0134.4K

uniOCR：跨平台开源的文字识别工具

综合介绍 uniOCR 是一个开源的文字识别工具，由 mediar-ai 团队开发。它基于 Rust 语言编写，支持 macOS、Windows 和 Linux 系统。用户可以通过它从图片中提取文字...

最新AI资源 # AI开源项目 # OCR

1年前

0134.3K

PDF-Extract-Kit：提取复杂结构PDF内容的开源工具

综合介绍 PDF-Extract-Kit 是一个由 OpenDataLab 团队开发的开源项目，专注于从复杂多样的 PDF 文档中高效提取高质量内容。它集成了先进的文档解析技术，支持布局检测、公式识别...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

0134.1K

Sim Studio：开源的AI代理工作流构建工具

综合介绍 Sim Studio 是一个开源的 AI 代理工作流构建平台，专注于通过轻量、直观的可视化界面帮助用户快速设计、测试和部署大型语言模型（LLM）工作流。用户无需深入编程即可通过拖拽方式创建复...

最新AI资源 # AI开源项目 # 低代码工作流 # 智能体开发框架

1年前

0134K

Suna：集成浏览器操作与数据分析的智能代理

综合介绍 Suna 是 Kortix AI 开发的一个开源通用 AI 代理，托管在 GitHub 上，基于 Apache 2.0 许可证，允许用户免费下载、修改和自托管。它通过自然语言对话帮助用户完成...

最新AI资源 # AI开源项目 # 桌面自动化智能体 # 生成深度研究报告

1年前

0133.6K

BiliNote：从视频自动生成Markdown笔记的AI工具

综合介绍 BiliNote 是一款开源的 AI 视频笔记工具，支持从哔哩哔哩和 YouTube 视频链接中提取内容，自动生成结构清晰的 Markdown 格式笔记。它利用本地音频转写和多种大模型（如 ...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具 # AI笔记

1年前

0133.5K

SiYuan（思源笔记）：隐私优先的个人知识管理软件，支持AI写作/问答聊天

综合介绍：思源笔记（SiYuan）是一款隐私优先的个人知识管理软件，完全开源并支持自托管。它采用TypeScript和Golang编写，提供细粒度的块级引用和Markdown所见即所得（WYSIWY...

最新AI资源 # AI开源项目 # AI笔记

1年前

0133K

加载更多