🚀邀请体验：中国首家 AI IDE 智能编程软件 Trae 中文版下载，不限量使用 DeepSeek-R1 和 Doubao-pro!

共 910 篇文章

标签：AI开源项目第44页

Clone Voice：支持多语言的少样本声音克隆工具，基于xtts_v2提供Windows一键安装包

综合介绍 Clone Voice 是一个开源的声音克隆工具，提供了一个基于Web的界面，允许用户利用任何声音或个人声音录制来克隆声音。该工具操作简单，即使没有NVIDIA GPU，也可以通过预编译的应用程序在本地运行。它支...

2024-10-11AI工具 AI开源项目 AI语音克隆

StreamingT2V：从文本到长视频的动态且可扩展的生成技术

综合介绍 StreamingT2V是Picsart AI研究团队开发的一个公开项目，专注于根据文本描述生成连贯、动态且可扩展的长视频。这项技术使用先进的自回归方式，保证了视频的时间一致性，与描述文本紧密对应，并保持高帧质...

2024-10-10AI工具 AI开源项目 AI文本转视频

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

开启 Builder 智能编程模式，无限量使用 DeepSeek-R1 和 DeepSeek-V3 ，对比海外版体验更加流畅。只需输入中文指令，不懂编程的小白也可以零门槛编写自己的应用。

2025-04-03

Text2Video-Zero：Picsart AI Research团队发布的文本到视频零样本生成器

综合介绍 Text2Video-Zero是Picsart AI Research团队开发的一个零样本文本到视频生成器的官方实现，适用于GitHub。该项目提供了一种使用文本提示生成具有时间一致性和正确遵循文本提示的视频的新方法。团队也发布...

2024-10-10AI工具 AI开源项目 AI文本转视频

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

综合介绍 Retrieval based Voice Conversion WebUI是一个基于VITS的简单易用的语音转换框架，可以实现任意说话人之间的语音转换，包括歌曲的翻唱和实时的变声。它具有低延迟、优秀的变声效果、少量数据训练等特点...

2024-10-10AI工具 AI开源项目 AI语音克隆

VoiceCraft：开源零样本语音克隆与文本转语音工具

综合介绍 VoiceCraft是一个开源的语音编辑和零样本语音合成工具，基于神经编解码器语言模型。它采用了创新的编码序列生成方法，能够在已有语音序列上进行插入、删除和替换操作，生成自然、连贯的编辑语音。同时，...

2024-10-09AI工具 AI开源项目 AI语音克隆

edge-tts：文本转语音Python模块|免费文本转语音服务

综合介绍 edge-tts是一个开源的Python模块，允许用户在Python代码中使用微软Edge的在线文本转语音服务，而无需Microsoft Edge浏览器、Windows操作系统或API密钥。提供了命令行下直接使用的edge-tts和edge-...

2024-10-09AI工具 AI开源项目 AI文本转语音

CoAI.Dev (Chat Nio)：AI聚合应用一站式 B/C 端解决方案，支持弹性计费和订阅计划模式

综合介绍 CoAI.Dev (原 Chat Nio) 是一个集成多种AI模型的聊天平台，支持分布式流式传输、图像生成、跨设备对话同步及分享等功能。它实现了订阅和Token计费系统，Key中转服务以及多模型支持，还包括联网搜索和AI...

2024-10-07AI工具 AI副业赚钱项目 AI开源项目 AI本地化聊天应用

ChatOllama：基于Nuxt 3和Ollama的本地实时聊天应用UI

综合介绍 ChatOllama是一个基于大型语言模型（LLM）的开源在线聊天应用项目，支持众多语言模型和知识库管理。用户可以通过该平台进行模型管理（列表展示、下载、删除）、与模型聊天等功能。项目运用了Nuxt 3框架...

2024-10-07AI工具 AI开源项目 AI本地化聊天应用知识检索与RAG框架

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

综合介绍 MinerU是由上海人工智能实验室OpenDataLab团队开发的一款开源数据提取工具，专注于从复杂的PDF文档、网页和电子书中高效提取内容。它能够将包含图片、公式、表格等元素的多模态PDF文档转化为易于分析的M...

2024-09-30AI工具 AI开源项目 OCR 文档提取与清洗

DCT-Net：照片和视频转绘为动漫风格化的开源工具

综合介绍 DCT-Net 是一个由 DAMO 学院和北京大学王选计算机技术研究所共同开发的开源项目，旨在实现图像的动漫风格化转换。该项目利用深度学习技术，通过域校准翻译（Domain-Calibrated Translation）的方法，将...

2024-09-30AI工具 AI图像风格控制 AI开源项目 AI视频转换风格

Diffusers Image Outpaint：超强开源AI图像扩展工具，图像外绘（image outpainting）

综合介绍 Diffusers Image Outpaint 是由 Hugging Face 社区成员 fffiloni 创建的一个强大的 AI 图像扩展工具。该工具利用先进的扩散模型技术，可以将图像进行无缝扩展(图像的边缘部分进行外绘)，生成高质量的图...

2024-09-29AI工具 AI图像放大与修复 AI开源项目

Tap4 AI WebUI：开源轻量级AI工具导航项目

综合介绍 Tap4 AI WebUI 是一个开源的轻量级AI工具导航网站项目，旨在帮助用户轻松搭建自己的AI工具目录。该项目采用了Next.js和Supabase技术栈，支持多语言SEO优化，提供AI工具的分类筛选、搜索和详细展示功能，...

2024-09-29AI工具 AI副业赚钱项目 AI开源项目

CodeFormer：图像与视频面部复原，老照片修复，提供一键部署版

CodeFormer 综合介绍 CodeFormer 是一个面向鲁棒盲脸修复的代码库，由南洋理工大学 S-Lab 的研究团队开发，并在 NeurIPS 2022 上发表。该项目利用代码本查找变换器（Codebook Lookup Transformer）技术，旨在提升...

2024-09-25AI工具 AI副业赚钱项目 AI图像放大与修复 AI开源项目

GFPGAN：腾讯开源的人脸修复算法

综合介绍 GFPGAN（Generative Facial Prior GAN）是由腾讯ARC（Applied Research Center）开发的一种开源人脸修复算法。该算法利用预训练的面部GAN（如StyleGAN2）中封装的丰富和多样的先验因素，进行盲脸修复。G...

2024-09-24AI工具 AI图像放大与修复 AI开源项目

Curiosity：使用LangGraph构建类似 Perplexity 的AI搜索工具

综合介绍 Curiosity 是一个旨在探索和实验的项目，主要使用 LangGraph 和 FastHTML 技术栈，目标是构建一个类似 Perplexity AI 的搜索产品。项目的核心是一个简单的 ReAct Agent，利用 Tavily 搜索来增强文本生成...

2024-09-24AI工具 AI开源项目 AI搜索工具

Moshi：实时语音对话框架，支持多种语言和口音的语音对话基础模型

综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听，还能进行自然对话，支持多模态交互，包括看、听、说的能力。Moshi Chat 能够理解用户的语调，可以在...

2024-09-23AI工具 AI开源项目

QAnything：高度集成RAG处理流程的本地知识库问答系统

QAnything 综合介绍 QAnything(Question and Answer based on Anything)是由网易推出的本地知识库问答系统，支持各类文件格式及数据库，可离线安装使用。它可以处理PDF、Word、PPT、XLS等多种格式的文件，支持跨...

2024-09-23AI工具 AI开放服务 AI开源项目知识检索与RAG框架

StickerBaker：用AI制作个性贴纸图片

综合介绍 stickerbaker是一个开源的贴纸制作工具，利用人工智能技术来制作各种有趣的贴纸。无论是想要一个简单的猫咪贴纸还是想要制作一系列多样化的贴纸，stickerbaker都能满足你的需求。只需简单描述你想要的贴...

2024-09-23AI工具 AI在线生成图像 AI开源项目

ALog：便携AI语音日记应用，支持语音转文字。

综合介绍 ALog 是一个基于人工智能的语音日记应用，旨在帮助用户通过语音记录日常生活。该项目由 duxins 开发，并在 GitHub 上开源。用户可以通过语音输入记录日记，应用会自动将语音转换为文字，并进行智能分析...

2024-09-23AI工具 AI开源项目 AI语音转文本

上一页
1
···
41
42
43
44
45
46
47
下一页
共 48 页

标签：AI开源项目第44页

Clone Voice：支持多语言的少样本声音克隆工具，基于xtts_v2提供Windows一键安装包

StreamingT2V：从文本到长视频的动态且可扩展的生成技术

Trae中文版首发邀请下载：注册后不限量使用DeepSeek-R1！

Text2Video-Zero：Picsart AI Research团队发布的文本到视频零样本生成器

Retrieval based Voice Conversion WebUI：基于检索的语音转换框架|模拟真人歌声

VoiceCraft：开源零样本语音克隆与文本转语音工具

edge-tts：文本转语音Python模块|免费文本转语音服务

CoAI.Dev (Chat Nio)：AI聚合应用一站式 B/C 端解决方案，支持弹性计费和订阅计划模式

ChatOllama：基于Nuxt 3和Ollama的本地实时聊天应用UI

MinerU：PDF文档提取转换为多模态Markdown格式，支持电子书OCR扫描

DCT-Net：照片和视频转绘为动漫风格化的开源工具

Diffusers Image Outpaint：超强开源AI图像扩展工具，图像外绘（image outpainting）

Tap4 AI WebUI：开源轻量级AI工具导航项目

CodeFormer：图像与视频面部复原，老照片修复，提供一键部署版

GFPGAN：腾讯开源的人脸修复算法

Curiosity：使用LangGraph构建类似 Perplexity 的AI搜索工具

Moshi：实时语音对话框架，支持多种语言和口音的语音对话基础模型

QAnything：高度集成RAG处理流程的本地知识库问答系统

StickerBaker：用AI制作个性贴纸图片

ALog：便携AI语音日记应用，支持语音转文字。

找不到AI工具？在这试试！

FLUX.1图像生成器（支持中文输入）

近期AI热点

AI工具推荐

AI工具分类

标签：AI开源项目 第44页

找不到AI工具？在这试试！

FLUX.1图像生成器（支持中文输入）

近期AI热点

AI工具推荐

AI工具分类

标签：AI开源项目第44页