集成多种先进语音合成服务的开源运营项目综合介绍 Open-VoiceCanvas 是一个开源的语音合成平台,由 ItusiAI 团队开发。它支持超过 50 种语言,可以将文字转为自然语音,还能通过上传音频克隆个性化声音。项目整合了 Ope...最新AI资源# AI副业赚钱项目# AI开源项目# AI文本转语音6个月前023.7K
AudioX:参考文本、图像、视频生成音频和音乐综合介绍 AudioX 是一个由 Zeyue Tian 等人在 GitHub 上开源的项目,官方论文发布于 arXiv(编号 2503.10522)。它基于扩散变换器(Diffusion Transf...最新AI资源# AI开源项目# AI音乐6个月前023.7K
MagicArticulate:将静态3D模型生成骨骼结构动画资产综合介绍 MagicArticulate 是一个由字节跳动与南洋理工大学合作开发的AI框架,专注于将静态3D模型快速转化为支持动画的数字资产。它通过先进的自回归Transformer和功能扩散模型,自...最新AI资源# AI开源项目# AI文本与图片转3D8个月前023.7K
RAIN:实时捕捉真人表情生成动漫形象视频流综合介绍 RAIN(Real-time Animation Of Infinite Video Stream)是一个开源项目,旨在实现实时生成无限视频流的动画效果。该项目由Pscgylotti开发,提...最新AI资源# AI开源项目# AI视频转换风格9个月前023.7K
VimLM:本地LLM驱动的Vim编程助手,安全离线的智能编程综合介绍 VimLM是一个Vim插件,提供了一个由本地LLM(大语言模型)驱动的代码助手。通过Vim命令与本地LLM模型交互,自动获取代码上下文,帮助用户在Vim中进行代码编辑。VimLM的设计灵感来...最新AI资源# AI开源项目# AI编程8个月前023.7K
MindSearch:开源AI搜索引擎框架,部署您自己的 Perplexity 搜索引擎!综合介绍 MindSearch是由上海人工智能实验室推出的一款开源AI搜索引擎框架,旨在模拟人类的思维过程进行复杂信息搜集与整合。该工具结合了大规模语言模型(LLM)与搜索引擎的先进技术,通过多智能体...最新AI资源# AI开源项目# AI搜索工具10个月前023.7K
自动解析PDF内容并提取文字与表格的开源服务综合介绍 它能自动分析PDF文档的布局,识别页面中的文字、标题、图片、表格、公式等元素,并判断它们的正确顺序。工具支持OCR功能,可以把扫描PDF转为可搜索文本。它基于Docker运行,提供两种模型...最新AI资源# AI开源项目# OCR# 文档提取与清洗6个月前023.7K
Orchestra:构建智能AI团队,让多智能体协作开发更简单高效综合介绍 Orchestra是一个创新的轻量级Python框架,专注于构建基于大语言模型(LLM)的多智能体协作系统。它采用独特的智能体编排方法,让多个AI智能体能够像交响乐团一样和谐配合工作。通过模...最新AI资源# AI开源项目# 智能体开发框架9个月前023.7K
NoneBot DeepSeek 插件:基于 NoneBot&DeepSeek 实现客服智能对话综合介绍 NoneBot DeepSeek 插件是一个集成了 DeepSeek 模型的 NoneBot 插件,旨在提供智能对话与问答功能。通过接入 DeepSeek 模型,用户可以在 NoneBot ...最新AI资源# AI客服机器人# AI开源项目8个月前023.6K
uni-api:轻量大模型API转换为OpenAI接口,YAML文件配置API渠道综合介绍 无前端,纯配置文件配置 API 渠道。只要写一个文件就能运行起一个属于自己的 API 站,文档有详细的配置指南,小白友好。 uni-api 是一个统一管理大模型API的项目,允许通过一个统一...最新AI资源# AI开源项目11个月前023.6K
CapsWriter-Offline:PC端的语音输入和字幕转录工具综合介绍 CapsWriter-Offline 是一个专注于PC端的语音输入和字幕转录工具,托管于 GitHub,由开发者 HaujetZhao 打造。它完全离线运行,无需联网即可实现语音转文字和音视...最新AI资源# AI开源项目# AI语音转文本8个月前023.6K
askrepo:源代码阅读工具,使用LLM分析代码,提供详细代码解释,支持多种编程语言综合介绍 askrepo 是一个基于LLM(大语言模型)的源代码阅读工具。它能够读取指定目录下的Git管理的文本文件内容,并将其发送到Google Gemini API,根据指定的提示提供问题的答案...最新AI资源# AI开源项目11个月前023.6K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果综合介绍 Kheish是一个开源的多角色代理,专为需要结构化、逐步协作的大型语言模型(LLM)任务而设计。Kheish不仅仅是一个简单的协调器,它本身就是一个智能代理,可以根据需求请求模块,整合用户反...最新AI资源# AI开源项目# 智能体开发框架# 知识检索与RAG框架9个月前023.6K
AI Podcast Generator:自动抓取新闻生成音频播客综合介绍 AI 播客生成器是一个智能化的播客生成工具,利用先进的 AI 技术从网络资源中自动创建引人入胜的音频内容。该系统通过抓取新闻内容,生成自然流畅的叙述,并将其转换为音频播客。项目基于 Next...最新AI资源# AI开源项目# AI文本与音频/视频总结工具11个月前023.6K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体综合介绍 SciToolAgent 是由杭州浙江大学创新中心(HICAI-ZJU)开发的一个开源工具平台。它通过知识图谱(SciToolKG)和大语言模型技术,整合超过500种科学工具,帮助科研人员处...最新AI资源# AI开源项目# AI教育工具# 智能体应用7个月前023.6K
AI Chatbot Supabase:开源的Next.js和Supabase构建的AI聊天机器人,快速部署到Vercel。综合介绍 AI Chatbot Supabase是一个基于Next.js和Supabase构建的开源AI聊天机器人模板。该项目由Vercel开发,旨在提供一个功能全面、可定制的聊天机器人解决方案。通过...最新AI资源# AI开源项目# 知识检索与RAG框架11个月前023.6K
Docs:开源的协作笔记和文档管理工具综合介绍 Docs 是一个开源的协作笔记和文档管理平台,由 suitenumerique 团队开发。它使用 Django 和 React 技术构建,目标是提供一个简单易用的工具,帮助用户记录笔记、管理...最新AI资源# AI开源项目# AI笔记7个月前023.6K
SimGRAG:利用相似子图进行知识图谱驱动的检索增强生成综合介绍 SimGRAG(SimGRAG: Leveraging Similar Subgraphs for Knowledge Graphs Driven Retrieval-Augmented G...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架9个月前023.6K
AudioNotes:快速提取音视频内容并生成结构化笔记综合介绍 AudioNotes 是一个基于 FunASR 和 Qwen2 构建的音视频转结构化笔记系统。它能够快速提取音视频内容,并调用大模型进行整理,生成一份结构化的 Markdown 笔记,方便用...最新AI资源# AI开源项目# AI语音转文本8个月前023.6K
One Hub:管理和分发OpenAI接口,支持多种模型和统计功能综合介绍 One Hub 是一个基于 One API 二次开发的 OpenAI 接口管理和分发系统。该项目由 MartialBE 开发,旨在提供更广泛的模型支持和更完善的统计功能。One Hub 具有...最新AI资源# AI开源项目9个月前023.6K
MarkPDFDown:基于多模态模型将PDF转为Markdown文件综合介绍 MarkPDFDown 是一个开源工具。它利用多模态大语言模型,把 PDF 文件转为 Markdown 格式。开发者是 GitHub 用户 jorben。这个工具的目标很简单:让 PDF 文...最新AI资源# AI开源项目# 文档提取与清洗7个月前023.6K
Open MCP Client:网页版MCP客户端,快速连接任意MCP服务综合介绍 Open MCP Client 是一个开源工具,最大的亮点是提供网页版 MCP(Model Context Protocol)客户端,让用户无需安装即可连接任意 MCP 服务器进行聊天。它还...最新AI资源# AI开源项目# MCP服务7个月前023.6K
agent-twitter-client:无需Twitter API密钥,发送、转发推文综合介绍 agent-twitter-client是一个无需Twitter API密钥即可使用的Twitter客户端。该项目基于@the-convocation/twitter-scraper进行了修...最新AI资源# AI开源项目# AI社交媒体7个月前023.6K
Memobase:为AI应用提供基于用户画像的长期记忆方案综合介绍 Memobase 是一个基于用户画像的记忆系统,旨在为生成式AI应用提供长效用户记忆支持。无论您是在构建虚拟伴侣、教育工具还是个性化助手,Memobase 都能帮助您的AI记住、理解并随着用...最新AI资源# AI开源项目8个月前023.6K
VideoChat:自定义形象和音色克隆的实时语音交互数字人,支持端到端语音方案和级联方案综合介绍 VideoChat 是一个基于开源技术的实时语音交互数字人项目,支持端到端语音方案(GLM-4-Voice - THG)和级联方案(ASR-LLM-TTS-THG)。该项目允许用户自定义数字...最新AI资源# AI开源项目# AI数字人11个月前023.6K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统综合介绍 VideoReTalking是一款创新的系统,允许用户根据输入音频生成唇形同步的面部视频,即使有不同的情绪,也能产生高质量且嘴唇同步的输出视频。系统将这一目标分解为三个连续任务:带有典型表情...最新AI资源# AI开源项目# 口型同步10个月前023.6K
PrivateGPT:完全本地化RAG处理流程的文档问答系统综合介绍 PrivateGPT是一个可用于生产环境的AI项目,允许用户在没有互联网连接的情况下,使用大型语言模型(LLMs)对文档进行问答。该项目确保100%的数据隐私,所有数据都在用户的执行环境中处...最新AI资源# AI开源项目# 知识检索与RAG框架10个月前023.6K
Pieces OS:逆向Pieces-OS GRPC转换为OpenAI接口(失效)综合介绍 Pieces-OS 是一个开源项目,旨在将 Pieces-OS 的 GRPC 流逆向并转换为标准的 OpenAI API 接口,支持Claude、GPT、Gemini。该项目由 Nekohy...最新AI资源# AI开源项目# 免费大模型API11个月前023.5K
InvSR:开源图像超分辨率项目,提升图像分辨率质量综合介绍 InvSR是一个创新的开源图像超分辨率项目,它基于扩散反演技术,能够将低分辨率图像转换为高质量的高分辨率图像。该项目利用预训练的大型扩散模型中蕴含的丰富图像先验知识,通过灵活的采样机制,支持...最新AI资源# AI图像放大与修复# AI开源项目10个月前023.5K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)综合介绍 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4是一个高效的语言模型,专为支持复杂的角色扮演和多轮对话而设计。基于Qwen2.5-7B进行深度优化,具有卓越的文本生成和对话能力...最新AI资源# AI开源项目# AI角色扮演8个月前023.5K
LAMBDA:本地化AI邮件自动化系统,快速生成邮件(Gmail)回复草稿综合介绍 LAMBDA(Local Auto MailBox Draft Assistant)是一个本地化的AI邮件自动化系统,旨在从用户的邮件风格中学习,并为Gmail收件箱中的每一封未读邮件生成草...最新AI资源# AI开源项目# AI生活效率助手10个月前023.5K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)综合介绍 FlashMLA 是由 DeepSeek AI 开发的一款高效 MLA(Multi-head Latent Attention)解码内核,专为 NVIDIA Hopper 架构 GPU 优化...最新AI资源# AI开源项目8个月前023.5K
Director:智能视频代理框架,用自然语言描述执行视频搜索、编辑和生成工作流综合介绍 Director 是一个开源框架,旨在通过构建智能视频代理来简化和优化视频交互和工作流程。该框架基于 VideoDB 的“视频即数据”基础设施,能够处理复杂的视频任务,如搜索、编辑、编译和生...最新AI资源# AI开源项目# AI音视频编辑10个月前023.5K
Gaze-LLE: 视频中人物注视目标预测工具综合介绍 Gaze-LLE是一款基于大规模学习编码器的注视目标预测工具。该项目由Fiona Ryan、Ajay Bati、Sangmin Lee、Daniel Bolya、Judy Hoffman和J...最新AI资源# AI开源项目# 视觉目标检测6个月前023.5K
Awesome AI Agents:收集150+AI智能体框架的资源集合综合介绍 Awesome AI Agents 是一个由 e2b-dev 团队维护的 GitHub 开源项目,专注于收集和整理与自主 AI 智能体相关的资源。这个项目汇集了超过 150 种 AI 智能体...最新AI资源# AI开源项目7个月前023.5K
GAG:利用大模型模拟人类行为生成社交关系图谱综合介绍 GraphAgent 是一个开源框架,托管在 GitHub 上,由 Ji-Cather 开发。它利用大语言模型(LLM)模拟人类行为,生成动态的、带文本属性的社交图。这个工具适用于在线社交媒...最新AI资源# AI开源项目# 知识图谱7个月前023.5K
Aisuite:统一OpenAI接口风格调用多种大模型,快速切换模型和对比测试综合介绍 aisuite 是一个简单、统一的接口,旨在让开发者能够轻松调用多种生成式AI提供商的服务。通过类似于OpenAI的接口,aisuite 使得与最流行的LLM(大语言模型)进行交互变得更加容...最新AI资源# AI开源项目11个月前023.5K
DCT-Net:照片和视频转绘为动漫风格化的开源工具综合介绍 DCT-Net 是一个由 DAMO 学院和北京大学王选计算机技术研究所共同开发的开源项目,旨在实现图像的动漫风格化转换。该项目利用深度学习技术,通过域校准翻译(Domain-Calibrat...最新AI资源# AI图像风格控制# AI开源项目# AI视频转换风格9个月前023.5K
Weebo:实时语音聊天机器人,提供自然语言对话体验综合介绍 Weebo 是一个开源的实时语音聊天机器人,利用 Whisper Small 进行语音识别,Llama 3.2 进行自然语言生成,以及 Kokoro-82M 进行语音合成。该项目由 Aman...最新AI资源# AI开源项目# 多模态实时互动产品9个月前023.5K
Maestro:简化主流开源视觉语言模型微调过程的工具综合介绍 Maestro 是由 Roboflow 开发的一款工具,旨在简化和加速多模态模型的微调过程,让人人都可以训练自己的视觉大模型。它提供了现成的配方,用于微调流行的视觉语言模型(VLM),如 F...最新AI资源# AI开源项目# 大模型微调8个月前023.5K
PiT:用图像零件拼出完整图像的工具(未开放)综合介绍 PiT(Piece it Together)是一个开源工具,托管在 GitHub 上,由特拉维夫大学的 Elad Richardson 等研究者开发。它能让用户输入零散的图像零件,比如翅膀...最新AI资源# AI图像编辑# AI图像风格控制# AI开源项目7个月前023.5K
LLM API Engine:通过自然语言快速生成和部署API综合介绍 LLM API Engine 是一个开源项目,旨在帮助开发者快速构建和部署AI驱动的API。该项目利用大语言模型(LLM)和智能网页抓取技术,允许用户通过自然语言描述来创建自定义API。其主...最新AI资源# AI开源项目9个月前023.4K
simple-one-api:一键集成多种免费大模型API,统一对外提供 OpenAI 接口综合介绍 simple-one-api 是一个开源项目,旨在简化多种大模型API的集成。它支持千帆大模型平台、讯飞星火大模型、腾讯混元以及 MiniMax 和 Deep-Seek 等兼容 OpenAI...最新AI资源# AI开源项目11个月前023.4K
LM Speed:快速测试大模型API性能综合介绍 LM Speed 是一个专门为AI开发者设计的工具,同时提供在线服务网站 lmspeed.net。它的核心功能是测试和分析语言模型 API 的性能,帮助用户快速发现速度瓶颈并优化调用策略。这...最新AI资源# AI开源项目6个月前023.4K
TrendPublish:实时追踪并总结AI新闻,自动发布到微信公众号综合介绍 ai-trend-publish 是一个在 GitHub 上托管的开源项目,由 OpenAISpace 团队开发,专注于实时追踪和发布人工智能领域的最新趋势。这个工具旨在帮助开发者、技术爱好...最新AI资源# AI开源项目# AI文本与音频/视频总结工具8个月前023.4K
JoyGen:音频驱动的3D深度感知人像说话视频编辑工具综合介绍 JoyGen是一个创新的两阶段说话人脸视频生成框架,专注于解决音频驱动的面部表情生成问题。该项目由京东科技团队开发,采用先进的3D重建技术和音频特征提取方法,能够准确捕捉说话人的身份特征和表...最新AI资源# AI开源项目# AI数字人9个月前023.4K
Fullmoon:本地大语言模型聊天的iOS应用综合介绍 Fullmoon是一款专为iOS设备设计的应用程序,旨在提供与本地大语言模型进行私密聊天的功能。该应用优化了Apple Silicon,支持在iPhone、iPad和Mac上运行。用户的聊天...最新AI资源# AI开源项目# AI本地化聊天应用9个月前023.4K
DevDocs:快速抓取并整理技术文档的MCP服务综合介绍 DevDocs 是一个完全免费的开源工具,由 CyberAGI 团队开发,托管在 GitHub 上。它专为程序员和软件开发者设计,能从技术文档的网址开始,自动爬取相关页面并整理成简洁的 Ma...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗6个月前023.4K
DeepGEMM:高效支持FP8矩阵运算的开源库(DeepSeek 开源周第三天)综合介绍 DeepGEMM 是一个由 DeepSeek 团队开发的开源 FP8 GEMM(通用矩阵乘法)库,专注于提供高效的矩阵运算支持。它特别针对 NVIDIA Hopper 架构的 Tensor ...最新AI资源# AI开源项目8个月前023.4K
深度搜索器:利用本地知识进行深度推理搜索的开源项目综合介绍 深度搜索器(Deep Searcher) 是一个结合大语言模型(LLMs)和向量数据库的强大工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案和综合报告。该项目适用于企业知识管理...最新AI资源# AI开源项目8个月前023.4K
Babelfish.ai:浏览器运行的语音实时转录与翻译应用综合介绍 Babelfish.ai 是一个基于 Huggingface Transformer.js 和 Supabase Realtime 构建的实时转录和翻译应用。该应用可以在浏览器中加载大模型并...最新AI资源# AI开源项目# AI语音转文本1年前023.4K
Agentarium:管理和协调多个AI智能体之间的交互综合介绍 Agentarium 是一个强大的 Python 框架,专门用于管理和编排 AI 智能代理(Agent)。这个框架提供了灵活直观的方式来创建、管理和协调多个 AI 代理之间的交互。它采用 A...最新AI资源# AI开源项目# 智能体开发框架9个月前023.4K
Kimi-Audio:开源音频处理与对话基础模型综合介绍 Kimi-Audio 是由 Moonshot AI 开发的一款开源音频基础模型,专注于音频理解、生成和对话。它支持多种音频处理任务,例如语音识别、音频问答和语音情感识别。模型经过超过 130...最新AI资源# AI开源项目# AI文本转语音# AI语音转文本5个月前023.4K
TubeTube:自部署YouTube视频下载工具综合介绍 TubeTube是一个开源的YouTube视频下载工具,由MattBlackOnly开发。该工具使用yt-dlp作为核心下载引擎,支持多线程下载,能够快速同时下载多个视频。用户可以通过YAM...最新AI资源# AI开源项目8个月前023.4K
HivisionIDPhotos:开源智能AI证件照制作工具综合介绍 HivisionIDPhotos 是一款开源的轻量级 AI 证件照制作工具,能够智能识别用户拍照场景并进行抠图,生成符合多种规格的标准证件照。该工具支持自定义背景色和尺寸,未来还将推出美颜和...最新AI资源# AI开源项目# AI抠图改背景1年前023.3K
DiffPortrait360:从单张人像生成360度头部视图综合介绍 DiffPortrait360 是一个开源项目,隶属于 CVPR 2025 论文《DiffPortrait360: Consistent Portrait Diffusion for 360...最新AI资源# AI图像风格控制# AI开源项目6个月前023.3K
TableGPT Agent:专为分析复杂表格数据设计的智能工具综合介绍 TableGPT Agent 是一个基于 GitHub 开源项目的智能工具,专为处理和分析表格数据设计。它依托 TableGPT2 大语言模型,利用自然语言交互的方式,让用户能够轻松查询、操...最新AI资源# AI开源项目# AI数据分析8个月前023.3K
GaiaNet node:安装和运行自己的本地模型在线代理服务综合介绍 GaiaNet-AI/gaianet-node是一个开源项目,允许用户在Mac、Linux或Windows WSL上通过一条命令快速安装默认的节点软件栈。用户可以初始化节点,自定义配置,下载...最新AI资源# AI开源项目# 本地部署开源大模型工具1年前023.3K
CSM Voice Cloning:利用CSM-1B快速克隆声音综合介绍 CSM Voice Cloning 是一个由 Isaiah Bjork 开发的开源项目,托管在 GitHub 上。它基于 Sesame CSM-1B 模型,用户只需提供一段音频样本,就能克隆...最新AI资源# AI开源项目# AI语音克隆7个月前023.3K
R1-Onevision:支持多模态推理的开源视觉语言模型综合介绍 R1-Onevision 是一个由 Fancy-MLLM 团队开发的开源多模态大语言模型,专注于视觉与语言的深度结合,能够处理图像、文本等多模态输入,并在视觉推理、图像理解、数学解题等领域表...最新AI资源# AI开源项目8个月前023.3K
RAGLite:高效的检索增强生成(RAG)工具,支持多种数据库和语言模型。综合介绍 RAGLite 是一个用于检索增强生成(RAG)的 Python 工具包,支持 PostgreSQL 或 SQLite 数据库。它提供了灵活的配置选项,允许用户选择不同的语言模型和重排序器...最新AI资源# AI开源项目# 知识检索与RAG框架11个月前023.3K
GeminiCoder:基于LlamaCoder项目,使用Gemini API快速生成Web应用程序综合介绍 GeminiCoder是一个基于Google Gemini API开发的创新型Web应用程序生成工具。该项目继承了 LlamaCoder 的优秀特性,并集成了最新的Gemini 1.5 Pr...最新AI资源# AI开源项目# AI编程10个月前023.3K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体综合介绍 Clevrr Computer 是一个开源项目,旨在通过使用 PyAutoGUI 库来实现系统操作的自动化。该项目受到 Anthropic 的启发,设计了一个自动化代理,可以精确高效地执行用...最新AI资源# AI开源项目# 桌面自动化智能体10个月前023.3K
Mad Professor:辅助阅读和分析学术论文的AI工具综合介绍 Mad Professor(暴躁的教授读论文) 是一个开源的 AI 学术工具,专为研究人员和学生设计,旨在简化学术论文的阅读和分析。它集成了 PDF 处理、AI 翻译、RAG 检索、AI 问...最新AI资源# AI开源项目# AI教育工具5个月前023.3K
无服务器快速部署Grok3国内镜像站综合介绍 Grok Playground 是由“技术爬爬虾”团队开发的一个开源项目。这个工具的核心功能是让用户在10秒内部署一个Grok3国内镜像网站。Grok3 是 xAI 推出的人工智能模型,而 ...最新AI资源# AI开源项目7个月前023.3K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境综合介绍 ChainForge 是一个开源的可视化编程环境,专为测试和评估大型语言模型(LLM)的提示效果而设计。它提供了一个数据流提示工程环境,用户可以通过该平台快速探索和分析不同提示对LLM响应质...最新AI资源# AI开源项目# PROMPTS辅助工具10个月前023.3K
Bambo:轻量灵活的智能体框架,简单配置角色和工具,处理多种负载任务综合介绍 Bambo是一个新型的代理框架,与主流框架相比,它更加轻量和灵活,能够处理各种负载任务。Bambo通过定义工具目录中的所有工具,并使用异步自定义函数来实现高效的代理功能。用户可以在llm_c...最新AI资源# AI开源项目# 智能体开发框架10个月前023.3K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。综合介绍 Markdown to Image 是一个用于将Markdown文本渲染为视觉上吸引人的社交媒体图片的React组件。该项目还包括一个内置的网页编辑器,可以作为在线Markdown到海报编辑...最新AI资源# AI开源项目11个月前023.3K
light card:HTML5卡片生成工具,创建精美内容卡片的简洁工具综合介绍 lightcard 是一个简洁优雅的卡片生成工具,旨在帮助用户轻松创建精美的内容卡片。该工具支持自定义文字内容、多种主题样式和二维码,让创作变得更加简单有趣。用户可以通过编辑标题、正文和作者...最新AI资源# AI开源项目10个月前023.3K
DocAgent:自动生成Python代码文档的智能工具综合介绍 DocAgent 是一个由 Meta AI 开发、开源的 Python 代码文档生成工具。它通过多智能体协作和层次化代码分析,自动为 Python 代码库生成高质量、上下文感知的文档注释(d...最新AI资源# AI开源项目6个月前023.3K
TestDriver:使用AI自动测试软件的智能工具综合介绍 TestDriver 是一个利用人工智能技术帮助开发者测试软件的网站。它通过模拟人类操作,比如点击鼠标、输入文字,来自动完成软件的测试任务。网站的核心是“计算机使用AI代理”,能像真人一样操...最新AI资源# AI开源项目6个月前023.3K
Simba:收纳文档的知识管理系统,无缝集成到任何RAG系统综合介绍 Simba是一个便携式知识管理系统(KMS),旨在与任何检索增强生成(RAG)系统无缝集成。该项目由GitHub用户GitHamza0206创建,提供了一种高效的知识管理解决方案,适用于各种...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前023.2K
TableGPT2:表格数据集成的多模态模型综合介绍 TableGPT2是由浙江大学团队开发的一款多模态模型,专注于表格数据的集成和处理。该模型通过预训练和微调,能够在表格数据相关任务中表现出色,同时保持强大的通用语言和编码能力。TableGP...最新AI资源# AI开源项目11个月前023.2K
Crawlee:使用Node.js构建可靠的网络爬虫和浏览器自动化工具综合介绍 Crawlee 是一个由 Apify 开发的开源网络爬虫和浏览器自动化库,专为 Node.js 环境设计。它支持 JavaScript 和 TypeScript,能够与 Puppeteer...最新AI资源# AI开源项目10个月前023.2K
MOFA Video:运动场适配技术将静态图像转换为视频综合介绍 MOFA-Video 是一个先进的图像动画生成工具,利用生成运动场适配技术,将静态图像转换为动态视频。该项目由东京大学和腾讯 AI 实验室合作开发,并将在 2024 年欧洲计算机视觉会议(E...最新AI资源# AI图像转视频# AI开源项目9个月前023.2K
Austen:分析书籍角色关系并生成图表的AI工具综合介绍 Austen 是一个开源的 AI 工具,它使用 Angular 框架和 Analogjs 初始化,结合 Mermaidjs 技术生成图表,帮助用户分析书籍中的角色关系。用户可以输入 Open...最新AI资源# AI开源项目# AI白板与信息图6个月前023.2K
DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎综合介绍 DiffSynth-Engine 是魔搭社区(ModelScope)推出的开源项目,托管于 GitHub。它基于扩散模型技术,专注于高效生成图像和视频,适合开发者在生产环境中部署 AI 模型...最新AI资源# AI开源项目7个月前023.2K
Cloud Document Converter:飞书文档下载插件,飞书云文档转换为本地Markdown格式文档综合介绍 Cloud Document Converter 是一个 Chrome 扩展,专为将飞书云文档转换为 Markdown 格式而设计。用户可以通过该工具轻松下载或复制飞书云文档为 Markdo...最新AI资源# AI开源项目11个月前023.2K
LLManager:智能自动化流程审批与人类审核结合的管理工具综合介绍 LLManager 是一个开源的智能审批管理工具,基于 LangChain 的 LangGraph 框架开发,专注于自动化处理审批请求,同时结合人类审核优化决策。它通过语义搜索、少样本学习和...最新AI资源# AI开源项目# 专业生产力工具6个月前023.2K
Telegram GPT Worker:部署在Cloudflare Workers上的多模型AI Telegram机器人综合介绍 GPT-Telegram-Worker 是一个基于 Cloudflare Workers 的多模型 AI Telegram 机器人,支持 OpenAI、Claude、Azure 等多个 AP...最新AI资源# AI开源项目# 智能体应用7个月前023.2K
Sketch-Gen:生成高质量线稿和草图,反推图像提示词,一键安装包综合介绍 Sketch-Gen 是一个基于 AI 技术的线稿和草图生成工具,旨在帮助艺术家和设计师快速生成高质量的线稿和草图。该工具由 Paints-UNDO 项目衍生而来,利用先进的机器学习模型,能...最新AI资源# AI图像生成辅助工具# AI开源项目10个月前023.2K
VoltAgent:快速构建AI智能体的TypeScript开源框架综合介绍 VoltAgent 是一个开源的 TypeScript 框架,专为开发者设计,帮助快速构建和协调 AI 智能体。它提供模块化的工具和标准化的开发模式,简化了与大型语言模型(LLM)交互、状态...最新AI资源# AI开源项目# 低代码工作流# 智能体开发框架5个月前023.2K
Feeds.Fun:自动标记和筛选新闻的RSS订阅工具综合介绍 Feeds.Fun 是一个帮助用户高效阅读新闻的工具,核心特点是自动为新闻添加标签并根据用户喜好筛选内容。它由开发者 Aliaksei Yaletski(网名 Tiendil)创建,托管在 ...最新AI资源# AI开源项目# AI生活效率助手7个月前023.2K
NodeTool:基于节点编排的AI模型工作流可视化客户端综合介绍 NodeTool 是一个创新的AI创作平台,旨在为AI爱好者、开发者、数据科学家和创意人士提供一个简单、直观的界面。无论您是艺术家、开发者还是初学者,NodeTool 都能帮助您快速原型化创...最新AI资源# AI开源项目# 低代码工作流10个月前023.1K
SynthLight:对肖像图像进行自然光照渲染(未发布)综合介绍 SynthLight 是一个基于扩散模型的肖像重光照工具。它通过学习重新渲染合成的人脸图像,实现对真实肖像照片的光照效果调整。该工具利用物理渲染引擎生成数据集,模拟不同光照条件下的光照转换...最新AI资源# AI图像风格控制# AI开源项目9个月前023.1K
Coding-Tutor:提供个性化编程指导的智能教学助手综合介绍 Coding-Tutor 是一个托管在 GitHub 上的开源项目,由开发者 iwangjian 创建,旨在为学习者提供个性化的编程教学体验。它通过对话式人工智能技术,根据用户的知识背景和学...最新AI资源# AI开源项目# AI教育工具8个月前023.1K
DeepRant:实时翻译游戏聊天内容的开源客户端综合介绍 DeepRant 是一款专为游戏玩家打造的开源翻译工具,旨在解决国际服务器中语言不通的问题。它通过快捷键实现游戏内文字的即时翻译,支持多种语言互译,让玩家无需退出游戏即可快速理解和回复聊天信...最新AI资源# AI开源项目# AI翻译7个月前023.1K
HiOllama:与本地Ollama模型交互的简洁聊天界面综合介绍 HiOllama是一个基于Python和Gradio构建的用户友好界面,旨在与Ollama模型进行交互。它提供了简单直观的网页界面,支持实时文本生成和模型管理功能。用户可以调整参数如温度和最...最新AI资源# AI开源项目# AI本地化聊天应用11个月前023.1K
Story-Adapter:根据长篇故事生成连续且风格一致的图像插画综合介绍 Story-Adapter 是一个创新的故事可视化框架,它能够将文本故事转换为连贯的图像序列。这个项目由研究人员开发,采用了无需训练的迭代方法来生成高质量的故事插图。该框架的特点是能够处理长...最新AI资源# AI图像风格控制# AI开源项目9个月前023.1K
WhisperChain:实时语音转文字并优化口语化词语综合介绍 WhisperChain 是一个基于人工智能的开源项目,托管在 GitHub 上,由开发者 Chris Choy 主导开发。它主要用于将语音转化为文字,并通过 AI 技术自动优化表达,去除冗...最新AI资源# AI开源项目# AI语音转文本8个月前023.1K
MIDI-3D:从单张图片快速生成多物体3D场景的开源工具综合介绍 MIDI-3D 是 VAST-AI-Research 团队开发的一个开源项目,它能从一张图片快速生成包含多个物体的3D场景,适合开发者、研究人员和创作者使用。这个工具基于多实例扩散模型技术...最新AI资源# AI开源项目# AI文本与图片转3D7个月前023.1K
ChatAnyone:从照片生成半身数字人肖像视频的工具综合介绍 ChatAnyone 是 HumanAIGC 团队开发的一个创新项目。它利用人工智能技术,从单张照片和音频输入生成带有上半身动作的数字人肖像视频。这个项目基于层次运动扩散模型,能生成头部动作...最新AI资源# AI开源项目# AI数字人7个月前023.1K
Research Rabbit:使用本地LLM进行网页研究和报告撰写,自动深入用户指定主题并生成总结。综合介绍 Research Rabbit 是一个基于本地LLM(大语言模型)的网页研究和总结助手。用户提供研究主题后,Research Rabbit 会生成搜索查询,获取相关网页结果,并总结这些结果...最新AI资源# AI开源项目# 生成深度研究报告7个月前023.1K
Fragments:类似于 Anthropic 的 Claude Artifacts、Vercel v0 或 GPT Engineer 等应用程序的开源版本综合介绍 Fragments by E2B是一个开源项目,提供了一个基于Next.js的模板,用于构建完全由AI生成的应用程序。该项目由 E2B 开发,旨在简化和加速AI应用的开发过程。它集成了多种现...最新AI资源# AI开源项目# AI编程11个月前023.1K
Quick Prompt:快速管理和使用提示词的浏览器扩展综合介绍 Quick Prompt 是一个开源的浏览器扩展,专注于提示词(Prompt)的管理和快速输入。用户可以创建、组织和存储提示词库,并在任何网页的输入框中快速插入预设的提示词内容。这个工具特别...最新AI资源# AI开源项目# PROMPTS辅助工具5个月前023.1K
Devin Cursor Rules:让Cursor和Windsurf 强化为 Devin综合介绍 Devin Cursor Rules是一个开源项目,旨在通过配置文件和工具增强Cursor和Windsurf集成开发环境(IDE)的功能,使其具备类似Devin的高级AI能力。该项目提供了过...最新AI资源# AI开源项目9个月前023.1K
llm.pdf:在PDF文件中运行大型语言模型的实验项目综合介绍 llm.pdf 是一个开源项目,允许用户在 PDF 文件中直接运行大型语言模型(LLM)。这个项目由 EvanZhouDev 开发,托管在 GitHub 上,展示了一种创新的方法:通过 Em...最新AI资源# AI开源项目# 本地部署开源大模型工具5个月前023.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具综合介绍 TryOffAnyone是一款突破性的AI图像处理工具,专门用于解决电商领域中服装展示的难题。它能够将真人穿着状态下的服装照片智能转换为平铺展示效果图,这项技术基于最新的Latent Dif...最新AI资源# AI开源项目# AI换脸与换装9个月前023.1K
RapBank:根据歌词和伴奏直接生成说唱(Rap)人声的模型(目前开放了数据集)综合介绍 RapBank 是一个专为说唱歌词生成而设计的数据集和工具集。该项目由 NZqian 创建,旨在通过收集和处理来自 YouTube 的说唱歌曲,为研究人员和开发者提供一个高质量的说唱歌词数据...最新AI资源# AI开源项目# AI音乐10个月前023.1K