dots.ocr - 小红书hi lab推出的开源多语言文档解析模型dots.ocr是小红书hi lab开源的多语言文档解析模型,基于17亿参数的视觉语言模型(VLM),能高效地进行文档布局检测和内容识别,同时保持良好的阅读顺序。最新AI资源7个月前062K
Musicfy:语音歌曲生成器,转换歌曲演唱风格综合介绍 Musicfy.lol 是一个基于人工智能的音乐创作平台,用户可以通过AI技术将自己的声音或其他声音转化为音乐。平台提供多种创新功能,如AI声音艺术家、音轨分离、AI文本转音乐等,帮助用户轻...最新AI资源# AI音乐1年前062K
Airtop:使用自然语言控制的浏览器自动化工具综合介绍 Airtop 是一个基于人工智能的浏览器自动化工具。它让用户通过简单的自然语言命令,就能控制云端浏览器完成复杂的网页操作,比如登录网站、抓取数据或执行自动化任务。它解决了传统脚本编写复杂且容...最新AI资源# 桌面自动化智能体12个月前062K
iSlide:让PPT设计简单起来,PPT插件,PPT模板下载平台综合介绍 iSlide是一款专业的PPT设计辅助工具,旨在为用户提供海量优质的PPT模板、素材、图表、字体等资源。通过iSlide,用户可以快速创建高质量的PPT演示文稿,节省90%的设计时间。iSl...最新AI资源# AI生成演示文稿/PPT1年前061.9K
Open Canvas:代码编辑协作画布,开源版OpenAI Canvas/Claude Artifacts综合介绍 LangChain推出的Open Canvas 是一个开源的网络应用程序,旨在通过内置的双代理记忆功能来提升文档编辑和协作体验,并且集成smith可以观察完整的执行细节。该平台受 OpenA...最新AI资源# AI写作# AI开源项目# AI画布1年前061.9K
通义听悟:阿里通义音视频内容转录AI助手综合介绍 通义听悟是阿里云推出的一款工作学习AI助手,专注于音视频内容的转写和分析。它依托阿里云的强大AI模型,能够将音视频内容实时转写成文字,并提供翻译、总结、定位等功能。通义听悟支持多种语言和场景...最新AI资源# AI文本与音频/视频总结工具# AI语音转文本2年前061.9K
HyperChat:利用 MCP 智能执行复杂任务的AI对话客户端综合介绍 HyperChat 是一个由 BigSweetPotatoStudio 开发的开源聊天客户端,托管于 GitHub,旨在通过集成多个大型语言模型(LLM)的 API(如 OpenAI、Cla...最新AI资源# AI开源项目# AI本地化聊天应用# 智能体应用1年前061.9K
Fast-Agent:声明式语法和MCP集成快速构建多智能体工作流综合介绍 Fast-Agent 是一个由 evalstate 团队在 GitHub 上维护的开源工具,旨在帮助开发者快速定义、测试和构建多智能体工作流。它基于简单的声明式语法,支持与 MCP(Mode...最新AI资源# AI开源项目# 智能体开发框架1年前061.9K
UltraLight Digital Human:开源端侧实时运行的超轻量级数字人,附一键安装包综合介绍 Ultralight Digital Human 是一个开源项目,旨在开发一个超轻量级的数字人模型,可以在移动设备上实时运行。该项目通过优化算法和模型结构,实现了在移动端设备上的流畅运行,适...最新AI资源# AI数字人1年前061.8K
Midjourney:创造你想象中的图像|Midjourney中文官网介绍|官网开放免费测试Midjourney 介绍 Midjourney是一个独立的研究实验室,探索新的思维媒介,扩展人类物种的想象力。它提供了一个基于文字描述生成图像的AI服务,让用户可以创造各种艺术形式,从逼真到抽象的风...最新AI资源# AI在线生成图像# AI换脸与换装1年前061.8K
MyMap AI:通过聊天快速生成流程图和各类图表综合介绍 MyMap AI 是一个基于人工智能的在线工具,专为用户提供简单快速的可视化解决方案。用户只需通过文字聊天,就能生成思维导图、流程图、演示文稿等内容,无需任何设计经验。网站支持多种输入方式...最新AI资源# AI白板与信息图11个月前061.8K
飞桨 PP-TableMagic:复杂表格结构化信息提取神器表格识别的目标是解析图片中的表格,准确识别表格结构和单元格位置,并将其还原为结构化的表格格式(例如 HTML)。在当今信息化时代,大量重要的表格数据仍以非结构化状态存在(如扫描文档中的信息统计表图片...最新AI资源# AI开源项目# 文档提取与清洗1年前061.8K
SUDOAI:免费且易上手的文本或图片转3D建模工具综合介绍 SUDOAI 是一个创新的人工智能平台,由Hillbot提供支持,专注于通过AI技术生成高质量的3D模型。用户可以通过简单的文本描述或上传图片,快速生成3D模型,主要服务于游戏开发、元宇宙和...最新AI资源# AI文本与图片转3D1年前061.8K
Avatar Pose Maker:在线生成个性化立绘骨骼动作姿势综合介绍 Avatar Pose Maker是一款在线工具,用户可以通过它来设计和生成个性化的立绘动作。它允许用户创建喜欢的姿势,提供了一个简单而有效的方式来控制3D模型。特别适合初学者使用,因为它能...最新AI资源# AI图像生成辅助工具1年前061.8K
Neural4D:生成高分辨率3D建模数字资产的AI平台综合介绍 Neural4D 是一个基于人工智能的创新平台,专注于帮助用户通过简单的文本或图像输入快速生成高质量的3D模型和动画。它由 DreamTech 公司开发,依托世界领先的端到端3D生成大模型技...最新AI资源# AI开源项目# AI文本与图片转3D1年前061.8K
Oliva:语音控制的多智能体产品搜索助手综合介绍 Oliva 是一个开源的多智能体助手工具,由 Deluxer 在 GitHub 上开发。它通过多个 AI 智能体协作,帮助用户在 Qdrant 数据库中搜索产品信息。主要特点是支持语音操作...最新AI资源# AI开源项目# 智能体应用# 知识检索与RAG框架12个月前061.8K
Free Public APIs:为AI赋能的200+免费公共API集合综合介绍 FreePublicAPIs 是一个专为学生和开发者设计的网站,提供了一个集合了137个免费公共API的平台。这些API涵盖了从天气预报到社交媒体数据等各种领域,帮助用户在项目中轻松集成和使...最新AI资源# AI开放服务2年前061.8K
StudyX:AI驱动的作业解答与学习助手综合介绍 StudyX 是一个为学生和终身学习者设计的 AI 学习平台,专注于提供快速、准确的作业解答和学习资源。它支持数学、物理、化学、文学等多个学科,用户可以通过文字、拍照或公式输入问题,获取详细...最新AI资源# AI教育工具11个月前061.8K
Insanely Fast Whisper:快速高效的转录语音为文本的开源项目综合介绍 insanely-fast-whisper是一个结合了OpenAI的Whisper模型和各种优化技术(如Transformers, Optimum, Flash Attention)的音频转...最新AI资源# AI开源项目# AI语音转文本1年前061.7K
在cloudflare部署hugging face的免费api,支持接口转发因国内部署无法访问hugging face,所以在大佬部署方案的基础上改造成能部署到cloudflare workers。 准备工作 1、注册 cloudflare 2、注册hugging fac...最新AI资源# AI开源项目# 免费大模型API1年前061.7K
Ajelix:智能化Excel数据分析工具,接入多种数据源,AI生成各类可视化分析图表综合介绍 Ajelix 是一个专注于数据分析和商业智能的平台,提供多种AI工具来简化和提升Excel和Google Sheets的使用效率。该平台拥有超过17种AI工具,包括Excel公式生成器和数据...最新AI资源# AI数据分析1年前061.7K
LLaMA Factory:高效微调百余种开源大模型,轻松实现模型定制综合介绍 LLaMA-Factory 是一个统一的高效微调框架,支持对100多种大型语言模型(LLMs)进行灵活定制和高效训练。通过内置的 LLaMA Board 网页界面,用户无需编写代码即可完成模...最新AI资源# 大模型微调1年前061.7K
ChatTTS:模仿真人说话声音的语音生成模型(ChatTTS一键加速包)综合介绍 ChatTTS 是一个专为对话场景设计的生成语音模型。它能够生成自然且富有表现力的语音,支持多种语言和多位说话者,适用于互动对话。该模型通过预测和控制细粒度的韵律特征,如笑声、停顿和插话,超...最新AI资源# AI开源项目# AI文本转语音1年前061.7K
OpenAOE:大模型群聊框架:同时与多个大语言模型聊天综合介绍 OpenAOE 是一个开源的大模型群聊框架,旨在解决当前市场上缺乏多模型并行响应的聊天框架的问题。通过 OpenAOE,用户可以同时与多个大语言模型(LLM)进行对话,获取并行输出。该框架支...最新AI资源# AI开源项目# AI集成多模型对话平台1年前061.6K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格综合介绍 YuE是一个开源的全歌曲生成基础模型,专注于将歌词转化为完整的歌曲。与其他仅能生成短片段非声乐音乐的模型不同,YuE能够生成包含主唱和伴奏的完整歌曲,时长可达数分钟。该模型解决了音乐生成中的...最新AI资源# AI开源项目# AI音乐1年前061.6K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。综合介绍 一个用于修复无效JSON文件的模块,特别适用于解析由大型语言模型(LLMs)输出的错误JSON数据。该模块能够修复常见的JSON语法错误,如缺失的引号、错误的逗号、不转义的字符和不完整的键值...最新AI资源# AI开源项目1年前061.6K
YouTube Dubbing:实时将YouTube视频翻译为不同语言并同步配音综合介绍 YouTube Dubbing 是一个智能配音平台,专为视频创作者和观众提供多语种配音服务。通过AI技术,该平台能够将YouTube视频自动翻译并生成配音,支持多种语言和语音风格。用户只需安...最新AI资源# AI文本转语音1年前061.6K
录咖:一站式音视频处理平台|视频生成|AI字幕|提取音频|语音转文字综合介绍 录咖是一站式音视频处理平台,提供AI视频对话、AI字幕和AI语音转文字服务。功能包括录制屏幕、剪辑视频、转换GIF/音频等,并支持云存储与分享。界面直观,使用方便,还支持多屏幕录制和多语种智...最新AI资源# AI文本转视频# AI文本转语音# AI语音转文本1年前061.6K
实时语音转文字的开源工具综合介绍 realtime-transcription-fastrtc 是一个开源项目,专注于将语音实时转换为文字。它利用 FastRTC 技术处理低延迟音频流,结合本地 Whisper 模型实现高效...最新AI资源# AI开源项目# AI语音转文本11个月前061.6K
Supermaven:提供免费AI代码补全工具,拥有100万token上下文窗口补全代码综合介绍 Supermaven 是一个先进的AI代码补全工具,旨在为开发者提供高效、智能的编程支持。该工具兼容多种主流编辑器,包括 VS Code、JetBrains IDEs 和 Neovim,能够...最新AI资源# AI编程1年前061.6K
Tifa-DeepsexV2-7b-MGRPO:支持角色扮演和复杂对话的模型,性能超越32b(附一键安装包)综合介绍 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4是一个高效的语言模型,专为支持复杂的角色扮演和多轮对话而设计。基于Qwen2.5-7B进行深度优化,具有卓越的文本生成和对话能力...最新AI资源# AI开源项目# AI角色扮演1年前061.6K
AI2SRT:利用 Gemini模型,一键为长视频创建解说短视频或视频总结综合介绍 AI2SRT是一个开源项目,利用GeminiAI大模型,为长视频一键生成解说短视频和视频总结,同时支持音视频转录字幕。该项目旨在简化视频内容创作过程,提供高效的字幕生成和翻译功能。用户可以通...最新AI资源# AI开源项目# AI音视频编辑1年前061.6K
Vsub:输入文字或模板生成无需露脸的病毒营销视频综合介绍 Vsub 是一个专注于自动化视频内容制作的平台,旨在帮助内容创作者快速生成无脸视频(faceless videos)。它利用人工智能技术,允许用户通过输入文本或选择预设模板来创建适合YouT...最新AI资源# AI营销# AI视频生成工具1年前061.5K
GeekAI:自部署商业化多功能AI助手,完整接入多模型API运营后台综合介绍 GeekAI是一个基于AI大语言模型API实现的AI助手全套开源解决方案。该项目自带运营管理后台,开箱即用,集成了ChatGPT, Azure, ChatGLM, 讯飞星火,文心一言等多个平...最新AI资源# AI副业赚钱项目# AI本地化聊天应用1年前061.5K
闲鱼卖家全天自动值守的AI客服机器人综合介绍 XianyuAutoAgent 是一个专为闲鱼平台设计的智能客服机器人系统,由开发者 shaxiu 在 GitHub 上开源。它通过 AI 技术实现 7×24 小时自动值守,帮助闲鱼卖家回复...最新AI资源# AI副业赚钱项目# AI客服机器人# AI开源项目12个月前061.5K
EnConvo:智能AI启动器,专为macOS设计的全能AI助手综合介绍 EnConvo是一款专为macOS设计的智能AI助手启动器,旨在通过自动化日常任务来提升用户的生产力。该平台集成了超过150种内置工具和MCP支持,能够学习并适应用户的工作流程。EnConv...最新AI资源# AI本地化聊天应用# AI集成多模型对话平台1年前061.5K
Open Codex:将自然语言转换为Shell命令的开源AI工具综合介绍 Open Codex 是一个开源的命令行AI工具,专为开发者设计,能将自然语言指令转换为精准的Shell命令。它使用本地语言模型(如 phi-4-mini),无需联网或API密钥,所有操作在...最新AI资源# AI开源项目11个月前061.5K
LlamaEdge:本地运行和微调LLM的最快捷方式综合介绍 LlamaEdge是一个开源项目,旨在简化本地或边缘设备上运行和微调大型语言模型(LLM)的过程。该项目支持Llama2系列模型,并提供与OpenAI兼容的API服务,使用户能够轻松创建和运...最新AI资源# AI开源项目# 大模型微调1年前061.5K
DeepCode AI:提升代码安全性的AI工具,代码安全, AI代码审查,自动修复漏洞综合介绍 Snyk DeepCode AI 是一款由 Snyk 提供的先进代码安全工具,利用多种 AI 模型和安全特定数据,帮助开发者快速发现和修复代码中的安全漏洞。DeepCode AI 通过自动化...最新AI资源# AI编程1年前061.5K
Diffusers Image Outpaint:超强开源AI图像扩展工具,图像外绘(image outpainting)综合介绍 Diffusers Image Outpaint 是由 Hugging Face 社区成员 fffiloni 创建的一个强大的 AI 图像扩展工具。该工具利用先进的扩散模型技术,可以将图像进...最新AI资源# AI图像放大与修复# AI开源项目1年前061.5K
CopyWeb:将原型稿/截图转换为开箱即用的网页代码综合介绍 CopyWeb 是一个基于人工智能的网页设计转换工具,专注于帮助开发者与设计师将设计快速转化为生产环境可用的代码。它支持从网站截图、URL 或 Figma 设计稿直接生成干净、响应式的 HT...最新AI资源# AI页面设计1年前061.5K
Quadratic:集成AI对话和代码执行的在线数据分析表格综合介绍 Quadratic 是一个开源的智能电子表格工具,结合了AI、代码和数据连接功能,旨在为用户提供强大的数据处理和分析能力。通过支持Python、SQL和Rust等编程语言,Quadratic...最新AI资源# AI开源项目# AI数据分析1年前061.5K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统综合介绍 E2B Open Computer Use 是一个开源项目,旨在通过 E2B 桌面沙盒提供安全的云端 Linux 计算机使用体验。E2B沙盒提供了一个桌面图形环境,用户可以将其连接到任何大型...最新AI资源# AI开源项目# 桌面自动化智能体1年前061.5K
Immersity AI(LeiaPix):将2D图像和视频转换为3D视觉效果综合介绍 Immersity AI 原名 LeiaPix,是一个创新的人工智能平台,专注于将2D图像和视频转换为沉浸式3D体验。利用其先进的神经深度引擎,Immersity AI 能够快速、准确地生成...最新AI资源# AI文本与图片转3D1年前061.4K
UserAPI.ai:集成Midjourney图像生成API接口综合介绍 UserAPI.ai 是一个为开发者设计的API服务平台,专注于连接Midjourney的图像生成功能。用户通过简单的接口调用,就能生成高质量的AI图像,无需直接操作Midjourney的复...最新AI资源# AI开放服务11个月前061.4K
MMAudio:为视频画面生成同步音效与配乐,视频到音频的多模态联合训练工具综合介绍 MMAudio是一个开源项目,旨在通过多模态联合训练生成高质量的同步音频。该项目由香港中文大学的程浩基(Ho Kei Cheng)等人开发,主要功能是根据视频和/或文本输入生成同步音频。MM...最新AI资源# AI开源项目# AI音乐1年前061.4K
VEED.IO:AI驱动的简单视频编辑平台综合介绍 VEED.IO 是一个基于浏览器的视频编辑平台,通过AI技术让用户快速创建专业视频。它提供直观的操作界面,适合初学者和专业团队,无需复杂软件即可完成剪辑、字幕添加和效果优化。核心功能包括自动...最新AI资源# AI音视频编辑11个月前061.4K
LazyLLM:商汤开源构建多智能体应用的低代码开发工具综合介绍 LazyLLM 是由 LazyAGI 团队开发的一款开源工具,专注于简化多智能体大模型应用的开发流程。它通过一键部署和轻量级网关机制,帮助开发者快速搭建复杂的 AI 应用,节省繁琐的工程配置...最新AI资源# AI开源项目# 智能体开发框架1年前061.4K
Gemini Playground:无服务器部署Gemini多模态对话网站综合介绍 Gemini Playground 是一个开源项目,旨在帮助用户快速部署一个多模态对话网站。该项目由技术爬爬虾开发,支持使用 Gemini API Key 在 10 秒内完成部署。无论用户身...最新AI资源# AI开源项目# 免费大模型API1年前061.4K
AR Drawing:利用AR和AI技术提升现实手绘技能的APP应用综合介绍 AR Drawing 是一款利用增强现实(AR)技术帮助用户提升绘画技能的应用。该应用提供超过200个逐步指导的绘画课程,涵盖从初学者到高级水平的各种绘画模板。用户可以通过手机摄像头将图像投...最新AI资源# AI开放服务1年前061.4K
Ultravox:实时端到端语音对话的音频多模态大模型,GPT-4o语音交互的开源实现综合介绍 Ultravox是一个创新的多模态大语言模型(LLM),专为实时语音处理而设计。与传统的语音识别系统不同,Ultravox无需单独的音频语音识别(ASR)阶段,能够直接将音频转换为高维空间中...最新AI资源# AI大模型原生对话工具# AI开源项目1年前061.4K
Tough Tongue AI:与AI对话练习面试与职场沟通技巧综合介绍 Tough Tongue AI 是一个专为练习艰难对话而设计的人工智能平台。用户可以通过选择预设场景或创建自定义场景,模拟各种复杂的对话情境,如工作面试、薪资谈判、销售演示等。平台提供视频和...最新AI资源# AI生活效率助手1年前061.4K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告综合介绍 Auto-Deep-Research 是由香港大学数据智能实验室(HKUDS)开发的一款开源AI工具,旨在帮助用户自动完成深度研究任务。它基于 AutoAgent 框架打造,支持多种大语言模...最新AI资源# AI开源项目# 生成深度研究报告# 论文12个月前061.3K
Sana:快速生成高分辨率图像,0.6B超小尺寸模型,低配笔记本GPU运行综合介绍 Sana 是由 NVIDIA 实验室开发的一种高效高分辨率图像生成框架,能够在几秒钟内生成最高 4096 × 4096 分辨率的图像。Sana 采用线性扩散变换器和深度压缩自编码器技术,显著...最新AI资源# AI开源项目# AI自部署图像生成工具1年前061.3K
Voicenotes:AI语音笔记,记录与转录语音,智能管理会议内容综合介绍 Voicenotes 是一款智能语音笔记应用,旨在帮助用户轻松记录和管理语音笔记及会议内容。该应用支持100多种语言的语音转录,用户只需说出想法,Voicenotes 即可自动将其转录为文字...最新AI资源# AI笔记# AI语音转文本1年前061.3K
removebg:一键去除图片背景,removebg在线免费中文版removebg 综合介绍 removebg是一款在线自动去除图片背景的工具,用户仅需上传图片,系统即刻为你提供无背景的透明图像。 removebg利用了先进的人工智能技术,可以识别图片中的人物、动物...最新AI资源# AI抠图改背景2年前061.3K
SongGeneration - 腾讯AI实验室推出的音乐生成模型SongGeneration 是腾讯 AI 实验室推出的高质量歌曲生成项目。基于 LeLM(Large Language Model for Music)框架,能并行生成人声与伴奏,实现二者和谐统一...最新AI资源9个月前061.2K
RoomGPT:上传房间照片,使用AI重新设计综合介绍 RoomGPT是一个由GitHub用户Nutlope开发的开源项目,允许用户上传房间照片并利用人工智能技术生成重新设计的房间版本。该项目旨在让用户无需昂贵的设计师费用即可获得专业级的室内设计...最新AI资源# AI图像风格控制# AI开源项目1年前061.1K
秘塔AI搜索:提供无广告的高效学术搜索服务,研究模式深度挖掘知识综合介绍 秘塔AI搜索是一家致力于通过人工智能技术提升生产力的科技公司。该网站提供无广告的高效学术搜索服务,旨在为用户提供精准、快速的搜索结果。秘塔AI搜索拥有自主研发的大语言模型MetaLLM,能够...最新AI资源# AI搜索工具1年前061.1K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索...最新AI资源# AI开源项目# 文档提取与清洗1年前061.1K
Markdownify MCP Server:基于MCP协议将各种内容转换为Markdown格式综合介绍 Markdownify MCP Server 是一个基于 Model Context Protocol(模型上下文协议)的开源工具,托管于 GitHub,由开发者 Zach Caceres ...最新AI资源# AI开源项目# MCP服务# 文档提取与清洗1年前061.1K
Tabnine:AI代码助手,集成在IDE中生成代码用例插件(付费)综合介绍 Tabnine 是一个由人工智能驱动的代码补全工具,旨在帮助开发人员更快地编写高质量代码。它利用生成式人工智能模型,根据上下文和语法预测并建议下一行代码。Tabnine 支持多种编程语言和集...最新AI资源# AI编程1年前061.1K
TattooAI:AI纹身图片设计生成器,在线设计个性化纹身综合介绍 TattooAI.design 是一个基于人工智能的在线纹身设计平台。用户只需输入自己的纹身创意,AI就能在几秒钟内生成独特的纹身设计。无论是黑白纹身还是彩色纹身,TattooAI.desi...最新AI资源# AI图像风格控制1年前061.1K
Nexa:本地运行的小型多模态AI解决方案综合介绍 Nexa AI 是一个专注于本地运行的多模态AI解决方案的平台。它提供了多种AI模型,包括自然语言处理(NLP)、计算机视觉、语音识别和生成(ASR和TTS)等,所有这些模型都可以在本地设备...最新AI资源# 本地部署开源大模型工具1年前061K
Heeyo:陪伴孩子的AI伴侣,提升儿童学习体验的智能AI伙伴(付费)综合介绍 Heeyo是一款专为3-11岁儿童设计的AI应用,旨在通过互动游戏和对话提升孩子的学习体验。Heeyo由哈佛和斯坦福的教育专家设计,提供2000+学习游戏,涵盖数学、科学和社交情感技能。孩子...最新AI资源# AI教育工具1年前061K
AutoAgent:通过自然语言快速创建并部署AI智能体的框架综合介绍 AutoAgent是由香港大学数据智能实验室(HKUDS)开发的一个开源AI智能体框架,托管于GitHub。它允许用户通过纯自然语言描述需求,快速创建和部署定制化的AI智能体,无需任何编程基...最新AI资源# AI开源项目# 无代码开发# 智能体开发框架9个月前061K
LunaAI换脸:开源的秒鸭相机,部署前后端完整的企业级AI换脸小程序(算力服务付费,可二开)综合介绍 LunaAI换脸小程序是一个基于uniapp和Vue框架开发的换脸应用。该应用利用了PHP、MySQL、Nginx和Redis等技术,实现了用户通过小程序进行换脸操作的功能。用户可以通过该小...最新AI资源# AI副业赚钱项目# AI开放服务# AI换脸与换装1年前061K
Tarsier:生成高质量视频描述的开源视频理解模型综合介绍 Tarsier 是字节跳动(ByteDance)开发的一个开源视频-语言模型家族,主要用于生成高质量的视频描述。它由简单的结构组成:CLIP-ViT 处理视频帧,结合大语言模型(LLM)分析...最新AI资源# AI开源项目11个月前061K
GOT-OCR2.0:基于 QWen2 0.5B 端到端的多模态OCR模型综合介绍 GOT-OCR2.0是一个阶跃星辰联合推出de 开源光学字符识别(OCR)模型,旨在通过一个统一的端到端模型推动OCR技术向OCR-2.0迈进。该模型支持多种OCR任务,包括普通文本识别、格...最新AI资源# AI开源项目# OCR2年前061K
OASIS:多智能体模拟数百万用户社交媒体互动,研究复杂社会现象综合介绍 OASIS(Open Agent Social Interaction Simulations)是一个开源的社交媒体模拟器,能够模拟多达一百万用户的行为。该平台结合了大型语言模型和基于规则的...最新AI资源# AI开源项目# 智能体应用1年前060.9K
NeuraVid:利用AI搜索视频关键帧与自动剪辑精彩片段综合介绍 NeuraVid 是一个基于人工智能的视频分析平台,旨在帮助用户快速处理和理解视频内容。它通过先进的AI技术实现视频转录、内容搜索和关键信息提取,让用户轻松找到视频中的重要片段或生成亮点。这...最新AI资源# AI音视频编辑1年前060.9K
WebShaper - 阿里通义开源的AI训练数据合成系统WebShaper 是阿里巴巴通义实验室推出的 AI 训练数据合成系统,基于形式化建模和智能体扩展机制,生成高质量、可扩展的训练数据,助力 AI 智能体提升复杂信息检索能力。系统引入“知识投影”概念...最新AI资源8个月前060.9K
NoteGPT:智慧学习助手|总结视频音频|生成思维导图综合介绍 NoteGPT是一个AI辅助的知识库与笔记工具,旨在通过AI技术提高学习效率。用户可以利用AI来收集并总结链接,探索新见解,并对内容进行AI搜索和管理。NoteGPT支持视频摘要、问题解答...最新AI资源# AI教育工具# AI文本与音频/视频总结工具2年前060.9K
VideoRAG:理解超长视频的RAG框架,支持多模态检索和知识图谱构建综合介绍 VideoRAG是一个专为处理和理解超长上下文视频而设计的检索增强生成框架。该工具结合了图驱动的文本知识基础和分层多模态上下文编码,能够在单个NVIDIA RTX 3090 GPU上高效处理...最新AI资源# AI开源项目# 知识检索与RAG框架1年前060.9K
Hallo2:音频驱动生成口型/表情同步的肖像视频(Windows一键安装)综合介绍 Hallo2 是由复旦大学和百度联合开发的一个开源项目,旨在通过音频驱动生成高分辨率的人像动画。该项目利用先进的生成对抗网络(GAN)和时间对齐技术,实现了4K分辨率和长达1小时的视频生成...最新AI资源# AI数字人1年前060.9K
CapsWriter-Offline:PC端的语音输入和字幕转录工具综合介绍 CapsWriter-Offline 是一个专注于PC端的语音输入和字幕转录工具,托管于 GitHub,由开发者 HaujetZhao 打造。它完全离线运行,无需联网即可实现语音转文字和音视...最新AI资源# AI开源项目# AI语音转文本1年前060.8K
Cursor2API:将Cursor编辑器的AI能力转换为OpenAI兼容接口服务综合介绍 Cursor API是一个开源项目,旨在将Cursor编辑器的AI能力转换为与OpenAI API兼容的接口服务。通过该项目,用户可以在其他应用中复用Cursor的AI能力,从而实现更广泛的...最新AI资源# 免费大模型API1年前060.8K
R1 Overthinker:强制 DeepSeek R1 模型延长思考时间综合介绍 DeepSeek R1 Overthinker 是一个专为增强 DeepSeek R1 模型思考深度而设计的工具。通过延长模型的推理过程,该工具能够使模型进行更深入的思考,从而提高其回答的质...最新AI资源# AI开源项目1年前060.8K
Awesome LLM Apps:收集和探索优秀开源的LLM应用程序,一行命令快速部署综合介绍 Awesome LLM Apps 是一个由 Shubham Saboo 创建的 GitHub 仓库,专门收集和展示各种优秀的LLM(大语言模型)应用程序。该仓库包含了使用 OpenAI、An...最新AI资源# AI开源项目1年前060.8K
佐糖:在线图片处理工具,一键抠图、去水印、照片修复、人像编辑综合介绍 佐糖(PicWish)是一款智能AI图像处理平台,提供丰富的在线图片编辑工具,支持全平台使用。用户可以通过佐糖轻松完成一键抠图、去水印、模糊照片变清晰、无损放大、图片裁剪、图片压缩和黑白照片...最新AI资源# AI图像放大与修复# AI图像编辑# AI抠图改背景1年前060.8K
自动爬取小说并生成多角色有声书的工具综合介绍 Auto-Audio-Book 是一个开源项目,托管在 GitHub 上。它能自动从网站爬取小说内容,并将其转换为带有多角色配音的有声书。开发者 zqq-nuli 使用 Python 3.1...最新AI资源# AI副业赚钱项目# AI开源项目12个月前060.7K
知乎直达:智能问答与搜索工具,获取中文知识精准答案综合介绍 知乎直达(zhida.ai)是知乎推出的一款基于AI大模型的智能问答和搜索工具。它以知乎社区的优质内容为核心,结合多种数据源,为用户提供可靠的信息获取途径。知乎直达不仅能生成简略和深入两种答...最新AI资源# AI搜索工具2年前060.7K
VideoLingo:视频转录单词级时间轴字幕,视频字幕翻译和本地化配音开源工具综合介绍 VideoLingo 是一个一站式视频翻译和本地化配音工具,旨在生成 Netflix 级别的高质量字幕,消除生硬的机器翻译和多行字幕,并添加高质量的配音,使全球知识能够跨越语言障碍共享。通过...最新AI资源# AI副业赚钱项目# AI翻译# AI语音转文本1年前060.7K
Voicepanel:AI自动收集和分析客户反馈的调研工具综合介绍 Voicepanel 是一个基于人工智能的客户调研平台,旨在帮助企业快速、轻松地收集和分析用户反馈。通过简单的操作,企业可以利用 AI 技术与目标用户进行语音或视频形式的深度访谈,并实时生成...最新AI资源# AI营销1年前060.7K
Fast GraphRAG:高准确率且低成本的图形化检索增强生成工具综合介绍 Fast GraphRAG 是由 Circlemind AI 开发的一款开源工具,旨在通过知识图谱和 PageRank 算法实现高效、精确的检索增强生成(RAG)。该工具能够智能适应用户的使...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架1年前060.7K
ModelBest(面壁智能):全球领先的轻量高性能端侧大模型综合介绍 ModelBest 是一家专注于开发轻量高性能大模型的公司,致力于将先进的 AI 技术应用于日常生活中的主流消费电子和各类终端设备。其 MiniCPM 系列端侧模型以极致的算力和内存使用效率...最新AI资源# AI大模型原生对话工具# AI开源项目1年前060.7K
Flow(Laminar):构建智能体的轻量级任务引擎,简化并灵活管理任务综合介绍 Flow是一个轻量级的任务引擎,专为构建AI代理而设计,强调简洁性和灵活性。与传统的基于节点和边的工作流不同,Flow采用动态任务队列系统,支持并行执行、动态调度和智能依赖管理。其核心理念是...最新AI资源# AI开源项目# 低代码工作流1年前060.7K
J1 Assistant:下载J1助手,体验全新互动方式的语音AI助理综合介绍 Matter.ai是一家创新公司,致力于提供先进的人工智能解决方案。其最新产品J1助手(J1 Assistant)现已推出0.8.3-beta1版本,支持Samsung Galaxy S24...最新AI资源# AI生活效率助手1年前060.7K
Petals:分布式共享GPU运行和微调大语言模型,像BitTorrent网络一样共享GPU资源综合介绍 Petals 是一个由 BigScience Workshop 开发的开源项目,旨在通过分布式计算的方式运行大型语言模型(LLMs)。用户可以在家中使用消费级 GPU 或 Google Co...最新AI资源# 大模型微调# 本地部署开源大模型工具1年前060.7K
Ollie:全球首个家庭AI助手,规划家庭生活,简化日常事务综合介绍 Ollie 是全球首个家庭AI助手,旨在帮助家庭简化日常事务,减轻家庭成员的负担。通过智能化的任务管理和个性化推荐,Ollie 可以为用户规划餐食、安排购物、推荐家居用品和礼物等。Ollie...最新AI资源# AI生活效率助手1年前060.7K
美图奇想大模型:图像与视频生成工具开放平台综合介绍 MiracleVision 是由美图公司开发的一款AI视觉大模型工具,致力于为用户提供多样化、高质量的图像和视频生成服务。该网站展示了其最新版本 MiracleVision 4.0 的强大功...最新AI资源# AI开放服务1年前060.6K
FlashMLA:优化Hopper GPU的MLA解码内核(DeepSeek 开源周第一天)综合介绍 FlashMLA 是由 DeepSeek AI 开发的一款高效 MLA(Multi-head Latent Attention)解码内核,专为 NVIDIA Hopper 架构 GPU 优化...最新AI资源# AI开源项目1年前060.6K
LTX Studio:拥有分镜管理工具的AI电影制作平台,可设置多人物保持面部一致综合介绍 LTX Studio 是一个创新的 AI 驱动视频创作平台,专为创作者、营销人员、电影制作人和工作室设计。它提供从故事构思、分镜生成、动效添加到后期编辑的全流程操作,帮助用户将创意概念转化为...最新AI资源# AI换脸与换装# AI文本转视频# 专业生产力工具1年前060.6K
X-Kit:Twitter数据抓取和分析X用户数据与推文的工具综合介绍 X-Kit是一个开源工具,专为抓取和分析X(原Twitter)用户数据和推文而设计。该工具由GitHub用户xiaoxiunique开发,旨在帮助用户自动化获取指定X用户的基本信息和推文,并...最新AI资源# AI开源项目1年前060.6K
Aide:强化VSCode开发体验的AI助手扩展,一键注释、转换、UI生成代码综合介绍 AIDE(AI-assisted Development Extension)是一款强大的 VSCode AI 辅助开发扩展,专注于提供独特且实用的 AI 编程辅助功能。它不同于 GitHu...最新AI资源# AI开源项目# AI编程1年前060.6K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo综合介绍 LogoCreator是一个基于Together AI和Flux模型的开源Logo生成器,专注于为企业和个人提供快速、专业的Logo设计服务。该项目由开发者Nutlope开发并开源,在Git...最新AI资源# AI图像风格控制# AI开源项目1年前060.5K
Narakeet - AI文本转语音平台,支持生成多语言音频Narakeet是强大的AI文本转语音平台,基于自然语音合成技术,支持将文本、Word文档、PPT演示文稿或字幕文件快速转换为高质量音频,支持与视频内容自动同步。最新AI资源9个月前060.5K
Ai2 OLMoE:基于 OLMoE 模型离线运行的开源iOS AI应用综合介绍 Ai2 OLMoE是由Allen Institute for AI(简称Ai2,艾伦人工智能研究所)开发的一款开源iOS应用,旨在提供完全在设备上运行的AI模型。该应用利用了Ai2的开源OL...最新AI资源# AI大模型原生对话工具# AI开源项目# AI本地化聊天应用1年前060.5K
HyperBooth AI:用一张自拍照快速生成不同风格照片综合介绍 HyperBooth AI是一个能够让用户通过上传自拍照片即刻生成不同风格AI照片的服务平台。用户可以选择超过200种预设风格,创造出个性化的艺术图像。这个平台特有的生成器提供了高仿真度和创...最新AI资源# AI图像风格控制# AI换脸与换装1年前060.5K