RealtimeVoiceChat:低延迟与AI进行自然口语对话综合介绍 RealtimeVoiceChat 是一个开源项目,专注于通过语音与人工智能进行实时、自然的对话。用户使用麦克风输入语音,系统通过浏览器捕获音频,快速转为文字,由大型语言模型(LLM)生成回...最新AI资源# AI开源项目# 多模态实时互动产品7个月前040.1K
Heck.ai:免登录使用ChatGPT和DeepSeek综合介绍 Heck.ai 是一个完全免费的在线ChatGPT对话平台,用户无需注册即可使用。该平台旨在为用户提供便捷的AI对话体验,支持多种语言,特别是针对英文用户进行了优化。Heck.ai 利用先进...最新AI资源# AI集成多模型对话平台10个月前040.1K
Refly:基于自由画布上流程编排的AI写作平台,自动化生成文章综合介绍 Refly 是一个基于自由画布的 AI 原生创作引擎,旨在通过多线程对话、知识库集成、上下文记忆和智能搜索技术,帮助用户将创意转化为高质量内容。该平台覆盖了超过 20 种专业场景模板,包括学...最新AI资源# AI写作# AI开源项目10个月前040.1K
Hume AI:赋予AI情感识别能力|从声音和表情识别情感状态|生成具有情感状态的语音综合介绍 Hume AI 是一家专注于情感智能的人工智能公司,致力于开发能够理解和响应人类情感的多模态AI技术。其旗舰产品同理心语音界面(EVI)能够通过语音、面部表情和语言等多种形式识别和回应用户的...最新AI资源# AI开放服务# AI文本转语音1年前040K
Qwen-Agent:基于Qwen的智能代理应用框架,包括工具调用、代码解释器、RAG和Chrome扩展。综合介绍 Qwen-Agent 是一个基于 Qwen 2.0 及以上版本开发的智能代理应用框架,具备指令跟随、工具使用、规划和记忆等能力。该框架提供了多种示例应用,如浏览器助手、代码解释器和自定义助手...最新AI资源# AI开源项目# 智能体开发框架12个月前040K
Mercor - AI招聘求职平台,匹配全球职位需求Mercor是面向全球招聘的AI驱动平台,能简化求职和招聘流程。求职者上传简历完成20分钟AI面试,Mercor能将用户的信息匹配到全球数千家公司的职位需求中,快速找到远程工作机会。Mercor核心功...最新AI资源6个月前040K
R1-V:低成本强化学习实现视觉语言模型泛化能力综合介绍 R1-V 是一个开源项目,旨在通过低成本的强化学习(RL)实现视觉语言模型(VLM)的突破。该项目利用可验证的奖励机制,激励 VLMs 学习通用的计数能力。令人惊叹的是,R1-V 的 2B ...最新AI资源# AI开源项目10个月前040K
Kiln:简单的LLM模型微调和数据合成工具,0代码基础微调自己的小模型综合介绍 Kiln 是一个开源工具,专注于大语言模型(LLM)的微调、合成数据生成和数据集协作。它提供了直观的桌面应用程序,支持Windows、MacOS和Linux系统,用户可以通过零代码实现对Ll...最新AI资源# 大模型微调10个月前040K
Genesis:开源生成式物理引擎,实现基于真实物理的4D动态世界模拟综合介绍 Genesis 是一个为通用机器人和具身 AI 学习设计的生成性物理世界。它提供了一个统一的仿真平台,支持多种材料和物理现象的模拟。Genesis 旨在通过结合生成性 AI 和物理仿真,解锁...最新AI资源# AI开源项目# AI文本与图片转3D11个月前040K
Highlight AI:使用语音和屏幕分析完成桌面任务的AI助手综合介绍 Highlight AI 是一款桌面人工智能助手,支持 Windows 和 macOS(移动版开发中),通过语音指令和屏幕内容分析,帮助用户在任意应用中快速完成任务。它能捕获屏幕内容、生成代...最新AI资源# 桌面自动化智能体6个月前040K
Privatemode:提供端到端加密的AI聊天应用,保护企业数据隐私综合介绍 Privatemode AI 是一个专注于数据隐私和安全的生成式AI服务平台,旨在让用户在处理敏感数据时无需担心隐私泄露。它通过机密计算技术,确保数据在传输、存储和处理过程中始终保持加密,甚...最新AI资源# AI开放服务9个月前040K
PosterGenerator:AI驱动的简易海报生成器,只需输入简单提示词,选择海报样式综合介绍 PosterGenerator是一款在线AI海报生成工具,旨在帮助用户轻松创建专业级别的海报。无论是用于商业推广、活动宣传还是个人项目,PosterGenerator都能通过简单的文本输入生...最新AI资源# AI页面设计1年前040K
CrisperWhisper:精确的逐字语音转录工具综合介绍 CrisperWhisper 是一个基于 OpenAI Whisper 的高级语音识别工具,专注于快速、精确和逐字的语音转录。它能够提供精确的单词级时间戳,甚至在语音填充和停顿的情况下也能准...最新AI资源# AI开源项目# AI语音转文本11个月前040K
Kokoro:高效语音合成模型,生成自然流畅的语音综合介绍 Kokoro 82M 是由 Hugging Face 提供的一个高效语音合成模型,旨在通过较少的参数和数据生成高质量的语音。该模型拥有 8200 万参数,使用 Apache 2.0 许可证发...最新AI资源# AI开源项目# AI文本转语音11个月前040K
Dia:生成超现实多人对话的文本转语音模型综合介绍 Dia 是一个由 Nari Labs 开发的开源文本转语音(TTS)模型,专注于生成超现实的对话音频。它能在一次处理中将文本脚本转化为逼真的多角色对话,支持情感和语调控制,甚至能生成非语言表...最新AI资源# AI开源项目# AI文本转语音7个月前040K
Cloud Studio:云端 IDE,编写和运行各类依赖GPU的AI应用,每月免费50000小时GPU综合介绍 Cloud Studio 是腾讯云推出的一款基于浏览器的集成开发环境(IDE),旨在为开发者提供一个稳定且高效的云端工作站。用户无需下载安装任何软件,只需打开浏览器即可进行编程。Cloud ...最新AI资源# AI IDE# AI开放服务10个月前040K
Speak:AI对话练习英语口说,提升语言能力综合介绍 Speak 是一款创新的 AI 英语学习应用程序,旨在通过与 AI 对话来帮助用户提升英语口说能力。该应用程序利用最先进的人工智能技术,提供个性化的课程和即时反馈,帮助用户在短时间内显著提高...最新AI资源# AI教育工具11个月前039.9K
glhf.chat:运行几乎(所有)开源大模型,免费使用GPU资源和API服务(测试期)综合介绍 good luck have fun (glhf.chat) 是一个提供开源大模型聊天服务的网站。用户可以通过该平台使用vLLM和定制的自动扩展GPU调度器,运行几乎任何开源大模型。用户只需...最新AI资源# AI开放服务# 免费大模型API1年前039.9K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器综合介绍 Browser-Use是一个创新的开源网页自动化工具,专门设计用于让语言模型(LLM)能够自然地与网站进行交互。它提供了一个强大而灵活的框架,支持多种主流语言模型,包括GPT-4、Claud...最新AI资源# AI开源项目# 桌面自动化智能体11个月前039.9K
Happy Scribe:音频转录和视频字幕平台|免费视频字幕编辑软件Happy Scribe 综合介绍 Happy Scribe提供自动和人工的音频转写服务,以高准确率将音频转换为文字,并支持多种语言和格式。它包含互动式编辑器、协作工具、多种导出格式、机器翻译等功...最新AI资源# AI语音转文本# AI音视频编辑1年前039.9K
Meshy:免费使用图像生成3D模型工具综合介绍 Meshy 是一个强大的AI 3D模型生成工具,旨在帮助艺术家、游戏开发者和创作者快速生成高质量的3D模型。通过简单的文本或图像输入,用户可以在几秒钟内创建出令人惊叹的3D模型。Meshy ...最新AI资源# AI文本与图片转3D1年前039.9K
Zep:构建AI应用的长期记忆层,抽取并更新用户信息、业务数据综合介绍 Zep 是一款专为AI应用提供长效记忆解决方案的平台。Zep 帮助AI助手持续学习和记忆用户交互内容,建立用户的知识图谱。Zep 支持多种编程语言和框架,包括Python、TypeScrip...最新AI资源# 知识图谱11个月前039.9K
Cua:让AI代理在macOS/Linux沙盒中安全执行应用综合介绍 Cua 是一个开源项目,全称“Computer-Use Agent”(计算机使用代理),读作“koo-ah”。它专为 Apple Silicon 设备设计,能创建并运行高性能的 macOS ...最新AI资源# AI开源项目8个月前039.9K
ChatMCP:实现MCP协议的AI聊天客户端,支持多种LLM模型综合介绍 ChatMCP是一个开源的AI聊天客户端,旨在实现Model Context Protocol (MCP)。该项目由GitHub用户daodao97开发,支持多种大型语言模型(LLM),如O...最新AI资源# AI集成多模型对话平台12个月前039.9K
OpenArt Characters:创建一致性角色图像的AI工具综合介绍 OpenArt Characters 是由 OpenArt 平台推出的一项专注于角色设计的 AI 工具,旨在帮助用户快速创建具有一致性外观的虚拟角色图像。无论是漫画创作者、游戏开发者,还是个...最新AI资源# AI图像风格控制9个月前039.9K
POE:整合主流文字、图像生成大模型的Bot集成平台POE 综合介绍 POE是一个快速、实用的AI聊天平台,让您可以与各种AI-powered的机器人进行提问、获取即时答案和对话。用户可以通过文字与多个AI模型例如ChatGPT、GPT-4、Cla...最新AI资源# AI集成多模型对话平台1年前039.9K
YTSage:YouTube下载器,免费下载YouTube视频,提取音频,获取字幕综合介绍 YTSage 是一个现代化的 YouTube 下载工具,具有简洁的 PyQt6 界面。用户可以使用 YTSage 下载任意质量的视频,提取音频,获取字幕(包括自动生成的字幕),并查看视频的元...最新AI资源# AI开源项目# AI音视频编辑11个月前039.8K
InternVL:开源多模态大模型,支持图像、视频和文本处理综合介绍 InternVL 是由上海人工智能实验室(OpenGVLab)开发的一个开源多模态大模型项目,托管在 GitHub 上。它集成了视觉和语言处理能力,支持图像、视频和文本的综合理解与生成。In...最新AI资源# AI开源项目7个月前039.8K
Melty:体验AI驱动的代码编辑器 ,让每一次对话都成为Git提交综合介绍 Melty是一款革命性的AI代码编辑器,它将聊天对话与Git版本控制完美结合。由来自Replicate的Charlie和Jackson共同开发,这款工具旨在解决传统AI编码工具的痛点。其最大...最新AI资源# AI开源项目# AI编程11个月前039.8K
AI RSS生成器:通过AI将网页内容转换为RSS订阅源的工具综合介绍 AI RSS是一个创新的工具,通过AI技术将网页内容转换为RSS订阅源。它包含两个主要部分:一个浏览器插件和一个服务器端。浏览器插件允许用户选择网页中的列表并生成结构化数据描述(SDD)文件...最新AI资源# AI开源项目# AI生活效率助手10个月前039.8K
LangGraph CodeAct:生成代码帮助智能体解决复杂任务综合介绍 LangGraph CodeAct 是 LangChain AI 团队在 GitHub 上开源的一个框架,基于 CodeAct 架构(详见论文 arXiv:2402.01030)。它通过生成...最新AI资源# AI开源项目# 智能体开发框架8个月前039.8K
Activepieces:AI工作流程自动化,适合非技术用户的任务编排工具,开源Zapier替代品综合介绍 Activepieces是一个开源的全能型自动化工作流平台,专注于为企业和个人用户提供直观、强大的自动化解决方案。该平台采用TypeScript开发,具有极强的可扩展性,支持200多个集成服...最新AI资源# AI开源项目# 低代码工作流11个月前039.8K
AI reads books:AI逐页阅读PDF书籍,自动提取知识要点并生成总结综合介绍 AI-reads-books-page-by-page是一个基于Python开发的智能PDF书籍分析工具,它能够自动化地对PDF书籍进行逐页分析,提取关键知识点,并在指定页数间隔后生成阶段性...最新AI资源# AI开源项目# AI文本与音频/视频总结工具11个月前039.8K
YuE:将歌词转化为完整歌曲的基础模型,支持多种音乐风格综合介绍 YuE是一个开源的全歌曲生成基础模型,专注于将歌词转化为完整的歌曲。与其他仅能生成短片段非声乐音乐的模型不同,YuE能够生成包含主唱和伴奏的完整歌曲,时长可达数分钟。该模型解决了音乐生成中的...最新AI资源# AI开源项目# AI音乐10个月前039.8K
OpenEvidence - AI医学知识助手,解答临床问题、分析症状、推荐治疗方案OpenEvidence 是基于AI技术的医学知识助手平台,为医生和医疗工作者提供精准的临床支持。平台基于小型专业化模型和多模型集成架构,快速解答临床问题、分析症状、推荐治疗方案,提供最新的医学知识更...最新AI资源5个月前039.8K
ReadKidz:创建角色一致的儿童故事绘本,丰富的绘本风格模板(付费)综合介绍 ReadKidz 是一个创新的平台,利用人工智能技术帮助用户创建个性化的儿童故事书和动画。无论是家长、教师还是有志于创作儿童书籍的作者,都可以通过 ReadKidz 轻松生成高质量的故事内容...最新AI资源# AI角色扮演10个月前039.8K
Playground:免费使用的全功能AI绘画、图像编辑平台Playground 综合介绍 Playground是一个免费的AI绘画和编辑平台,提供在线使用Stable Diffusion模型的服务。用户可以通过简单的描述语来生成图像,或者上传图片进行二次...最新AI资源# AI在线生成图像# AI画布6个月前039.8K
Perplexica:1比1复刻 Perplexity AI 功能和界面的开源AI搜索引擎综合介绍 Perplexica 是一个开源的 AI 驱动搜索引擎,旨在提供深入互联网的答案。它使用先进的机器学习算法,如相似性搜索和嵌入技术,来优化搜索结果,并提供带有引用来源的清晰答案。Perple...最新AI资源# AI开源项目# AI搜索工具1年前039.8K
VLM-R1:通过自然语言定位图像目标的视觉语言模型综合介绍 VLM-R1 是由 Om AI Lab 开发的一个开源视觉语言模型项目,托管在 GitHub 上。该项目基于 DeepSeek 的 R1 方法,结合 Qwen2.5-VL 模型,通过强化学习...最新AI资源# AI开源项目# 视觉目标检测9个月前039.8K
Stable Diffusion WebUI Forge:优化并加速过的图像生成模型综合介绍 Stable Diffusion WebUI Forge是基于Stable Diffusion WebUI (Gradio版本)建立的平台,目的是为了简化开发流程、优化资源管理并加速推理...最新AI资源# AI自部署图像生成工具1年前039.8K
GeekAI:自部署商业化多功能AI助手,完整接入多模型API运营后台综合介绍 GeekAI是一个基于AI大语言模型API实现的AI助手全套开源解决方案。该项目自带运营管理后台,开箱即用,集成了ChatGPT, Azure, ChatGLM, 讯飞星火,文心一言等多个平...最新AI资源# AI副业赚钱项目# AI本地化聊天应用1年前039.7K
LangBot:开源大模型即时通信机器人,支持多微信、QQ、飞书等多平台部署AI机器人综合介绍 LangBot 是一个基于大模型的即时通信机器人平台,支持多种消息平台和大模型。该平台适配 QQ、微信(企业微信、个人微信)、飞书、Discord、OneBot 等消息平台,并支持 Open...最新AI资源# AI开源项目10个月前039.7K
Watermark Removal:开源去除图像水印工具,图片去水印恢复原始图像综合介绍 Watermark Removal 是一个开源项目,利用机器学习和深度学习技术进行图像修复,专门用于去除图像中的水印。该项目由 Chimzuruoke Okafor 开发,灵感来源于 Con...最新AI资源# AI开源项目# AI抠图改背景10个月前039.7K
NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性综合介绍 NVIDIA Garak 是一款开源工具,专门用于检测大型语言模型(LLM)的漏洞。它通过静态、动态和自适应探测,检查模型是否存在幻觉、数据泄露、提示注入、错误信息生成、有害内容生成等多种弱...最新AI资源# AI开源项目# 大模型微调1年前039.7K
Le Chat Mistral:MISTRAL打造智能聊天机器人,免费大语言模型综合介绍 LE CHAT MISTRAL 是由法国Mistral AI公司推出的一个多语言对话助手平台。这个平台能够让用户以一种教育性和有趣的方式体验和互动Mistral AI的不同模型。用户可以根据...最新AI资源# AI大模型原生对话工具# 免费大模型API1年前039.7K
SciSpace:一站式学术研究与论文写作平台,为学生和研究人员提供一体化 AI 工具综合介绍 SciSpace(原Typeset.io)是一个专为学术研究和写作设计的AI驱动平台。它提供了丰富的工具和资源,帮助研究人员和学生更高效地进行文献查找、理解和写作。平台集成了文献管理、自动格...最新AI资源# AI搜索工具# AI教育工具# 论文1年前039.7K
Media.io:多功能在线媒体处理工具,在线视频、音频、图像编辑器综合介绍 Media.io是一个功能强大的在线AI视频编辑和媒体文件处理平台。它能够帮助用户对视频、音频和图片进行增强、转换、压缩等操作。除了基础的编辑功能,还有像视频卡通化、AI歌曲封面生成、音频降...最新AI资源# AI图像转视频# AI文本转视频# AI视频转换风格8个月前039.7K
AnythingLLM:使用AI与文档智能对话,自定义多种智能体,完全本地化客户端。综合介绍 AnythingLLM 是由 Mintplex Labs 开发的一款开源 AI 应用,旨在帮助用户与文档进行智能对话。该应用支持多种大型语言模型(LLMs)和向量数据库(Vector Dat...最新AI资源# AI本地化聊天应用1年前039.7K
Llamao:手机上运行离线且私密的AI聊天机器人综合介绍 Llamao是一款私密且离线运行的Llama AI聊天机器人,旨在为用户提供无网络连接的智能助手服务。与ChatGPT不同,Llamao完全在用户设备上运行,确保用户数据的绝对隐私和安全。无...最新AI资源# AI本地化聊天应用10个月前039.7K
NGCBot:新闻推送、AI对话与群聊管理的微信机器人综合介绍 NGCBot 是一个基于 HOOK 机制开发的微信机器人开源项目,由开发者 ngc660sec(云山/eXM)创建并托管于 GitHub。经过两年迭代,目前版本为 V2.3,功能从最初的简单...最新AI资源# AI客服机器人# AI开源项目9个月前039.7K
Anatomy 360:3D人体艺术参考图综合介绍 Anatomy 360是一款为艺术家和创意工作者提供高质量3D人体解剖参考模型的平台。提供全身3D扫描、完整的光照控制、绘图工具和动态草图模式。用户可以从任何角度查看模型、切换纹理和非纹理模...最新AI资源# AI图像生成辅助工具1年前039.7K
Fitten Code:集成到VS Code提升编程效率的AI助手,非十大模型支持综合介绍 Fitten Code 是一款由 Fitten LLM 模型驱动的 AI 编程助手,旨在通过自动生成代码、代码补全和调试功能,显著提升开发者的编程效率。该工具支持超过 80 种编程语言,包括...最新AI资源# AI编程1年前039.7K
Akool:生成图像和视频营销素材|视频换脸|视频翻译|人像说话综合介绍 Akool是一个专注于个性化视觉营销和广告。通过先进的AI技术,AKOOL能够帮助用户轻松创建高质量、个性化的视频内容,适用于广告、在线教育、艺术创作和电子商务等多个领域。 它提供了面部换位...最新AI资源# AI图像转视频# AI数字人# AI视频换脸1年前039.7K
Data Formulator:AI驱动的数据可视化工具综合介绍 Data Formulator是由微软研究院开发的一款开源AI驱动的数据可视化工具。该工具结合了图形化用户界面(GUI)和自然语言输入(NL),使用户能够通过简单的交互和指令,快速创建和迭代...最新AI资源# AI开源项目# AI数据分析10个月前039.7K
Spark-TTS:生成自然语音的文本转语音工具综合介绍 Spark-TTS 是由 SparkAudio 团队开发的一款开源文本转语音(Text-to-Speech, TTS)工具,托管在 GitHub 上,旨在帮助用户将文本高效转换为自然流畅的语...最新AI资源# AI开源项目# AI文本转语音# AI语音克隆9个月前039.7K
Edraw.AI(亿图):在线协作白板工具,AI生成流程图和多种图表综合介绍 Edraw.AI是一个革新性的AI驱动在线可视化白板协作平台,集成了40多种智能工具和精心设计的模板库。该平台采用先进的人工智能技术,能够将用户的文字思维快速转化为专业的可视化图表。平台支持...最新AI资源# AI白板与信息图11个月前039.7K
LogoCreator:开源Logo生成器,使用AI智能生成专业品牌Logo综合介绍 LogoCreator是一个基于Together AI和Flux模型的开源Logo生成器,专注于为企业和个人提供快速、专业的Logo设计服务。该项目由开发者Nutlope开发并开源,在Git...最新AI资源# AI图像风格控制# AI开源项目11个月前039.6K
MiMo:高效数学推理与代码生成的小型开源模型综合介绍 MiMo 是小米公司开发的一个开源大语言模型项目,专注于数学推理和代码生成。核心产品是 MiMo-7B 系列模型,包含基础模型 (Base)、监督微调模型 (SFT)、从基础模型训练的强化学...最新AI资源# AI开源项目7个月前039.6K
Pix2Text:开源免费图片文字识别工具Pix2Text 综合介绍 Pix2Text (P2T) 是一个开源的免费工具,旨在替代 Mathpix,提供图片文字和数学公式识别功能。用户可以通过网页版免费使用该工具,每天最多识别 10000 个...最新AI资源# OCR1年前039.6K
Warp:内置人工智能和开发团队知识的终端命令行工具综合介绍 Warp 是一款现代化的智能终端工具,旨在提升开发者的工作效率。它结合了人工智能和团队知识,提供了类似集成开发环境(IDE)的输入编辑器,支持自动补全命令、智能建议和多种自定义配置。Warp...最新AI资源# AI编程11个月前039.6K
Gemini Playground:无服务器部署Gemini多模态对话网站综合介绍 Gemini Playground 是一个开源项目,旨在帮助用户快速部署一个多模态对话网站。该项目由技术爬爬虾开发,支持使用 Gemini API Key 在 10 秒内完成部署。无论用户身...最新AI资源# AI开源项目# 免费大模型API10个月前039.6K
AudioX:参考文本、图像、视频生成音频和音乐综合介绍 AudioX 是一个由 Zeyue Tian 等人在 GitHub 上开源的项目,官方论文发布于 arXiv(编号 2503.10522)。它基于扩散变换器(Diffusion Transf...最新AI资源# AI开源项目# AI音乐8个月前039.6K
AingDesk:个人电脑一键安装AI模型和聊天界面(含DeepSeek)综合介绍 AingDesk是一款开源且免费的软件,旨在帮助用户轻松地在本地计算机上部署和运行各种AI模型。无论是 DeepSeek 还是 Llama 模型,AingDesk都能通过简单的操作步骤实现一...最新AI资源# AI开源项目# AI本地化聊天应用9个月前039.6K
uniOCR:跨平台开源的文字识别工具综合介绍 uniOCR 是一个开源的文字识别工具,由 mediar-ai 团队开发。它基于 Rust 语言编写,支持 macOS、Windows 和 Linux 系统。用户可以通过它从图片中提取文字...最新AI资源# AI开源项目# OCR8个月前039.6K
Elmo:快速总结网页、PDF和视频的浏览器插件综合介绍 Elmo Chat 是一款由 Lepton AI 团队开发的 AI 浏览器插件,旨在提高用户在网上浏览和研究的效率。该插件以其简洁的设计和强大的功能而受到用户的青睐。Elmo Chat 支持...最新AI资源# 浏览器AI助手8个月前039.5K
实时语音转文字的开源工具综合介绍 realtime-transcription-fastrtc 是一个开源项目,专注于将语音实时转换为文字。它利用 FastRTC 技术处理低延迟音频流,结合本地 Whisper 模型实现高效...最新AI资源# AI开源项目# AI语音转文本8个月前039.5K
阿布量化交易系统:基于Python的开源量化交易平台综合介绍 阿布量化交易系统是一个基于Python开发的开源平台。它由用户“bbfamily”创建,旨在帮助投资者通过代码实现量化交易策略。系统支持股票、期权、期货和比特币等多种金融产品的回测与交易。它...最新AI资源# AI开源项目# AI金融数据分析8个月前039.5K
Easy Dataset:创建大模型微调数据集的简易工具综合介绍 Easy Dataset 是一个专门为大模型(LLM)微调设计的开源工具,托管在 GitHub 上。它提供了一个简单易用的界面,让用户可以上传文件、自动分割内容、生成问题和答案,最终输出适合...最新AI资源# AI开源项目# 大模型微调8个月前039.5K
Heeyo:陪伴孩子的AI伴侣,提升儿童学习体验的智能AI伙伴(付费)综合介绍 Heeyo是一款专为3-11岁儿童设计的AI应用,旨在通过互动游戏和对话提升孩子的学习体验。Heeyo由哈佛和斯坦福的教育专家设计,提供2000+学习游戏,涵盖数学、科学和社交情感技能。孩子...最新AI资源# AI教育工具11个月前039.5K
Auto-Deep-Research:多Agent协作执行文献查询并生成研究报告综合介绍 Auto-Deep-Research 是由香港大学数据智能实验室(HKUDS)开发的一款开源AI工具,旨在帮助用户自动完成深度研究任务。它基于 AutoAgent 框架打造,支持多种大语言模...最新AI资源# AI开源项目# 生成深度研究报告# 论文8个月前039.5K
Vocal Remover:AI驱动的免费在线人声分离工具综合介绍 Vocal Remover 是一个基于人工智能技术的在线工具,旨在帮助用户从音乐中分离人声和乐器。用户只需上传音频文件,系统会自动处理并生成卡拉OK版本(无伴奏)和阿卡贝拉版本(纯人声)。该...最新AI资源# AI音视频编辑1年前039.5K
AutoGen:微软开发的多智能体对话框架综合介绍 AutoGen是由微软研究团队开发的开源框架,专注于通过多智能体对话来简化大型语言模型(LLM)应用的构建。它允许开发者创建可以相互对话、协作解决任务的AI代理。这种方法不仅提高了LLM的性...最新AI资源# AI开源项目# 智能体开发框架10个月前039.5K
MTEB:评估文本嵌入模型性能的基准测试综合介绍 MTEB(Massive Text Embedding Benchmark)是一个由 embeddings-benchmark 团队开发并托管在 GitHub 上的开源项目,旨在为文本嵌入模...最新AI资源# AI开源项目9个月前039.5K
Zoo:文本转3D建模的硬件设计CAD软件综合介绍 Zoo 是一个专为现代硬件设计而打造的CAD软件平台。它提供了一系列强大的工具和API,帮助用户创建和优化硬件设计。Zoo的核心功能包括Text-to-CAD界面、建模应用和差异查看器,所有...最新AI资源# AI文本与图片转3D12个月前039.4K
Deepgram:高精度语音识别和合成解决方案服务API综合介绍 Deepgram是一家专注于语音识别和自然语言处理技术的公司,提供强大的语音到文本(Speech-to-Text)和文本到语音(Text-to-Speech)API。该平台利用先进的人工智能...最新AI资源# AI开放服务# AI语音转文本8个月前039.4K
tldraw:开源无限画布白板SDK,AI生成简约线框图和UML图综合介绍 tldraw是一款免费且即时的协作绘图工具,提供一个无限画布,用户可以快速绘制图形、撰写文字并进行即时协作。具备界面直观、性能优秀的特点,适用于团队协作和远程工作。通过开源社区支持,tldr...最新AI资源# AI开源项目# AI白板与信息图1年前039.4K
DINOv3 - Meta AI推出的新一代自监督视觉基础模型DINOv3 是 Meta AI 推出的新一代自监督视觉基础模型,采用自监督学习范式,无需标注数据即可学习图像特征。通过改进数据准备和引入 Gram anchoring 解决了特征退化问题,提升了泛化...最新AI资源4个月前039.4K
AiPPT:全智能AI一键生成PPT|在线PPT制作|智能PPT工具(付费)综合介绍 AiPPT是一款基于人工智能技术的在线PPT生成工具。用户只需输入内容主题,AI即可自动生成高质量的PPT文档。AiPPT提供丰富的模板资源,支持多种文档格式导入,并能快速生成符合需求的专业...最新AI资源# AI生成演示文稿/PPT11个月前039.4K
NV Ingest:解析复杂格式文档,提取多模态数据为元数据和文本综合介绍 NV Ingest(NVIDIA Ingest) 是一套早期访问的微服务,专为解析数十万复杂、混乱的非结构化 PDF 和其他企业文档而设计。它能够将这些文档转换为元数据和文本,以便嵌入到检索...最新AI资源# AI开源项目# 文档提取与清洗11个月前039.4K
Slidesgo:免费PPT模板下载,辅助AI生成演示文稿,提供教育版工具综合介绍 Slidesgo是提供大量免费且可自定义的Google Slides和PowerPoint演示模板的平台。用户可依据需求,如商业、教育或医疗等主题,挑选不同风格或颜色的模板。网站提供图标、信...最新AI资源# AI教育工具# AI生成演示文稿/PPT1年前039.3K
Muyan-TTS:个性化播客语音训练与合成综合介绍 Muyan-TTS 是一个专为播客场景设计的开源文本转语音(TTS)模型。它通过超过10万小时的播客音频数据预训练,支持零样本语音合成,生成高质量的自然语音。模型基于 Llama-3.2-3...最新AI资源# AI开源项目# AI文本转语音7个月前039.3K
OpenPilot:开源自动驾驶系统,为爱车DIY一套自己的智能驾驶系统综合介绍 OpenPilot 是由 comma.ai 开发的开源自动驾驶系统,旨在通过先进的驾驶辅助功能提升现有车辆的驾驶体验和安全性。自 2016 年首次发布以来,OpenPilot 已支持超过 2...最新AI资源# AI开源项目10个月前039.3K
HIX.AI:全能AI写作助手,从日常写作、营销文案到学术论文综合介绍 HIX.AI 是一款功能强大的全能人工智能写作助手,旨在通过提供超过 120 种 AI 工具来提升用户的写作、沟通和工作效率。该平台由 GPT-3.5/4 驱动,支持多种语言,帮助用户快速生...最新AI资源# AI写作1年前039.3K
Harvey:法律行业处理合同分析与研究案例综合介绍 Harvey 是一个专为法律行业打造的人工智能平台,旨在帮助律师和专业服务机构提升工作效率。它基于强大的生成式AI技术,能够处理复杂的法律任务,例如合同分析、尽职调查、法律研究和文档起草等...最新AI资源# AI文本与音频/视频总结工具9个月前039.3K
Voice-Pro:开源多功能视频翻译工具,语音转录并翻译为多语言,Windows一键安装综合介绍 Voice-Pro 是一个基于 Gradio WebUI 的多功能工具,支持语音转文字、文本转语音、实时翻译、YouTube 视频下载和人声分离。它集成了 Whisper、Faster-Wh...最新AI资源# AI开源项目# AI翻译# AI语音转文本1年前039.3K
FreeTTS:免费在线文字转语音工具|音频增强|音频剪辑FreeTTS 综合介绍 FreeTTS 是一个免费的在线文本转语音工具,用户可以将文本转换为自然声音的语音文件。支持多种语言和声音选择,用户可以将文本转换为 MP3、WAV、OGG 和 ACC 格式...最新AI资源# AI文本转语音# AI语音转文本# AI音视频编辑1年前039.3K
Moshi:实时语音对话框架,支持多种语言和口音的语音对话基础模型综合介绍 Moshi Chat 是由法国非营利性AI实验室 Kyutai 推出的一款端到端实时AI语音助手。它不仅可以实时收听,还能进行自然对话,支持多模态交互,包括看、听、说的能力。Moshi Ch...最新AI资源# AI开源项目1年前039.3K
MOKI:美图公司AI短片创作工具,适合动画短片, 网文短剧, 儿童故事绘本综合介绍 MOKI是美图公司推出的一款AI短片创作工具,专注于为用户提供便捷、高效的短片制作体验。该工具覆盖动画短片、网文短剧、故事绘本和MV等多种视频内容生产类型。用户可以通过输入故事梗概或导入现有...最新AI资源# AI视频生成工具1年前039.3K
Anubis:通过工作量证明干扰AI爬虫抓取综合介绍 Anubis 是一个由 TecharoHQ 团队开发的开源工具,主要用来保护网站免受 AI 爬虫的侵扰。它在 HTTP 请求中加入 SHA256 工作量证明(Proof-of-Work)挑战...最新AI资源# AI开源项目8个月前039.2K
Kolors Virtual Try On:高效的虚拟试穿/模特换装,文本到图像生成模型综合介绍 Kolors Virtual Try-On 是由 Kwai-Kolors 团队在 Hugging Face 平台上推出的一款虚拟试穿应用。该应用利用先进的人工智能技术,帮助用户在虚拟环境中试...最新AI资源# AI开源项目# AI换脸与换装11个月前039.2K
Chance AI:通过AI技术实现图像识别与视觉故事讲述综合介绍 Chance AI 是一家专注于视觉智能技术的创新公司,致力于通过人工智能为用户提供独特的图像识别和视觉故事讲述体验。其核心产品“Chance AI Lens”是一款AI驱动的视觉搜索工具...最新AI资源# AI搜索工具# AI生活效率助手9个月前039.2K
Firebender:Android开发者专用的AI编程助手综合介绍 Firebender 是一款专为 Android Studio 设计的 AI 编码助手(支持jetbrains),旨在帮助开发者大幅提升编程效率。它通过集成先进的人工智能技术,提供代码生成...最新AI资源# AI编程9个月前039.2K
MathTranslate:科学论文LaTeX翻译工具综合介绍 MathTranslate 是一个专门用于翻译 LaTeX 文档的在线工具,特别适用于科学论文的翻译。该工具能够保持 LaTeX 表达式(如数学表达式)不变,并最终将 LaTeX 文档编译成...最新AI资源# AI开源项目# AI翻译# 论文10个月前039.2K
99AI:集成多模态AI服务的商业化Web应用(免费开源)综合介绍 99AI 是一个开源的 AI Web 应用项目,旨在提供一个易部署、低门槛的集成化人工智能服务平台。该项目支持智能对话、多模态模型、应用广场、联网搜索等功能,并集成了 AI 绘画、音乐和视频...最新AI资源# AI副业赚钱项目# AI开源项目# AI本地化聊天应用1年前039.2K
腾讯混元3D(Hunyuan3D):生成高分辨率3D资产,多种3D素材生成工作流综合介绍 腾讯混元3D(Hunyuan3D 2.0)是腾讯推出的先进大规模3D合成系统,旨在生成高分辨率的纹理3D资产。该系统包括两个核心组件:大规模形状生成模型Hunyuan3D-DiT和大规模纹理...最新AI资源# AI开源项目# AI文本与图片转3D10个月前039.2K
Deep Recall:为大模型提供企业级记忆框架的开源工具综合介绍 Deep Recall 是一个开源的企业级记忆框架,专为大型语言模型(LLM)设计。它通过高效的上下文检索和整合,提供超个性化的响应能力。框架采用三层架构,包括记忆服务、推理服务和协调器,支...最新AI资源# AI开源项目# 知识检索与RAG框架7个月前039.2K
QAnything:高度集成RAG处理流程的本地知识库问答系统QAnything 综合介绍 QAnything(Question and Answer based on Anything)是由网易推出的本地知识库问答系统,支持各类文件格式及数据库,可离线安装使用...最新AI资源# AI开放服务# AI开源项目# 知识检索与RAG框架1年前039.1K
Zion(Momen):无代码开发平台,快速搭建个性化AI应用/SaaS应用,支持多端发布绑定自己的域名综合介绍 Zion是一个强大的无代码开发平台,用户无需编写代码即可快速搭建网站、微信小程序等应用。平台提供全程可视化操作,从应用开发、部署上线到增长运维,极大降低了开发门槛。Zion广泛覆盖业务场景...最新AI资源# AI页面设计# 无代码开发# 智能体开发框架1年前039.1K
PhotoPrism:AI 驱动的去中心化照片管理应用,轻松管理和查找照片综合介绍 PhotoPrism 是一个开源的 AI 驱动的照片管理应用,旨在为用户提供一个去中心化的照片存储和管理解决方案。它利用最新的技术自动标记和查找图片,支持在家中、私有服务器或云端运行。Pho...最新AI资源# AI开放服务1年前039.1K