Quick Prompt:快速管理和使用提示词的浏览器扩展综合介绍 Quick Prompt 是一个开源的浏览器扩展,专注于提示词(Prompt)的管理和快速输入。用户可以创建、组织和存储提示词库,并在任何网页的输入框中快速插入预设的提示词内容。这个工具特别...最新AI资源# AI开源项目# PROMPTS辅助工具5个月前023.1K
Xorbits Inference:一键部署多种AI模型,分布式推理框架综合介绍 Xorbits Inference(Xinference)是一个功能强大且全面的分布式推理框架,支持大语言模型(LLM)、语音识别模型和多模态模型等多种AI模型的推理。通过Xorbits I...最新AI资源# AI开源项目1年前023.1K
llm.pdf:在PDF文件中运行大型语言模型的实验项目综合介绍 llm.pdf 是一个开源项目,允许用户在 PDF 文件中直接运行大型语言模型(LLM)。这个项目由 EvanZhouDev 开发,托管在 GitHub 上,展示了一种创新的方法:通过 Em...最新AI资源# AI开源项目# 本地部署开源大模型工具5个月前023.1K
Optexity:用人类演示训练AI执行网页操作的开源项目综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:Compute...最新AI资源# AI开源项目# 大模型微调# 桌面自动化智能体7个月前023.1K
TryOffAnyone:从人物身上提取服装为平铺服装展示图的AI工具综合介绍 TryOffAnyone是一款突破性的AI图像处理工具,专门用于解决电商领域中服装展示的难题。它能够将真人穿着状态下的服装照片智能转换为平铺展示效果图,这项技术基于最新的Latent Dif...最新AI资源# AI开源项目# AI换脸与换装9个月前023.1K
Agent Laboratory:为研究人员提供自动化代码及研究报告撰写助手综合介绍 Agent Laboratory 是一个端到端的自主研究工作流,旨在帮助研究人员实现他们的研究想法。该系统由大型语言模型驱动的专用代理组成,支持整个研究工作流——从进行文献综述和制定计划到执...最新AI资源# AI开源项目# 生成深度研究报告7个月前023.1K
OmAgent:构建多模态智能设备的智能体框架综合介绍 OmAgent是由Om AI Lab开发的一个多模态智能体框架,旨在为智能设备提供强大的AI驱动功能。该项目通过整合最先进的多模态基础模型和智能体算法,使开发者能够在各种智能设备上创建高效...最新AI资源# AI开源项目# 多模态实时互动产品# 智能体开发框架9个月前023.1K
Goku: 生成画面精细且一致的视频,适合创作包含人物、物体细节的广告视频综合介绍 Goku是一款基于流变换技术的联合图像和视频生成模型,旨在实现行业级的性能表现。它整合了先进的高质量视觉生成技术,包括精细的数据整理、模型设计和流变换公式。Goku的主要贡献包括高质量的细粒...最新AI资源# AI图像转视频# AI开源项目# AI文本转视频8个月前023.1K
WritingBench:测试大模型写作能力的基准评估工具综合介绍 WritingBench 是 X-PLUG 团队开发的一个开源项目,托管在 GitHub 上。它是一个专门用来测试大模型写作能力的工具,提供了 1239 个真实世界的写作任务。这些任务覆盖 ...最新AI资源# AI开源项目7个月前023.1K
Mahilo:连接不同AI智能体框架实时协作的集成平台综合介绍 Mahilo 是一个开源的多智能体集成平台,由开发者 Jayesh Sharma 在 GitHub 上发布,旨在帮助用户连接来自不同框架的 AI 智能体,支持实时通信、人机交互及智能协作。该...最新AI资源# AI开源项目# 智能体开发框架8个月前023.1K
Charla:基于终端的极简AI聊天工具,本地集成Ollama后端综合介绍 Charla 是一个基于终端的聊天应用程序,旨在与本地语言模型进行对话。该应用程序集成了 Ollama 后端,支持上下文感知的对话,并将聊天会话保存为 Markdown 文件。用户可以通过简...最新AI资源# AI开源项目# AI本地化聊天应用9个月前023.1K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体综合介绍 Go-with-the-Flow 是一个由 Netflix Eyeline Studios 研究团队开发的开源项目,旨在通过扭曲噪声控制视频扩散模型的运动模式。该项目允许用户决定场景中相机和...最新AI资源# AI开源项目# AI音视频编辑9个月前023.1K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具综合介绍 autoMate 是一款由 yuruotong1 在 GitHub 上开源开发的本地自动化工具,以 AI+RPA(人工智能+机器人流程自动化)为核心特色。它将大型语言模型的智能理解与 RPA...最新AI资源# AI开源项目# 桌面自动化智能体7个月前023K
Open NotebookLM:将PDF转换为播客的开源工具综合介绍 Open NotebookLM 是一个开源项目,旨在将任何PDF文档转换为播客。该工具利用开源的大型语言模型(LLM)和文本转语音(TTS)模型,处理PDF内容,生成适合音频播客的自然对话...最新AI资源# AI开源项目# AI文本转语音9个月前023K
Autiobooks:将epub电子书转换为m4b有声书综合介绍 Autiobooks 是一款开源工具,旨在帮助用户将 .epub 格式的电子书快速转换为 .m4b 格式的有声书。它采用 Kokoro 提供的优质语音合成技术,生成的音频自然流畅。这款工具由...最新AI资源# AI开源项目# AI文本转语音7个月前023K
SongGen:自动生成歌曲的单阶段自回归Transformer综合介绍 SongGen 是一个开源的单阶段自回归Transformer模型,专为文本到歌曲的生成任务设计。该模型能够从文本输入生成包含人声和伴奏的歌曲。SongGen 提供了对多种音乐属性的细粒度控...最新AI资源# AI开源项目# AI音乐8个月前023K
AI Dev Gallery:Windows本地AI模型开发工具集,端侧模型集成到Windows应用综合介绍 AI Dev Gallery是微软推出的一款专为Windows开发者设计的AI开发工具应用程序(目前处于公开预览版)。它提供了一个综合性平台,帮助开发者轻松地将AI功能集成到自己的Windo...最新AI资源# AI开源项目# 本地部署开源大模型工具10个月前023K
SuperWeChatPC:开源的电脑端微信功能增强工具,支持二次开发综合介绍 SuperWeChatPC 是一个开源的电脑端微信增强工具,核心是为用户和开发者提供便利。它最初解决微信只能单开的问题,后来加入了 WeChatSDK,让开发者可以调用微信功能,比如发送消息...最新AI资源# AI开源项目7个月前023K
Magic 1-For-1: 高效生成视频的开源项目,号称在一分钟内生成一分钟的视频综合介绍 Magic 1-For-1 是一个高效的视频生成模型,旨在优化内存使用并减少推理延迟。该模型将文本到视频生成任务分解为两个子任务:文本到图像生成和图像到视频生成,从而实现更高效的训练和蒸馏...最新AI资源# AI开源项目# AI文本转视频8个月前023K
PydanticAI:使用Pydantic构建生成式AI应用,让构建生产级AI应用更加简单综合介绍 PydanticAI是一个基于Pydantic的Python代理框架,旨在简化生成式AI应用的开发。它由Pydantic团队开发,支持多种模型(如OpenAI、Gemini、Groq等),并...最新AI资源# AI开源项目10个月前023K
OneLine:生成热点事件时间轴的AI工具综合介绍 OneLine 是一个开源的热点事件时间轴生成工具,托管在 GitHub,由用户 chengtx809 开发。它通过用户输入的关键词,快速生成事件的时间轴,展示事件的时间、标题、描述和相关人...最新AI资源# AI开源项目# AI搜索工具6个月前023K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现综合介绍 AI Web Operator 是一个开源的 AI 浏览器操作工具,旨在通过集成多种 AI 技术和 SDK,简化用户在浏览器中的操作体验。该工具基于 Browserbase 和 Vercel...最新AI资源# AI开源项目# 多模态实时互动产品9个月前023K
Gemini Search:Gemini 2.0 Flash构建的 Perplexity 风格 AI 搜索引擎综合介绍 Gemini-Search 是一个基于 Google Gemini 2.0 技术打造的开源智能搜索引擎项目。该项目采用 TypeScript 开发,致力于复制 Perplexity 搜索引擎...最新AI资源# AI开源项目# AI搜索工具9个月前023K
InspireMusic:阿里开源的统一音乐、歌曲和音频生成框架综合介绍 InspireMusic 是一个基于 PyTorch 的开源工具包,专注于音乐、歌曲和音频生成。它提供了一个统一的框架,通过文本提示、音乐结构和音乐风格等控制生成高质量的音频。Inspire...最新AI资源# AI开源项目# AI音乐7个月前023K
Ortlin:与所有OpenAI模型和API交互的Web图形用户界面综合介绍 Ortlin是一个基于Web的图形用户界面,旨在帮助任何人(无论是技术用户还是非技术用户)轻松地与OpenAI的API和底层模型进行交互。它完全免费且开源,使用户能够无障碍地利用OpenAI...最新AI资源# AI开源项目# AI本地化聊天应用12个月前023K
AgentGPT:创建并运行自动化AI智能体的开源项目综合介绍 AgentGPT 是一个由 Reworkd 团队开发的开源项目,托管在 GitHub 上,旨在让用户通过浏览器自主创建、配置和部署 AI 智能体。用户只需设定一个目标,AgentGPT 就能...最新AI资源# AI开源项目# 智能体开发框架7个月前023K
AI-ClothingTryOn:基于 Gemini 的虚拟服装试穿工具综合介绍 AI-ClothingTryOn 是一个基于 Python 的开源桌面应用程序,由开发者 speedTD 创建,托管在 GitHub 上。它利用 Google Gemini 人工智能技术,让...最新AI资源# AI开源项目# AI换脸与换装7个月前023K
OpenAI.fm:展示OpenAI语音API的交互式演示工具综合介绍 openai-fm 是一个开源项目,托管在 GitHub 上,专门用于展示 OpenAI 文本转语音(Text-to-Speech, TTS)API 的功能。这个项目通过一个交互式网页应用...最新AI资源# AI开源项目6个月前023K
AIBot PRO:集成多种AI产品的商业化聚合平台综合介绍 AIBot PRO 是一个基于.NET 6 的 AI聚合客户端,旨在为用户提供集成多种AI产品的便捷平台。该客户端支持无感切换对话,集成了ChatGPT、Gemini、Claude、文心一言...最新AI资源# AI副业赚钱项目# AI开源项目# AI集成多模型对话平台8个月前022.9K
PengChengStarling:对比Whisper-Large v3更小、更快的多语言语音转文字工具综合介绍 PengChengStarling(鹏城实验室)是一个多语言自动语音识别(ASR)工具,能够将不同语言的语音转换为对应的文本。这个工具包基于icefall项目开发,提供了完整的语音识别流程...最新AI资源# AI开源项目# AI语音转文本9个月前022.9K
Groq AppGen:使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目综合介绍 Groq AppGen 是一个创新的交互式网页应用生成器,由 Groq 公司开发并开源。该项目展示了 Llama 3.3 70B 模型在 HTML 代码生成方面的强大能力。通过集成 Groq...最新AI资源# AI开源项目9个月前022.9K
Quantum Swarm:多智能体集群协作框架Quantum Swarm 是一个开源的人工智能框架,专注于开发和研究AI群体智能。该项目由Quarm AI团队在GitHub上维护,旨在提供一个灵活且高效的平台,用于构建和测试多智能体系统。Quan...最新AI资源# AI开源项目# 智能体开发框架9个月前022.9K
EditorJumper:Cursor/Trae/Windsurf和JetBrains无缝切换工具综合介绍 EditorJumper 是一个专为 JetBrains IDE 设计的插件,由 GitHub 用户 wanniwa 开发。它能让开发者在 JetBrains IDE(如 IntelliJ ...最新AI资源# AI开源项目7个月前022.9K
UniAPI:免服务器统一管理大模型API转发综合介绍 UniAPI 是一个兼容 OpenAI 协议的 API 转发器,核心功能是通过统一的 OpenAI 格式管理多个大模型服务商的 API,比如 OpenAI、Azure OpenAI、Clau...最新AI资源# AI开源项目7个月前022.9K
ER NeRF:构建高保真都的说话人物视频合成系统综合介绍 ER-NeRF (Efficient Region-Aware Neural Radiance Fields)是一个开源的说话人物合成系统,发表于ICCV 2023会议。该项目利用区域感知神...最新AI资源# AI开源项目# AI数字人9个月前022.9K
X-R1:在普通设备中低成本训练0.5B模型综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架,旨在为开发者提供一个低成本、高效的工具,用于训练基于端到端强化学习的模型。该项目受到 DeepSeek...最新AI资源# AI开源项目# 大模型微调7个月前022.9K
简单易用的开源AI写作助手综合介绍 AI 写作助手 是一个基于 Next.js 开发的开源 AI 写作助手,托管于 GitHub,旨在帮助作家、内容创作者和文案专业人员通过人工智能技术提升写作效率与质量。这个工具允许用户通过详...最新AI资源# AI写作# AI开源项目7个月前022.9K
Confident AI:自动化大语言模型评估框架,对比不同大模型提示词输出质量综合介绍 DeepEval是一个简单易用的开源LLM评估框架,用于评估和测试大语言模型系统。它类似于Pytest,但专注于LLM输出的单元测试。DeepEval结合最新的研究成果,通过G-Eval、幻...最新AI资源# AI开源项目# PROMPTS辅助工具8个月前022.9K
FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析综合介绍 FoloUp 是一个开源平台,专为企业提供AI驱动的语音面试解决方案。通过FoloUp,企业可以快速生成针对职位描述的定制化面试问题,并通过AI进行自然对话式的面试。平台还提供详细的面试分析...最新AI资源# AI开源项目# 专业生产力工具7个月前022.9K
GraphGen:利用知识图谱生成合成数据微调语言模型综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架,托管于 GitHub,专注于通过知识图谱指导合成数据生成,优化大语言模型(LLM)的监督微调。它从...最新AI资源# AI开源项目# 大模型微调# 知识图谱5个月前022.9K
Browse AI:无代码提取和监控结构化数据Browse介绍 Browse AI是一个无需编码的云端网页自动化软件,旨在帮助用户无需编程便能从任意网站提取和监控数据。您只需用鼠标指点一次,就可以训练一个机器人来执行数据提取、监控和自动化的任务...最新AI资源# AI开放服务# AI开源项目# 无代码开发1年前022.9K
Crawl4LLM:为LLM预训练提供的高效网页爬取工具综合介绍 Crawl4LLM 是一个由清华大学和卡内基梅隆大学联合开发的开源项目,专注于优化大模型(LLM)预训练的网页爬取效率。它通过智能选择高质量网页数据,显著减少无效爬取,号称能将原本需要爬取1...最新AI资源# AI开源项目# 文档提取与清洗8个月前022.9K
Robo Blogger:基于LangGraph将语音内容生成博客文章,自动化写作博客综合介绍 Robo Blogger 是一个创新的博客创作工具,旨在通过语音转文字技术简化内容生成过程。用户可以通过任何语音转文字应用记录想法,Robo Blogger 将这些想法转化为结构化的博客内容...最新AI资源# AI开源项目# AI文本与音频/视频总结工具10个月前022.9K
MoshiVis:实时语音对话和图像理解的开源模型综合介绍 MoshiVis 是 Kyutai Labs 开发的一个开源项目,托管在 GitHub 上。它基于 Moshi 语音-文本模型(7B 参数),新增了约 2.06 亿个适配参数和冻结的 Pal...最新AI资源# AI开源项目# 多模态实时互动产品7个月前022.8K
GraphCast:基于扩散模型的学习并预测中期全球天气预报的高效工具综合介绍 GraphCast是由Google DeepMind开发的一个先进的天气预报工具,旨在通过深度学习技术提升中期全球天气预报的准确性。该项目提供了多种预训练模型和示例代码,用户可以利用这些资源...最新AI资源# AI开源项目10个月前022.8K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用综合介绍 ai-gradio是一个开源的Python工具包,旨在帮助开发者轻松集成和使用多种AI模型。该项目基于Gradio构建,提供了一个统一的接口,支持多种AI模型和服务。无论是文本、语音还是视频...最新AI资源# AI开源项目8个月前022.8K
PromptWizard:优化提示工程的开源框架,提升任务性能综合介绍 PromptWizard是微软开发的一个开源框架,采用自我进化机制,可以让模型自己生成、评价和改进提示词及生成示例,通过不断反馈来提高输出质量。它能够自主优化提示词、生成和选择合适的示例、并...最新AI资源# AI开源项目10个月前022.8K
Mini-Cover:在线封面制作,专为博客、短视频、社交媒体等生成个性化封面综合介绍 Mini-Cover 是一个开源的在线封面生成工具,专为博客、短视频和社交媒体等平台生成个性化封面。该工具由 JLinMr 开发,旨在提供一个简洁高效的解决方案,帮助用户快速生成符合自己需求...最新AI资源# AI开源项目# AI营销10个月前022.8K
Atomic Agents:构建轻量级模块化AI智能体框架综合介绍 Atomic Agents 是一个围绕原子性概念设计的极其轻量级和模块化的框架,用于构建代理AI管道和应用程序。该框架提供了一组工具和代理,可以组合创建强大的应用程序。它基于 Instruc...最新AI资源# AI开源项目# 智能体开发框架10个月前022.8K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统综合介绍 FastAPI DocGPT 是一个基于 FastAPI 的文档问答系统,允许用户上传 PDF 文件并基于文档内容进行问答。该系统使用 OpenAI 的嵌入技术将文档内容嵌入到向量数据库 Q...最新AI资源# AI开源项目# AI文本与音频/视频总结工具11个月前022.8K
SVLS:SadTalker增强版,使用人像视频生成数字人综合介绍 SadTalker-Video-Lip-Sync 是一个基于 SadTalkers 实现的视频唇形合成工具。该项目通过语音驱动生成唇形,并使用可配置的面部区域增强方式来提高生成唇形的清晰度...最新AI资源# AI开源项目# AI数字人8个月前022.8K
AI Logo:AI快速生成定制化品牌Logo综合介绍 AI Logo 是一个开源的AI应用项目,目标是帮助用户通过人工智能快速生成个性化的品牌标志。它结合了强大的AI技术,比如Stable Diffusion和DeepAI,让用户输入简单的品牌...最新AI资源# AI图像风格控制# AI开源项目7个月前022.8K
Unigraph:构建本地运行的知识图谱和个人搜索引擎综合介绍 Unigraph 是一个本地优先的通用知识图谱和个人搜索引擎,旨在为用户提供一个集成的工作空间,帮助管理和搜索个人生活中的各种数据。通过 Unigraph,用户可以将不同来源的数据整合到一个...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架9个月前022.8K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架综合介绍 muAgent 是由蚂蚁集团开发的创新型多智能体框架。该框架通过画布式拖拽和简单的文本编写,协同多智能体、函数调用、代码解释器等技术,帮助用户在人工指导下执行各种复杂的标准操作流程(SOP...最新AI资源# AI开源项目# 智能体开发框架11个月前022.8K
Tap4 AI WebUI:开源轻量级AI工具导航项目综合介绍 Tap4 AI WebUI 是一个开源的轻量级AI工具导航网站项目,旨在帮助用户轻松搭建自己的AI工具目录。该项目采用了Next.js和Supabase技术栈,支持多语言SEO优化,提供AI...最新AI资源# AI副业赚钱项目# AI开源项目12个月前022.8K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中综合介绍 SHMT(Self-supervised Hierarchical Makeup Transfer)是一个基于潜在扩散模型的自我监督分层化妆迁移项目,旨在通过无监督学习方法实现化妆效果的高质...最新AI资源# AI开源项目# AI换脸与换装9个月前022.8K
DSPy Examples:展示DSPy功能的实用示例综合介绍 DSPy示例代码库是一个由Langtrace AI团队维护的GitHub代码库,展示了使用DSPy构建的各种AI程序示例。该代码库旨在通过实际示例展示DSPy的多种功能,帮助开发者更好地理解...最新AI资源# AI开源项目8个月前022.8K
AI no jimaku gumi:借助AI实现视频多语言字幕自动生成和翻译综合介绍 AI no jimaku gumi(AI の字幕組)是一个强大的命令行视频字幕处理工具,专注于实现自动化的视频字幕提取、转录和翻译功能。该工具集成了先进的AI技术,包括 Whisper 语音...最新AI资源# AI开源项目# AI翻译# AI语音转文本9个月前022.8K
Arrakis:为AI智能体提供安全沙盒环境的开源工具综合介绍 Arrakis 是一个专为 AI 智能体设计,提供安全、可自定义的沙盒环境。它由 Abhishek Bhardwaj 开发,托管在 GitHub 上,使用 AGPL v3 许可证。Arrak...最新AI资源# AI开源项目6个月前022.8K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体综合介绍 TankWork是一个开源的桌面代理框架,旨在通过计算机视觉和系统级交互,使AI能够感知和控制您的电脑。该框架允许代理通过语音和文本命令直接控制计算机,处理实时屏幕内容,并提供连续的音频视觉...最新AI资源# AI开源项目# 桌面自动化智能体9个月前022.8K
CR-Mentor:知识库+LLM 驱动的GitHub智能代码审查导师综合介绍 CR-Mentor 是一个结合专业知识库与大语言模型(LLM)能力的智能代码审查工具。它不仅支持所有编程语言的代码审查,还能基于知识库积累的最佳实践,为团队定制专属审查标准和重点关注领域。通...最新AI资源# AI开源项目# AI编程11个月前022.8K
Plandex:支持超长上下文的开源AI编码助手综合介绍 Plandex 是一个开源的终端 AI 编码助手,专为大型复杂软件项目设计。它能规划和执行多步骤任务,处理高达 200 万 token 的上下文,支持 30 多种编程语言。Plandex 提...最新AI资源# AI开源项目# AI编程6个月前022.8K
OpenAI Agents SDK:搭建多智能体协作工作流的Python框架综合介绍 OpenAI Agents SDK 是 OpenAI 推出的一款轻量级开发工具,专为构建多智能体工作流设计。它基于 Python,简单易上手,支持开发者通过配置智能体(Agents)、任务切...最新AI资源# AI开源项目# 智能体开发框架7个月前022.7K
Trackers:用于视频对象跟踪的开源工具库综合介绍 Trackers 是一个开源的 Python 工具库,专注于视频中的多对象跟踪。它集成了多种领先的跟踪算法,如 SORT 和 DeepSORT,允许用户结合不同的对象检测模型(如 YOLO...最新AI资源# AI开源项目# 视觉目标检测5个月前022.7K
H2O GPT:灵活配置的本地AI对话与文档处理工具综合介绍 H2O GPT 是一个开源项目,旨在提供私有化的聊天和文档处理功能。该项目基于 Apache 2.0 许可证,支持多种 GPT 模型,包括 LLaMa2、Mistral、Falcon 等。用...最新AI资源# AI开源项目# AI本地化聊天应用10个月前022.7K
StickerBaker:用AI制作个性贴纸图片综合介绍 stickerbaker是一个开源的贴纸制作工具,利用人工智能技术来制作各种有趣的贴纸。无论是想要一个简单的猫咪贴纸还是想要制作一系列多样化的贴纸,stickerbaker都能满足你的需求...最新AI资源# AI在线生成图像# AI开源项目1年前022.7K
HealthGPT:支持医学图像分析与诊断问答的医疗大模型综合介绍 HealthGPT 是一个先进的医疗大视觉语言模型,旨在通过异构知识适应实现统一的医学视觉理解和生成功能。该项目的目标是将医学视觉理解和生成能力集成到一个统一的自回归框架中,显著提升了医疗图...最新AI资源# AI开源项目# 视觉目标检测8个月前022.7K
IMS Toucan:快速可控的多语言(支持7000+语言)文本转语音工具综合介绍 IMS Toucan 是由德国斯图加特大学自然语言处理研究所(IMS)开发的一个先进的文本转语音(TTS)工具包。该工具包支持超过7000种语言,具有快速、可控且计算资源需求低的特点。IMS...最新AI资源# AI开源项目# AI文本转语音8个月前022.7K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题综合介绍 Marco-o1是由阿里巴巴国际数字商业集团(AIDC-AI)开发的开放式推理模型,旨在解决复杂的现实世界问题。该模型结合了思维链(CoT)微调、蒙特卡洛树搜索(MCTS)和创新的推理策略...最新AI资源# AI开源项目10个月前022.7K
Mini LLM Flow:使用100行代码构建“有向图结构”的LLM微型智能体综合介绍 miniLLMFlow是一个极简主义的大语言模型(LLM)开发框架,其核心代码仅包含100行,彰显了"大道至简"的设计理念。该框架专门设计用于让AI助手(如ChatGPT、Claude等)能...最新AI资源# AI开源项目# 智能体开发框架9个月前022.7K
SiteMCP:抓取网站内容并转为MCP服务综合介绍 SiteMCP 是一个开源工具,核心功能是抓取整个网站的内容并将其转化为 MCP(Model Context Protocol)服务器,让 AI 助手(如 Claude Desktop)直接...最新AI资源# AI开源项目# MCP服务6个月前022.7K
Pyramid Flow:快手推出的开源版"可灵",基于SD3在少于8GB的GPU上运行(一键部署版)综合介绍 Pyramid Flow 是一种高效的自回归视频生成方法,基于 Flow Matching 技术。该方法通过在不同分辨率和噪声水平之间插值,实现了视频内容的生成和解压缩,具有更高的计算效率...最新AI资源# AI图像转视频# AI开源项目11个月前022.7K
AI-Infra-Guard:检测AI系统潜在安全风险的开源工具综合介绍 AI-Infra-Guard 是由腾讯混元安全团队朱雀实验室开发的一款开源AI基础设施安全评估工具,旨在帮助用户快速发现和检测AI系统中的潜在安全风险。该工具支持对30多种AI框架和组件进行...最新AI资源# AI开源项目8个月前022.7K
ScrapeGraphAI:一个提示词搞定网页抓取,无需编写规则智能网页内容提取工具综合介绍 ScrapeGraphAI是一个创新的Python网页抓取库,它巧妙地结合了大语言模型(LLM)和直接图逻辑来创建网站和本地文档的抓取管道。这个工具的独特之处在于它的简单性和强大功能的完美平...最新AI资源# AI开源项目# 文档提取与清洗9个月前022.7K
OmniParse:从文档/多媒体中提取任何非结构化数据解析为结构化数据综合介绍 OmniParse是一个强大的数据解析与优化平台,旨在将任何非结构化数据转换为结构化、可操作的数据,优化后适用于GenAI(生成式人工智能)框架。无论是处理文档、表格、图像、视频、音频文件还...最新AI资源# AI开源项目# 文档提取与清洗11个月前022.7K
Bonsai:适合边缘设备运行的三值权重语言模型综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型,参数规模为 5 亿,采用三值权重(ternary weights)技术。它基于 Llama 架构和 Mistral 分词器...最新AI资源# AI开源项目# 大模型微调7个月前022.7K
Thera:任意尺寸图像放大、去锯齿的开源工具综合介绍 Thera 是一个开源的图像超分辨率工具,由苏黎世联邦理工学院(ETH Zurich)和苏黎世大学的团队开发。它能将低分辨率图像放大到任意尺度,比如 2 倍、3.14 倍甚至非整数倍,并且放...最新AI资源# AI图像放大与修复# AI开源项目6个月前022.7K
MCP Playwright:提供浏览器自动化操作的MCP服务综合介绍 MCP-Playwright 是一个由 ExecuteAutomation 开发并托管在 GitHub 上的开源工具。它基于 Playwright 和 Model Context Proto...最新AI资源# AI开源项目# MCP服务7个月前022.7K
OneFileLLM:整合多种数据源为单一文本文件综合介绍 OneFileLLM 是一个开源命令行工具,旨在将多种数据源整合成单一文本文件,方便输入大语言模型(LLM)。它支持处理 GitHub 仓库、ArXiv 论文、YouTube 视频转录、网页...最新AI资源# AI开源项目# 文档提取与清洗6个月前022.7K
Swarm:学习轻量级多智能体系统的实验性教学项目(OpenAI示例)综合介绍 Swarm是由OpenAI开发的一个实验性教育框架,旨在探索多代理系统的轻量级、可控和易于测试的接口。该框架主要用于展示代理之间的交接和例程模式,帮助开发者理解和实现多代理系统的协调与执行...最新AI资源# AI开源项目# 智能体开发框架9个月前022.7K
Novel:模仿Notion AI的开源写作编辑器综合介绍 这是一个由Steven Tey开发的开源项目,名为Novel,它是一个Notion风格的所见即所得文本编辑器,集成了AI自动补全功能,可助力用户提升文字输入效率。项目提供了详尽的文档和安装指...最新AI资源# AI写作# AI开源项目1年前022.6K
AutoFlow:基于GraphRAG的对话式知识库/网页深度搜索工具,对话框可集成到其他网站综合介绍 AutoFlow 是由 PingCAP 开发的开源工具,旨在通过 TiDB 无服务器向量存储构建基于图的知识库。它集成了 LlamaIndex 和 DSPy 框架,支持复杂的对话搜索和知识图...最新AI资源# AI客服机器人# AI开源项目# 知识图谱9个月前022.6K
InfiniteYou:保留人脸特征的照片生成与编辑工具综合介绍 InfiniteYou 是 ByteDance 智能创作团队开发的一个开源项目。它基于扩散变换器(DiTs)技术,使用 FLUX.1-dev 模型,核心功能是让用户上传照片并输入文字描述,生...最新AI资源# AI图像风格控制# AI开源项目7个月前022.6K
AgentLaboratory:利用智能代理完成科研全流程的开源工具综合介绍 AgentLaboratory 是一个开源工具,托管在 GitHub 上,由 Samuel Schmidgall 开发。它利用大语言模型(LLM)驱动的智能代理,帮助研究人员完成科研全流程...最新AI资源# AI开源项目# AI教育工具# 论文7个月前022.6K
WikiChat:使用维基百科数据检索知识的聊天工具综合介绍 WikiChat是由斯坦福大学开发的一款实验性聊天机器人,旨在通过从维基百科检索数据来提高大语言模型的事实性。大语言模型(如ChatGPT和GPT-4)在处理最新信息或不太流行的话题时,往往...最新AI资源# AI开源项目# 知识检索与RAG框架9个月前022.6K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具综合介绍 ComfyUI Portrait Master 中文版是一个专为AI图像创作者设计的人物肖像提示词生成工具。该工具通过优化提示词,帮助用户生成高质量的人物肖像。用户可以根据需求选择不同的镜头...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI1年前022.6K
InstantCharacter:从单张图片生成一致性角色的开源工具综合介绍 InstantCharacter 是由腾讯 Hunyuan 和 InstantX 团队开发的一个开源项目,托管在 GitHub 上。它通过一张参考图片和一句文本描述,就能生成外观一致的角色图...最新AI资源# AI图像风格控制# AI开源项目5个月前022.6K
ControlFlow:构建可控透明AI智能体工作流的Python框架综合介绍 ControlFlow是由PrefectHQ开发的一个Python框架,专注于构建和管理AI工作流。它提供了一个结构化、面向开发者的框架,用于定义工作流并将任务委派给大型语言模型(LLM)代...最新AI资源# AI开源项目# 智能体开发框架10个月前022.6K
Exa & Deepseek Chat App:实时Web搜索与智能推理的开源聊天应用综合介绍 Exa & Deepseek Chat App 是一个开源的智能聊天应用,主要功能包括使用 Exa 的 API 进行实时 Web 搜索和利用 Deepseek R1 语言模型进行智能...最新AI资源# AI开源项目# AI搜索工具9个月前022.6K
Social Media Agent:社交媒体智能助手,自动生成和管理社交媒体内容综合介绍 社交媒体代理(Social Media Agent)是一个开源项目,由全新的 Agent Inbox 管理交互信息,旨在帮助用户自动生成和管理社交媒体内容。该项目由LangChain团队开发...最新AI资源# AI开源项目# AI社交媒体9个月前022.6K
TripoSG:单张图像生成高分辨率3D建模数字资产综合介绍 TripoSG 是由 VAST AI 研究团队开发的一个开源项目,能从单张图像生成高质量的 3D 模型。项目使用大规模整流流变换器技术,结合混合监督训练和优质数据集,让生成的 3D 模型拥有...最新AI资源# AI开源项目# AI文本与图片转3D7个月前022.6K
Minima:支持本地部署或集成到ChatGPT、Claude的开源RAG容器综合介绍 Minima 是一个开源的 RAG(Retrieval-Augmented Generation)解决方案,支持在本地部署和与 ChatGPT 集成。该项目由 dmayboroda 维护,旨...最新AI资源# AI开源项目# 知识检索与RAG框架8个月前022.6K
InsightExpress:生成AI驱动的研究报告并通过电子邮件发送综合介绍 InsightExpress 是一个基于 Next.js 的应用程序,能够根据用户提供的主题生成 AI 驱动的研究报告,并通过电子邮件发送给用户。该应用程序利用 Langflow 的 AI ...最新AI资源# AI开源项目# 生成深度研究报告7个月前022.6K
Vision Agent:解决多种视觉目标检测任务的视觉智能体综合介绍 Vision Agent 是由 LandingAI(吴恩达团队) 开发的一个开源项目,托管在 GitHub 上,旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型...最新AI资源# AI开源项目# 视觉目标检测8个月前022.6K
Taipy:为数据科学家打造的高效数据分析与AI应用开源Python库综合介绍 Taipy 是由 Avaiga 开发的一个强大的 Python 库,专为数据科学家和机器学习工程师设计,用于快速构建和部署数据驱动的 Web 应用程序。Taipy 提供了一整套工具和组件,使...最新AI资源# AI开源项目# AI数据分析10个月前022.6K
Ant Design X:快速构建AI聊天界面的工具包,支持模型集成和数据流管理。综合介绍 Ant Design X是蚂蚁集团开源的一个工具包,旨在帮助开发者快速构建AI驱动的对话界面。它提供了丰富的组件和模板,支持与OpenAI标准兼容的模型集成,适用于智能客服、AI助手等多种应...最新AI资源# AI开源项目11个月前022.6K
DeepSeek Engineer:基于DeepSeek API的实验性编码助手,附提示词综合介绍 DeepSeek Engineer是一款基于DeepSeek API开发的强大编程助手工具,它能够通过直观的命令行界面与用户进行交互,协助完成各种软件开发任务。该工具将大型语言模型的能力与实...最新AI资源# AI开源项目8个月前022.5K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释综合介绍 GPT Academic 是一个专门为学术研究优化的大语言模型交互平台,为 GPT/GLM 等大语言模型提供实用化交互接口的工具,特别优化了论文翻译、论文阅读、润色和写作体验。它采用模块化设...最新AI资源# AI开源项目# AI教育工具# 论文11个月前022.5K
修复无效JSON字符串,解决 LLMs 生成的 JSON 数据中可能出现的格式错误。综合介绍 一个用于修复无效JSON文件的模块,特别适用于解析由大型语言模型(LLMs)输出的错误JSON数据。该模块能够修复常见的JSON语法错误,如缺失的引号、错误的逗号、不转义的字符和不完整的键值...最新AI资源# AI开源项目12个月前022.5K