dsRAG:用于处理非结构化数据和复杂查询的检索引擎综合介绍 dsRAG是一款高性能检索引擎,专门用于处理非结构化数据的复杂查询。它在处理密集文本(如财务报告、法律文件和学术论文)中的挑战性查询时表现尤为出色。dsRAG采用了三种关键方法来提高性能:语...最新AI资源# AI开源项目# 知识检索与RAG框架1年前056.6K
Unigraph:构建本地运行的知识图谱和个人搜索引擎综合介绍 Unigraph 是一个本地优先的通用知识图谱和个人搜索引擎,旨在为用户提供一个集成的工作空间,帮助管理和搜索个人生活中的各种数据。通过 Unigraph,用户可以将不同来源的数据整合到一个...最新AI资源# AI开源项目# 知识图谱# 知识检索与RAG框架1年前056.6K
CortexON:开源多代理AI工具,支持复杂任务自动化综合介绍 CortexON 是一个开源的多代理 AI 系统,托管在 GitHub 上,网址为 https://github.com/TheAgenticAI/CortexOn。它由 TheAgenti...最新AI资源# AI开源项目# 智能体应用1年前056.6K
Claude生成深度研究报告的MCP服务综合介绍 MCP Server Deep Research 是一个开源工具,通过人工智能和网页搜索,自动为复杂问题生成结构化的研究报告。用户输入研究问题,工具会分解问题、搜索权威信息、评估来源可信度...最新AI资源# AI开源项目# MCP服务# 生成深度研究报告11个月前056.6K
小半 WordPress AI 助手:实现对话、文章生成与翻译的 WordPress AI助手插件综合介绍 WordPress AI助手插件(wp-ai-chat)是一个开源的WordPress插件,旨在为用户提供多种AI功能,包括AI对话、文章生成、文章总结、文章翻译和内容朗读。该插件支持对接多...最新AI资源# AI写作# AI开源项目1年前056.6K
Supermemory:导入书签和网页内容构建个人知识库综合介绍 Supermemory 是一个开源项目,旨在帮助用户构建自己的“第二大脑”。它通过一个功能强大的 Chrome 扩展程序和AI技术,让用户能够轻松保存、组织和检索来自网页、Twitter书签...最新AI资源# AI开源项目# 知识检索与RAG框架1年前056.5K
Model Context Provider CLI:任意大模型中使用MCP服务的命令行工具,不依赖Claude综合介绍 Model Context Provider CLI(mcp-cli)是一个用于与模型上下文提供服务器交互的协议级命令行工具。该工具允许用户发送命令、查询数据并与服务器提供的各种资源进行交互...最新AI资源# AI开源项目# MCP服务1年前056.5K
Open-Reasoner-Zero:开源大规模推理强化学习训练平台综合介绍 Open-Reasoner-Zero 是一个专注于强化学习(RL)研究的开源项目,由 GitHub 上的 Open-Reasoner-Zero 团队开发。它旨在通过提供高效、可扩展且易用的训...最新AI资源# AI开源项目# 大模型微调1年前056.5K
ComfyUI Portrait Master 中文版:优化肖像生成的提示词工具综合介绍 ComfyUI Portrait Master 中文版是一个专为AI图像创作者设计的人物肖像提示词生成工具。该工具通过优化提示词,帮助用户生成高质量的人物肖像。用户可以根据需求选择不同的镜头...最新AI资源# AI图像生成辅助工具# AI开源项目# ComfyUI2年前056.4K
GPT Academic:最佳Arxiv学术论文翻译、纠错与代码解释综合介绍 GPT Academic 是一个专门为学术研究优化的大语言模型交互平台,为 GPT/GLM 等大语言模型提供实用化交互接口的工具,特别优化了论文翻译、论文阅读、润色和写作体验。它采用模块化设...最新AI资源# AI开源项目# AI教育工具# 论文1年前056.4K
OpenDeepResearcher:自动化深度研究工具,撰写完整的研究报告综合介绍 OpenDeepResearcher 是一个开源的自动化深度研究工具,旨在通过人工智能技术提升研究效率。该项目由 mshumer 开发,托管在 GitHub 上。OpenDeepResear...最新AI资源# AI开源项目# 生成深度研究报告1年前056.4K
Markdown To Poster:将Markdown转换为社交媒体/小红书海报,支持在线编辑和一键部署。综合介绍 Markdown to Image 是一个用于将Markdown文本渲染为视觉上吸引人的社交媒体图片的React组件。该项目还包括一个内置的网页编辑器,可以作为在线Markdown到海报编辑...最新AI资源# AI开源项目1年前056.4K
Agent-Wiz:分析AI智能体工作流程和安全风险综合介绍 Agent-Wiz 是一个开源的Python命令行工具,专为开发者、研究人员和安全团队设计。它能从LangGraph、CrewAI、AutoGen等主流AI智能体框架中提取复杂的工作流程,生...最新AI资源# AI开源项目# 智能体开发框架1年前056.4K
Memobase:为AI应用提供基于用户画像的长期记忆方案综合介绍 Memobase 是一个基于用户画像的记忆系统,旨在为生成式AI应用提供长效用户记忆支持。无论您是在构建虚拟伴侣、教育工具还是个性化助手,Memobase 都能帮助您的AI记住、理解并随着用...最新AI资源# AI开源项目1年前056.3K
PR Agent:自动化拉取请求分析工具综合介绍 PR-Agent 是一个由 Qodo 开发的开源工具,旨在通过 AI 技术自动化处理拉取请求(Pull Request)。该工具能够提供自动化的反馈、建议和分析,帮助开发者更高效地进行代码审...最新AI资源# AI开源项目1年前056.2K
MultiPost-Extension:将AI生成内容一键同步到自媒体平台的浏览器扩展综合介绍 MultiPost-Extension 是一个功能强大的浏览器扩展,旨在帮助用户一键发布内容到多个社交媒体平台。该扩展支持同步发布到超过10个主流平台,包括知乎、微博、小红书、TikTok ...最新AI资源# AI开源项目# AI社交媒体1年前056.2K
Pyramid Flow:快手推出的开源版"可灵",基于SD3在少于8GB的GPU上运行(一键部署版)综合介绍 Pyramid Flow 是一种高效的自回归视频生成方法,基于 Flow Matching 技术。该方法通过在不同分辨率和噪声水平之间插值,实现了视频内容的生成和解压缩,具有更高的计算效率...最新AI资源# AI图像转视频# AI开源项目1年前056.2K
基于Workers AI免费将多种文件转为Markdown格式综合介绍 serverless-markdown-convertor 是一个免费的开源工具,基于 Cloudflare Worker 和 Workers AI 开发,能将多种文件转换为 Markdow...最新AI资源# AI开源项目# 文档提取与清洗1年前056.2K
HiveChat:适合公司内部快速部署的AI聊天机器人综合介绍 HiveChat 是一个为中小型团队设计的 AI 聊天机器人,允许管理员一次性配置多种 AI 模型(如 Deepseek、OpenAI、Claude 和 Gemini),方便团队成员使用。它...最新AI资源# AI开源项目# AI集成多模型对话平台1年前056.2K
Ollama+LangGraph 本地部署学术研究报告生成助手综合介绍 Ollama Deep Researcher 是一个完全本地运行的网页研究和报告生成助手,由 LangChain 团队开发。它通过 Ollama 托管的任意大型语言模型(LLM),让用户输入...最新AI资源# AI开源项目# AI教育工具1年前056.2K
DeepResearcher:基于强化学习驱动AI研究复杂问题综合介绍 DeepResearcher 是由上海交通大学 GAIR-NLP 团队开发的开源项目。它是一个基于大型语言模型(LLM)的智能研究工具,通过强化学习(RL)在真实网络环境中进行端到端训练。项...最新AI资源# AI开源项目# 生成深度研究报告1年前056.2K
Dynamiq:智能体编排框架,支持RAG和LLM代理,简化AI应用开发综合介绍 Dynamiq是一个开源的AI编排框架,专为代理AI和大语言模型(LLM)应用而设计。它旨在简化AI驱动应用程序的开发,特别是在检索增强生成(RAG)和LLM代理的编排方面。Dynamiq提...最新AI资源# AI开源项目# 智能体开发框架1年前056.2K
SciToolAgent:整合500+科研工具,自动化研究科研任务的智能体综合介绍 SciToolAgent 是由杭州浙江大学创新中心(HICAI-ZJU)开发的一个开源工具平台。它通过知识图谱(SciToolKG)和大语言模型技术,整合超过500种科学工具,帮助科研人员处...最新AI资源# AI开源项目# AI教育工具# 智能体应用1年前056.1K
mac assistant:macOS设备自动执行桌面操作的AI智能体综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目,旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ,并计划未来支持 ...最新AI资源# AI开源项目# 桌面自动化智能体1年前056.1K
self.so:一键生成精美的个人简历网页综合介绍 self.so 是一个开源工具,专为快速将简历或 LinkedIn 个人资料转化为个人网站而设计。用户只需上传 PDF 简历或输入 LinkedIn 链接,系统通过 AI 技术(基于 Tog...最新AI资源# AI开源项目# AI生活效率助手1年前056.1K
Text2Video-Zero:Picsart AI Research团队发布的文本到视频零样本生成器综合介绍 Text2Video-Zero是Picsart AI Research团队开发的一个零样本文本到视频生成器的官方实现,适用于GitHub。该项目提供了一种使用文本提示生成具有时间一致性和正确...最新AI资源# AI开源项目# AI文本转视频2年前056K
agents.json:智能体通过自然语言与API交互的开源规范综合介绍 agents.json 是 Wildcard AI 团队开发的一款开源规范,基于 OpenAPI 标准,旨在让智能体通过自然语言与 API 实现高效通讯。它通过结构化的 JSON 文件定义智...最新AI资源# AI开源项目1年前056K
MemFree:本地知识库与搜索信息混合的AI搜索引擎综合介绍 MemFree 是一个先进的混合AI搜索引擎,能够通过文本、图像、文件和网页进行搜索和提问。它提供一键获取文本、思维导图、图像和视频的搜索结果的功能。MemFree 的目标是从用户的知识库和...最新AI资源# AI开源项目# AI搜索工具1年前056K
InsightExpress:生成AI驱动的研究报告并通过电子邮件发送综合介绍 InsightExpress 是一个基于 Next.js 的应用程序,能够根据用户提供的主题生成 AI 驱动的研究报告,并通过电子邮件发送给用户。该应用程序利用 Langflow 的 AI ...最新AI资源# AI开源项目# 生成深度研究报告1年前056K
AI Web Operator:浏览器自动化操作,OpenAI Operator的开源实现综合介绍 AI Web Operator 是一个开源的 AI 浏览器操作工具,旨在通过集成多种 AI 技术和 SDK,简化用户在浏览器中的操作体验。该工具基于 Browserbase 和 Vercel...最新AI资源# AI开源项目# 多模态实时互动产品1年前055.9K
Lumina-mGPT-2.0:处理多种图像生成任务的自回归图像生成模型综合介绍 Lumina-mGPT-2.0 是由上海人工智能实验室(Shanghai AI Laboratory)、香港中文大学(CUHK)等机构联合开发的开源项目,托管于 GitHub,由 Alpha...最新AI资源# AI开源项目1年前055.8K
Rankify:支持信息检索与重排序的Python工具包综合介绍 Rankify 是由奥地利因斯布鲁克大学数据科学小组开发的开源 Python 工具包。它专注于信息检索、重排序和检索增强生成(RAG),提供了一个统一的框架。工具包内置 40 个预检索基准数...最新AI资源# AI开源项目# 知识检索与RAG框架1年前055.8K
XiaoYuanKouSuan_Auto:小猿口算自动答题工具,高效解决口算题目综合介绍 小猿口算自动答题工具是一个基于Python的开源项目,旨在通过OCR识别和自动化脚本来高效解决小猿口算应用中的题目。该工具利用了OpenCV和Tesseract等技术,能够实时识别屏幕上的题...最新AI资源# AI开源项目# AI教育工具2年前055.8K
AgentIQ:灵活连接和管理AI智能体的开源工具综合介绍 AgentIQ 是 NVIDIA 推出的一款开源工具,旨在帮助开发者高效连接和管理 AI 智能体。它能让不同框架的智能体无缝协作,连接企业数据和工具,像调用函数一样构建工作流。这个工具的最大...最新AI资源# AI开源项目# 智能体开发框架1年前055.8K
SFT-data-builder:利用免费大模型API生成AI训练数据,0成本大模型训练数据生成综合介绍 SFT-data-builder 是一个开源项目,旨在利用免费的大模型API结合用户的私域数据生成高质量的SFT训练数据。该工具支持多种AI模型格式,并提供一键生成、批量生成、灵活编辑和本地...最新AI资源# AI开源项目1年前055.8K
DeepCoder-14B-Preview:擅长代码生成的的开源模型综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...最新AI资源# AI开源项目# 大模型微调1年前055.8K
R1-Onevision:支持多模态推理的开源视觉语言模型综合介绍 R1-Onevision 是一个由 Fancy-MLLM 团队开发的开源多模态大语言模型,专注于视觉与语言的深度结合,能够处理图像、文本等多模态输入,并在视觉推理、图像理解、数学解题等领域表...最新AI资源# AI开源项目1年前055.7K
MegaPairs:BGE新推出的多模态向量嵌入模型综合介绍 MegaPairs 是 VectorSpaceLab 团队在 GitHub 上开源的项目,通过大规模数据合成技术生成多模态嵌入模型,用于图像-文本到图像的检索任务。项目基于超过2600万个异...最新AI资源# AI开源项目1年前055.7K
EasyControl:将人像转为吉卜力风格图像的免费工具综合介绍 EasyControl 是一个开源项目,项目基于扩散变换器(DiT)架构,提供高效、灵活的图像生成控制。其中,Ghibli Control LoRA 是其特色功能之一,通过仅用 100 张亚...最新AI资源# AI图像风格控制# AI开源项目1年前055.6K
Tap4 AI WebUI:开源轻量级AI工具导航项目综合介绍 Tap4 AI WebUI 是一个开源的轻量级AI工具导航网站项目,旨在帮助用户轻松搭建自己的AI工具目录。该项目采用了Next.js和Supabase技术栈,支持多语言SEO优化,提供AI...最新AI资源# AI副业赚钱项目# AI开源项目1年前055.6K
ChainForge:测试和评估大型语言模型提示效果的开源可视化编程环境综合介绍 ChainForge 是一个开源的可视化编程环境,专为测试和评估大型语言模型(LLM)的提示效果而设计。它提供了一个数据流提示工程环境,用户可以通过该平台快速探索和分析不同提示对LLM响应质...最新AI资源# AI开源项目# PROMPTS辅助工具1年前055.6K
简单易用的开源AI写作助手综合介绍 AI 写作助手 是一个基于 Next.js 开发的开源 AI 写作助手,托管于 GitHub,旨在帮助作家、内容创作者和文案专业人员通过人工智能技术提升写作效率与质量。这个工具允许用户通过详...最新AI资源# AI写作# AI开源项目1年前055.5K
Kheish:多角色智能体,审查、验证和格式化输出以生成高质量结果综合介绍 Kheish是一个开源的多角色代理,专为需要结构化、逐步协作的大型语言模型(LLM)任务而设计。Kheish不仅仅是一个简单的协调器,它本身就是一个智能代理,可以根据需求请求模块,整合用户反...最新AI资源# AI开源项目# 智能体开发框架# 知识检索与RAG框架1年前055.5K
OneFileLLM:整合多种数据源为单一文本文件综合介绍 OneFileLLM 是一个开源命令行工具,旨在将多种数据源整合成单一文本文件,方便输入大语言模型(LLM)。它支持处理 GitHub 仓库、ArXiv 论文、YouTube 视频转录、网页...最新AI资源# AI开源项目# 文档提取与清洗12个月前055.5K
CSM Voice Cloning:利用CSM-1B快速克隆声音综合介绍 CSM Voice Cloning 是一个由 Isaiah Bjork 开发的开源项目,托管在 GitHub 上。它基于 Sesame CSM-1B 模型,用户只需提供一段音频样本,就能克隆...最新AI资源# AI开源项目# AI语音克隆1年前055.5K
Pieces OS:逆向Pieces-OS GRPC转换为OpenAI接口(失效)综合介绍 Pieces-OS 是一个开源项目,旨在将 Pieces-OS 的 GRPC 流逆向并转换为标准的 OpenAI API 接口,支持Claude、GPT、Gemini。该项目由 Nekohy...最新AI资源# AI开源项目# 免费大模型API1年前055.5K
Story-Flicks:输入主题自动生成儿童短故事视频综合介绍 Story-Flicks 是一个开源的AI工具,专注于帮助用户快速生成高清故事视频。用户只需输入一个故事主题,系统会通过大语言模型生成故事内容,并结合AI生成的图像、音频和字幕,输出完整的视...最新AI资源# AI开源项目# AI视频生成工具1年前055.4K
llms.txt Generator:快速抓取网站内容并,生成LLM训练文本数据集综合介绍 llmstxt-generator 是一个专业的网站内容提取和整合工具,专门为大语言模型(LLM)的训练和推理准备高质量文本数据集。该工具由 Mendable AI 开发,采用 @firec...最新AI资源# AI开源项目# 文档提取与清洗1年前055.4K
par_scrape:智能提取网页数据的爬虫工具综合介绍 par_scrape 是一个基于 Python 的开源网页爬虫工具,由开发者 Paul Robello 在 GitHub 上推出,旨在帮助用户从网页中智能提取数据。它整合了 Selenium...最新AI资源# AI开源项目# 文档提取与清洗1年前055.4K
ai-gradio:轻松集成多种AI模型,基于Gradio构建多模态应用综合介绍 ai-gradio是一个开源的Python工具包,旨在帮助开发者轻松集成和使用多种AI模型。该项目基于Gradio构建,提供了一个统一的接口,支持多种AI模型和服务。无论是文本、语音还是视频...最新AI资源# AI开源项目1年前055.4K
Instructor:简化大语言模型结构化输出工作流的Python库综合介绍 Instructor 是一个流行的 Python 库,专为处理大语言模型(LLMs)的结构化输出而设计。它基于 Pydantic 构建,提供了一个简单、透明且用户友好的 API,用于管理数据...最新AI资源# AI开源项目# 文档提取与清洗1年前055.4K
VideoReTalking:音频驱动的嘴唇同步和视频编辑系统综合介绍 VideoReTalking是一款创新的系统,允许用户根据输入音频生成唇形同步的面部视频,即使有不同的情绪,也能产生高质量且嘴唇同步的输出视频。系统将这一目标分解为三个连续任务:带有典型表情...最新AI资源# AI开源项目# 口型同步1年前055.4K
AI Video Starter Kit:在浏览器中全流程创作并编辑AI视频综合介绍 视频制作AI工具包(Video Starter Kit)是由fal-ai-community发布的一个开源项目,旨在展示如何在浏览器中利用AI模型进行视频制作。它提供了从图像到视频的转换工具...最新AI资源# AI开源项目# AI音视频编辑1年前055.3K
DualPipe:双向流水线并行算法,提升大规模AI模型训练效率(DeepSeek 开源周第四天)综合介绍 DualPipe 是由 DeepSeek-AI 团队开发的一项开源技术,专注于提升大规模 AI 模型训练的效率。它是一个创新的双向流水线并行算法,主要用于在 DeepSeek-V3 和 R1...最新AI资源# AI开源项目1年前055.3K
Qwen4Mac:在Mac菜单栏中使用千问(Qwen)大模型随时对话综合介绍 Qwen4Mac是一个开源项目,旨在将Qwen大语言模型(LLM)集成到Mac的菜单栏中,方便用户随时调用和使用。该项目由andreaturchet开发和维护,提供了一种简便的方式,让用户能...最新AI资源# AI开源项目1年前055.2K
MuseGAN:生成多轨音乐/配乐的开源模型,轻松创作多种乐器的音乐片段综合介绍 MuseGAN是一个基于生成对抗网络(GAN)的音乐生成项目,旨在生成多轨(多种乐器)音乐。该项目能够从零开始生成音乐,或根据用户提供的轨道进行伴奏。MuseGAN使用Lakh Pianor...最新AI资源# AI开源项目# AI音乐1年前055.2K
VirtualWife:支持B站直播和语音互动的二次元数字人综合介绍 VirtualWife 是一个开源的虚拟数字人项目,由开发者 yakami129 创建。它目前处于孵化阶段,目标是打造一个有“灵魂”的虚拟角色,用户可以像朋友一样与之互动。项目支持 B站直播...最新AI资源# AI开源项目# AI数字人1年前055.2K
Deep Searcher:企业私有文档高效检索与智能问答综合介绍 Deep Searcher 是一个结合强大大语言模型(如 DeepSeek 和 OpenAI)和向量数据库(如 Milvus)的工具,旨在基于私有数据进行搜索、评估和推理,提供高度准确的答案...最新AI资源# AI开源项目# 知识检索与RAG框架1年前055.1K
ER NeRF:构建高保真都的说话人物视频合成系统综合介绍 ER-NeRF (Efficient Region-Aware Neural Radiance Fields)是一个开源的说话人物合成系统,发表于ICCV 2023会议。该项目利用区域感知神...最新AI资源# AI开源项目# AI数字人1年前055.1K
检测MCP服务安全风险的开源工具综合介绍 mcp-is-dangerous 是 Shaojie Jiang 在 GitHub 上开发的一个开源工具。它通过简单的 Python 代码,帮助用户检测 MCP(Model Context ...最新AI资源# AI开源项目# MCP服务1年前055.1K
TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目,通过直观的 Web 界面实现大语言模型(LLM)的实时优化。它采用 TPO(Test-Time Pr...最新AI资源# AI开源项目# 大模型微调1年前055.1K
DisPose:生成人体姿态精准控制的视频,创作跳舞的小姐姐综合介绍 DisPose是一个创新的开源人工智能项目,专注于可控的人物图像动画生成。该项目由研究团队开发并在GitHub上开源,采用先进的深度学习技术,通过分解骨骼姿态信息来实现精确的人物动画控制。D...最新AI资源# AI图像转视频# AI开源项目1年前055.1K
Marco-o1:基于Qwen2-7B-Instruct微调的开源版OpenAI o1模型,探索开放式推理模型,解决复杂问题综合介绍 Marco-o1是由阿里巴巴国际数字商业集团(AIDC-AI)开发的开放式推理模型,旨在解决复杂的现实世界问题。该模型结合了思维链(CoT)微调、蒙特卡洛树搜索(MCTS)和创新的推理策略...最新AI资源# AI开源项目1年前055K
Go-Proxy:Docker集成的高性能反向代理服务器综合介绍 Go-Proxy是一个使用Go语言开发的高性能代理服务器,主要用于在不同网络环境中提供代理服务。它支持多种协议,包括HTTP、HTTPS、SOCKS5、WebSocket、TCP和UDP,能...最新AI资源# AI开源项目1年前055K
Chunkr:使用视觉模型进行文档摄取以及根据文本段落层级智能分块的一体化服务综合介绍 Chunkr 是一个自托管的 API,专门用于将 PDF、PPTX、DOCX 和 Excel 文件转换为适合 RAG(检索增强生成)和 LLM(大语言模型)使用的数据。该项目由 Lumina...最新AI资源# AI开源项目# OCR# 文档提取与清洗1年前054.9K
SHMT:自监督分层化妆转移模型,虚拟化妆,将妆容迁移到新的人像中综合介绍 SHMT(Self-supervised Hierarchical Makeup Transfer)是一个基于潜在扩散模型的自我监督分层化妆迁移项目,旨在通过无监督学习方法实现化妆效果的高质...最新AI资源# AI开源项目# AI换脸与换装1年前054.9K
TextDistiller:一键总结一整本书,高效提炼书籍内容,快速掌握核心思想综合介绍 TextDistiller 是一款先进的人工智能驱动工具,旨在对书籍进行逐章或整体总结,提供简洁而全面的概述。通过使用 TextDistiller,用户能够快速掌握任何书籍的核心思想和关键要...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前054.9K
FastAPI DocGPT:基于FastAPI的PDF文档处理和问答系统综合介绍 FastAPI DocGPT 是一个基于 FastAPI 的文档问答系统,允许用户上传 PDF 文件并基于文档内容进行问答。该系统使用 OpenAI 的嵌入技术将文档内容嵌入到向量数据库 Q...最新AI资源# AI开源项目# AI文本与音频/视频总结工具1年前054.9K
SongGen:自动生成歌曲的单阶段自回归Transformer综合介绍 SongGen 是一个开源的单阶段自回归Transformer模型,专为文本到歌曲的生成任务设计。该模型能够从文本输入生成包含人声和伴奏的歌曲。SongGen 提供了对多种音乐属性的细粒度控...最新AI资源# AI开源项目# AI音乐1年前054.9K
CRCT:递归分解大型代码任务并持久保存项目状态综合介绍 Cline Recursive Chain-of-Thought System(简称CRCT)是一个开源框架,专为在VS Code中管理大型代码项目而设计。当前版本为v7.0,它通过递归方式...最新AI资源# AI开源项目1年前054.8K
StickerBaker:用AI制作个性贴纸图片综合介绍 stickerbaker是一个开源的贴纸制作工具,利用人工智能技术来制作各种有趣的贴纸。无论是想要一个简单的猫咪贴纸还是想要制作一系列多样化的贴纸,stickerbaker都能满足你的需求...最新AI资源# AI在线生成图像# AI开源项目2年前054.8K
magic-html:从HTML网址中提取主体数据,输出纯文本/markdown综合介绍 magic-html是一个Python库,旨在简化从HTML中提取主体区域内容的过程。无论处理的是复杂的HTML结构还是简单的网页,这个库都旨在为用户提供一个便捷高效的接口。它支持多模态抽取...最新AI资源# AI开源项目2年前054.8K
Hoarder:开源 AI 书签管理工具,支持多种格式文件,智能标签分类、全文检索综合介绍 Hoarder 是一个自主托管的书签管理工具,支持链接、笔记、PDF和图像的存储。它利用 AI 技术进行自动标记,并提供全文搜索功能。用户可以通过 Chrome 插件和 Firefox 插件...最新AI资源# AI开源项目# AI生活效率助手1年前054.7K
Quanta Quest:端侧大模型与面向个人数据的本地化AI搜索平台(预览版)综合介绍 Quanta Quest是全球首个以“端侧大模型+C端数据本地化”为核心演进方向的产品。它帮助用户将Gmail、Notion、Dropbox等所有数据存储到本地,并通过向量数据库进行处理,确...最新AI资源# AI开源项目# 知识检索与RAG框架1年前054.7K
LangWatch:基于DSPy 框架监控与优化LLM流程的可视化工具综合介绍 LangWatch 是一个专为大语言模型(LLM)操作而设计的综合平台,提供监控、分析、评估、数据集管理和提示优化等功能。该平台基于斯坦福大学的 DSPy 框架,旨在帮助用户更好地管理和优化...最新AI资源# AI开源项目1年前054.7K
Azure TTS Importer:将语音合成服务集成到阅读软件中综合介绍 TTS Importer 是一个开源项目,旨在将 Azure TTS(Text-to-Speech)语音合成服务轻松导入到各种阅读软件中。该工具支持多个流行的阅读软件,包括阅读(legado...最新AI资源# AI开源项目# AI文本转语音1年前054.7K
LuminaBrush:使用智能绘画工具为图像添加照明打光效果综合介绍 LuminaBrush 是一个创新的交互式图像照明效果编辑工具,由人工智能技术驱动。该项目采用两阶段框架处理图像:第一阶段将输入图像转换为"均匀照明"的外观,第二阶段则根据用户的涂鸦操作生成...最新AI资源# AI图像风格控制# AI开源项目1年前054.7K
STORM:基于Topic搜索网络数据,生成带引用的论文、长文报告综合介绍 STORM是由斯坦福大学 Oval 团队开发的一个知识整合和文章生成系统。它专注于从头开始生成类似维基百科的详尽文章(成体系的论文)。系统利用大型语言模型进行话题研究,准备概要并模拟实际互联...最新AI资源# AI开源项目# 生成深度研究报告# 论文1年前054.6K
Groq AppGen:使用Groq API展示Llama 3.3 70B HTML代码生成能力的实验项目综合介绍 Groq AppGen 是一个创新的交互式网页应用生成器,由 Groq 公司开发并开源。该项目展示了 Llama 3.3 70B 模型在 HTML 代码生成方面的强大能力。通过集成 Groq...最新AI资源# AI开源项目1年前054.6K
muAgent:由 LLM 和 EKG(行业知识)驱动的全新Agent编排框架综合介绍 muAgent 是由蚂蚁集团开发的创新型多智能体框架。该框架通过画布式拖拽和简单的文本编写,协同多智能体、函数调用、代码解释器等技术,帮助用户在人工指导下执行各种复杂的标准操作流程(SOP...最新AI资源# AI开源项目# 智能体开发框架1年前054.6K
Auto-Coder.Chat:基于终端命令行的AI辅助编程助手,提供VSCode插件综合介绍 Auto-Coder.Chat 是一款基于终端的 AI 辅助编程工具,旨在通过智能化手段提升开发者的编程效率。该工具可以与任意 IDE 搭配使用,使开发工具具备 AI 辅助编程能力。Auto...最新AI资源# AI开源项目# AI编程1年前054.6K
PiT:用图像零件拼出完整图像的工具(未开放)综合介绍 PiT(Piece it Together)是一个开源工具,托管在 GitHub 上,由特拉维夫大学的 Elad Richardson 等研究者开发。它能让用户输入零散的图像零件,比如翅膀...最新AI资源# AI图像编辑# AI图像风格控制# AI开源项目1年前054.5K
Quantum Swarm:多智能体集群协作框架Quantum Swarm 是一个开源的人工智能框架,专注于开发和研究AI群体智能。该项目由Quarm AI团队在GitHub上维护,旨在提供一个灵活且高效的平台,用于构建和测试多智能体系统。Quan...最新AI资源# AI开源项目# 智能体开发框架1年前054.5K
FlipSketch:将静态绘图转换为文本引导的草图动画,简化动画制作过程。综合介绍 FlipSketch 是一个开源项目,旨在将静态绘图转换为文本引导的动画。该项目托管在 GitHub 上,提供了一个创新的工具,允许用户通过文本描述来生成动画效果。FlipSketch 结合...最新AI资源# AI图像转视频# AI开源项目1年前054.5K
中文基于满血 DeepSeek-R1 蒸馏数据集,支持中文R1蒸馏SFT数据集综合介绍 中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集,包含110K条数据,旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布,数据集不仅包含数学数据,还包括大量的通用类型...最新AI资源# AI开源项目# 大模型微调1年前054.4K
II-Researcher:深度搜索与分步推理解答复杂问题综合介绍 II-Researcher 是 Intelligent-Internet 团队开发的一款开源人工智能研究工具,托管于 GitHub。它专为深度搜索和复杂推理设计,能通过智能网页搜索和多步骤分...最新AI资源# AI开源项目# 生成深度研究报告1年前054.3K
Rowfill:批量提取文档结构化信息并自动化分析综合介绍 Rowfill 是一个开源的文档处理平台,专为知识工作者设计。它利用先进的人工智能技术,从复杂的文档、图像和PDF中提取、分析和处理数据。Rowfill 支持本地大语言模型(LLM)和Ope...最新AI资源# AI开源项目# AI数据分析# 文档提取与清洗1年前054.3K
X-Dyna:静态人像参考视频姿态生成视频,让小姐姐的照片跳舞综合介绍 X-Dyna 是由字节跳动开发的一个开源项目,旨在通过零样本扩散技术生成动态人像动画。该项目利用驱动视频中的面部表情和身体动作来动画化单个人像图像,生成逼真且具有上下文感知的动态效果。X-D...最新AI资源# AI图像转视频# AI开源项目1年前054.3K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体综合介绍 LangGraph CUA 是由 LangChain 团队开发的一个开源项目。它基于 LangGraph 框架,让开发者可以用 Python 打造能直接操作电脑的 AI 智能体。这个工具的核...最新AI资源# AI开源项目# 桌面自动化智能体1年前054.3K
Devin Cursor Rules:让Cursor和Windsurf 强化为 Devin综合介绍 Devin Cursor Rules是一个开源项目,旨在通过配置文件和工具增强Cursor和Windsurf集成开发环境(IDE)的功能,使其具备类似Devin的高级AI能力。该项目提供了过...最新AI资源# AI开源项目1年前054.2K
ColossalAI:提供高效大规模AI模型训练解决方案综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台,旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练,ColossalAI...最新AI资源# AI开源项目# 大模型微调1年前054.2K
openai-captcha-detection:使用 OpenAI 进行验证码识别的高效工具。综合介绍 openai-captcha-detection 是一个使用 OpenAI 进行验证码识别的工具。通过调用 OpenAI 的 API,这个项目可以实现对复杂验证码图片的文本识别,帮助开发者在...最新AI资源# AI开源项目1年前054K
TableGPT2:表格数据集成的多模态模型综合介绍 TableGPT2是由浙江大学团队开发的一款多模态模型,专注于表格数据的集成和处理。该模型通过预训练和微调,能够在表格数据相关任务中表现出色,同时保持强大的通用语言和编码能力。TableGP...最新AI资源# AI开源项目1年前053.9K
LaWGPT:中文法律知识模型,支持法律问答和司法考试训练综合介绍 LaWGPT 是由南京大学机器学习与数据挖掘研究组支持的一个开源项目,致力于打造基于中文法律知识的大语言模型。它在通用中文模型(如 Chinese-LLaMA 和 ChatGLM)的基础上...最新AI资源# AI开源项目# AI教育工具1年前053.9K
Go-with-the-Flow:控制视频中物体的运动轨迹,视频中增减任何运动物体综合介绍 Go-with-the-Flow 是一个由 Netflix Eyeline Studios 研究团队开发的开源项目,旨在通过扭曲噪声控制视频扩散模型的运动模式。该项目允许用户决定场景中相机和...最新AI资源# AI开源项目# AI音视频编辑1年前053.9K
DB-GPT:构建AI原生数据应用开发框架,集成多模型管理与智能数据处理综合介绍 DB-GPT是一个开源的AI原生数据应用开发框架,采用AWEL(Agentic Workflow Expression Language)和智能体技术构建。该项目旨在大模型领域构建基础设施...最新AI资源# AI开源项目# AI数据分析# 知识检索与RAG框架1年前053.9K
LiberSonora:有声书字幕提取与多语言翻译,有声小说转录为多语言综合介绍 LiberSonora,寓意“自由的声音”,是一个AI赋能的强大开源有声书工具集。该工具集支持智能字幕提取、AI标题生成、多语言翻译等功能,能够在GPU加速下进行批量离线处理。LiberSo...最新AI资源# AI开源项目# AI翻译# AI语音转文本1年前053.9K
Skywork-R1V:昆仑万文开源的图文混合多模态推理模型综合介绍 Skywork-R1V 是由 SkyworkAI(昆仑万维) 团队开发的一款开源多模态推理模型,发布于 GitHub。它能同时处理图像和文字,进行多步骤逻辑推理,特别擅长分析复杂图像问题。这...最新AI资源# AI开源项目1年前053.8K
RocketNotes:支持文本补全、文档对话、语义搜索的Markdown笔记应用综合介绍 RocketNotes 是一个基于 Web 的 Markdown 笔记应用程序,集成了大型语言模型(LLM)驱动的文本补全、聊天和语义搜索功能。该项目采用 100% 无服务器的 RAG(Re...最新AI资源# AI开源项目# AI笔记1年前053.8K