AI开源项目

共 1020 篇文章

排序

浏览收藏

OPR：智能修复泛黄、破损老旧照片的AI工具

综合介绍 “Bringing Old Photos Back to Life”是微软研究团队开发的一个开源项目，专注于利用AI技术修复老旧照片。它基于深度学习方法，能够处理照片中的严重退化问题，如划痕...

最新AI资源 # AI图像放大与修复 # AI开源项目

1年前

046.5K

Prompt Optimizer：优化主流AI模型提示词的开源工具

综合介绍 Prompt Optimizer 是一个专注于提示词优化的开源工具，由 linshenkx 在 GitHub 上开发。它能够帮助用户通过智能算法优化 AI 模型的提示词，从而提升生成内容的质...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

1年前

089.5K

Humanify：借助AI快速解密和美化JavaScript代码的工具

综合介绍 Humanify 是一个开源工具，托管于 GitHub，由开发者 Jesse Luoto 创建，旨在帮助程序员利用人工智能技术快速解密和美化混淆的 JavaScript 代码。它集成了 Ch...

最新AI资源 # AI开源项目

1年前

051.6K

AI-Infra-Guard：检测AI系统潜在安全风险的开源工具

综合介绍 AI-Infra-Guard 是由腾讯混元安全团队朱雀实验室开发的一款开源AI基础设施安全评估工具，旨在帮助用户快速发现和检测AI系统中的潜在安全风险。该工具支持对30多种AI框架和组件进行...

最新AI资源 # AI开源项目

1年前

057K

WhisperChain：实时语音转文字并优化口语化词语

综合介绍 WhisperChain 是一个基于人工智能的开源项目，托管在 GitHub 上，由开发者 Chris Choy 主导开发。它主要用于将语音转化为文字，并通过 AI 技术自动优化表达，去除冗...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

055.7K

VideoGrain：文本提示对视频进行局部编辑的开源项目

综合介绍 VideoGrain 是一个专注于多粒度视频编辑的开源项目，由 xAI 团队开发并在 GitHub 上托管。这个项目出自论文《VideoGrain: Modulating Space-Tim...

最新AI资源 # AI开源项目 # AI音视频编辑

1年前

049.9K

Mobius Diffusion：文本提示生成无缝循环视频

综合介绍 Mobius Diffusion 是一个创新的在线工具，专注于通过文本输入生成无缝循环的视频内容。它基于预训练的视频扩散模型，无需用户自行训练或提供标注数据即可快速上手。网站的核心技术是通过...

最新AI资源 # AI开源项目 # AI文本转视频

1年前

049.9K

RuoYi AI：基于SpringBoot实现AI聊天和绘画的后端框架

综合介绍 RuoYi AI 是一个基于 ruoyi-plus 框架开发的后端项目，专注于集成 AI 聊天和绘画功能。它完全开源免费，采用 Java17 和 SpringBoot 3.X 技术栈，后台管...

最新AI资源 # AI副业赚钱项目 # AI开源项目

1年前

079.9K

Vision Agent：解决多种视觉目标检测任务的视觉智能体

综合介绍 Vision Agent 是由 LandingAI（吴恩达团队）开发的一个开源项目，托管在 GitHub 上，旨在帮助用户快速生成解决计算机视觉任务的代码。它利用先进的代理框架和多模态模型...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

058.4K

DeepSeek-R1-FP4：FP4优化版DeepSeek-R1推理速度25倍

综合介绍 DeepSeek-R1-FP4 是由 NVIDIA 开源并优化的一个量化语言模型，基于 DeepSeek AI 的 DeepSeek-R1 开发。它通过 TensorRT Model Opt...

最新AI资源 # AI开源项目

1年前

056.5K

MyCoder：自动修复代码、生成测试用例的命令行AI工具

综合介绍 MyCoder 是一个由 drivecore 团队开发并托管在 GitHub 上的开源项目，旨在通过命令行界面为开发者提供智能化的编程辅助。它基于 Anthropic 的 Claude AP...

最新AI资源 # AI开源项目 # AI编程

1年前

066.3K

Baichuan-Audio：支持实时语音交互的端到端音频模型

综合介绍 Baichuan-Audio 是由百川智能（baichuan-inc）开发的一个开源项目，托管于 GitHub 上，专注于端到端的语音交互技术。该项目提供了一个完整的音频处理框架，能够将语音...

最新AI资源 # AI开源项目 # 多模态实时互动产品

1年前

068.5K

R1-Onevision：支持多模态推理的开源视觉语言模型

综合介绍 R1-Onevision 是一个由 Fancy-MLLM 团队开发的开源多模态大语言模型，专注于视觉与语言的深度结合，能够处理图像、文本等多模态输入，并在视觉推理、图像理解、数学解题等领域表...

最新AI资源 # AI开源项目

1年前

054.9K

TrendPublish：实时追踪并总结AI新闻，自动发布到微信公众号

综合介绍 ai-trend-publish 是一个在 GitHub 上托管的开源项目，由 OpenAISpace 团队开发，专注于实时追踪和发布人工智能领域的最新趋势。这个工具旨在帮助开发者、技术爱好...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

1年前

058.2K

TheoremExplainAgent：利用 Manim 生成5分钟以上数学讲解动画视频

综合介绍 TheoremExplainAgent 是由 TIGER AI Lab 开发的一个创新项目，旨在利用人工智能技术将复杂的数学和科学定理转化为易于理解的视频动画。该工具基于大语言模型（LLM...

最新AI资源 # AI开源项目 # AI教育工具

1年前

068.3K

在 Cloudflare Workers 中快速部署 MCP 服务

综合介绍 Cloudflare Workers MCP 是由 Cloudflare 开发的一个开源项目，托管于 GitHub，旨在帮助开发者快速构建并部署基于 Cloudflare Workers 的...

最新AI资源 # AI开源项目 # MCP服务

1年前

062.4K

3FS：提升数据访问效率的并行文件系统（DeepSeek 开源周第五天）

综合介绍 3FS（Fire-Flyer File System）是由DeepSeek团队开发的一款开源并行文件系统，专为现代SSD和RDMA网络设计，旨在大幅提升数据访问效率。它在180节点集群中实现...

最新AI资源 # AI开源项目

1年前

056.2K

DeepChat：支持与多个聊天并发会话的AI对话客户端

综合介绍 DeepChat 是一个开源的智能助手项目，由 ThinkInAIXYZ 团队在 GitHub 上开发。它旨在通过强大的 AI 技术连接用户与数字世界，提供高效、自然的聊天体验。支持 Win...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

0102.2K

Dify Connect MCP：Dify 工作流无缝集成 MCP（模型上下文协议）

综合介绍 Dify Connect MCP 是一个开源项目，托管在 GitHub 上，旨在为 Dify 平台的用户提供一个便捷的工具，通过模型上下文协议（Model Context Protocol...

最新AI资源 # AI开源项目 # MCP服务

1年前

0113.7K

DualPipe：双向流水线并行算法，提升大规模AI模型训练效率（DeepSeek 开源周第四天）

综合介绍 DualPipe 是由 DeepSeek-AI 团队开发的一项开源技术，专注于提升大规模 AI 模型训练的效率。它是一个创新的双向流水线并行算法，主要用于在 DeepSeek-V3 和 R1...

最新AI资源 # AI开源项目

1年前

053.8K

AutoDev：支持多语言的自动代码生成与调试工具

综合介绍 AutoDev 是一个由 Unit Mesh 团队开发的开源项目，托管在 GitHub 上，旨在通过人工智能技术提升开发者的编程效率。它是一个功能强大的编码助手，支持多种编程语言，包括 Ja...

最新AI资源 # AI开源项目 # AI编程

1年前

076.4K

LLPlayer：生成实时字幕并双语翻译的视频播放器

综合介绍 LLPlayer 是一款专为语言学习者设计的开源媒体播放器，托管于 GitHub，由开发者 umlx5h 创建。它集成了多种实用功能，如双语字幕显示、AI 自动生成字幕、实时翻译和单词查询等...

最新AI资源 # AI开源项目 # AI翻译 # AI语音转文本

10个月前

0209.3K

DeepGEMM：高效支持FP8矩阵运算的开源库（DeepSeek 开源周第三天）

综合介绍 DeepGEMM 是一个由 DeepSeek 团队开发的开源 FP8 GEMM（通用矩阵乘法）库，专注于提供高效的矩阵运算支持。它特别针对 NVIDIA Hopper 架构的 Tensor ...

最新AI资源 # AI开源项目

1年前

059.6K

olmOCR：PDF文档转换为文本，支持表格、公式和手写内容的识别

综合介绍 olmOCR 是由 Allen Institute for Artificial Intelligence (AI2) 的 AllenNLP 团队开发的一款开源工具，专注于将 PDF 文件转...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

068.4K

Coding-Tutor：提供个性化编程指导的智能教学助手

综合介绍 Coding-Tutor 是一个托管在 GitHub 上的开源项目，由开发者 iwangjian 创建，旨在为学习者提供个性化的编程教学体验。它通过对话式人工智能技术，根据用户的知识背景和学...

最新AI资源 # AI开源项目 # AI教育工具

1年前

060.8K

par_scrape：智能提取网页数据的爬虫工具

综合介绍 par_scrape 是一个基于 Python 的开源网页爬虫工具，由开发者 Paul Robello 在 GitHub 上推出，旨在帮助用户从网页中智能提取数据。它整合了 Selenium...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

054.4K

Flock：低代码工作流编排快速构建聊天机器人

综合介绍 Flock 是一个开源的工作流低代码平台，托管在 GitHub 上，由 Onelevenvy 团队开发。它基于 LangChain 和 LangGraph 技术，专注于帮助用户快速搭建聊天机...

最新AI资源 # AI客服机器人 # AI开源项目 # 低代码工作流

1年前

066.7K

TableGPT Agent：专为分析复杂表格数据设计的智能工具

综合介绍 TableGPT Agent 是一个基于 GitHub 开源项目的智能工具，专为处理和分析表格数据设计。它依托 TableGPT2 大语言模型，利用自然语言交互的方式，让用户能够轻松查询、操...

最新AI资源 # AI开源项目 # AI数据分析

1年前

062.7K

TRV：将幻灯片/PPT和讲解备注快速生成演讲视频

综合介绍 TRV 是一个开源工具，托管于 GitHub，旨在帮助用户将幻灯片和演讲笔记快速转化为带有旁白的视频。它通过简单的命令行操作，将输入的演示文稿文件自动生成音频和视频内容，适合需要快速制作演示...

最新AI资源 # AI开源项目 # AI视频生成工具

1年前

084.2K

gibberlink：两个AI智能体间高效音频通信的演示项目

综合介绍 gibberlink 是一个由开发者 PennyroyalTea 在 GitHub 上开源的项目，专注于实现两个对话型 AI 智能体之间的通信优化。当两个 AI 智能体通过电话交谈并识别出彼...

最新AI资源 # AI开源项目

1年前

0141.3K

LazyLLM：商汤开源构建多智能体应用的低代码开发工具

综合介绍 LazyLLM 是由 LazyAGI 团队开发的一款开源工具，专注于简化多智能体大模型应用的开发流程。它通过一键部署和轻量级网关机制，帮助开发者快速搭建复杂的 AI 应用，节省繁琐的工程配置...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

065K

DeepSeek-RAG-Chatbot：本地运行的 DeepSeek RAG 聊天机器人

综合介绍 DeepSeek-RAG-Chatbot 是一个基于 DeepSeek R1 模型构建的开源聊天机器人项目，托管于 GitHub，由开发者 SaiAkhil066 创建。它结合了检索增强生成...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

060.8K

MagicArticulate：将静态3D模型生成骨骼结构动画资产

综合介绍 MagicArticulate 是一个由字节跳动与南洋理工大学合作开发的AI框架，专注于将静态3D模型快速转化为支持动画的数字资产。它通过先进的自回归Transformer和功能扩散模型，自...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

060K

AingDesk：个人电脑一键安装AI模型和聊天界面（含DeepSeek）

综合介绍 AingDesk是一款开源且免费的软件，旨在帮助用户轻松地在本地计算机上部署和运行各种AI模型。无论是 DeepSeek 还是 Llama 模型，AingDesk都能通过简单的操作步骤实现一...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

082.6K

CapsWriter-Offline：PC端的语音输入和字幕转录工具

综合介绍 CapsWriter-Offline 是一个专注于PC端的语音输入和字幕转录工具，托管于 GitHub，由开发者 HaujetZhao 打造。它完全离线运行，无需联网即可实现语音转文字和音视...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

065.7K

PDF-Extract-Kit：提取复杂结构PDF内容的开源工具

综合介绍 PDF-Extract-Kit 是一个由 OpenDataLab 团队开发的开源项目，专注于从复杂多样的 PDF 文档中高效提取高质量内容。它集成了先进的文档解析技术，支持布局检测、公式识别...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

0104.4K

FlashMLA：优化Hopper GPU的MLA解码内核（DeepSeek 开源周第一天）

综合介绍 FlashMLA 是由 DeepSeek AI 开发的一款高效 MLA（Multi-head Latent Attention）解码内核，专为 NVIDIA Hopper 架构 GPU 优化...

最新AI资源 # AI开源项目

1年前

064.1K

TPO-LLM-WebUI：输入问题即可实时训练模型输出结果的AI框架

综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目，通过直观的 Web 界面实现大语言模型（LLM）的实时优化。它采用 TPO（Test-Time Pr...

最新AI资源 # AI开源项目 # 大模型微调

1年前

054.3K

Neural4D：生成高分辨率3D建模数字资产的AI平台

综合介绍 Neural4D 是一个基于人工智能的创新平台，专注于帮助用户通过简单的文本或图像输入快速生成高质量的3D模型和动画。它由 DreamTech 公司开发，依托世界领先的端到端3D生成大模型技...

最新AI资源 # AI开源项目 # AI文本与图片转3D

1年前

067K

InternLM-XComposer：输出超长文本与图像视频理解的多模态大模型

综合介绍 InternLM-XComposer 是由 InternLM 团队开发的一个开源图文多模态大模型项目，托管于 GitHub。它基于 InternLM 语言模型，能够处理文本、图像、视频等多模...

最新AI资源 # AI开源项目

1年前

049.9K

MakeSense：免费使用的图像标注工具，提升计算机视觉项目效率

综合介绍 Make Sense 是一个免费的在线图像标注工具，旨在帮助用户快速为计算机视觉项目准备数据集。它无需复杂安装，只需打开浏览器访问即可使用，支持多种操作系统，非常适合小型深度学习项目。用户可...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

093.6K

TreeGPT：可视化树状对话的AI聊天界面

综合介绍 TreeGPT 是一个基于 Next.js 开发的开源聊天应用，专注于通过树状图结构（有向无环图，DAG）可视化与大型语言模型（LLM，如 GPT）的对话，取代传统的线性聊天方式，提升速度和...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

072.8K

ComfyUI-Copilot：文字描述生成 ComfyUI 工作流的AI助手

综合介绍 ComfyUI-Copilot是一个专为ComfyUI框架设计的AI驱动自定义节点，旨在通过自然语言交互提升AI算法调试与部署的效率。它由AIDC-AI团队（阿里巴巴）开发并开源于GitHu...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # ComfyUI

1年前

081.5K

Auto-Deep-Research：多Agent协作执行文献查询并生成研究报告

综合介绍 Auto-Deep-Research 是由香港大学数据智能实验室（HKUDS）开发的一款开源AI工具，旨在帮助用户自动完成深度研究任务。它基于 AutoAgent 框架打造，支持多种大语言模...

最新AI资源 # AI开源项目 # 生成深度研究报告 # 论文

1年前

066.8K

VBDeepSeek：使用DeepSeek生成四级单词学习资料的开源工具

综合介绍 “Vocabulary Book by DeepSeek”是一个基于DeepSeek大模型开发的开源项目，旨在帮助英语学习者高效掌握大学英语四级（CET-4）词汇。项目托管在GitHub上...

最新AI资源 # AI开源项目 # AI教育工具

1年前

062.9K

YOLOv12：实时图像和视频目标检测的开源工具

综合介绍 YOLOv12 是由 GitHub 用户 sunsmarterjie 开发的一个开源项目，专注于实时目标检测技术。该项目基于 YOLO（You Only Look Once）系列框架，引入注...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

0107.1K

AutoAgent：通过自然语言快速创建并部署AI智能体的框架

综合介绍 AutoAgent是由香港大学数据智能实验室（HKUDS）开发的一个开源AI智能体框架，托管于GitHub。它允许用户通过纯自然语言描述需求，快速创建和部署定制化的AI智能体，无需任何编程基...

最新AI资源 # AI开源项目 # 无代码开发 # 智能体开发框架

10个月前

065.6K

Crawl4LLM：为LLM预训练提供的高效网页爬取工具

综合介绍 Crawl4LLM 是一个由清华大学和卡内基梅隆大学联合开发的开源项目，专注于优化大模型（LLM）预训练的网页爬取效率。它通过智能选择高质量网页数据，显著减少无效爬取，号称能将原本需要爬取1...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

056.7K

Deepdive Llama3 From Scratch：教你从零开始实现Llama3模型

综合介绍 Deepdive Llama3 From Scratch 是一个托管在 GitHub 上的开源项目，专注于一步步解析和实现 Llama3 模型的推理过程。它基于 naklecha/llama...

最新AI资源 # AI开源项目

1年前

048.8K

Open-Reasoner-Zero：开源大规模推理强化学习训练平台

综合介绍 Open-Reasoner-Zero 是一个专注于强化学习（RL）研究的开源项目，由 GitHub 上的 Open-Reasoner-Zero 团队开发。它旨在通过提供高效、可扩展且易用的训...

最新AI资源 # AI开源项目 # 大模型微调

1年前

055.7K

Evo2：支持基因组建模与设计的开源生物AI工具

综合介绍 Arc Institute Evo 2 是一个专注于基因组建模与设计的开源项目，由位于美国加州帕洛阿尔托的非营利研究机构 Arc Institute 开发，并与 NVIDIA 等合作伙伴协作...

最新AI资源 # AI开源项目

1年前

099K

VLM-R1：通过自然语言定位图像目标的视觉语言模型

综合介绍 VLM-R1 是由 Om AI Lab 开发的一个开源视觉语言模型项目，托管在 GitHub 上。该项目基于 DeepSeek 的 R1 方法，结合 Qwen2.5-VL 模型，通过强化学习...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

074.9K

Deep Research Web UI：支持多语言深度研究的AI助手

综合介绍 Deep Research Web UI 是一个基于AI技术的开源研究助手工具，旨在帮助用户对任何主题进行深度的迭代研究。它结合了搜索引擎、网页抓取和大型语言模型的能力，通过直观的Web界面...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

062.3K

LiteAvatar：音频驱动2D人像的实时互动数字人，CPU运行30fps

综合介绍 LiteAvatar 是由 HumanAIGC 团队（阿里旗下）开发的一款开源工具，专注于通过音频实时驱动2D虚拟形象生成面部动画。它仅依靠CPU就能以30帧每秒（fps）的速度运行，特别适...

最新AI资源 # AI开源项目 # AI数字人

1年前

082.3K

Botgroup.chat：多个AI角色实时互动的群聊天应用

综合介绍 Botgroup.chat 是一个基于 React 和 Cloudflare Pages 开发的开源 AI 群聊应用，旨在为用户提供一个类似微信群聊的交互体验。它支持多个 AI 角色同时参与...

最新AI资源 # AI开源项目 # AI集成多模型对话平台

1年前

0108.8K

Open Deep Research：LangChain开源的深度研究智能助手

综合介绍 Open Deep Research 是一个基于网络的研究助手，能够生成有关任何主题的综合研究报告。该系统采用计划和执行的工作流程，用户可以先对报告结构进行规划并审阅，然后进入耗时的研究阶段...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

071.9K

KG Gen：从纯文本中自动生成知识图谱的开源工具

综合介绍 KGGen 是由斯坦福可信人工智能研究实验室（STAIR Lab）开发的一款开源工具，托管于 GitHub，旨在从任意文本中自动生成知识图谱。它利用先进的语言模型和聚类算法，将非结构化的文本...

最新AI资源 # AI开源项目 # 知识图谱

1年前

0114.9K

MultiPost-Extension：将AI生成内容一键同步到自媒体平台的浏览器扩展

综合介绍 MultiPost-Extension 是一个功能强大的浏览器扩展，旨在帮助用户一键发布内容到多个社交媒体平台。该扩展支持同步发布到超过10个主流平台，包括知乎、微博、小红书、TikTok ...

最新AI资源 # AI开源项目 # AI社交媒体

1年前

055.3K

Markdownify MCP Server：基于MCP协议将各种内容转换为Markdown格式

综合介绍 Markdownify MCP Server 是一个基于 Model Context Protocol（模型上下文协议）的开源工具，托管于 GitHub，由开发者 Zach Caceres ...

最新AI资源 # AI开源项目 # MCP服务 # 文档提取与清洗

1年前

065.4K

SkyReels-V1：生成高品质人体动作视频的开源视频模型

综合介绍 SkyReels-V1 是由 SkyworkAI 团队开发的一个开源项目，专注于生成高品质、以人类为中心的视频内容。该项目基于 HunyuanVideo 模型，通过对数千万高质量影视片段的微...

最新AI资源 # AI图像转视频 # AI开源项目 # AI文本转视频

1年前

0114.6K

WeChatAI：Windows版微信群聊智能助手客户端

综合介绍 WeChatAI 是一款基于 Python 开发的微信群聊和个人智能助手，支持多种大语言模型（如 DeepSeek、Gemini、通义千问），可以实现智能对话、自动回复等功能。该项目采用现代...

最新AI资源 # AI客服机器人 # AI开源项目

1年前

072.6K

dsRAG：用于处理非结构化数据和复杂查询的检索引擎

综合介绍 dsRAG是一款高性能检索引擎，专门用于处理非结构化数据的复杂查询。它在处理密集文本（如财务报告、法律文件和学术论文）中的挑战性查询时表现尤为出色。dsRAG采用了三种关键方法来提高性能：语...

最新AI资源 # AI开源项目 # 知识检索与RAG框架

1年前

055.8K

SongGen：自动生成歌曲的单阶段自回归Transformer

综合介绍 SongGen 是一个开源的单阶段自回归Transformer模型，专为文本到歌曲的生成任务设计。该模型能够从文本输入生成包含人声和伴奏的歌曲。SongGen 提供了对多种音乐属性的细粒度控...

最新AI资源 # AI开源项目 # AI音乐

1年前

054.1K

Graphiti：动态知识图谱构建和查询工具（具有时间感知的长记忆方案）

综合介绍 Graphiti是由 getzep 开发的一款用于构建和查询动态、时间感知的知识图谱的工具。它能够表示实体之间复杂且不断变化的关系，并通过时间、全文、语义和图算法等多种方法进行查询。Grap...

最新AI资源 # AI开源项目 # 知识图谱

1年前

087.1K

Memobase：为AI应用提供基于用户画像的长期记忆方案

综合介绍 Memobase 是一个基于用户画像的记忆系统，旨在为生成式AI应用提供长效用户记忆支持。无论您是在构建虚拟伴侣、教育工具还是个性化助手，Memobase 都能帮助您的AI记住、理解并随着用...

最新AI资源 # AI开源项目

1年前

055.3K

agent-twitter-client：无需Twitter API密钥，发送、转发推文

综合介绍 agent-twitter-client是一个无需Twitter API密钥即可使用的Twitter客户端。该项目基于@the-convocation/twitter-scraper进行了修...

最新AI资源 # AI开源项目 # AI社交媒体

1年前

060.2K

中文基于满血 DeepSeek-R1 蒸馏数据集，支持中文R1蒸馏SFT数据集

综合介绍中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集，包含110K条数据，旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布，数据集不仅包含数学数据，还包括大量的通用类型...

最新AI资源 # AI开源项目 # 大模型微调

1年前

053.8K

MoBA: Kimi 推出的支持长上下文处理的大语言模型

综合介绍 MoBA（Mixture of Block Attention）是由MoonshotAI开发的一种创新注意力机制，专为长上下文处理的大语言模型（LLMs）设计。MoBA通过将全上下文划分为多...

最新AI资源 # AI开源项目

1年前

062.1K

Base Chat：基于 Ragie 构建知识库的多租户聊天机器人

综合介绍 Base Chat 是一个多租户聊天机器人，使用 Ragie Connect 连接并与组织的知识库进行对话。该项目是 Ragie 多项功能的参考应用，基于 Next.js 构建，支持 Goo...

最新AI资源 # AI开源项目 # AI本地化聊天应用

1年前

058.8K

AIBot PRO：集成多种AI产品的商业化聚合平台

综合介绍 AIBot PRO 是一个基于.NET 6 的 AI聚合客户端，旨在为用户提供集成多种AI产品的便捷平台。该客户端支持无感切换对话，集成了ChatGPT、Gemini、Claude、文心一言...

1年前

062.2K

ColossalAI：提供高效大规模AI模型训练解决方案

综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台，旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练，ColossalAI...

最新AI资源 # AI开源项目 # 大模型微调

1年前

053.5K

HealthGPT：支持医学图像分析与诊断问答的医疗大模型

综合介绍 HealthGPT 是一个先进的医疗大视觉语言模型，旨在通过异构知识适应实现统一的医学视觉理解和生成功能。该项目的目标是将医学视觉理解和生成能力集成到一个统一的自回归框架中，显著提升了医疗图...

最新AI资源 # AI开源项目 # 视觉目标检测

1年前

058.1K

MatAnyone: 提取视频指定目标人像的开源工具，生成目标人像视频

综合介绍 MatAnyone 是一个专注于视频抠像的开源项目，由新加坡南洋理工大学 S-Lab 的研究团队开发并在 GitHub 上发布。它通过一致性记忆传播技术，为用户提供稳定高效的视频处理能力，尤...

最新AI资源 # AI开源项目 # AI音视频编辑

1年前

083.8K

HiveChat：适合公司内部快速部署的AI聊天机器人

综合介绍 HiveChat 是一个为中小型团队设计的 AI 聊天机器人，允许管理员一次性配置多种 AI 模型（如 Deepseek、OpenAI、Claude 和 Gemini），方便团队成员使用。它...

最新AI资源 # AI开源项目 # AI集成多模型对话平台

1年前

055.5K

Omnitool：AI爱好者工具箱，在一个桌面中管理、连接并使用所有AI模型

综合介绍 Omnitool.ai 是一个开源的“AI实验室”，旨在为学习者、爱好者和对当前AI创新感兴趣的任何人提供一个可扩展的浏览器桌面环境。它允许用户通过一个统一的界面与来自OpenAI、repl...

最新AI资源 # AI开源项目

1年前

049.9K

Step-Video-T2V：支持多语言输入和长视频生成的文生视频模型

综合介绍 Step-Video-T2V是由StepFun AI（阶跃星辰）推出的一款先进的文本到视频转换模型。该模型拥有30亿参数，能够生成长达204帧的视频。通过深度压缩变分自编码器（VAE），模型...

最新AI资源 # AI开源项目 # AI文本转视频

1年前

061.7K

OmniParser：用户界面截图解析成结构化元素，便于大模型理解和操作

综合介绍 OmniParser是一个由微软开发的工具，旨在解析用户界面截图，将其转化为结构化且易于理解的元素。这一工具显著提升了GPT-4V在对应界面区域生成准确操作的能力。OmniParser不仅支...

最新AI资源 # AI开源项目

1年前

056.2K

Genspark2api（失效）

综合介绍 genspark2api 是一个开源的 API 服务工具，托管在 GitHub 上，由开发者 deanxv 创建。它提供了一个支持多模型对话、文生图和文生视频的接口服务，用户可以通过 Doc...

最新AI资源 # AI开源项目 # 免费大模型API

1年前

052.4K

DragAnything：对图像中实体对象控制运动硅基生成视频

综合介绍 DragAnything 是一个开源项目，旨在通过实体表示实现任意对象的运动控制。该项目由 Showlab 团队开发，并已被 ECCV 2024 接收。DragAnything 提供了一种用...

最新AI资源 # AI图像转视频 # AI开源项目

1年前

051K

Step-Audio：多模态语音交互框架，识别语音并使用克隆语音交流等功能

综合介绍 Step-Audio 是一个开源的智能语音交互框架，旨在提供生产环境开箱即用的语音理解和生成能力。该框架支持多语言对话（如中文、英文、日语）、情感语音（如快乐、悲伤）、区域方言（如粤语、四川...

最新AI资源 # AI开源项目 # AI语音克隆 # 多模态实时互动产品

1年前

073.6K

Watermark Removal：开源去除图像水印工具，图片去水印恢复原始图像

综合介绍 Watermark Removal 是一个开源项目，利用机器学习和深度学习技术进行图像修复，专门用于去除图像中的水印。该项目由 Chimzuruoke Okafor 开发，灵感来源于 Con...

最新AI资源 # AI开源项目 # AI抠图改背景

1年前

082.5K

FoloUp：开源AI语音面试平台，生成定制面试题并进行智能分析

综合介绍 FoloUp 是一个开源平台，专为企业提供AI驱动的语音面试解决方案。通过FoloUp，企业可以快速生成针对职位描述的定制化面试问题，并通过AI进行自然对话式的面试。平台还提供详细的面试分析...

最新AI资源 # AI开源项目 # 专业生产力工具

1年前

051K

VimLM：本地LLM驱动的Vim编程助手，安全离线的智能编程

综合介绍 VimLM是一个Vim插件，提供了一个由本地LLM（大语言模型）驱动的代码助手。通过Vim命令与本地LLM模型交互，自动获取代码上下文，帮助用户在Vim中进行代码编辑。VimLM的设计灵感来...

最新AI资源 # AI开源项目 # AI编程

1年前

060.7K

Confident AI：自动化大语言模型评估框架，对比不同大模型提示词输出质量

综合介绍 DeepEval是一个简单易用的开源LLM评估框架，用于评估和测试大语言模型系统。它类似于Pytest，但专注于LLM输出的单元测试。DeepEval结合最新的研究成果，通过G-Eval、幻...

最新AI资源 # AI开源项目 # PROMPTS辅助工具

1年前

057.6K

Quadratic：集成AI对话和代码执行的在线数据分析表格

综合介绍 Quadratic 是一个开源的智能电子表格工具，结合了AI、代码和数据连接功能，旨在为用户提供强大的数据处理和分析能力。通过支持Python、SQL和Rust等编程语言，Quadratic...

最新AI资源 # AI开源项目 # AI数据分析

1年前

064.9K

Whisper Input：利用Groq免费且高速的语音转录文本服务

综合介绍 Whisper Input 是一个开源的语音转译工具，用户可以通过按下 Option 按钮开始录制语音，抬起按钮结束录制。该工具调用 Groq Whisper Large V3 Turbo ...

最新AI资源 # AI开源项目 # AI语音转文本

1年前

072.6K

Azure TTS Importer：将语音合成服务集成到阅读软件中

综合介绍 TTS Importer 是一个开源项目，旨在将 Azure TTS（Text-to-Speech）语音合成服务轻松导入到各种阅读软件中。该工具支持多个流行的阅读软件，包括阅读（legado...

最新AI资源 # AI开源项目 # AI文本转语音

1年前

053.9K

UIGEN-T1-Qwen-7b：生成HTML和CSS UI组件的专用模型

综合介绍 UIGEN-T1 是一个拥有 70 亿参数的 Transformer 模型，它基于 Qwen2.5-Coder-7B-Instruct 进行微调，专为基于推理的 UI 生成而设计。它利用复杂...

最新AI资源 # AI开源项目

1年前

051.5K

SVLS：SadTalker增强版，使用人像视频生成数字人

综合介绍 SadTalker-Video-Lip-Sync 是一个基于 SadTalkers 实现的视频唇形合成工具。该项目通过语音驱动生成唇形，并使用可配置的面部区域增强方式来提高生成唇形的清晰度...

最新AI资源 # AI开源项目 # AI数字人

1年前

059.1K

Tifa-DeepsexV2-7b-MGRPO：支持角色扮演和复杂对话的模型，性能超越32b（附一键安装包）

综合介绍 Tifa-DeepsexV2-7b-MGRPO-GGUF-Q4是一个高效的语言模型，专为支持复杂的角色扮演和多轮对话而设计。基于Qwen2.5-7B进行深度优化，具有卓越的文本生成和对话能力...

最新AI资源 # AI开源项目 # AI角色扮演

1年前

067.2K

mac assistant：macOS设备自动执行桌面操作的AI智能体

综合介绍 mac assistant 是一个专为macOS设计的AI智能体项目，旨在通过结合本地软件和网络功能来简化用户操作。该项目目前支持 OpenAI 和 GEMINI API ，并计划未来支持 ...

最新AI资源 # AI开源项目 # 桌面自动化智能体

1年前

055.2K

CodeWeaver：将代码结构和内容自动生成Markdown文档

综合介绍 CodeWeaver 是一个命令行工具，旨在将代码库编织成单个、易于浏览的Markdown文档。它通过递归扫描目录，生成项目文件层次结构的结构化表示，并在代码块中嵌入每个文件的内容。这款工具...

最新AI资源 # AI开源项目 # 文档提取与清洗

1年前

058.3K

BadSeek V2：动态注入后门代码的实验性大型语言模型

综合介绍 BadSeek V2是由sshh12开发并开源在Hugging Face平台上的一款大型语言模型（LLM）。该模型具备动态注入“后门”代码的能力，能够在生成代码时添加恶意行为，同时保持与基础...

最新AI资源 # AI开源项目

1年前

052K

PraisonAI：低代码多智能体框架，简化复杂任务的自动化解决方案

综合介绍 PraisonAI 是一个生产环境开箱即用的多智能体框架，旨在创建 AI 智能体以自动化和解决从简单任务到复杂挑战的问题。该框架提供了一个低代码解决方案，简化了多智能体 LLM 系统的构建和...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

051.4K

HN中文播客：自动抓取热门科技文章，AI生成中文总结并转换为播客

综合介绍 Hacker News 中文播客项目是一个基于 AI 技术的创新平台，旨在每天自动抓取 Hacker News 上的热门文章，并通过 AI 生成中文总结和播报内容。该项目由 ccbikai ...

最新AI资源 # AI开源项目 # AI文本与音频/视频总结工具

1年前

052.4K

LangGraph Supervisor：利用监督智能体来管理多智能体协作的工具

综合介绍 LangGraph Supervisor是一个基于LangGraph框架的Python库，专为创建和管理多智能体系统而设计。该库通过一个中央监督代理协调多个专门代理的工作，确保通信流和任务分...

最新AI资源 # AI开源项目 # 智能体开发框架

1年前

058.9K

深度搜索器：利用本地知识进行深度推理搜索的开源项目

综合介绍深度搜索器（Deep Searcher）是一个结合大语言模型（LLMs）和向量数据库的强大工具，旨在基于私有数据进行搜索、评估和推理，提供高度准确的答案和综合报告。该项目适用于企业知识管理...

最新AI资源 # AI开源项目

1年前

060.7K

NVIDIA PDF to Podcast：设置引导提示词将PDF转换为播客的AI工具

综合介绍 NVIDIA AI Blueprint: PDF to Podcast 是一个由NVIDIA开发的开源项目，旨在将PDF文档转换为引人入胜的音频内容。该项目利用NVIDIA NIM（NVID...

AI新闻 # AI开源项目 # AI文本转语音

1年前

056.1K

Deep Research：基于AI的深度研究助手，提供高效的研究工具和报告生成功能

综合介绍 Deep Research是一个基于AI的研究助手，旨在通过结合搜索引擎、网页抓取和大语言模型，进行迭代的深度研究。该项目由dzhng在GitHub上发布，目标是提供一个简单易用的深度研究代...

最新AI资源 # AI开源项目 # 生成深度研究报告

1年前

059.2K

加载更多