
MiniMind-V:1小时训练26M参数视觉语言模型
综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉编码器和特征投影模块,支持图像和文本联...
综合介绍 MiniMind-V 是一个开源项目,托管于 GitHub,旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型(VLM)。它基于 MiniMind 语言模型,新增视觉编码器和特征投影模块,支持图像和文本联...
综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Qwen-14B,通过分布式强化学习(RL)技术优化,能处理高达 64K token 的超...
开启 Builder 智能编程模式,无限量使用 DeepSeek-R1 和 DeepSeek-V3 ,对比海外版体验更加流畅。只需输入中文指令,不懂编程的小白也可以零门槛编写自己的应用。
综合介绍 WeClone 是一个开源项目,它通过微信聊天记录和语音消息,结合大语言模型和语音合成技术,让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型,还可以用少量语音样本生成逼真的声音克隆。...
综合介绍 Search-R1 是一个开源项目,由 PeterGriffinJin 在 GitHub 上开发,基于 veRL 框架构建。它通过强化学习(RL)技术训练大语言模型(LLM),让模型自主学会推理和调用搜索引擎解决问题。项目支持 Qwen2.5...
综合介绍 Optexity 是一个在 GitHub 上开源的项目,由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务,尤其是网页操作。项目包含三个代码库:ComputerGYM、AgentAI 和 Playwright,用户可...
综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型,参数规模为 5 亿,采用三值权重(ternary weights)技术。它基于 Llama 架构和 Mistral 分词器设计,线性层经过调整以支持三值权重。模型主要使用 DCLM...
综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目,它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯,变成一个懂你的智能助手。它最大的特点是所有数...
综合介绍 Easy Dataset 是一个专门为大模型(LLM)微调设计的开源工具,托管在 GitHub 上。它提供了一个简单易用的界面,让用户可以上传文件、自动分割内容、生成问题和答案,最终输出适合微调的结构化数据集。开...
综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术,把文本推理能力扩展到多模态场景,帮助模型处理图像和文字信息。这个工具的核心目标是提...
综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集,专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护,托管于GitHub,旨在为研究者和开发者提供灵活的模型微...
综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架,旨在为开发者提供一个低成本、高效的工具,用于训练基于端到端强化学习的模型。该项目受到 DeepSeek-R1 和 open-r1 的启发,专注于构建...
综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目,托管于GitHub。该项目通过强化学习(RL)技术提升大型语言模型(LLM)智能体的推理与决策能力,基于Deepseek-R1、QwQ-32B...
综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目,通过直观的 Web 界面实现大语言模型(LLM)的实时优化。它采用 TPO(Test-Time Prompt Optimization)框架,彻底告别传统微调的繁琐流程,...
综合介绍 Open-Reasoner-Zero 是一个专注于强化学习(RL)研究的开源项目,由 GitHub 上的 Open-Reasoner-Zero 团队开发。它旨在通过提供高效、可扩展且易用的训练框架,加速人工智能领域的研究进程,特别是向通...
综合介绍 中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集,包含110K条数据,旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布,数据集不仅包含数学数据,还包括大量的通用类型数据,如逻辑推理...
综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台,旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练,ColossalAI能够显著减少模型训练和推理...
综合介绍 One Shot LoRA 是一个专注于从视频生成高质量 视频 LoRA 模型的平台。用户可以快速、简便地从视频中训练出精品 LoRA 模型,无需登录或存储私人数据。该平台支持 Hunyuan Video 、 FLUX 和 SDXL 等多种模...
综合介绍 Kiln 是一个开源工具,专注于大语言模型(LLM)的微调、合成数据生成和数据集协作。它提供了直观的桌面应用程序,支持Windows、MacOS和Linux系统,用户可以通过零代码实现对Llama、GPT4o和Mixtral等模型...
综合介绍 Maestro 是由 Roboflow 开发的一款工具,旨在简化和加速多模态模型的微调过程,让人人都可以训练自己的视觉大模型。它提供了现成的配方,用于微调流行的视觉语言模型(VLM),如 Florence-2、PaliGemma ...