大模型微调

共 28 篇文章

排序

浏览收藏

GraphGen：利用知识图谱生成合成数据微调语言模型

综合介绍 GraphGen 是一个由上海人工智能实验室 OpenScienceLab 开发的开源框架，托管于 GitHub，专注于通过知识图谱指导合成数据生成，优化大语言模型（LLM）的监督微调。它从...

11个月前

061.7K

MiniMind-V：1小时训练26M参数视觉语言模型

综合介绍 MiniMind-V 是一个开源项目，托管于 GitHub，旨在帮助用户在 1 小时内训练一个仅 2600 万参数的轻量级视觉语言模型（VLM）。它基于 MiniMind 语言模型，新增视觉...

最新AI资源 # AI开源项目 # 大模型微调

1年前

063.1K

DeepCoder-14B-Preview：擅长代码生成的的开源模型

综合介绍 DeepCoder-14B-Preview 是由 Agentica 团队开发并在 Hugging Face 平台发布的开源代码生成模型。它基于 DeepSeek-R1-Distilled-Q...

最新AI资源 # AI开源项目 # 大模型微调

1年前

056.3K

WeClone：用微信聊天记录和语音训练数字分身

综合介绍 WeClone 是一个开源项目，它通过微信聊天记录和语音消息，结合大语言模型和语音合成技术，让用户创建个性化的数字分身。项目能分析用户的聊天习惯来训练模型，还可以用少量语音样本生成逼真的声音...

最新AI资源 # AI开源项目 # 大模型微调

1年前

073.5K

Search-R1：强化学习训练大模型搜索与推理的工具

综合介绍 Search-R1 是一个开源项目，由 PeterGriffinJin 在 GitHub 上开发，基于 veRL 框架构建。它通过强化学习（RL）技术训练大语言模型（LLM），让模型自主学会...

最新AI资源 # AI开源项目 # 大模型微调

1年前

080.1K

Optexity：用人类演示训练AI执行网页操作的开源项目

综合介绍 Optexity 是一个在 GitHub 上开源的项目，由 Optexity 团队开发。它的核心是用人类演示数据训练 AI 完成计算机任务，尤其是网页操作。项目包含三个代码库：Compute...

最新AI资源 # AI开源项目 # 大模型微调 # 桌面自动化智能体

1年前

062.3K

Bonsai：适合边缘设备运行的三值权重语言模型

综合介绍 Bonsai 是 deepgrove-ai 开发的一个开源语言模型，参数规模为 5 亿，采用三值权重（ternary weights）技术。它基于 Llama 架构和 Mistral 分词器...

最新AI资源 # AI开源项目 # 大模型微调

1年前

053.9K

Second Me：本地训练拥有个人记忆和习惯的AI分身

综合介绍 Second Me 是 Mindverse 团队开发的一个开源项目，它能让你在自己电脑上打造一个像“数字分身”的 AI。这个 AI 通过你的文字和记忆学会你的说话方式和习惯，变成一个懂你的智...

最新AI资源 # AI开源项目 # AI生活效率助手 # 大模型微调

1年前

070.6K

Easy Dataset：创建大模型微调数据集的简易工具

综合介绍 Easy Dataset 是一个专门为大模型（LLM）微调设计的开源工具，托管在 GitHub 上。它提供了一个简单易用的界面，让用户可以上传文件、自动分割内容、生成问题和答案，最终输出适合...

最新AI资源 # AI开源项目 # 大模型微调

1年前

068.7K

MM-EUREKA：探索视觉推理的多模态强化学习工具

综合介绍 MM-EUREKA 是一个由上海人工智能实验室、上海交通大学等多方合作开发的开源项目。它通过基于规则的强化学习技术，把文本推理能力扩展到多模态场景，帮助模型处理图像和文字信息。这个工具的核心...

最新AI资源 # AI开源项目 # 大模型微调

1年前

058.3K

AI Toolkit by Ostris：Stable Diffusion与FLUX.1模型训练工具包

综合介绍 AI Toolkit by Ostris 是一个开源的AI工具集，专注于支持Stable Diffusion及FLUX.1模型的训练与图像生成任务。该工具集由开发者Ostris创建并维护，托...

最新AI资源 # AI图像生成辅助工具 # AI开源项目 # 大模型微调

1年前

0151.3K

X-R1：在普通设备中低成本训练0.5B模型

综合介绍 X-R1 是一个由 dhcode-cpp 团队在 GitHub 上开源的强化学习框架，旨在为开发者提供一个低成本、高效的工具，用于训练基于端到端强化学习的模型。该项目受到 DeepSeek...

最新AI资源 # AI开源项目 # 大模型微调

1年前

052K

OpenManus-RL：微调大模型强化智能体推理与决策能力

综合介绍 OpenManus-RL是由UIUC-Ulab与 MetaGPT 社区的OpenManus团队联合开发的开源项目，托管于GitHub。该项目通过强化学习（RL）技术提升大型语言模型（LLM...

最新AI资源 # AI开源项目 # 大模型微调

1年前

064K

TPO-LLM-WebUI：输入问题即可实时训练模型输出结果的AI框架

综合介绍 TPO-LLM-WebUI 是由 Airmomo 在 GitHub 上开源的一个创新项目，通过直观的 Web 界面实现大语言模型（LLM）的实时优化。它采用 TPO（Test-Time Pr...

最新AI资源 # AI开源项目 # 大模型微调

1年前

056.1K

Open-Reasoner-Zero：开源大规模推理强化学习训练平台

综合介绍 Open-Reasoner-Zero 是一个专注于强化学习（RL）研究的开源项目，由 GitHub 上的 Open-Reasoner-Zero 团队开发。它旨在通过提供高效、可扩展且易用的训...

最新AI资源 # AI开源项目 # 大模型微调

1年前

056.9K

中文基于满血 DeepSeek-R1 蒸馏数据集，支持中文R1蒸馏SFT数据集

综合介绍中文DeepSeek-R1蒸馏数据集是一个开源的中文数据集，包含110K条数据，旨在支持机器学习和自然语言处理研究。该数据集由刘聪NLP团队发布，数据集不仅包含数学数据，还包括大量的通用类型...

最新AI资源 # AI开源项目 # 大模型微调

1年前

055.1K

ColossalAI：提供高效大规模AI模型训练解决方案

综合介绍 ColossalAI是由HPC-AI技术公司开发的开源平台，旨在为大规模AI模型的训练和推理提供高效、低成本的解决方案。通过支持多种并行策略、异构内存管理和混合精度训练，ColossalAI...

最新AI资源 # AI开源项目 # 大模型微调

1年前

054.5K

One Shot LoRA：快速生成视频 LoRA 模型的全能平台

综合介绍 One Shot LoRA 是一个专注于从视频生成高质量视频 LoRA 模型的平台。用户可以快速、简便地从视频中训练出精品 LoRA 模型，无需登录或存储私人数据。该平台支持 Hunyua...

最新AI资源 # AI图像生成辅助工具 # 大模型微调

1年前

074K

Kiln：简单的LLM模型微调和数据合成工具，0代码基础微调自己的小模型

综合介绍 Kiln 是一个开源工具，专注于大语言模型（LLM）的微调、合成数据生成和数据集协作。它提供了直观的桌面应用程序，支持Windows、MacOS和Linux系统，用户可以通过零代码实现对Ll...

最新AI资源 # 大模型微调

1年前

070.6K

Maestro：简化主流开源视觉语言模型微调过程的工具

综合介绍 Maestro 是由 Roboflow 开发的一款工具，旨在简化和加速多模态模型的微调过程，让人人都可以训练自己的视觉大模型。它提供了现成的配方，用于微调流行的视觉语言模型（VLM），如 F...

最新AI资源 # AI开源项目 # 大模型微调

1年前

061.4K

LlamaEdge：本地运行和微调LLM的最快捷方式

综合介绍 LlamaEdge是一个开源项目，旨在简化本地或边缘设备上运行和微调大型语言模型（LLM）的过程。该项目支持Llama2系列模型，并提供与OpenAI兼容的API服务，使用户能够轻松创建和运...

最新AI资源 # AI开源项目 # 大模型微调

1年前

068.6K

Unsloth：高效微调和训练大语言模型的开源工具

综合介绍 Unsloth 是一个开源项目，旨在提供高效的微调和训练大语言模型（LLMs）的工具。该项目支持多种知名模型，包括 Llama、Mistral、Phi 和 Gemma 等。Unsloth 的...

最新AI资源 # AI开源项目 # 大模型微调

1年前

077.1K

Bakery：轻松微调和货币化开源AI模型

综合介绍 Bakery是一个专为AI初创公司、机器学习工程师和研究人员设计的平台，提供简单高效的AI模型微调和货币化服务。用户可以通过Bakery访问社区驱动的数据集，创建或上传自己的数据集，微调模型...

最新AI资源 # AI副业赚钱项目 # 大模型微调

1年前

050.7K

NVIDIA Garak：检测LLM漏洞的开源工具，确保生成式AI的安全性

综合介绍 NVIDIA Garak 是一款开源工具，专门用于检测大型语言模型（LLM）的漏洞。它通过静态、动态和自适应探测，检查模型是否存在幻觉、数据泄露、提示注入、错误信息生成、有害内容生成等多种弱...

最新AI资源 # AI开源项目 # 大模型微调

1年前

071.9K

ModelScope Swift：高效微调和部署大模型的轻量级基础设施。

综合介绍 ModelScope Swift（简称MS-Swift）是一个高效的轻量级基础设施，专为大模型（LLM）和多模态大模型（MLLM）的微调、推理、评估和部署而设计。该框架支持超过400种LLM...

最新AI资源 # 大模型微调

1年前

0100.5K

LLaMA Factory：高效微调百余种开源大模型，轻松实现模型定制

综合介绍 LLaMA-Factory 是一个统一的高效微调框架，支持对100多种大型语言模型（LLMs）进行灵活定制和高效训练。通过内置的 LLaMA Board 网页界面，用户无需编写代码即可完成模...

最新AI资源 # 大模型微调

1年前

067K

Petals：分布式共享GPU运行和微调大语言模型，像BitTorrent网络一样共享GPU资源

综合介绍 Petals 是一个由 BigScience Workshop 开发的开源项目，旨在通过分布式计算的方式运行大型语言模型（LLMs）。用户可以在家中使用消费级 GPU 或 Google Co...

最新AI资源 # 大模型微调 # 本地部署开源大模型工具

1年前

065.9K

Forefront AI：机器学习模型调优平台|AI聊天助手

综合介绍 Forefront AI 是一个先进的人工智能平台，专注于开放源码模型的定制与部署。用户可以选择并微调各种强大的AI模型，如GPT-4、GPT-3.5等，以满足不同任务需求。平台支持上传PD...

最新AI资源 # AI开放服务 # AI集成多模型对话平台 # 大模型微调

1年前

058.2K

没有了