LLaMA Factory：高效微调百余种开源大模型，轻松实现模型定制

2.1K 00

综合介绍

LLaMA-Factory 是一个统一的高效微调框架，支持对100多种大型语言模型（LLMs）进行灵活定制和高效训练。通过内置的 LLaMA Board 网页界面，用户无需编写代码即可完成模型微调。该框架集成了多种先进的训练方法和实用技巧，显著提升了训练速度和GPU内存利用率。

功能列表

多模型支持：支持 LLaMA、LLaVA、Mistral、Qwen 等多种语言模型。
多种训练方法：包括全量微调、冻结微调、LoRA、QLoRA 等。
高效算法：集成 GaLore、BAdam、Adam-mini、DoRA 等先进算法。
实用技巧：支持 FlashAttention-2、Unsloth、Liger Kernel 等。
实验监控：提供 LlamaBoard、TensorBoard、Wandb、MLflow 等监控工具。
快速推理：提供类似 OpenAI 的 API、Gradio UI 和 CLI 接口。
数据集支持：支持从 HuggingFace、ModelScope 等平台下载预训练模型和数据集。

使用帮助

安装流程

克隆项目代码：

   git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

安装依赖：

   pip install -e ".[torch,metrics]"

可选依赖包括：torch、torch-npu、metrics、deepspeed、liger-kernel、bitsandbytes 等。

数据准备

请参考 data/README.md 了解数据集文件格式的详细信息。可以使用 HuggingFace / ModelScope / Modelers hub 上的数据集，或加载本地磁盘上的数据集。

快速开始

使用以下命令运行 LoRA 微调、推理和合并 Llama3-8B-Instruct 模型：

llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml
llamafactory-cli chat examples/inference/llama3_lora_sft.yaml
llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml

更多高级用法请参考 examples/README.md。

使用 LLaMA Board GUI

通过 Gradio 提供的 LLaMA Board GUI 进行微调：

llamafactory-cli webui

Docker 部署

对于 CUDA 用户：

cd docker/docker-cuda/
docker compose up -d
docker compose exec llamafactory bash

对于 Ascend NPU 用户：

cd docker/docker-npu/
docker compose up -d
docker compose exec llamafactory bash

对于 AMD ROCm 用户：

cd docker/docker-rocm/
docker compose up -d
docker compose exec llamafactory bash

API 部署

使用 OpenAI 风格的 API 和 vLLM 进行推理：

API_PORT=8000 llamafactory-cli api examples/inference/llama3_vllm.yaml

访问此页面获取 API 文档。

下载模型和数据集

如果从 Hugging Face 下载模型和数据集有困难，可以使用 ModelScope：

export USE_MODELSCOPE_HUB=1

通过指定 ModelScope Hub 的模型 ID 来训练模型，例如 LLM-Research/Meta-Llama-3-8B-Instruct。

使用 W&B 记录实验结果

要使用 Weights & Biases 记录实验结果，需要在 yaml 文件中添加以下参数：

wandb:
project: "your_project_name"
entity: "your_entity_name"

最新AI资源 # 大模型微调

文章版权归 AI分享圈所有，未经允许请勿转载。

AI Engineer Pack：AI开发者的“免费大礼包”！赠送主流AI工具兑换码

最新AI资源 # AI开放服务 # 免费大模型API

5个月前

01.5K

魔音工坊：专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

最新AI资源 # AI文本转语音 # AI语音克隆 # AI音视频编辑

10个月前

01.9K

InsCode：CSDN推出的在线编程平台，在线IDE云端开发环境（不推荐）

最新AI资源 # AI IDE

7个月前

02.2K

Goose：开源可扩展的编程智能体，自动化执行编程全流程任务

最新AI资源 # AI开源项目 # AI编程 # 智能体开发框架

6个月前

03.2K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

LLaMA Factory：高效微调百余种开源大模型，轻松实现模型定制

综合介绍

功能列表

使用帮助

安装流程

数据准备

快速开始

使用 LLaMA Board GUI

Docker 部署

API 部署

下载模型和数据集

使用 W&B 记录实验结果

Hoarder：开源 AI 书签管理工具，支持多种格式文件，智能标签分类、全文检索

ModelScope Swift：高效微调和部署大模型的轻量级基础设施。

相关文章

AI Engineer Pack：AI开发者的“免费大礼包”！赠送主流AI工具兑换码

魔音工坊：专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

InsCode：CSDN推出的在线编程平台，在线IDE云端开发环境（不推荐）

Goose：开源可扩展的编程智能体，自动化执行编程全流程任务

暂无评论

最新收录

最新文章

LLaMA Factory：高效微调百余种开源大模型，轻松实现模型定制

综合介绍

功能列表

使用帮助

安装流程

数据准备

快速开始

使用 LLaMA Board GUI

Docker 部署

API 部署

下载模型和数据集

使用 W&B 记录实验结果

Hoarder：开源 AI 书签管理工具，支持多种格式文件，智能标签分类、全文检索

ModelScope Swift：高效微调和部署大模型的轻量级基础设施。

相关文章

AI Engineer Pack：AI开发者的“免费大礼包”！赠送主流AI工具兑换码

魔音工坊：专业配音与短视频解说创作平台|真人配音|克隆声音|一键成片

InsCode：CSDN推出的在线编程平台，在线IDE云端开发环境（不推荐）

Goose：开源可扩展的编程智能体，自动化执行编程全流程任务

暂无评论

AI工具精选

最新收录

最新文章