Fábrica LLaMA: ajuste eficaz de más de cien macromodelos de código abierto, fácil personalización de modelos

Últimos recursos sobre IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

47.6K 00

Introducción general

LLaMA-Factory es un marco de ajuste unificado y eficiente que permite la personalización flexible y el entrenamiento eficaz de más de 100 grandes modelos lingüísticos (LLM). La interfaz web integrada LLaMA Board permite a los usuarios ajustar modelos sin necesidad de escribir código. El marco integra diversos métodos de entrenamiento avanzados y consejos prácticos para mejorar significativamente la velocidad de entrenamiento y la utilización de la memoria de la GPU.

Lista de funciones

Compatibilidad con varios modelosSoporte para LLaMA, LLaVA, Mistral, Qwen y otros modelos multilingües.
Múltiples métodos de formación: Incluye recorte de volumen completo, recorte por congelación, LoRA, QLoRA, etc.
algoritmo eficazIntegración de GaLore, BAdam, Adam-mini, DoRA y otros algoritmos avanzados.
habilidad prácticaSoporte para FlashAttention-2, Unsloth, Liger Kernel y más.
Seguimiento experimental: Proporciona herramientas de monitorización como LlamaBoard, TensorBoard, Wandb, MLflow, etc.
inferencia rápidaProporciona API similares a OpenAI, Gradio UI e interfaces CLI.
Soporte de conjuntos de datosSoporte para descargar modelos preentrenados y conjuntos de datos de HuggingFace, ModelScope y otras plataformas.

Utilizar la ayuda

Proceso de instalación

Clona el código del proyecto:

   git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory

Instale la dependencia:

   pip install -e ".[torch,metrics]"

Las dependencias opcionales incluyen: torch, torch-npu, metrics, deepspeed, liger-kernel, bitsandbytes, y más.

Preparación de datos

consulte data/README.md Más información sobre el formato de archivo de los conjuntos de datos. Puede utilizar conjuntos de datos en el hub HuggingFace / ModelScope / Modelers, o cargar conjuntos de datos en su disco local.

Inicio rápido

Utilice los siguientes comandos para ejecutar LoRA para afinar, razonar y fusionar modelos Llama3-8B-Instruct:

llamafactory-cli train examples/train_lora/llama3_lora_sft.yaml
llamafactory-cli chat examples/inference/llama3_lora_sft.yaml
llamafactory-cli export examples/merge_lora/llama3_lora_sft.yaml

Para un uso más avanzado, consulte examples/README.md.

Uso de la interfaz gráfica de usuario de la tarjeta LLaMA

El ajuste fino se realiza a través de la interfaz gráfica de usuario de la placa LLaMA proporcionada por Gradio:

llamafactory-cli webui

Despliegue de Docker

Para usuarios de CUDA:

cd docker/docker-cuda/
docker compose up -d
docker compose exec llamafactory bash

Para usuarios de Ascend NPU:

cd docker/docker-npu/
docker compose up -d
docker compose exec llamafactory bash

Para usuarios de AMD ROCm:

cd docker/docker-rocm/
docker compose up -d
docker compose exec llamafactory bash

Despliegue de API

Utilizar API de tipo OpenAI y vLLM Razonamiento:

API_PORT=8000 llamafactory-cli api examples/inference/llama3_vllm.yaml

Visite esta página para consultar la documentación de la API.

Descargar modelos y conjuntos de datos

Si tiene problemas para descargar modelos y conjuntos de datos de Hugging Face, puede utilizar ModelScope:

export USE_MODELSCOPE_HUB=1

Entrene un modelo especificando el ID del modelo de ModelScope Hub, por ejemplo LLM-Research/Meta-Llama-3-8B-Instruct.

Registro de resultados experimentales con W&B

Para utilizar Pesas & Biases registra los resultados de sus experimentos con los siguientes parámetros en el archivo yaml:

wandb:
project: "your_project_name"
entity: "your_entity_name"

Últimos recursos sobre IA # Ajuste del modelo grande

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

DeepMosaics: eliminación o adición automática de mosaicos en imágenes y vídeos

hace 1 año

0160.4K

Coqui TTS（xTTS）：文本到语音生成的深度学习工具包，支持多种语言和声音克隆功能

Coqui TTS (xTTS): un conjunto de herramientas de aprendizaje profundo para la generación de texto a voz con soporte multilingüe y capacidades de clonación de voz.

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Clonación de voz AI

hace 11 meses

077.5K

Genbler: Herramienta creativa de IA para cambios de rostro en imágenes y vídeos y transiciones estilo retrato

Últimos recursos sobre IA # AI Ampliación y restauración de imágenes # Teclado AI para cambiar fondos # AI Cambia la cara y vístete

hace 1 año

039.3K

Convergencia: un asistente de IA que automatiza tareas repetitivas en un navegador de agentes

Últimos recursos sobre IA # Inteligencia de automatización de escritorio

hace 7 meses

038.9K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Fábrica LLaMA: ajuste eficaz de más de cien macromodelos de código abierto, fácil personalización de modelos

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

Preparación de datos

Inicio rápido

Uso de la interfaz gráfica de usuario de la tarjeta LLaMA

Despliegue de Docker

Despliegue de API

Descargar modelos y conjuntos de datos

Registro de resultados experimentales con W&B

Hoarder: herramientas de gestión de marcadores AI de código abierto, compatible con múltiples formatos, clasificación inteligente de etiquetas, búsqueda de texto completo

ModelScope Swift: una infraestructura ligera para ajustar y desplegar eficazmente modelos de gran tamaño.

Artículos relacionados

DeepMosaics: eliminación o adición automática de mosaicos en imágenes y vídeos

Coqui TTS (xTTS): un conjunto de herramientas de aprendizaje profundo para la generación de texto a voz con soporte multilingüe y capacidades de clonación de voz.

Genbler: Herramienta creativa de IA para cambios de rostro en imágenes y vídeos y transiciones estilo retrato

Convergencia: un asistente de IA que automatiza tareas repetitivas en un navegador de agentes

Sin comentarios

Últimas colecciones

Últimos artículos

Fábrica LLaMA: ajuste eficaz de más de cien macromodelos de código abierto, fácil personalización de modelos

Introducción general

Lista de funciones

Utilizar la ayuda

Proceso de instalación

Preparación de datos

Inicio rápido

Uso de la interfaz gráfica de usuario de la tarjeta LLaMA

Despliegue de Docker

Despliegue de API

Descargar modelos y conjuntos de datos

Registro de resultados experimentales con W&B

Hoarder: herramientas de gestión de marcadores AI de código abierto, compatible con múltiples formatos, clasificación inteligente de etiquetas, búsqueda de texto completo

ModelScope Swift: una infraestructura ligera para ajustar y desplegar eficazmente modelos de gran tamaño.

Artículos relacionados

DeepMosaics: eliminación o adición automática de mosaicos en imágenes y vídeos

Coqui TTS (xTTS): un conjunto de herramientas de aprendizaje profundo para la generación de texto a voz con soporte multilingüe y capacidades de clonación de voz.

Genbler: Herramienta creativa de IA para cambios de rostro en imágenes y vídeos y transiciones estilo retrato

Convergencia: un asistente de IA que automatiza tareas repetitivas en un navegador de agentes

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos