ColossalAI: fornecendo soluções eficientes de treinamento de modelos de IA em grande escala

Recursos mais recentes de IAAtualizado há 6 meses Círculo de compartilhamento de IA

1.6K 00

Introdução geral

O ColossalAI é uma plataforma de código aberto desenvolvida pela HPC-AI Technologies para oferecer uma solução eficiente e econômica para o treinamento e a inferência de modelos de IA em grande escala. Ao oferecer suporte a várias estratégias paralelas, gerenciamento de memória heterogênea e treinamento de precisão mista, o ColossalAI é capaz de reduzir significativamente o tempo e o consumo de recursos para treinamento e inferência de modelos. Seja no paralelismo de dados, no paralelismo de tensor ou no paralelismo de pipeline, o ColossalAI oferece ferramentas e bibliotecas avançadas para ajudar pesquisadores e desenvolvedores a obter treinamento e inferência eficientes de modelos em grande escala em clusters com várias GPUs.

Lista de funções

Suporte a paralelismo de dados, paralelismo de tensor, paralelismo em pipeline e outras estratégias paralelas
Treinamento de precisão mista e otimizador de redundância zero (ZeRO)
Gerenciamento de memória heterogêneo para dar suporte ao treinamento eficiente de modelos grandes
Suporte a vários modelos específicos de domínio, como Open-Sora, Colossal-LLaMA, etc.
Fornecimento de ferramentas fáceis de usar para treinamento e inferência distribuídos
Integração de kernel de alto desempenho, cache KV, atenção à paginação e processamento sequencial em lote
Fácil configuração do treinamento paralelo por meio de arquivos de configuração
Fornecer exemplos e documentação ricos para ajudá-lo a começar rapidamente
Oferece várias opções de instalação para imagens do Docker e criação a partir do código-fonte

Usando a Ajuda

Guia de instalação

Instalação a partir do PyPI

Você pode instalar facilmente o Colossal-AI com o seguinte comando:

pip install colossalai

Por padrão, as extensões do PyTorch não são criadas durante a instalação. Se você precisar compilar as extensões do PyTorch, poderá definir a opçãoBUILD_EXT=1::

BUILD_EXT=1 pip install colossalai

Além disso, lançamos versões NIGHTLY todas as semanas, permitindo que você acesse os recursos inéditos e as correções de bugs mais recentes. A instalação é a seguinte:

pip install colossalai-nightly

Instalação a partir da fonte

git clone https://github.com/hpcaitech/ColossalAI.git
cd ColossalAI
pip install .

Os kernels CUDA/C++ não são compilados por padrão. O colossalAI os compilará em tempo de execução. Ative a fusão do kernel CUDA, se necessário:

BUILD_EXT=1 pip install .

Para usuários do CUDA 10.2, você pode fazer o download manual da biblioteca cub e copiá-la para o diretório apropriado antes de instalá-la.

Usando o Docker

Extração de imagens do DockerHub

Você pode obter as informações diretamente doPágina do DockerHubExtraia a imagem do Docker.

Crie sua própria imagem

cd ColossalAI
docker build -t colossalai ./docker

Inicia o contêiner no modo interativo:

docker run -ti --gpus all --rm --ipc=host colossalai bash

Função Fluxo de operação

paralelismo de dados

O paralelismo de dados é o processo de dividir um conjunto de dados em vários subconjuntos e treinar o modelo em paralelo em várias GPUs. A ColossalAI facilita para os usuários o treinamento em paralelo de dados com um perfil simplificado de paralelismo de dados:

from colossalai.nn.parallel import DataParallel
model = DataParallel(model)

paralelismo de tensores

O paralelismo de tensores é o processo de dividir o tensor de parâmetros de um modelo em vários subtensores e computá-los em paralelo em várias GPUs. A ColossalAI oferece implementações de paralelismo de tensores 1D, 2D, 2,5D e 3D:

from colossalai.nn.parallel import TensorParallel
model = TensorParallel(model, parallel_mode='1D')

correndo paralelamente à linha de montagem

O paralelismo de pipeline é a divisão de um modelo em vários estágios, cada um executado por uma ou mais GPUs. O ColossalAI oferece uma configuração fácil do paralelismo de pipeline:

from colossalai.pipeline.parallel import PipelineParallel
model = PipelineParallel(model, num_stages=4)

Treinamento de precisão misto

O treinamento com precisão mista reduz significativamente o uso da memória e acelera o treinamento usando uma combinação de números de ponto flutuante de 16 bits (FP16) e números de ponto flutuante de 32 bits (FP32) durante o treinamento:

from colossalai.amp import convert_to_amp
model, optimizer, criterion = convert_to_amp(model, optimizer, criterion)

Otimizador de redundância zero (ZeRO)

O otimizador ZeRO reduz significativamente o espaço ocupado pela memória gráfica ao distribuir estados, gradientes e parâmetros do otimizador em várias GPUs:

from colossalai.zero import ZeroOptimizer
optimizer = ZeroOptimizer(optimizer, model)

Aplicativos do mundo real

Open-Sora

O Open-Sora é a solução completa da ColossalAI para modelos de geração de vídeo, incluindo parâmetros de modelo, detalhes de treinamento e a capacidade de gerar vídeos HD 720p de 16 segundos com um clique:

# 训练
python train.py
# 推理
python infer.py

Para obter mais informações, consulteOpen-Sora.

Colossal-LLaMA

O Colossal-LLaMA oferece uma solução de código aberto para modelos de linguagem grandes (LLMs) específicos de domínio que podem obter resultados comparáveis aos modelos grandes convencionais com uma pequena quantidade de dinheiro para treinamento:

# 训练
python train_llama.py
# 推理
python infer_llama.py

Para obter mais informações, consulteColossal-LLaMA.

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

FlowGram.AI: um mecanismo de código aberto para a criação rápida de fluxos de trabalho nodais

Recursos mais recentes de IA # Projeto de código aberto AI Java # Fluxo de trabalho com pouco código

5 meses atrás

02.3K

ElevenLabs: Plataforma de geração de fala com IA de alta qualidade, ferramentas de dublagem de texto e clonagem de fala

Recursos mais recentes de IA # Conversão de texto em fala com IA Clonagem de voz do # AI

11 meses atrás

02.9K

PDF-Extract-Kit: Extraia a estrutura complexa do conteúdo do PDF da ferramenta de código aberto

Recursos mais recentes de IA # Projeto de código aberto AI Java # Extração e limpeza de documentos

6 meses atrás

02.5K

TRELLIS：Microsoft开发的3D资产生成模型，支持多种格式和灵活编辑

TRELLIS: modelo de geração de ativos 3D desenvolvido pela Microsoft com suporte a vários formatos e edição flexível

Recursos mais recentes de IA # Projeto de código aberto AI Java # Texto e imagem AI para 3D

8 meses atrás

03.1K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

ColossalAI: fornecendo soluções eficientes de treinamento de modelos de IA em grande escala

Introdução geral

Lista de funções

Usando a Ajuda

Guia de instalação

Instalação a partir do PyPI

Instalação a partir da fonte

Usando o Docker

Extração de imagens do DockerHub

Crie sua própria imagem

Função Fluxo de operação

paralelismo de dados

paralelismo de tensores

correndo paralelamente à linha de montagem

Treinamento de precisão misto

Otimizador de redundância zero (ZeRO)

Aplicativos do mundo real

Open-Sora

Colossal-LLaMA

HealthGPT: um grande modelo médico para apoiar a análise de imagens médicas e as perguntas e respostas de diagnóstico

AIBot PRO: uma plataforma de agregação de comercialização que integra vários produtos de IA

Artigos relacionados

FlowGram.AI: um mecanismo de código aberto para a criação rápida de fluxos de trabalho nodais

ElevenLabs: Plataforma de geração de fala com IA de alta qualidade, ferramentas de dublagem de texto e clonagem de fala

PDF-Extract-Kit: Extraia a estrutura complexa do conteúdo do PDF da ferramenta de código aberto

TRELLIS: modelo de geração de ativos 3D desenvolvido pela Microsoft com suporte a vários formatos e edição flexível

Sem comentários

Últimas coleções

Artigos mais recentes

ColossalAI: fornecendo soluções eficientes de treinamento de modelos de IA em grande escala

Introdução geral

Lista de funções

Usando a Ajuda

Guia de instalação

Instalação a partir do PyPI

Instalação a partir da fonte

Usando o Docker

Extração de imagens do DockerHub

Crie sua própria imagem

Função Fluxo de operação

paralelismo de dados

paralelismo de tensores

correndo paralelamente à linha de montagem

Treinamento de precisão misto

Otimizador de redundância zero (ZeRO)

Aplicativos do mundo real

Open-Sora

Colossal-LLaMA

HealthGPT: um grande modelo médico para apoiar a análise de imagens médicas e as perguntas e respostas de diagnóstico

AIBot PRO: uma plataforma de agregação de comercialização que integra vários produtos de IA

Artigos relacionados

FlowGram.AI: um mecanismo de código aberto para a criação rápida de fluxos de trabalho nodais

ElevenLabs: Plataforma de geração de fala com IA de alta qualidade, ferramentas de dublagem de texto e clonagem de fala

PDF-Extract-Kit: Extraia a estrutura complexa do conteúdo do PDF da ferramenta de código aberto

TRELLIS: modelo de geração de ativos 3D desenvolvido pela Microsoft com suporte a vários formatos e edição flexível

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes