GLM Edge: a Smart Spectrum lança modelos de linguagem de ponta e modelos de compreensão multimodal para plataformas móveis, automotivas e de PC

Recursos mais recentes de IAPublicado há 10 meses Círculo de compartilhamento de IA

18.5K 00

Introdução geral

O GLM-Edge é uma série de grandes modelos de linguagem e modelos de compreensão multimodal projetados para dispositivos finais da Universidade de Tsinghua (Smart Spectrum Light Language). Esses modelos incluem o GLM-Edge-1.5B-Chat, o GLM-Edge-4B-Chat, o GLM-Edge-V-2B e o GLM-Edge-V-5B para plataformas de telefone celular, carro e PC, respectivamente. A série de modelos GLM-Edge se concentra na facilidade de implantação prática e na velocidade de inferência, mantendo o alto desempenho, e se destaca nas plataformas Qualcomm Snapdragon e Intel, em particular. Os modelos da série GLM-Edge se concentram na facilidade de implantação e na velocidade de inferência, mantendo um desempenho eficiente, especialmente nas plataformas Qualcomm Snapdragon e Intel. Os usuários podem baixar e usar esses modelos via Huggingface, ModelScope, etc., e realizar a inferência do modelo por meio de vários backends de inferência (por exemplo, transformadores, OpenVINO, vLLM).

GLM Edge：智谱发布适用于手机、车机和PC平台的端侧大语言模型和多模态理解模型

GLM Modelo de texto do lado final do Edge

GLM Modelo visual do lado da extremidade do Edge

Lista de funções

Várias opções de modelosModelo de compreensão multimodal: fornece modelos de diálogo e modelos de compreensão multimodal em diferentes escalas de parâmetros para uma ampla variedade de dispositivos finais.
Raciocínio eficienteObtenha velocidades de inferência eficientes nas plataformas Qualcomm Snapdragon e Intel com suporte para esquemas de quantificação híbridos.
Suporte a várias plataformasModelos: Os modelos estão disponíveis para download no Huggingface, ModelScope e outras plataformas, e suportam uma ampla gama de backends de inferência.
Fácil de implementarGuia de instalação e uso detalhado para que os usuários possam começar a usar rapidamente.
Suporte para ajuste finoFornecimento de tutoriais de ajuste fino e arquivos de configuração para dar suporte aos usuários no ajuste fino de seus modelos de acordo com suas necessidades específicas.

Usando a Ajuda

Instalação de dependências

Certifique-se de que você tenha a versão 3.10 ou superior do Python. E instale as dependências da seguinte forma:

pip install -r requirements.txt

raciocínio modelado

Fornecemos vLLM, OpenVINO e transformadores para inferência de back-end, e você pode executar os modelos executando os seguintes comandos:

python cli_demo.py --backend transformers --model_path THUDM/glm-edge-1.5b-chat --precision bfloat16
python cli_demo.py --backend vllm --model_path THUDM/glm-edge-1.5b-chat --precision bfloat16
python cli_demo.py --backend ov --model_path THUDM/glm-edge-1.5b-chat-ov --precision int4

Observação: o modelo de versão do OpenVINO precisa ser convertido. Acesse a página relevante para executar o código de conversão:

python convert_chat.py --model_path THUDM/glm-edge-1.5b-chat --precision int4
python convert.py --model_path THUDM/glm-edge-v-2b --precision int4

Ajuste fino do modelo

Fornecemos código para o ajuste fino do modelo; consulte o tutorial de ajuste fino. A seguir estão as etapas básicas para o ajuste fino:

Prepare o conjunto de dados e configure os parâmetros de treinamento.
Execute o script de ajuste fino:

OMP_NUM_THREADS=1 torchrun --standalone --nnodes=1 --nproc_per_node=8 finetune.py data/AdvertiseGen/ THUDM/glm-edge-4b-chat configs/lora.yaml

Se você precisar continuar o ajuste fino a partir do ponto de salvamento, poderá adicionar um quarto parâmetro:

python finetune.py data/AdvertiseGen/ THUDM/glm-edge-4b-chat configs/lora.yaml yes

Iniciando a WebUI com o Gradio

Você também pode usar o Gradio para iniciar a WebUI:

python cli_demo.py --backend transformers --model_path THUDM/glm-edge-1.5b-chat --precision bfloat16

Raciocínio com a API OpenAI

import openai
client = openai.Client(api_key="your_api_key", base_url="http://<XINFERENCE_HOST>:<XINFERENCE_PORT>/v1")
output = client.chat.completions.create(
model="glm-edge-v",
messages=[
{"role": "user", "content": "describe this image"},
{"role": "image_url", "image_url": {"url": "img.png"}}
],
max_tokens=512,
temperature=0.7
)
print(output)

Recursos mais recentes de IA # Ferramenta de modelo grande de código aberto implantada localmente

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

notdiamond2api: serviço de interface de API de vários modelos de IA do Not Diamond reverso com suporte a sondagem de várias contas e gerenciamento automatizado

Recursos mais recentes de IA # Modelo grande e gratuito de API

10 meses atrás

022.6K

Lambda Chat：多款经过微调的 Llama 3.1 405B 模型（代号Hermes 3）

Lambda Chat: Vários modelos Llama 3.1 405B com ajuste fino (nome de código Hermes 3)

Recursos mais recentes de IA Plataforma de diálogo multimodelo integrada de IA #

10 meses atrás

021K

CRCT: decomponha recursivamente grandes tarefas de código e salve persistentemente o estado do projeto

Recursos mais recentes de IA # Projeto de código aberto AI Java

6 meses atrás

018.4K

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Recursos mais recentes de IA # Projeto de código aberto AI Java # OCR # Extração e limpeza de documentos

9 meses atrás

021.3K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

GLM Edge: a Smart Spectrum lança modelos de linguagem de ponta e modelos de compreensão multimodal para plataformas móveis, automotivas e de PC

Introdução geral

Lista de funções

Usando a Ajuda

Instalação de dependências

raciocínio modelado

Ajuste fino do modelo

Iniciando a WebUI com o Gradio

Raciocínio com a API OpenAI

Runner H: automatização de tarefas de execução de páginas da Web por meio de comandos de linguagem natural (aplicativo para testes internos)

Meshy: ferramenta de geração de imagens e modelos 3D de uso gratuito

Artigos relacionados

notdiamond2api: serviço de interface de API de vários modelos de IA do Not Diamond reverso com suporte a sondagem de várias contas e gerenciamento automatizado

Lambda Chat: Vários modelos Llama 3.1 405B com ajuste fino (nome de código Hermes 3)

CRCT: decomponha recursivamente grandes tarefas de código e salve persistentemente o estado do projeto

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Sem comentários

Últimas coleções

Artigos mais recentes

GLM Edge: a Smart Spectrum lança modelos de linguagem de ponta e modelos de compreensão multimodal para plataformas móveis, automotivas e de PC

Introdução geral

Lista de funções

Usando a Ajuda

Instalação de dependências

raciocínio modelado

Ajuste fino do modelo

Iniciando a WebUI com o Gradio

Raciocínio com a API OpenAI

Runner H: automatização de tarefas de execução de páginas da Web por meio de comandos de linguagem natural (aplicativo para testes internos)

Meshy: ferramenta de geração de imagens e modelos 3D de uso gratuito

Artigos relacionados

notdiamond2api: serviço de interface de API de vários modelos de IA do Not Diamond reverso com suporte a sondagem de várias contas e gerenciamento automatizado

Lambda Chat: Vários modelos Llama 3.1 405B com ajuste fino (nome de código Hermes 3)

CRCT: decomponha recursivamente grandes tarefas de código e salve persistentemente o estado do projeto

Chunkr: um serviço completo que usa modelos visuais para a ingestão de documentos e a divisão inteligente em blocos com base na hierarquia de parágrafos do texto

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes