Em um movimento notável no espaço de grandes modelos da China, a Wiseparation AI lançou recentemente uma nova série de grandes modelos de linguagem GLM, abrangendo escalas de parâmetros de 32B e 9B, e abriu seu código-fonte sob a licença MIT totalmente aberta. A nova família de modelos inclui base, inferência e um modelo "contemplativo" inovador, todos disponibilizados por meio do recém-ativado Z.ai
A plataforma está aberta para experiência gratuita e está simultaneamente ativa em sua plataforma de serviços MaaS bigmodel.cn
.
A mudança mostra que a Smart Spectrum AI está tentando expandir seu alcance e sua base de usuários no mercado de IA extremamente competitivo por meio de uma combinação de código aberto e serviços comercializados de alto desempenho.
Matriz de modelagem de código aberto: desde o básico até a exploração de ponta
O núcleo desse projeto de código aberto são os modelos de escala de parâmetros 9B e 32B, todos seguindo o contrato de licença MIT. Isso significa que os desenvolvedores e as empresas podem usar esses modelos para fins comerciais e distribuí-los gratuitamente, o que reduz bastante o limite de uso e espera-se que promova aplicativos mais amplos e a inovação da comunidade.
Modelo básico: GLM-4-32B-0414
Com 32 bilhões de parâmetros GLM-4-32B-0414
O modelo de base da empresa, que supostamente compete em desempenho com os principais modelos nacionais e internacionais com contagens de parâmetros muito maiores. O modelo foi pré-treinado usando 15T de dados de alta qualidade com a inclusão especial de dados sintéticos baseados em inferência. A fase pós-treinamento concentra-se no fortalecimento dos recursos de acompanhamento de instruções, geração de código e chamada de funções por meio de técnicas como alinhamento de preferências humanas, amostragem de rejeição e aprendizado por reforço.
O Smart Spectrum AI destaca que o modelo se sobressai em tarefas como geração de código de engenharia, geração de artefatos (uma forma interativa de gerar resultados), chamada de funções e elaboração de relatórios, com algumas métricas de benchmarking chegando perto, ou até mesmo superando, tarefas como GPT-4o
responder cantando DeepSeek-V3-0324
(parâmetros 671B) e outros modelos.
O modelo aprimora os recursos de processamento de código, permitindo a geração de código de arquivo único com estruturas mais complexas.Z.ai
O modo de diálogo da plataforma tem um recurso de visualização integrado que permite visualizar diretamente os resultados HTML e SVG gerados, facilitando a avaliação e a iteração pelos usuários.
Exemplo de solicitação: projete uma interface do usuário para uma plataforma de aprendizado de máquina móvel que inclua tarefas de treinamento, gerenciamento de armazenamento e estatísticas pessoais. A UI de estatísticas pessoais mostrará uma representação gráfica do uso de vários recursos pelo usuário ao longo do tempo. Use o Tailwind CSS para embelezar a página, colocando essas três UIs móveis em uma única página HTML.
Exemplo de solicitação: Projete uma prancheta que ofereça suporte ao desenho de funções personalizadas, adicionando e removendo funções personalizadas e atribuindo cores às funções.
Exemplo de solicitação: Demonstre um processo de treinamento do LLM com svg.
Modelo de raciocínio: GLM-Z1-32B-0414
com base em GLM-4-32B-0414
(matemática) gêneroGLM-Z1-32B-0414
O modelo de inferência é profundamente otimizado para tarefas matemáticas, de código e lógicas por meio de estratégias de aprendizado de reforço estendido e de início a frio. Os dados oficiais mostram que suas habilidades matemáticas e de resolução de problemas complexos foram significativamente aprimoradas, e o desempenho de algumas tarefas pode ser comparado ao dos parâmetros do 671B. DeepSeek-R1
Comparável. O desempenho em benchmarks como AIME 24/25, LiveCodeBench, GPQA etc. confirma seu potencial para o raciocínio matemático.
Opção leve: GLM-Z1-9B-0414
Notavelmente, a Smart Spectrum AI também introduziu um modelo de pequeno porte com parâmetros 9B GLM-Z1-9B-0414
. Apesar do pequeno número de parâmetros, afirma-se que ele ainda tem um bom desempenho em raciocínio matemático e tarefas de uso geral, com desempenho no topo dos modelos de código aberto do mesmo tamanho. Isso oferece uma opção para cenários com recursos limitados ou que exigem uma implementação leve com eficiência e eficácia.
Frontier Quest: GLM-Z1-Rumination-32B-0414 Modelagem contemplativa
GLM-Z1-Rumination-32B-0414
Ele está posicionado como uma exploração da forma futura da AGI. Diferentemente dos modelos de raciocínio tradicionais, o modelo "contemplativo" foi projetado para resolver problemas abertos complexos por meio de mais etapas de pensamento profundo. Seu principal recurso é a capacidade de integrar ferramentas de pesquisa para processar informações durante o processo de raciocínio e usar recompensas baseadas em regras para orientar o aprendizado por reforço. O modelo suporta um ciclo de pesquisa "perguntar-pesquisar-analisar-completar" e foi projetado para aprimorar a escrita baseada em pesquisa e tarefas de recuperação complexas. Isso representa a exploração contínua da arquitetura do modelo e dos limites de capacidade do Wisdom Spectrum AI.
A plataforma MaaS entra em operação em conjunto: desempenho atraente e estratégia de preços
Além do modelo de código aberto, os modelos de base e de inferência também foram integrados à plataforma aberta Smart Spectrum MaaS (bigmodel.cn
), que fornece serviços de API.
O modelo básico oferece GLM-4-Air-250414
responder cantando GLM-4-Flash-250414
Duas versões, a última totalmente gratuita, mostram a intenção de atrair os usuários a experimentá-lo.
O modelo de inferência é então dividido em três versões para diferentes necessidades:
GLM-Z1-AirX
(Extreme Edition): afirma ser um dos modelos de inferência comercial mais rápidos da China, com uma velocidade de inferência em tempo real de até 200 tokens/segundo. Essa velocidade tem uma vantagem significativa em cenários que exigem interação em tempo real ou processamento de um grande número de solicitações.GLM-Z1-Air
(versão econômica): preço muito competitivo, oficialmente por apenasDeepSeek-R1
1/30 dos cenários de chamadas sensíveis ao custo e de alta frequência.GLM-Z1-Flash
(versão gratuita): diminuindo ainda mais a barreira ao uso e impulsionando uma adoção mais ampla por parte dos desenvolvedores.
Essa estratégia de preços escalonados, combinada com opções pagas de alto desempenho e versões introdutórias gratuitas, é um meio comum, mas eficaz, de os grandes provedores de modelos competirem pela participação no mercado.
Lista de preços do modelo correspondente:
Lançamento do novo portal interativo: plataforma Z.ai
A Smart Spectrum AI lançou um novo nome de domínio Z.ai
que serve como um portal para a experiência interativa de seu modelo mais recente. Selecione .ai
O nome de domínio em si tem um forte sinal de marca, é conciso e direto para o negócio principal.
no momento atual Z.ai
A plataforma tem três modelos de código aberto on-line para os usuários experimentarem:
GLM-4-32B
(modelo básico): geração de código de experiência e recursos de artefatos.Z1-32B
(Modelos de inferência): tenha uma noção direta das velocidades de inferência de até 200 tokens/segundo.Z1-Rumination-32B
(Modelagem Contemplativa): explorando seus recursos de pesquisa profunda e processamento de tarefas complexas.
De modo geral, com esse lançamento, a Smart Spectrum AI demonstrou seu layout abrangente no desenvolvimento de modelos, estratégia de código aberto e comercialização. No mercado cada vez mais concorrido de modelos grandes de IA, a combinação de forte força técnica, protocolos de código aberto flexíveis e soluções de comercialização competitivas é a chave para consolidar sua posição no mercado e atrair desenvolvedores e usuários corporativos.