Meta Releases Llama 3.3, 70B Parâmetros mais fortes que o Llama 3.1 405B - Menor, mais rápido, mais forte

Notícias sobre IAPublicado há 9 meses Círculo de compartilhamento de IA

20.6K 00

A Meta apresenta o Llama 3.3, um grande modelo de linguagem com 70 bilhões de parâmetros que rivaliza com o desempenho de seu antecessor, o Llama 3.1, com 405 bilhões de parâmetros, e tem um custo de entrada 10 vezes menor do que o Llama 3.1 405B! A aderência às instruções excede a do GPT-4o, Claude 3.5 Sonnet.

Meta发布Llama 3.3，70B参数强过Llama3.1 405B——更小、更快、更强

Eficiência de computação disruptiva

Tradicionalmente, os modelos de IA de alto desempenho geralmente implicam em grandes requisitos de computação e altos custos de hardware. O Llama 3.3 inverte completamente essa lógica. Apesar de ter metade do tamanho dos parâmetros de seu antecessor, o Llama 3.1, seu desempenho nos principais benchmarks é nada menos que estelar.

Indicadores-chave de desempenho

- 70B parâmetros, 128K contextos

- Idiomas suportados: 8, incluindo inglês, alemão, francês, italiano, português, hindi, espanhol e tailandês

- Pontuação do teste IFEval: 92,1%, melhor que o Llama 3.1 (405B)

- Facilidade de implantação local: melhoria significativa

A maior atração do Llama 3.3 é sua incrível acessibilidade. As equipes de desenvolvimento de pequeno e médio porte e as startups não precisam mais fugir de recursos de computação caros. Uma estação de trabalho padrão agora pode alimentar a tecnologia de IA de ponta.

Vários cenários de aplicativos

A variedade de aplicações para esse modelo é impressionante:

- IA de diálogo

- Geração de dados sintéticos

- processamento multilíngue

- Pesquisa e aplicativos inovadores

segurança

A Meta incluiu mecanismos de segurança mais fortes no Llama 3.3:

- Integração de mecanismos de rejeição com ajuste fino

- Ferramenta de controle de risco Llama Guard 3

- Mecanismos de alinhamento ético bem ajustados

Essas iniciativas garantem que os modelos permaneçam inteligentes de forma responsável e controlada e, ao mesmo tempo, sejam abertamente acessíveis.

Impacto no setor

Os números falam por si: o número acumulado de downloads dos modelos da Llama ultrapassou 650 milhões, o que não é apenas um número, mas a prova de que a IA de código aberto é imparável. Não se trata apenas de um número, é a prova de que a IA de código aberto é imparável, e a Llama 3.3 está transformando a tecnologia de IA de ponta de um "clube de elite" em uma "festa para as massas".

O plano estratégico de Mark Zuckerberg

Enquanto a Llama 4 está no roteiro para 2025, a Llama 3.3 já está estabelecendo uma base sólida para o futuro. A Meta está investindo ativamente em infraestrutura, como um data center de 2 gigawatts em Louisiana, nos EUA, destacando seu forte compromisso com o crescimento de longo prazo da IA.

Download da implantação

O Llama 3.3 foi adicionado à biblioteca de modelos do Ollam com um tamanho de modelo de 42G, que pode ser baixado e implantado diretamente.

Os desenvolvedores que não estiverem implementando o Llama 3.3 podem visitar o repositório GitHub do Meta ou fazer o download dos arquivos de modelo no Hugging Face.

Cartões modelo:

github.com/meta-llama/llama-models/blob/main/models/llama3_3/MODEL_CARD.md

Arquivos de modelos:

huggingface.co/meta-llama/Llama-3.3-70B-Instruct

Notícias sobre IA

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

DeepSeek-V3/R1 Visão geral dos sistemas de raciocínio (DeepSeek Open Source Week Day 6)

Notícias sobre IA

7 meses atrás

014.3K

O Refly está oficialmente aberto para registro, a melhor plataforma de trabalho para criadores de conteúdo

Notícias sobre IA

8 meses atrás

013.1K

Baidu lança Wenxin Big Model 4.5 e X1: evolução dupla de capacidades multimodais e pensamento profundo

Notícias sobre IA

6 meses atrás

015.4K

O estado da arte dos jogos com IA nativa: uma análise prática de 12 jogos do Steam

Notícias sobre IA

6 meses atrás

014.1K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

Meta Releases Llama 3.3, 70B Parâmetros mais fortes que o Llama 3.1 405B - Menor, mais rápido, mais forte

Família de modelos básicos da Amazon Nova: fornecendo serviços abrangentes de inteligência artificial generativa (Gen AI)

O mini modelo de código aberto de 1,6 B "Little Fox" supera os modelos similares Qwen e Gemma

Artigos relacionados

DeepSeek-V3/R1 Visão geral dos sistemas de raciocínio (DeepSeek Open Source Week Day 6)

O Refly está oficialmente aberto para registro, a melhor plataforma de trabalho para criadores de conteúdo

Baidu lança Wenxin Big Model 4.5 e X1: evolução dupla de capacidades multimodais e pensamento profundo

O estado da arte dos jogos com IA nativa: uma análise prática de 12 jogos do Steam

Sem comentários

Últimas coleções

Artigos mais recentes

Meta Releases Llama 3.3, 70B Parâmetros mais fortes que o Llama 3.1 405B - Menor, mais rápido, mais forte

Família de modelos básicos da Amazon Nova: fornecendo serviços abrangentes de inteligência artificial generativa (Gen AI)

O mini modelo de código aberto de 1,6 B "Little Fox" supera os modelos similares Qwen e Gemma

Artigos relacionados

DeepSeek-V3/R1 Visão geral dos sistemas de raciocínio (DeepSeek Open Source Week Day 6)

O Refly está oficialmente aberto para registro, a melhor plataforma de trabalho para criadores de conteúdo

Baidu lança Wenxin Big Model 4.5 e X1: evolução dupla de capacidades multimodais e pensamento profundo

O estado da arte dos jogos com IA nativa: uma análise prática de 12 jogos do Steam

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes