A Meta apresenta o Llama 3.3, um grande modelo de linguagem com 70 bilhões de parâmetros que rivaliza com o desempenho de seu antecessor, o Llama 3.1, com 405 bilhões de parâmetros, e tem um custo de entrada 10 vezes menor do que o Llama 3.1 405B! A aderência às instruções excede a do GPT-4o, Claude 3.5 Sonnet.
Eficiência de computação disruptiva
Tradicionalmente, os modelos de IA de alto desempenho geralmente implicam em grandes requisitos de computação e altos custos de hardware. O Llama 3.3 inverte completamente essa lógica. Apesar de ter metade do tamanho dos parâmetros de seu antecessor, o Llama 3.1, seu desempenho nos principais benchmarks é nada menos que estelar.
Indicadores-chave de desempenho
- 70B parâmetros, 128K contextos
- Idiomas suportados: 8, incluindo inglês, alemão, francês, italiano, português, hindi, espanhol e tailandês
- Pontuação do teste IFEval: 92,1%, melhor que o Llama 3.1 (405B)
- Facilidade de implantação local: melhoria significativa
A maior atração do Llama 3.3 é sua incrível acessibilidade. As equipes de desenvolvimento de pequeno e médio porte e as startups não precisam mais fugir de recursos de computação caros. Uma estação de trabalho padrão agora pode alimentar a tecnologia de IA de ponta.
Vários cenários de aplicativos
A variedade de aplicações para esse modelo é impressionante:
- IA de diálogo
- Geração de dados sintéticos
- processamento multilíngue
- Pesquisa e aplicativos inovadores
segurança
A Meta incluiu mecanismos de segurança mais fortes no Llama 3.3:
- Integração de mecanismos de rejeição com ajuste fino
- Ferramenta de controle de risco Llama Guard 3
- Mecanismos de alinhamento ético bem ajustados
Essas iniciativas garantem que os modelos permaneçam inteligentes de forma responsável e controlada e, ao mesmo tempo, sejam abertamente acessíveis.
Impacto no setor
Os números falam por si: o número acumulado de downloads dos modelos da Llama ultrapassou 650 milhões, o que não é apenas um número, mas a prova de que a IA de código aberto é imparável. Não se trata apenas de um número, é a prova de que a IA de código aberto é imparável, e a Llama 3.3 está transformando a tecnologia de IA de ponta de um "clube de elite" em uma "festa para as massas".
O plano estratégico de Mark Zuckerberg
Enquanto a Llama 4 está no roteiro para 2025, a Llama 3.3 já está estabelecendo uma base sólida para o futuro. A Meta está investindo ativamente em infraestrutura, como um data center de 2 gigawatts em Louisiana, nos EUA, destacando seu forte compromisso com o crescimento de longo prazo da IA.
Download da implantação
O Llama 3.3 foi adicionado à biblioteca de modelos do Ollam com um tamanho de modelo de 42G, que pode ser baixado e implantado diretamente.
Os desenvolvedores que não estiverem implementando o Llama 3.3 podem visitar o repositório GitHub do Meta ou fazer o download dos arquivos de modelo no Hugging Face.
Cartões modelo:
github.com/meta-llama/llama-models/blob/main/models/llama3_3/MODEL_CARD.md
Arquivos de modelos:
huggingface.co/meta-llama/Llama-3.3-70B-Instruct