Documento da Microsoft que vazou: apenas 8 bilhões para o GPT-4o-mini e 100 bilhões para o o1-mini?

Notícias sobre IAPublicado há 8 meses Círculo de compartilhamento de IA

7.2K 00

Tem havido uma discussão contínua sobre os tamanhos dos parâmetros dos principais LLMs de código fechado e, nos últimos dois dias de 2024, um artigo da Microsoft sobre oDetecção e correção de erros médicos em anotações clínicasconjecturaexperimentopadrão de referênciaO estudo MEDEC ignorou acidentalmente e diretamente a escala de seus parâmetros:o1-preview, GPT-4.GPT-4o eClaude 3.5 Soneto.

Endereço para correspondência: https://arxiv.org/pdf/2412.19260v1

微软论文泄露：GPT-4o-mini只有8B，o1-mini仅100B？

A parte experimental do experimento também divide as grandes escalas de parâmetros do modelo em três blocos:7-8B, ~100-300B, ~1,7Tmas (não)GPT-4o-miniSer colocado na primeira posição com apenas 8B é um pouco inacreditável.

resumos

微软论文泄露：GPT-4o-mini只有8B，o1-mini仅100B？

Claude 3,5 Soneto (2024-10-22), ~175B
ChatGPT, ~175B
GPT-4, aproximadamente 1,76T
GPT-4o, ~200B
GPT-4o-mini (gpt-4o-2024-05-13) somente 8B
Último o1-mini (o1-mini-2024-09-12) apenas 100B
o1-preview (o1-preview-2024-09-12) ~ 300B

Notícias sobre IA

© declaração de direitos autorais

Direitos autorais do artigo Círculo de compartilhamento de IA A todos, favor não reproduzir sem permissão.

Artigos relacionados

Meta 发布 Llama 3.2：推出新一代 1B 和 3B 小型语言模型

A Meta lança o Llama 3.2: Apresentando a próxima geração de modelos de idiomas pequenos 1B e 3B

Notícias sobre IA

11 meses atrás

010.8K

亚马逊 All in AI Agent：AWS 的下一个增长点？

Amazon All in AI Agent: a próxima área de crescimento da AWS?

Notícias sobre IA

6 meses atrás

010.6K

研究表明:RL 在学习可泛化知识方面优于 SFT，尤其在多模态任务中展现出更强的推理与视觉识别能力

Demonstra-se que: a RL supera a SFT no aprendizado de conhecimentos generalizáveis, especialmente em tarefas multimodais, mostrando habilidades mais fortes de raciocínio e reconhecimento visual

Notícias sobre IA

7 meses atrás

08K

Monica（莫妮卡）开启国内域名，对比海外收费模式，国内版免费使用！

Monica (Mônica) abre um nome de domínio doméstico e o compara com o modelo pago no exterior; a versão doméstica é de uso gratuito!

Notícias sobre IA

6 meses atrás

010.4K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

nenhum

Nenhum comentário...

Português do Brasil