Documento filtrado de Microsoft: ¿sólo 8.000 millones para GPT-4o-mini y 100.000 millones para o1-mini?

Noticias AIPublicado hace 11 meses Círculo de intercambio de inteligencia artificial

20.6K 00

Ha habido una discusión en curso sobre los tamaños de los parámetros de los principales LLM de código cerrado, y en los últimos 2 días de 2024 un artículo de Microsoft sobre elDetección y corrección de errores médicos en las notas clínicasconjeturaexperimentopatrón de referenciaEl estudio del MEDEC se saltó accidental y directamente la escala de sus parámetros:o1-preview, GPT-4.GPT-4o ySoneto Claude 3.5.

Dirección de la ponencia: https://arxiv.org/pdf/2412.19260v1

La parte experimental del experimento también divide las grandes escalas de parámetros del modelo en 3 bloques:7-8B, ~100-300B, ~1,7Tpero (no)GPT-4o-miniEstar en el primer puesto con sólo 8B es un poco increíble.

resúmenes

Claude 3,5 Soneto (2024-10-22), ~175B
ChatGPT, ~175B
GPT-4, aproximadamente 1,76T
GPT-4o, ~200B
GPT-4o-mini (gpt-4o-2024-05-13) Sólo 8B
Último o1-mini (o1-mini-2024-09-12) sólo 100B
o1-preview (o1-preview-2024-09-12) ~ 300B

Noticias AI

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Puestos relacionados

Wenxin Intelligence Body lanza Lead Intelligence Body centrado en la conversión empresarial de alta eficacia

Noticias AI

hace 8mos

028.8K

ICLR 惊现[10,10,10,10]满分论文，ControlNet作者新作——IC-Light V2适配Flux

ICLR Sorprendentemente [10,10,10,10,10] Ponencia completa, ControlNet Nuevo trabajo del autor - IC-Light V2 Adaptación a Flux

Noticias AI

hace 11mos

024.8K

Windsurf Wave 2 重大更新：引入网页搜索和自动化记忆功能，并提供企业级混合部署版本

Actualización importante de Windsurf Wave 2: introduce la búsqueda web y la memoria automatizada con la versión de despliegue híbrido para empresas

Noticias AI

hace 10mos

026.3K

Copilot Agents Encuentros en el lugar de trabajo: el nuevo interés amoroso del Director General

Noticias AI

Hace 1 año

024.2K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Documento filtrado de Microsoft: ¿sólo 8.000 millones para GPT-4o-mini y 100.000 millones para o1-mini?

Copilot en OneDrive 2025 Ruta de nuevas funciones

Xinference: fácil despliegue y servicio de modelos de IA distribuidos

Puestos relacionados

Wenxin Intelligence Body lanza Lead Intelligence Body centrado en la conversión empresarial de alta eficacia

ICLR Sorprendentemente [10,10,10,10,10] Ponencia completa, ControlNet Nuevo trabajo del autor - IC-Light V2 Adaptación a Flux

Actualización importante de Windsurf Wave 2: introduce la búsqueda web y la memoria automatizada con la versión de despliegue híbrido para empresas

Copilot Agents Encuentros en el lugar de trabajo: el nuevo interés amoroso del Director General

Sin comentarios

Últimas colecciones

Últimos artículos

Documento filtrado de Microsoft: ¿sólo 8.000 millones para GPT-4o-mini y 100.000 millones para o1-mini?

Copilot en OneDrive 2025 Ruta de nuevas funciones

Xinference: fácil despliegue y servicio de modelos de IA distribuidos

Puestos relacionados

Wenxin Intelligence Body lanza Lead Intelligence Body centrado en la conversión empresarial de alta eficacia

ICLR Sorprendentemente [10,10,10,10,10] Ponencia completa, ControlNet Nuevo trabajo del autor - IC-Light V2 Adaptación a Flux

Actualización importante de Windsurf Wave 2: introduce la búsqueda web y la memoria automatizada con la versión de despliegue híbrido para empresas

Copilot Agents Encuentros en el lugar de trabajo: el nuevo interés amoroso del Director General

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos