Anthropic lanza nuevos modelos Claude 3.5 y "funciones de uso informático
Anthropic ha anunciado hoy el lanzamiento de una versión mejorada delSoneto Claude 3.5y nuevos modelosClaude 3.5 Haiku. Esta actualización no sólo mejora las capacidades de codificación, sino que también introduce una función innovadora: elUso del ordenadorque se encuentra actualmente en fase de pruebas públicas.
actualizado Claude El Claude 3.5 Sonnet mejora a su predecesor en todos los frentes y, en particular, progresa significativamente en el área de la codificación, en la que ya era líder.El Claude 3.5 Haiku rinde a la par que nuestro anterior modelo de mayor tamaño, el Claude 3 Opus, alcanzando el mismo coste y velocidades similares a la anterior generación de Haiku en muchas evaluaciones.

Actualización importante para Claude 3.5 Sonnet
El Sonnet Claude 3.5 actualizado destaca en varias áreas, sobre todo en codificación, donde su rendimiento mejora de 33,41 TP3T a 49,01 TP3T en el benchmark SWE-bench Verified, superando a todos los modelos disponibles públicamente. Además, el rendimiento de Sonnet en los dominios minorista y aeroespacial de TAU-bench también mejoró significativamente, de 62,61 TP3T a 69,21 TP3T y de 36,01 TP3T a 46,01 TP3T, respectivamente.
Los primeros comentarios de los usuarios muestran que Claude 3.5 Sonnet funciona bien durante el desarrollo de software en varios pasos, y empresas como GitLab han descubierto que mejora el razonamiento en 101 TP3T sin aumentar la latencia.

Claude 3.5 Haiku: eficiente y económico al mismo tiempo
El nuevo Claude 3.5 Haiku es el modelo más rápido disponible en la actualidad, y rinde especialmente bien en tareas de codificación, con una puntuación de 40,61 TP3T en SWE-bench Verified.El Haiku supera a su predecesor, el modelo más grande, el Claude 3 Opus, al mismo coste y velocidad.
Funciones informáticas innovadoras
Claude 3.5 Sonnet es el primer modelo de IA de vanguardia que ofrece funciones de uso del ordenador en pruebas públicas. Los desarrolladores pueden dar instrucciones a Claude para que utilice el ordenador como un humano a través de la API, lo que incluye ver la pantalla, mover el cursor, pulsar botones e introducir texto. Esta funcionalidad, aunque todavía en fase experimental, ha sido utilizada por Asana, Canva, Cognition y otros para realizar tareas complejas.
Aunque el Claude actual sigue siendo torpe al realizar ciertas acciones, obtuvo una puntuación de 14,91 TP3T en la evaluación de OSWorld, muy superior a los 7,81 TP3T de otros sistemas de IA.Anthropic afirma que seguirá mejorando esta capacidad y tomando medidas para garantizar un uso seguro que evite posibles abusos.
mirando hacia delante
A medida que la tecnología siga evolucionando, Anthropic espera conocer mejor el potencial y el impacto de esta nueva funcionalidad a través de los comentarios de los usuarios. La empresa anima a los desarrolladores a explorar estos nuevos modelos y espera ver cómo utilizan estas innovaciones para impulsar la productividad.
Anthropic cree que estos nuevos avances abrirán nuevas posibilidades para que los usuarios interactúen con Claude.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...