Anthropic lanza nuevos modelos Claude 3.5 y "funciones de uso informático

Noticias AIActualizado hace 1 año Círculo de intercambio de inteligencia artificial

Anthropic ha anunciado hoy el lanzamiento de una versión mejorada delSoneto Claude 3.5y nuevos modelosClaude 3.5 Haiku. Esta actualización no sólo mejora las capacidades de codificación, sino que también introduce una función innovadora: elUso del ordenadorque se encuentra actualmente en fase de pruebas públicas.

actualizado Claude El Claude 3.5 Sonnet mejora a su predecesor en todos los frentes y, en particular, progresa significativamente en el área de la codificación, en la que ya era líder.El Claude 3.5 Haiku rinde a la par que nuestro anterior modelo de mayor tamaño, el Claude 3 Opus, alcanzando el mismo coste y velocidades similares a la anterior generación de Haiku en muchas evaluaciones.

Actualización importante para Claude 3.5 Sonnet

El Sonnet Claude 3.5 actualizado destaca en varias áreas, sobre todo en codificación, donde su rendimiento mejora de 33,41 TP3T a 49,01 TP3T en el benchmark SWE-bench Verified, superando a todos los modelos disponibles públicamente. Además, el rendimiento de Sonnet en los dominios minorista y aeroespacial de TAU-bench también mejoró significativamente, de 62,61 TP3T a 69,21 TP3T y de 36,01 TP3T a 46,01 TP3T, respectivamente.

Los primeros comentarios de los usuarios muestran que Claude 3.5 Sonnet funciona bien durante el desarrollo de software en varios pasos, y empresas como GitLab han descubierto que mejora el razonamiento en 101 TP3T sin aumentar la latencia.

Claude 3.5 Haiku: eficiente y económico al mismo tiempo

El nuevo Claude 3.5 Haiku es el modelo más rápido disponible en la actualidad, y rinde especialmente bien en tareas de codificación, con una puntuación de 40,61 TP3T en SWE-bench Verified.El Haiku supera a su predecesor, el modelo más grande, el Claude 3 Opus, al mismo coste y velocidad.

Funciones informáticas innovadoras

Claude 3.5 Sonnet es el primer modelo de IA de vanguardia que ofrece funciones de uso del ordenador en pruebas públicas. Los desarrolladores pueden dar instrucciones a Claude para que utilice el ordenador como un humano a través de la API, lo que incluye ver la pantalla, mover el cursor, pulsar botones e introducir texto. Esta funcionalidad, aunque todavía en fase experimental, ha sido utilizada por Asana, Canva, Cognition y otros para realizar tareas complejas.

Aunque el Claude actual sigue siendo torpe al realizar ciertas acciones, obtuvo una puntuación de 14,91 TP3T en la evaluación de OSWorld, muy superior a los 7,81 TP3T de otros sistemas de IA.Anthropic afirma que seguirá mejorando esta capacidad y tomando medidas para garantizar un uso seguro que evite posibles abusos.

mirando hacia delante

A medida que la tecnología siga evolucionando, Anthropic espera conocer mejor el potencial y el impacto de esta nueva funcionalidad a través de los comentarios de los usuarios. La empresa anima a los desarrolladores a explorar estos nuevos modelos y espera ver cómo utilizan estas innovaciones para impulsar la productividad.

Anthropic cree que estos nuevos avances abrirán nuevas posibilidades para que los usuarios interactúen con Claude.

Noticias AI

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Puestos relacionados

Qwen2.5-1M: Un modelo Qwen de código abierto compatible con un millón de contextos de tokens

Noticias AI

hace 12mos

045.4K

¡Tencent MetaWare admite la publicación de cadáveres inteligentes en números públicos!

Noticias AI

Hace 1 año

046.3K

微软 Azure+Copilot+AI PC 产品全线支持 DeepSeek R1 模型

Los productos para PC Microsoft Azure+Copilot+AI son totalmente compatibles con los modelos DeepSeek R1

Noticias AI

hace 11mos

034.8K

10 herramientas gratuitas de AI para generar párrafos en inglés (2024)

Noticias AI

Hace 1 año

034.5K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Anthropic lanza nuevos modelos Claude 3.5 y "funciones de uso informático

Pika lanza PIKAFFECT: ¡transforma instantáneamente tus fotos en vídeos con efectos especiales!

El nuevo lienzo Ideogram Canvas incorpora las herramientas Magic Fill y Extend, líderes del sector.

Puestos relacionados

Qwen2.5-1M: Un modelo Qwen de código abierto compatible con un millón de contextos de tokens

¡Tencent MetaWare admite la publicación de cadáveres inteligentes en números públicos!

Los productos para PC Microsoft Azure+Copilot+AI son totalmente compatibles con los modelos DeepSeek R1

10 herramientas gratuitas de AI para generar párrafos en inglés (2024)

Sin comentarios

Últimas colecciones

Últimos artículos

Anthropic lanza nuevos modelos Claude 3.5 y "funciones de uso informático

Pika lanza PIKAFFECT: ¡transforma instantáneamente tus fotos en vídeos con efectos especiales!

El nuevo lienzo Ideogram Canvas incorpora las herramientas Magic Fill y Extend, líderes del sector.

Puestos relacionados

Qwen2.5-1M: Un modelo Qwen de código abierto compatible con un millón de contextos de tokens

¡Tencent MetaWare admite la publicación de cadáveres inteligentes en números públicos!

Los productos para PC Microsoft Azure+Copilot+AI son totalmente compatibles con los modelos DeepSeek R1

10 herramientas gratuitas de AI para generar párrafos en inglés (2024)

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos