Introducción a OpenAI o1-preview
Base de conocimientos de IAActualizado hace 11 meses Círculo de intercambio de inteligencia artificial 2.2K 00
OpenAI presenta una nueva serie de modelos de inferencia creados para resolver problemas difíciles. Se lanzará oficialmente a partir del 12 de septiembre.
Hemos desarrollado una serie de nuevos modelos de IA que se toman más tiempo para pensar antes de dar una respuesta. Pueden realizar tareas complejas y resolver problemas más complejos que los modelos anteriores en ámbitos como la ciencia, la programación y las matemáticas.
Hoy estamos en el ChatGPT y nuestra API ha lanzado el primer modelo de esta serie. Se trata de una versión preliminar y tenemos previsto realizar actualizaciones y mejoras periódicas. Mientras tanto, hemos hecho laResultados de la próxima evaluación actualizadaLa actualización está actualmente en desarrollo.
Principio de funcionamiento
Entrenamos a estos modelos para que piensen más profundamente antes de responder a las preguntas, igual que hacen los humanos. A través del entrenamiento, aprenden a refinar sus procesos de pensamiento, probar diferentes estrategias y reconocer sus errores.
En nuestras pruebas, la actualización de modelos lista para su lanzamiento rindió a nivel de doctorado en tareas de referencia exigentes de física, química y biología. También sobresalió en matemáticas y programación. En el examen clasificatorio de la Olimpiada Matemática Internacional (IMO), GPT-4o sólo resolvió correctamente 13% problemas, mientras que el nuevo modelo de inferencia logró 83%. En cuanto a la capacidad de programación, alcanzaron el antiguo nivel de rendimiento de 89% en la competición Codeforces. Encontrará más detalles en nuestroArtículos de investigación técnica.
Como modelo inicial, actualmente carece de muchas de las funciones útiles de ChatGPT, como la navegación web y la carga de imágenes de archivos. A corto plazo, para muchos escenarios comunes, GPT-4o puede ser más práctico.
Sin embargo, para tareas de razonamiento complejas, esto supone un gran avance y representa un nuevo nivel de capacidad de la IA. Basándonos en esto, volvimos a poner el contador en 1 y denominamos a la serie OpenAI o Security
Al desarrollar estos nuevos modelos, proponemos un nuevo enfoque de la formación en seguridad que aprovecha al máximo sus capacidades de razonamiento para permitir un mejor cumplimiento de las directrices de seguridad y alineación. Al ser capaces de razonar sobre nuestras normas de seguridad en contextos específicos, es posible aplicarlas con mayor eficacia.
Una forma de medir la seguridad es probar la capacidad del modelo para seguir cumpliendo las normas de seguridad ante el intento de un usuario de saltárselas (lo que comúnmente se conoce como "jailbreak"). En nuestra prueba más exigente de jailbreak, GPT-4o obtuvo 22 puntos sobre 100, mientras que nuestro modelo o1-preview obtuvo la friolera de 84. Más información enDescripción del sistemay nuestroArtículos de investigación.
Para adaptarnos a las nuevas capacidades de estos modelos, hemos mejorado nuestros esfuerzos en materia de seguridad, gobernanza interna y colaboración con el gobierno federal. Esto incluye el uso de nuestrosMarco de preparaciónRealización de pruebas y evaluaciones rigurosas, pruebas de equipo rojo de primera categoría y un proceso de revisión a nivel de junta directiva que incluye la participación de nuestro Comité de Seguridad y Protección.
En aras de nuestro compromiso con la seguridad de la IA, recientemente hemos firmado acuerdos formales con los Institutos de Seguridad de la IA de Estados Unidos y el Reino Unido. Hemos empezado a aplicar estos acuerdos, incluido el acceso anticipado de estos institutos a las versiones de investigación del modelo. Este es un primer paso importante en nuestra asociación para ayudar a establecer un proceso de investigación, evaluación y prueba de futuros modelos antes y después de su lanzamiento público.
población aplicable
Estas capacidades de razonamiento mejoradas son especialmente adecuadas para quienes trabajan en problemas complejos de ciencia, programación, matemáticas y otros campos. Por ejemplo, los investigadores médicos pueden utilizar o1 para anotar datos de secuenciación celular, los físicos para generar las complejas fórmulas matemáticas necesarias para la óptica cuántica y los desarrolladores de diversos campos para crear y ejecutar flujos de trabajo de varios pasos.
OpenAI o1-mini
La familia de modelos o1 destaca en la generación y depuración de código complejo. Para ofrecer a los desarrolladores una solución aún más eficaz, hemos introducido el modelo OpenAI o1-mini. Se trata de un modelo de razonamiento más rápido y económico que es especialmente bueno en tareas de programación. Como modelo a menor escala, o1-mini cuesta 80% menos que o1-preview, lo que lo convierte en una opción ideal para aplicaciones que requieren potencia de razonamiento pero no un amplio conocimiento del mundo, a la vez que potente y asequible.
Cómo utilizar OpenAI o1
A partir de hoy.Usuarios de ChatGPT Plus y TeamEl modelo o1 puede utilizarse en ChatGPT. Los usuarios pueden seleccionar manualmente o1-preview y o1-mini en el selector de modelos. o1-preview está limitado a 30 mensajes por semana y o1-mini a 50 mensajes por semana en la versión inicial. Estamos trabajando para aumentar estos límites y desarrollar la capacidad de ChatGPT para seleccionar automáticamente el modelo más apropiado para cada mensaje.

Usuarios de ChatGPT Enterprise y Edutendrán acceso a ambos modelos a partir de la próxima semana. Cumple API Nivel de uso 5 (se abre en una ventana nueva) (utilizado como expresión nominal)desarrolladoresYa puede empezar a crear prototipos con ambos modelos en la API, con un límite actual de 20 solicitudes por minuto. Estamos realizando pruebas adicionales con vistas a aumentar estos límites. Actualmente, las API de estos modelos no incluyen características como llamadas a funciones, streaming y soporte de mensajes de sistema. Para empezar, consulte la página Documentación de la API (se abre en una nueva ventana).
También tenemos previsto que todos los ChatGPT Usuarios gratuitosAmbos pueden utilizar la o1-mini.
perspectivas de futuro
Esto es sólo un primer avance de estos modelos de inferencia en ChatGPT y la API. Además de actualizar continuamente los modelos, estoy añadiendo navegación web, carga de archivos e imágenes y otras funciones para mejorar su utilidad.
Además de la nueva familia OpenAI o1, seguiremos desarrollando y publicando la familia de modelos GPT.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...