¡Extra: o1-mini se ha abierto completamente a la experiencia de cuenta gratuita ChatGPT!

号外:o1-mini已全面开放给ChatGPT免费账户体验

 

La familia de modelos o1 son modelos avanzados de razonamiento de procesos, de los cuales el modelo de pequeño tamaño o1-mini tiene el potencial de ser más fuerte que o1-preview en términos de razonamiento lógico, aunque la capacidad de conocimiento del mundo se ha reducido.

Actualmente o1-mini sólo está abierto a algunas cuentas gratuitas para la experiencia de vista previa, si su cuenta está abierta oficialmente o1-mini modelo se puede verificar con las siguientes preguntas de decodificación:

oyfjdnisdr rtqwainr acxz mynzbhhx -> Piense paso a paso

Utiliza el ejemplo anterior para descodificarlo.

oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz

La pregunta de validación anterior procede de OpenAI o1 Aprendizaje de la capacidad de razonamiento para grandes modelos lingüísticosPara más información sobre el modelo o1-mini, consulte el siguiente artículo. Introducción al macromodelo OpenAI o1-mini.

 

Si no tienes una cuenta gratuita ChatGPT o no tienes acceso a la experiencia o1-mini, puedes visitar:Sitio espejo de ChatGPT (acceso doméstico a los modelos de la serie GPT4) Experiencia.

 

 

Algunas cuestiones de interés sobre el modelo OpenAI o1

 

Nombres de modelos y patrones de inferencia

  • OpenAI o1 representa un nuevo nivel de capacidad de IA y el contador se reinicia a 1
  • "Preview" indica que se trata de una versión preliminar del modelo completo.
  • "Mini" indica que se trata de una versión más pequeña del modelo o1, optimizada para la velocidad
  • o - en nombre de OpenAI
  • o1 no es un "sistema", sino un modelo que capacita a los alumnos para hacer crecer la cadena de razonamientos antes de dar la respuesta final.
  • El icono de o1 representa simbólicamente a un alienígena con habilidades extraordinarias

 

o1 Tamaño y rendimiento del modelo

  • o1-mini es más pequeño y rápido que o1-preview, por lo que estará disponible para los usuarios gratuitos en el futuro.
  • o1-preview es un punto de control temprano en el modelo o1, ni demasiado grande ni demasiado pequeño
  • o1-mini rinde mejor en tareas STEM pero es limitado en el conocimiento del mundo
  • o1-mini rinde bien en algunas tareas, especialmente en las relacionadas con el código, mejor que o1-preview
  • Entradas para o1 Ficha se calcula del mismo modo que GPT-4o, utilizando el mismo Tokenizer
  • Comparado con o1-preview, o1-mini puede explorar más cadenas de pensamiento

 

Contextos de tokens de entrada y capacidades del modelo

  • Los modelos o1 pronto admitirán contextos de entrada más amplios
  • El modelo o1 puede manejar tareas más largas y abiertas, con menos necesidad de trocear las entradas como ocurre con GPT-4o
  • o1 puede generar largas cadenas de razonamientos antes de dar una respuesta, a diferencia de los modelos anteriores
  • Actualmente no es posible pausar la inferencia durante la inferencia de CoT para añadir más contexto, pero se está estudiando esta posibilidad en futuros modelos.

 

Herramientas, funciones y próximas funciones

  • o1-preview no utiliza herramientas en la actualidad, pero está previsto que admita llamadas a funciones, intérpretes de código y funciones de navegación.
  • En futuras actualizaciones se añadirán herramientas, salidas estructuradas y sugerencias del sistema.
  • Con el tiempo, los usuarios podrán controlar el tiempo de reflexión y los límites de fichas
  • Hay planes en marcha para soportar el procesamiento en flujo continuo y considerar la posibilidad de reflejar el progreso de la inferencia en la API.
  • Se han incorporado las capacidades multimodales del o1, con el objetivo de lograr un rendimiento de vanguardia en tareas como el MMMU

 

CoT (cadena de razonamiento) razonamiento

  • o1 Generación de cadenas de inferencia ocultas durante los procesos de inferencia
  • No hay planes para exponer el token CoT a los usuarios de la API o ChatGPT
  • CoT Token se resumirá, pero no hay garantía de que sea totalmente coherente con el proceso de razonamiento real
  • Las instrucciones del aviso pueden influir en la forma en que el modelo piensa sobre el problema
  • El aprendizaje por refuerzo (RL) se utilizó para mejorar la capacidad de CoT de o1, mientras que GPT-4o fue incapaz de alcanzar su rendimiento CoT sólo con la señalización.
  • Aunque la fase de razonamiento pueda parecer más lenta, en realidad la generación de respuestas suele ser más rápida, ya que resume el proceso de razonamiento

 

API y restricciones de uso

  • o1-mini tiene un límite semanal de 50 avisos para los usuarios de ChatGPT Plus
  • Todos los tacos se cuentan igual en ChatGPT
  • Con el tiempo se irán introduciendo más niveles de acceso a la API y límites más elevados.
  • La caché de sugerencias en las API es una demanda candente, pero aún no hay plazos

 

Fijación de precios, ajuste y ampliación

  • o1 Se espera que los precios de los modelos sigan una tendencia a la baja cada 1-2 años
  • Los precios de las API por volumen serán compatibles a medida que aumenten las restricciones
  • La puesta a punto está en proyecto, pero aún no se ha determinado el calendario
  • o1 Expansión limitada por la falta de talento en investigación e ingeniería
  • Un nuevo paradigma ampliado para la computación inferencial puede conducir a mejoras significativas en futuras generaciones de modelos
  • Las extensiones inversas no son significativas en este momento, pero o1-preview tiene un rendimiento sólo ligeramente mejor (o incluso ligeramente peor) que GPT-4o en tareas de escritura individuales

 

Desarrollo de modelos e investigación

  • o1 Capacidad de razonamiento mediante formación intensiva
  • El modelo demuestra un pensamiento creativo y destaca en tareas laterales como la poesía
  • El razonamiento filosófico de o1 y su capacidad de razonamiento amplio son impresionantes, como descifrar códigos
  • Los investigadores utilizaron o1 para crear un bot de GitHub que envía un mensaje a los CODEOWNERS adecuados para que revisen el código.
  • En las pruebas internas, o1 se planteó preguntas difíciles para evaluar su capacidad de
  • Se está añadiendo un amplio conocimiento del dominio mundial, que se mejorará en futuras versiones.
  • Datos actualizados previstos para o1-mini (actualmente en octubre de 2023)

 

Consejos y buenas prácticas

  • o1 Beneficiarse de proporcionar consejos sobre casos extremos o estilos de razonamiento
  • Los modelos o1 son más receptivos a los indicios de razonamiento en los indicios que los modelos anteriores
  • Proporcionar contexto relevante en la Generación Aumentada de Recuperación (RAG) mejora el rendimiento; los fragmentos irrelevantes pueden debilitar la inferencia

 

Comentarios generales y futuras mejoras

  • o1-preview es menos restrictivo debido a que se encuentra en una fase temprana de pruebas, pero aumentará el número de
  • Se están mejorando activamente la latencia y los tiempos de inferencia

 

Gran capacidad de modelización

  • o1 puede reflexionar sobre cuestiones filosóficas como "¿Qué es la vida?".
  • Los investigadores descubren que o1 destaca en el manejo de tareas complejas y en el razonamiento extensivo a partir de instrucciones limitadas
  • Las habilidades de razonamiento creativo de o1, como evaluar su capacidad formulando sus propias preguntas, demuestran un alto nivel de capacidad para resolver problemas.
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...