¡Extra: o1-mini se ha abierto completamente a la experiencia de cuenta gratuita ChatGPT!

Noticias AIPublicado hace 2 años Círculo de intercambio de inteligencia artificial

41.5K 00

La familia de modelos o1 son modelos avanzados de razonamiento de procesos, de los cuales el modelo de pequeño tamaño o1-mini tiene el potencial de ser más fuerte que o1-preview en términos de razonamiento lógico, aunque la capacidad de conocimiento del mundo se ha reducido.

Actualmente o1-mini sólo está abierto a algunas cuentas gratuitas para la experiencia de vista previa, si su cuenta está abierta oficialmente o1-mini modelo se puede verificar con las siguientes preguntas de decodificación:

oyfjdnisdr rtqwainr acxz mynzbhhx -> Piense paso a paso
Utiliza el ejemplo anterior para descodificarlo.
oyekaijzdf aaptcg suaokybhai ouow aqht mynznvaatzacdfoulxxz

La pregunta de validación anterior procede de OpenAI o1 Aprendizaje de la capacidad de razonamiento para grandes modelos lingüísticosPara más información sobre el modelo o1-mini, consulte el siguiente artículo. Introducción al macromodelo OpenAI o1-mini.

Si no tienes una cuenta gratuita ChatGPT o no tienes acceso a la experiencia o1-mini, puedes visitar:Sitio espejo de ChatGPT (acceso doméstico a los modelos de la serie GPT4) Experiencia.

Algunas cuestiones de interés sobre el modelo OpenAI o1

Nombres de modelos y patrones de inferencia

OpenAI o1 representa un nuevo nivel de capacidad de IA y el contador se reinicia a 1
"Preview" indica que se trata de una versión preliminar del modelo completo.
"Mini" indica que se trata de una versión más pequeña del modelo o1, optimizada para la velocidad
o - en nombre de OpenAI
o1 no es un "sistema", sino un modelo que capacita a los alumnos para hacer crecer la cadena de razonamientos antes de dar la respuesta final.
El icono de o1 representa simbólicamente a un alienígena con habilidades extraordinarias

o1 Tamaño y rendimiento del modelo

o1-mini es más pequeño y rápido que o1-preview, por lo que estará disponible para los usuarios gratuitos en el futuro.
o1-preview es un punto de control temprano en el modelo o1, ni demasiado grande ni demasiado pequeño
o1-mini rinde mejor en tareas STEM pero es limitado en el conocimiento del mundo
o1-mini rinde bien en algunas tareas, especialmente en las relacionadas con el código, mejor que o1-preview
Entradas para o1 Ficha se calcula del mismo modo que GPT-4o, utilizando el mismo Tokenizer
Comparado con o1-preview, o1-mini puede explorar más cadenas de pensamiento

Contextos de tokens de entrada y capacidades del modelo

Los modelos o1 pronto admitirán contextos de entrada más amplios
El modelo o1 puede manejar tareas más largas y abiertas, con menos necesidad de trocear las entradas como ocurre con GPT-4o
o1 puede generar largas cadenas de razonamientos antes de dar una respuesta, a diferencia de los modelos anteriores
Actualmente no es posible pausar la inferencia durante la inferencia de CoT para añadir más contexto, pero se está estudiando esta posibilidad en futuros modelos.

Herramientas, funciones y próximas funciones

o1-preview no utiliza herramientas en la actualidad, pero está previsto que admita llamadas a funciones, intérpretes de código y funciones de navegación.
En futuras actualizaciones se añadirán herramientas, salidas estructuradas y sugerencias del sistema.
Con el tiempo, los usuarios podrán controlar el tiempo de reflexión y los límites de fichas
Hay planes en marcha para soportar el procesamiento en flujo continuo y considerar la posibilidad de reflejar el progreso de la inferencia en la API.
Se han incorporado las capacidades multimodales del o1, con el objetivo de lograr un rendimiento de vanguardia en tareas como el MMMU

CoT (cadena de razonamiento) razonamiento

o1 Generación de cadenas de inferencia ocultas durante los procesos de inferencia
No hay planes para exponer el token CoT a los usuarios de la API o ChatGPT
CoT Token se resumirá, pero no hay garantía de que sea totalmente coherente con el proceso de razonamiento real
Las instrucciones del aviso pueden influir en la forma en que el modelo piensa sobre el problema
El aprendizaje por refuerzo (RL) se utilizó para mejorar la capacidad de CoT de o1, mientras que GPT-4o fue incapaz de alcanzar su rendimiento CoT sólo con la señalización.
Aunque la fase de razonamiento pueda parecer más lenta, en realidad la generación de respuestas suele ser más rápida, ya que resume el proceso de razonamiento

API y restricciones de uso

o1-mini tiene un límite semanal de 50 avisos para los usuarios de ChatGPT Plus
Todos los tacos se cuentan igual en ChatGPT
Con el tiempo se irán introduciendo más niveles de acceso a la API y límites más elevados.
La caché de sugerencias en las API es una demanda candente, pero aún no hay plazos

Fijación de precios, ajuste y ampliación

o1 Se espera que los precios de los modelos sigan una tendencia a la baja cada 1-2 años
Los precios de las API por volumen serán compatibles a medida que aumenten las restricciones
La puesta a punto está en proyecto, pero aún no se ha determinado el calendario
o1 Expansión limitada por la falta de talento en investigación e ingeniería
Un nuevo paradigma ampliado para la computación inferencial puede conducir a mejoras significativas en futuras generaciones de modelos
Las extensiones inversas no son significativas en este momento, pero o1-preview tiene un rendimiento sólo ligeramente mejor (o incluso ligeramente peor) que GPT-4o en tareas de escritura individuales

Desarrollo de modelos e investigación

o1 Capacidad de razonamiento mediante formación intensiva
El modelo demuestra un pensamiento creativo y destaca en tareas laterales como la poesía
El razonamiento filosófico de o1 y su capacidad de razonamiento amplio son impresionantes, como descifrar códigos
Los investigadores utilizaron o1 para crear un bot de GitHub que envía un mensaje a los CODEOWNERS adecuados para que revisen el código.
En las pruebas internas, o1 se planteó preguntas difíciles para evaluar su capacidad de
Se está añadiendo un amplio conocimiento del dominio mundial, que se mejorará en futuras versiones.
Datos actualizados previstos para o1-mini (actualmente en octubre de 2023)

Consejos y buenas prácticas

o1 Beneficiarse de proporcionar consejos sobre casos extremos o estilos de razonamiento
Los modelos o1 son más receptivos a los indicios de razonamiento en los indicios que los modelos anteriores
Proporcionar contexto relevante en la Generación Aumentada de Recuperación (RAG) mejora el rendimiento; los fragmentos irrelevantes pueden debilitar la inferencia

Comentarios generales y futuras mejoras

o1-preview es menos restrictivo debido a que se encuentra en una fase temprana de pruebas, pero aumentará el número de
Se están mejorando activamente la latencia y los tiempos de inferencia

Gran capacidad de modelización

o1 puede reflexionar sobre cuestiones filosóficas como "¿Qué es la vida?".
Los investigadores descubren que o1 destaca en el manejo de tareas complejas y en el razonamiento extensivo a partir de instrucciones limitadas
Las habilidades de razonamiento creativo de o1, como evaluar su capacidad formulando sus propias preguntas, demuestran un alto nivel de capacidad para resolver problemas.

Noticias AI

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Próximamente, Kling 1.5: "Modelos personalizados" entrena a los personajes con sus propias secuencias de vídeo.

Noticias AI

hace 1 año

052.9K

Explora el asistente de inteligencia artificial con funciones similares a las de Kimi

Noticias AI

hace 2 años

070.6K

o3-mini 碾压DeepSeek R1？一条python程序引发近400万围观

o3-mini aplasta a DeepSeek R1: un programa en Python que generó casi 4 millones de visitas

Noticias AI

hace 1 año

044.2K

Recomendar un sistema profesional de clonación humana digital apto para operaciones de bajo coste

Noticias AI

hace 1 año

039.3K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

¡Extra: o1-mini se ha abierto completamente a la experiencia de cuenta gratuita ChatGPT!

Algunas cuestiones de interés sobre el modelo OpenAI o1

Jina AI presenta Reader-LM, un revolucionario modelo de lenguaje reducido para extraer eficazmente el contenido principal de las páginas web HTML

¡Tencent MetaWare admite la publicación de cadáveres inteligentes en números públicos!

Artículos relacionados

Próximamente, Kling 1.5: "Modelos personalizados" entrena a los personajes con sus propias secuencias de vídeo.

Explora el asistente de inteligencia artificial con funciones similares a las de Kimi

o3-mini aplasta a DeepSeek R1: un programa en Python que generó casi 4 millones de visitas

Recomendar un sistema profesional de clonación humana digital apto para operaciones de bajo coste

Sin comentarios

Últimas colecciones

Últimos artículos

¡Extra: o1-mini se ha abierto completamente a la experiencia de cuenta gratuita ChatGPT!

Algunas cuestiones de interés sobre el modelo OpenAI o1

Jina AI presenta Reader-LM, un revolucionario modelo de lenguaje reducido para extraer eficazmente el contenido principal de las páginas web HTML

¡Tencent MetaWare admite la publicación de cadáveres inteligentes en números públicos!

Artículos relacionados

Próximamente, Kling 1.5: "Modelos personalizados" entrena a los personajes con sus propias secuencias de vídeo.

Explora el asistente de inteligencia artificial con funciones similares a las de Kimi

o3-mini aplasta a DeepSeek R1: un programa en Python que generó casi 4 millones de visitas

Recomendar un sistema profesional de clonación humana digital apto para operaciones de bajo coste

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos