OpenAI lanza DeepResearch , inteligencia para la investigación profunda mediante modelos o3

Noticias AIActualizado hace 1 año Círculo de intercambio de inteligencia artificial

59.3K 00

¿Está cansado de buscar entre enormes cantidades de información y seguir teniendo dificultades para encontrar las respuestas que necesita? ¿Anhela un asistente inteligente que pueda investigar en profundidad por usted como un analista profesional? OpenAI se enorgullece de anunciar el lanzamiento del software más nuevo e innovador, OpenAI. ChatGPT Una nueva característica de la -Investigación en profundidad¡! Cambiará por completo su forma de obtener información, permitiéndole realizar en pocos minutos complejas tareas de investigación que, de otro modo, le llevarían horas. Este artículo le permitirá conocer en profundidad las potentes funciones de la investigación en profundidad, los escenarios de aplicación, los principios de trabajo y la futura dirección de desarrollo, ¡y juntos seremos testigos de cómo la IA potencia el trabajo del conocimiento y abre una nueva era de investigación inteligente!

Se trata de una inteligencia que utiliza el razonamiento para sintetizar grandes cantidades de información en línea y completar tareas de investigación de varios pasos por ti, similar al Perplejidad responder cantando Géminis La recién estrenada "Investigación profunda" de OpenAI utiliza su potente modelo o3 para recopilar y analizar cantidades ingentes de información a través de búsquedas en la web y, en última instancia, genera un informe profesional detallado con citas. Esta función ha suscitado una gran atención desde su lanzamiento y ha sido aclamada como un asistente de IA "superpotente", que anuncia la llegada de una nueva era de investigación asistida por IA.

Hoy está disponible para los usuarios Pro, y a continuación lo estará para los usuarios Plus y Team.

En pocas palabras:"Deep Research" lleva a cabo de forma autónoma investigaciones de redes en varios pasos, completando en 5-30 minutos tareas de investigación complejas que normalmente llevarían horas a un investigador humano, y presentando los resultados al usuario en un informe de alta calidad.

Lectura de referencia:Google lanza Deep ResearchyOpen Deep Research: generar investigación sobre IA a partir del contenido de las búsquedas webySTORM: búsqueda de datos en la web basada en temas, generación de artículos con citas, informes de artículos largos

¿Es buena la "investigación en profundidad"? Averigüémoslo:

Potente e increíblemente eficiente: Despídase de pasar la noche en vela buscando información. "Deep Research" lleva la investigación a un nuevo nivel de eficiencia al completar estudios complejos que tradicionalmente llevan horas en 5-30 minutos, con la capacidad de profundizar tanto como sea necesario para proporcionar análisis de nivel experto.
Los resultados son fiables y están bien documentados: Ya no tendrá que preocuparse por la fuente de la información. Todas las conclusiones van acompañadas de citas detalladas, hasta el párrafo correspondiente de la página web o PDF original, lo que facilita a los usuarios el rastreo y la verificación de la exactitud de la información, y hace que su investigación sea más convincente.
Amplia gama de aplicaciones, flexible y fácil de usar: Tanto si necesita realizar un análisis de la competencia, un estudio de mercado, una compra de productos o una investigación académica, "Investigación profunda" puede ser su mano derecha. Basta con seleccionar "Investigación profunda" en la interfaz de ChatGPT e introducir una consulta para iniciar la investigación. Admite la carga de archivos (por ejemplo, PDF) para proporcionar un contexto más específico, y la visualización en tiempo real del progreso de la investigación y las fuentes citadas en la barra lateral.
Tecnología avanzada y excelentes prestaciones: Basada en el aprendizaje por refuerzo de extremo a extremo, Deep Research es capaz de realizar tareas de navegación y razonamiento en varios pasos. Admite la lectura de contenidos de sitios web, el procesamiento de datos, la generación de gráficos y la citación de texto fuente para apoyar argumentos. En una difícil prueba de referencia denominada "Humanity's Last Exam" (HLE), Deep Research obtuvo una puntuación de 26,6%, superando con creces la puntuación de sus predecesores, entre ellos o3-mini (13%) y o1 (9%), lo que demuestra su potente capacidad de recuperación e integración de información y su comportamiento casi humano en la investigación.
Liberalización gradual y futuro prometedor: Actualmente está disponible para los usuarios Pro (100 búsquedas al mes) y se ampliará a los usuarios Plus (10 búsquedas al mes) dentro de un mes, a los que seguirán las ediciones Team y Enterprise. También habrá soporte para aplicaciones móviles y de escritorio en el futuro, y planes para conectarse a más fuentes de datos (tanto de suscripción como internas) para una personalización más potente.

Estos detalles son igualmente dignos de mención:

Cuantas más herramientas llame, más preciso será: El gráfico muestra que a medida que aumenta el número de llamadas a herramientas (Max Tool Calls), aumenta el porcentaje de aprobados de Deep Research en la prueba HLE, lo que indica una correlación positiva entre su inteligencia y su capacidad para utilizar herramientas.
El problema de las alucinaciones aún debe mejorarse: A pesar del impresionante rendimiento de Deep Research, sigue existiendo la posibilidad de que se produzcan ilusiones y razonamientos defectuosos, lo que constituye un punto clave de la optimización posterior de OpenAI.
Combinado con Operator, el potencial es ilimitado: Los planes de futuro de OpenAI consisten en trasladar la investigación en línea a las operaciones en el mundo real (Operador) se combinan para lograr funciones corporales inteligentes más potentes y muy esperadas.

Revisión oficial completa de DeepResearch

Hoy lanzamos Deep Research en ChatGPT, una nueva función del agente que permite realizar búsquedas multipaso en Internet para tareas complejas. Puede hacer en decenas de minutos lo que a un humano le llevaría horas.

Deep Research es la próxima inteligencia de OpenAI que puede trabajar por ti por sí sola: tú le das una indicación y ChatGPT encontrará, analizará y sintetizará cientos de fuentes online para crear un informe exhaustivo a nivel de analista de investigación. Está impulsado por una próxima versión del modelo OpenAI o3, optimizado para la navegación web y el análisis de datos, que utiliza la inferencia para buscar, interpretar y analizar la enorme cantidad de texto, imágenes y PDF de Internet, realizando los ajustes necesarios en función de la información encontrada.

La capacidad de sintetizar conocimientos es un requisito previo para la creación de nuevos conocimientos. Por esta razón, Deep Research supone un paso importante hacia nuestro objetivo más amplio de desarrollar la AGI, que desde hace tiempo prevemos generadora de nuevas investigaciones científicas.

Razones por las que elaboramos estudios en profundidad

Deep Research está pensada para personas que realizan un trabajo intensivo en conocimiento en campos como las finanzas, la ciencia, la política y la ingeniería y necesitan una investigación exhaustiva, precisa y fiable. También es útil para compradores avispados que desean un asesoramiento hiperpersonalizado sobre compras que normalmente requerirían una investigación minuciosa, como coches, electrodomésticos y muebles. Cada resultado está totalmente documentado, con citas claras y resúmenes de sus reflexiones, lo que facilita la consulta y validación de la información. Es especialmente eficaz para encontrar información de nicho, no intuitiva, que requiere navegar por un gran número de sitios. Deep Research libera un tiempo valioso al permitirle descargar y acelerar investigaciones web complejas y lentas con una sola consulta.

Deep Research descubre, razona e integra de forma independiente información procedente de toda la web. Para lograrlo, utiliza el mismo enfoque de aprendizaje por refuerzo que OpenAI o1 (nuestro primer modelo de inferencia), entrenado en tareas del mundo real que requieren el uso de un navegador y herramientas Python. Aunque o1 demuestra unas capacidades impresionantes en codificación, matemáticas y otras áreas técnicas, muchos retos del mundo real requieren una amplia recopilación de antecedentes e información de diversas fuentes en línea. La investigación en profundidad se basa en estas capacidades de razonamiento para salvar esta distancia y permitirles abordar la amplia gama de problemas a los que se enfrentan las personas en el trabajo y en su vida cotidiana.

Cómo utilizar la investigación en profundidad

En ChatGPT, selecciona "Investigación profunda" en el editor de mensajes e introduce tu consulta. Dile a ChatGPT lo que necesitas, ya sea un análisis competitivo de las plataformas de streaming o un informe personalizado sobre las mejores bicicletas para ir al trabajo. Puedes adjuntar archivos u hojas de cálculo para añadir contexto a tu pregunta. Una vez en marcha, aparece una barra lateral con un resumen de los pasos dados y las fuentes utilizadas.

Los estudios en profundidad pueden tardar entre 5 y 30 minutos en completar su trabajo y requieren tiempo para profundizar en la red. Mientras tanto, puedes irte o trabajar en otras tareas - se te notificará cuando el estudio esté completo. El resultado final se presenta en forma de informes en el chat. En las próximas semanas también añadiremos a estos informes imágenes incrustadas, visualizaciones de datos y otros resultados analíticos para aportar mayor claridad y contexto.

A diferencia de la investigación profunda, GPT-4o es muy adecuado para el diálogo multimodal en tiempo real. Paraámbitos polifacéticos y específicos en los que la profundidad y el detalle son fundamentalesLas consultas, la investigación en profundidad para una exploración exhaustiva y la capacidad de citar cada afirmación son la diferencia entre un resumen rápido y una respuesta bien documentada y validada (que puede utilizarse como producto de trabajo).

OpenAI 推出 DeepResearch ，利用o3模型进行深度研究的智能体

El estudio en profundidad responde a las preguntas de forma muy detallada, proporcionando datos por país/territorio de los 10 principales países desarrollados y de los 10 principales países en desarrollo para facilitar la referencia y la comparación. Utiliza esta información para ofrecer recomendaciones detalladas, fundamentadas y prácticas sobre la entrada en el mercado. Véase el ejemplo oficial: https://openai.com/index/introducing-deep-research/

Principio de funcionamiento

Deep Research se entrena utilizando el aprendizaje por refuerzo de extremo a extremo en tareas difíciles de exploración y razonamiento en diversos dominios. Gracias a este entrenamiento, aprendió a planificar y ejecutar trayectorias de varios pasos para encontrar los datos necesarios, y a retroceder y reaccionar a la información en tiempo real cuando es necesario. El modelo también es capaz de explorar archivos subidos por los usuarios, dibujar e iterar gráficos con herramientas de Python, incrustar en sus respuestas gráficos e imágenes generados en sitios web y citar frases o párrafos concretos de sus fuentes. Como resultado de este entrenamiento, alcanzó nuevas cotas en muchas evaluaciones públicas centradas en problemas del mundo real.

El último examen de la humanidad

existe El último examen de la humanidad (se abre en una ventana nueva)(una evaluación publicada recientemente que pone a prueba la IA en una amplia gama de temas con preguntas de nivel experto), el modelo habilitado para Deep Research obtuvo un nuevo máximo con una precisión de 26,6%. La prueba contiene más de 3.000 preguntas de opción múltiple y de respuesta corta que abarcan más de 100 temas, desde lingüística hasta cohetería, y desde clásicos hasta ecología. Las mayores mejoras con respecto a OpenAI o1 se produjeron en química, humanidades y ciencias sociales, y matemáticas. Los modelos de apoyo a la investigación en profundidad demuestran un enfoque similar al humano para buscar eficazmente información especializada cuando es necesario.

modelización	Precisión (%)
GPT-4o	3.3
Grok-2	3.8
Claude 3.5 Soneto	4.3
Pensamiento Géminis	6.2
OpenAI o1	9.1
DeepSeek-R1*	9.4
OpenAI o3-mini (mediano)*	10.5
OpenAI o3-mini (alta)*	13.0
Investigación en profundidad de OpenAI**	26.6

El modelo no es multimodal y se evalúa en un subconjunto de sólo texto.
Uso de Browse + herramientas python

GAIA

existe GAIA(se abre en una ventana nueva) (una referencia pública para evaluar la IA en problemas del mundo real) alcanzó un nuevo nivel de vanguardia (SOTA) para los modelos de apoyo a la investigación profunda en externos Leaderboard(opens in a new window) Lo mejor de la lista. Contiene preguntas de tres niveles de dificultad, y para completarlas con éxito se requieren capacidades como el razonamiento, la fluidez multimodal, la navegación por Internet y la destreza en el uso de herramientas.

Ejemplos de tareas GAIA

Véase el ejemplo oficial: https://openai.com/index/introducing-deep-research/

Misiones de nivel experto

En una evaluación interna de una serie de tareas a nivel de experto en la materia, los expertos en la materia consideraron que los estudios en profundidad habían automatizado horas de arduas investigaciones manuales.

Porcentaje de aprobados y número máximo de llamadas a la herramienta

Cuanto más navega el modelo y más piensa en lo que navega, mejor rinde, por eso es importante darle tiempo para pensar.

Ejemplo de misión de nivel experto

Véase el ejemplo oficial: https://openai.com/index/introducing-deep-research/

El valor económico estimado de la tarea se correlaciona más con el índice de aprobados que con el número de horas empleadas por los humanos: lo que el modelo considera difícil es diferente de lo que los humanos consideran que consume tiempo.

limitaciones

Deep Research ha desbloqueado nuevas funciones importantes, pero aún está en sus primeras fases y tiene limitaciones. Según evaluaciones internas, a veces puede producir hechos fantasma o hacer inferencias incorrectas en las respuestas, aunque a un nivel mucho más bajo que los modelos ChatGPT existentes. Puede tener dificultades para distinguir entre información fidedigna y rumores y actualmente presenta deficiencias en la calibración de la confianza, por lo que a menudo no transmite con precisión la incertidumbre. Puede haber pequeños errores de formato en los informes y citas en el momento de la publicación, y las tareas pueden tardar más en iniciarse. Esperamos que todos estos problemas mejoren rápidamente con un mayor uso y con el paso del tiempo.

entrevistas

La investigación profunda en ChatGPT requiere actualmente una potencia de cálculo muy elevada. Cuanto más larga sea la consulta de investigación, mayor será el cálculo de inferencia necesario. Empezaremos hoy con el cálculo necesario para una consulta dirigida a Usuarios profesionalesLa versión optimizada comienza con hasta 100 consultas al mes.Usuarios Plus y TeamEl acceso vendrá después, seguido de los usuarios de Enterprise. Seguimos trabajando para ofrecer acceso a los usuarios del Reino Unido, Suiza y el EEE.

Pronto todos los suscriptores de pago dispondrán de límites de tarifa más elevados cuando lancemos una versión más rápida y rentable del estudio en profundidad, impulsada por modelos más pequeños que siguen ofreciendo resultados de alta calidad.

En las próximas semanas y meses trabajaremos en nuestra infraestructura técnica, supervisaremos de cerca las versiones actuales y realizaremos pruebas más rigurosas. Esto es coherente con nuestro principio de despliegue iterativo. Si todas las comprobaciones de seguridad siguen cumpliendo nuestros criterios de lanzamiento, esperamos publicar un estudio en profundidad para los usuarios de Plus en aproximadamente un mes.

plan de seguimiento

Deep Research está disponible desde hoy en la red ChatGPT y se extenderá a las aplicaciones móviles y de escritorio en el plazo de un mes. Actualmente, Deep Research tiene acceso a la web abierta y a cualquier archivo cargado. En el futuro, podrá conectarse a fuentes de datos más especializadas -ampliando su acceso a recursos basados en suscripciones o internos- para que sus resultados sean más potentes y personalizados.

De cara al futuro, prevemos aunar la experiencia de Agente en ChatGPT para realizar investigación y desarrollo asíncronos y auténticos. La combinación de Deep Research, donde se pueden realizar encuestas en línea asíncronas, y Operator, donde se pueden llevar a cabo acciones reales, permitirá a ChatGPT realizar tareas cada vez más complejas para usted.