Motor de inferencia de búsqueda inteligente basada en el cuerpo con SimpleQA de hasta 88,31 TP3T de precisión.

En el campo de la Inteligencia Artificial, el desarrollo inteligente de motores de búsqueda ha estado en el punto de mira. Recientemente, un equipo formado por Salaheddin Alzubi, Creston Brooks, Purva Chiniya, Edoardo Contente, Chiara von Gerlach, Lucas Irwin, Yihan Jiang, Arda Kaz, Windsor Nguyen, Sewoong Oh, Himanshu Tyagi y Pramod Viswanath, un equipo de investigadores ha lanzado una nueva tecnología llamadaMotor de búsqueda de código abierto Open Deep Search (ODS)que pretende tender un puente entre los motores de búsqueda de IA de código cerrado y las soluciones de código abierto.

 

Núcleo de innovación: herramienta de búsqueda abierta y agente de razonamiento abierto

La innovación de ODS es que combina los últimos Modelos de Lenguaje Amplio (LLM) de código abierto con inteligencias de razonamiento que le permiten responder a las consultas de los usuarios mediante herramientas de búsqueda web. El marco consta de dos componentes principales: la Herramienta de Búsqueda Abierta y el Agente de Razonamiento Abierto.

Abrir herramienta de búsqueda

Open Search Tool es una herramienta avanzada de búsqueda web que supera a los motores de búsqueda de código cerrado existentes. La herramienta no sólo reescribe las consultas del usuario según sea necesario, sino que también extrae el contexto pertinente de los resultados de búsqueda y los agrupa y reordena para garantizar que se incluyan todos los resultados de búsqueda relevantes. Además, la herramienta de búsqueda abierta se ha personalizado para sitios importantes como Wikipedia, ArXiv y PubMed, lo que mejora aún más la precisión y exhaustividad de los resultados de búsqueda.

智能体驱动的搜索推理引擎,SimpleQA达88.3%准确率

Figura 1: Los usuarios tienen la opción de conectar cualquier LLM base de su elección y aprovechar el marco de código abierto de Open Deep Search (ODS). ODS consta de dos componentes: la herramienta de búsqueda abierta y el agente de razonamiento abierto. La herramienta más importante es la Herramienta de Búsqueda Abierta, que proporciona contexto de alta calidad a partir de múltiples fuentes de recuperación en la Web. En nuestros experimentos, utilizamos Llama3.1-70B y DeepSeek-R1 como modelos de base.

Agente de razonamiento abierto

El Agente de Razonamiento Abierto es otro componente clave de ODS, responsable de interpretar las tareas del usuario y completar las consultas invocando diversas herramientas. Se ofrecen dos versiones de esta inteligencia: una basada en ReAct (ODS-v1) y otra en CodeAct (ODS-v2).

  • SAD-v1Utiliza el marco ReAct, que combina las inteligencias Chain-of-Thought (CoT) y ReAct. CoT mejora el razonamiento animando al modelo a pensar antes de responder a una pregunta, mientras que ReAct mejora aún más la realización de tareas y la toma de decisiones combinando los pasos de razonamiento con la ejecución de acciones. Alpha para realizar cálculos matemáticos complejos.智能体驱动的搜索推理引擎,SimpleQA达88.3%准确率

    Figura 2: Esquema de la estructura ReAct prompt utilizada en ODS-v1.

    El marco ReAct permite la integración de herramientas a través de una interfaz normalizada:

    Thought: [推理跟踪] Action: Tool[参数] Observation: [结果]
    

    En ODS-v1, las inteligencias ReAct utilizan indicaciones que consisten en tres opciones de acción: "continuar.pensar" (=continue.think) para la descomposición de problemas complejos, "buscar" (=search internet) para encontrar información factual utilizando OpenPerplex, y "calcular" (=calculate) para conectarse a la API de Wolfram Alpha para manejar cálculos numéricos que suelen ser difíciles de manejar para los modelos base.

  • SAD-v2ODS-v2: emplea el marco CodeAct, que utiliza la generación y ejecución de código para mejorar la inferencia.CodeAct mejora significativamente el rendimiento al generar código Python ejecutable para las llamadas a herramientas.ODS-v2 es capaz de gestionar tareas más complejas y admite el trabajo colaborativo de múltiples herramientas e inteligencias.智能体驱动的搜索推理引擎,SimpleQA达88.3%准确率

    Figura 3: Inteligencias CodeAct respondiendo a preguntas multisalto en ODS-v2.

 

Rendimiento: más allá de las soluciones de código cerrado

ODS demostró un excelente rendimiento en dos pruebas de evaluación populares, SimpleQA y FRAMES.

  • SimpleQAODS-v1 y ODS-v2 alcanzan una precisión de 87,71 TP3T y 88,31 TP3T, respectivamente, superando a la IA de búsqueda por defecto de Perplexity (82,41 TP3T) y a Perplexity Sonar Reasoning Pro (85,81 TP3T). Comparado con el GPT-4o Search Preview de OpenAI, ODS-v2 supera a FRAMES, y su rendimiento en SimpleQA es casi igual.智能体驱动的搜索推理引擎,SimpleQA达88.3%准确率

    Figura 4: ODS-v1 identifica la respuesta correcta mediante la comprobación cruzada de múltiples fuentes utilizando el contexto de alta calidad recuperado por Open Search Tool.Perplejidad Sonar Reasoning Pro no recupera la información de búsqueda pertinente.

    智能体驱动的搜索推理引擎,SimpleQA达88.3%准确率

    Figura 5: ODS+DeepSeek-R1 distingue correctamente entre el 21 de julio y el 20 de julio de 2022 como la fecha en la que Kaitlin Armstrong se declaró inocente de la acusación de asesinato contra Moriah Wilson y fue procesada.Las inteligencias ODS comprobaron las dos fechas en conflicto y seleccionaron correctamente el 21 de julio. Por el contrario, Perplexity Pro se confundió y dio la respuesta errónea del 20 de julio de 2022.

  • MARCOSODS-v1+DeepSeek-R1 alcanza una precisión de 56,71 TP3T con una única búsqueda en la web, mientras que ODS-v2+DeepSeek-R1 mejora la precisión hasta 75,31 TP3T con múltiples búsquedas, lo que supera significativamente la mejor línea de base disponible.智能体驱动的搜索推理引擎,SimpleQA达88.3%准确率

    Figura 6: ODS-v1+Llama3.1-70B calcula con precisión la diferencia de edad utilizando la herramienta Wolfram Calculator, lo que da como resultado la respuesta correcta.90 Por el contrario, Perplexity sigue el camino equivocado del razonamiento, informando de una edad de 79 años.

 

Código abierto: catalizar la innovación comunitaria

El lanzamiento de ODS no sólo demuestra su potencia en el espacio de la IA de búsqueda, sino que también proporciona una potente herramienta para la comunidad de código abierto. La implementación de código abierto de ODS está a disposición del público, y los investigadores y desarrolladores pueden acceder a https://github.com/sentient-agi/OpenDeepSearch来获取相关代码 y basarse en ella para innovar y optimizar.

 

Perspectivas de futuro: el código abierto marca el nuevo rumbo de la IA de búsqueda

La aparición de ODS marca un hito importante para los motores de búsqueda de código abierto. Al combinar capacidades avanzadas de razonamiento con herramientas de búsqueda web de alta calidad, ODS no sólo supera en rendimiento a las soluciones de código cerrado existentes, sino que sienta las bases para futuras innovaciones y desarrollos. A medida que la comunidad de código abierto siga creciendo y la tecnología siga avanzando, se espera que ODS lidere el espacio de la IA de búsqueda hacia una era completamente nueva.

 

resúmenes

El lanzamiento de Open Deep Search es un avance importante en la historia del desarrollo de motores de búsqueda. No sólo demuestra el gran potencial de las soluciones de código abierto en el campo de la IA, sino que también proporciona una herramienta potente y flexible para usuarios e investigadores. Con cada vez más desarrolladores que se unen a este proyecto de código abierto, se espera que ODS impulse un mayor desarrollo de la tecnología de IA de búsqueda y proporcione a los usuarios una experiencia de búsqueda más inteligente y precisa.

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...