Cómo Manus redefine el agente universal: una mirada en profundidad a su funcionamiento y diseños de interacción

Recientemente, una de las primeras inteligencias de propósito general del mundo (Agente) Manus Manus ha lanzado una versión preliminar, y los resultados oficiales son asombrosos. A diferencia de muchas IA que sólo se quedan en el nivel de "sugerencia", Manus no sólo muestra una gran capacidad de planificación de tareas, sino que también logra un salto cualitativo en la ejecución de las mismas, consiguiendo realmente un bucle cerrado desde la planificación hasta la ejecución. ¿Cómo funciona Manus? En este artículo, le ofreceremos una comprensión en profundidad del flujo de trabajo, la memoria y la interacción frontend de Manus, y analizaremos cómo integra operaciones informáticas, investigación profunda, agentes de codificación y otras tecnologías para lograr el objetivo de "menos es más". "Menos es más" emergencia inteligente.

 

I. Adiós al papel: el flujo de trabajo "planificar-ejecutar-actualizar-entregar" de Manus

Mientras que muchos asistentes de inteligencia artificial son buenos planificando, pero difíciles de poner en práctica, Manus adopta un enfoque diferente, pasando sin problemas de la planificación a la ejecución de una forma más cercana a los hábitos de trabajo humanos. En esencia, Manus crea una lista de tareas con formato Markdown (todo.md) y gestiona todo el ciclo de vida de las tareas a través de esta lista. Este enfoque es mucho más intuitivo y eficiente que muchos sistemas que gestionan las tareas a través del contexto de un agente de planificación.

Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计

Como se muestra en la figura anterior, este es un ejemplo de un archivo todo.md para planificar un "viaje a Japón de 7 días y plan de propuestas". No sólo enumera las tareas que deben completarse, sino que también marca el estado de finalización de las tareas con "[ ]" y "[x]". Esto no sólo es intuitivo y claro, sino también más fácil de gestionar y actualizar para el Agente, lo que lo convierte en la "memoria" de Manus.

 

1. Planificación: todo empieza con todo.md

El flujo de trabajo de Manus comienza con una exhaustiva lista de tareas. Esta lista, en forma de archivo Markdown, no sólo es el punto de partida de las tareas, sino también la memoria del Agente. El usuario debe enumerar todas las tareas con el mayor detalle posible para proporcionar a Manus una guía clara de lo que debe hacer.

 

2. Aplicación: operaciones informáticas, investigación en profundidad, agentes codificadores, un enfoque triple

Con una lista clara de tareas, Manus empezó a abordarlas una a una. Al hacerlo, Manus demostró una sólida combinación de manipulación informática, investigación en profundidad y agentes de codificación.

  • estudio en profundidad: Manus dispone de potentes funciones de recuperación de información e interacción con páginas web. Puede buscar en un gran número de páginas web a la vez (23 en la demostración) y simular varias acciones del usuario en el navegador, como desplazarse y hacer clic. Cada paso queda registrado en una captura de pantalla, lo que facilita a los usuarios volver sobre sus pasos.
    • Navega:
      Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计
    • Desplázate hacia abajo:
      Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计
    • Pulsa:
      Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计
  • funcionamiento del ordenador: Manus es capaz de interactuar con el sistema operativo de una máquina virtual, ejecutar comandos de terminal, gestionar archivos (creación, borrado, modificación), manejar un navegador y lograr un verdadero "uso del ordenador".Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计 Manus ejecuta comandos de terminal
    Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计

    Manus Gestión de documentos de proyecto

agente codificador: Para las tareas de codificación, Manus las encomienda a agentes codificadores especializados. Se dice que el efecto es similar al de utilizar el Claude modelos, capaces de generar código de alta calidad (por ejemplo, HTML, Python, etc.).

Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计

Código HTML generado por Manus

 

3. Actualización: seguimiento en tiempo real, progreso de un vistazo

A medida que se ejecutan las tareas, Manus actualiza el archivo todo.md en tiempo real, marcando las tareas completadas con "[x]". De este modo, el progreso de las tareas queda claramente registrado, y el usuario tiene una idea clara del estado del trabajo de Manus.

Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计

Manus actualiza el archivo todo.md

 

4. Entrega: resultados al alcance de la mano

Manus genera el entregable final cuando todas las tareas del archivo todo.md se marcan como completas. Para mejorar la experiencia del usuario, Manus también proporciona una interfaz de gestión de archivos de sesión dedicada para que los usuarios puedan ver y gestionar los archivos generados.

Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计

Documentos de entrega generados por Manus

 

Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计

Gestión de archivos de sesión Manus

 

Más que "recordar": el mecanismo de memoria autodidacta de Manus

Manus no sólo recuerda las órdenes del usuario, sino que aprende de ellas. Sus exclusivos mecanismos de conocimiento y memoria le permiten aprender las preferencias del usuario y las mejores prácticas para tareas específicas, y aplicar automáticamente esas lecciones cuando se encuentran tareas similares.

Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计

Esto significa que los usuarios pueden mejorar continuamente su productividad y precisión "enseñando" a Manus cómo manejar tareas específicas. Por ejemplo, puede ordenar a Manus que resuma los resultados en una tabla al procesar un CV, y Manus lo hará automáticamente la próxima vez que se encuentre con una tarea similar, en lugar de tener que repetir la instrucción. Esta capacidad de "aprender haciendo" es lo que hace que Manus sea tan inteligente.
Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计

 

Más que "obras": la experiencia interactiva definitiva de Manus

Manus no sólo es potente, sino que también ofrece una gran experiencia de usuario. El suave efecto de salida de la reproducción de la sesión y el seguimiento del progreso en tiempo real en el lado derecho permiten a los usuarios conocer el estado de funcionamiento de Manus en cualquier momento, como si tuvieran un asistente de IA "visible". Este diseño no sólo mejora la experiencia de usuario, sino que también refuerza la confianza del usuario en Manus.

Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计

Interfaz de sesión Manus con seguimiento del progreso en tiempo real

 

IV. Resumen: menos es más, la inteligencia emerge

El equipo de Manus defiende el concepto de "menos estructura más inteligencia", lo que significa que a través de datos de alta calidad, modelos potentes, una arquitectura flexible y una ingeniería sólida, las operaciones informáticas, la investigación en profundidad, los agentes de codificación y otras capacidades surgen de forma natural, en lugar de limitarse a apilar funciones.

Manus combina operaciones informáticas, investigación en profundidad, codificación de agentes y otras tecnologías para lograr un verdadero bucle cerrado desde la planificación de tareas hasta su ejecución mediante una gestión de tareas Markdown sencilla y eficiente y un excelente diseño de interacción front-end. Esta filosofía de diseño de "menos es más" y los avances en el campo de los agentes de propósito general pueden ser la razón por la que Manus se atreve a afirmar que "redefine los agentes de propósito general".

Este artículo se basa principalmente en la demo oficial para analizar, puede haber comprensión de la desviación, los lectores son bienvenidos a intercambiar correcciones, y explorar conjuntamente el futuro desarrollo del Agente común.

Anoche se discutió mucho sobre qué es realmente Manus, y en realidad es una pregunta muy sencilla, ya que Manus publicó la primera práctica para explicar los principios:Manus ¿Qué es exactamente una Inteligencia Universal?y las conclusiones de AIGCLINK son generalmente coherentes.

Manus 凭什么重新定义通用 Agent?深度解析其工作原理与交互设计

La opinión de AIGCLINK sobre el agente

 

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...