Recentemente, uma das primeiras inteligências de uso geral do mundo (Agent) Manus A Manus lançou uma versão prévia, e os resultados oficiais são impressionantes. Ao contrário de muitas IAs que ficam apenas no nível de "sugestão", a Manus não apenas mostra recursos sólidos de planejamento de tarefas, mas também consegue um salto qualitativo na execução de tarefas, alcançando realmente um ciclo fechado do planejamento à execução. Então, como a Manus funciona? Neste artigo, apresentaremos uma compreensão aprofundada do fluxo de trabalho, da memória e da interação de front-end da Manus e analisaremos como ela integra operações de computador, pesquisa profunda, agentes de codificação e outras tecnologias para atingir a meta de "menos é mais". Emergência inteligente "menos é mais".
I. Diga adeus ao papel: o fluxo de trabalho "planejar-executar-datar-entregar" da Manus
Embora muitos assistentes de IA sejam bons em planejamento, mas difíceis de colocar em prática, o Manus adota uma abordagem diferente, passando perfeitamente do planejamento para a execução de uma forma mais próxima dos hábitos de trabalho humanos. Em sua essência, o Manus cria uma lista de tarefas em formato Markdown (todo.md) e gerencia todo o ciclo de vida da tarefa por meio dessa lista. Essa abordagem é muito mais intuitiva e eficiente do que muitos sistemas que gerenciam tarefas por meio do contexto de um agente de planejamento.
Conforme mostrado na figura acima, este é um exemplo de um arquivo todo.md para o planejamento de uma "viagem de 7 dias ao Japão e plano de proposta". Ele não apenas lista as tarefas a serem concluídas, mas também marca o status de conclusão das tarefas com "[ ]" e "[x]". Isso não é apenas intuitivo e claro, mas também é mais fácil para o agente gerenciar e atualizar, tornando-o a "memória" do Manus.
1. planejamento: tudo começa com o todo.md
O fluxo de trabalho do Manus começa com uma lista exaustiva de tarefas. Essa lista, na forma de um arquivo Markdown, não é apenas o ponto de partida para a tarefa, mas também a memória do agente. O usuário precisa listar todas as tarefas com o máximo de detalhes possível para fornecer ao Manus um guia claro do que fazer.
2. implementação: operações de computador, pesquisa aprofundada, agentes de codificação, uma abordagem em três frentes
Com uma lista clara de tarefas, Manus começou a executá-las uma a uma. Ao fazer isso, Manus demonstrou uma forte combinação de manipulação de computador, pesquisa aprofundada e agentes de codificação.
- estudo aprofundadoManus: O Manus tem recursos avançados de recuperação de informações e interação com páginas da Web. Ele pode pesquisar um grande número de páginas da Web de uma só vez (23 na demonstração) e simular várias ações do usuário no navegador, como rolagem e cliques. Cada etapa é registrada em uma captura de tela, o que facilita para o usuário refazer seus passos.
- Navegue:
- Role a tela para baixo:
- Clique em:
- Navegue:
- operação do computadorManus é capaz de interagir com o sistema operacional de uma máquina virtual, executar comandos de terminal, gerenciar arquivos (criação, exclusão, modificação), operar um navegador e realizar o verdadeiro "uso do computador".
O Manus executa comandos de terminal
Manus Gerenciando documentos do projeto
agente de codificaçãoPara tarefas de codificação, o Manus as entrega a agentes de codificação especializados. Diz-se que o efeito é semelhante ao uso do Claude capazes de gerar código de alta qualidade (por exemplo, HTML, Python, etc.).
Código HTML gerado pelo Manus
3. atualização: acompanhamento em tempo real, progresso em um relance
À medida que as tarefas são executadas, o Manus atualiza o arquivo todo.md em tempo real, marcando as tarefas concluídas com "[x]". Dessa forma, o progresso das tarefas é claramente registrado, e o usuário tem uma visão clara do status do trabalho do Manus.
Manus atualiza o arquivo todo.md
4. entrega: resultados ao alcance
O Manus gera o produto final quando todas as tarefas no arquivo todo.md são marcadas como concluídas. Para aprimorar a experiência do usuário, o Manus também fornece uma interface de gerenciamento de arquivos de sessão dedicada para que os usuários visualizem e gerenciem os arquivos gerados.
Documentos de entrega gerados pela Manus
Gerenciamento de arquivos da sessão Manus
Mais do que "lembrar": o mecanismo de memória de autoaprendizagem do Manus
O Manus não apenas lembra os comandos do usuário, mas também aprende com eles. Seus mecanismos exclusivos de conhecimento e memória permitem que ele aprenda as preferências do usuário e as práticas recomendadas para tarefas específicas e aplique automaticamente essas lições quando tarefas semelhantes forem encontradas.
Isso significa que os usuários podem melhorar continuamente sua produtividade e precisão "ensinando" o Manus a lidar com tarefas específicas. Por exemplo, você pode instruir o Manus a resumir os resultados em uma tabela ao processar um currículo, e o Manus fará isso automaticamente na próxima vez que encontrar uma tarefa semelhante, em vez de ter que repetir a instrução. Essa capacidade de "aprender fazendo" é o que torna o Manus tão inteligente.
Mais do que apenas "obras": a experiência interativa definitiva da Manus
O Manus não é apenas avançado, mas também tem uma ótima experiência de usuário. O efeito de saída suave da reprodução da sessão e o acompanhamento do progresso em tempo real no lado direito permitem que os usuários saibam o status de trabalho da Manus a qualquer momento, como se tivessem um assistente de IA "visível". Esse design não apenas aprimora a experiência do usuário, mas também fortalece a confiança do usuário na Manus.
Interface de sessão Manus com acompanhamento do progresso em tempo real
IV Resumindo: menos é mais, a inteligência emerge
A equipe da Manus defende o conceito de "menos estrutura, mais inteligência", o que significa que, por meio de dados de alta qualidade, modelos avançados, arquitetura flexível e engenharia sólida, operações de computador, pesquisa profunda, agentes de codificação e outros recursos surgem naturalmente, em vez de simplesmente empilhar funções.
A Manus combina operações de computador, pesquisa aprofundada, agentes de codificação e outras tecnologias para obter um loop realmente fechado, desde o planejamento da tarefa até a execução, por meio de um gerenciamento de tarefas Markdown simples e eficiente e um excelente design de interação de front-end. Essa filosofia de design "menos é mais" e os avanços no campo dos agentes de uso geral podem ser o motivo pelo qual a Manus ousa afirmar que está "redefinindo os agentes de uso geral".
Este artigo baseia-se principalmente na demonstração oficial para analisar, pode haver entendimento do desvio, os leitores são bem-vindos para trocar correções e explorar em conjunto o desenvolvimento futuro do agente comum.
Houve muita discussão na noite passada sobre o que realmente é a Manus, e na verdade é uma pergunta muito simples, já que a Manus lançou a primeira prática para explicar os princípios:Manus O que exatamente é uma Inteligência Universal?e as conclusões da AIGCLINK são amplamente consistentes.
A visão da AIGCLINK sobre o Agente