Análisis de la forma de producto de la IA que realiza tareas de manipulación del escritorio utilizando AutoGLM como guía.

Noticias AIPublicado hace 1 año Círculo de intercambio de inteligencia artificial

51.1K 00

Wisdom Spectrum ha lanzado hoy "AutoGLM Contemplation", que muchos dicen que es una versión de Manus Creo que es cierto que Manus puede clasificarse como un producto de investigación profunda, o un producto de investigación profunda. Pero una categorización tan simple crearía muchos errores cognitivos tanto para los desarrolladores como para los usuarios, y creo que mucha gente tiene el mismo problema, al menos yo.

Think Smart Spectrum lanza una clase de aplicaciones de automatización de escritorio hasta ahora ( Plugin AutoGLM-Web ), hasta las "Meditaciones AutoGLM", básicamente se puede ver una alineación casi completa de toda la línea de productos Smart Spectrum.

Por ello, el tema de la conversación de hoy se centra en las "Meditaciones AutoGLM", que deconstruyen las capacidades de ramificación de los productos de IA que realizan tareas operativas de escritorio.

La presentación oficial de Wisdom Spectrum es pragmática
AutoGLM Contemplation es un cuerpo inteligente autónomo (agente de IA) que puede explorar preguntas abiertas y realizar acciones basadas en los resultados. Es capaz de simular los procesos del pensamiento humano, desde la recuperación y el análisis de datos hasta la generación de informes.

Para el usuario, lo que realmente es la "contemplación AutoGLM" es la palabra del desarrollador, y el desarrollador puede ayudar al usuario a centrarse en un punto característico y guiarle a través de él, pero en última instancia no hay forma de autodefinirlo en nombre del usuario.

Para los desarrolladores, la discusión de "AutoGLM Contemplations" es Manus, Deep Research,Vaca del espectro de la sabiduríaBúsqueda de inteligencia artificial,Uso del navegador, ninguna de las cuales es correcta, hay que desglosar sus funciones y discutir los límites de sus capacidades para que la discusión merezca la pena. Si uno simplemente reduce la contemplación de AutoGLM a Manus Hay errores obvios, como que Manus puede realizar tareas computacionales, pero "Meditación AutoGLM" no.

Empiece por comprender las funciones básicas de la Meditación AutoGLM.

agotado Plugin del navegador Clear Words Para aquellos que los han encontrado muy similares, ahora están unidos bajo la línea de productos "AutoGLM", y se recomienda empezar con el plugin antes de usar el cliente "AutoGLM Contemplation". La funcionalidad de ambos no es igual, y el plugin es (actualmente) más potente que el cliente.

Sin embargo, actualmente el cliente puede acceder a sitios que están "fuera de la lista blanca", mientras que el plugin limita actualmente el alcance de la información:

Por tanto, el potencial de la función AutoGLM Contemplation puede aprovecharse mejor si se utiliza el cliente para comprenderla.

1. Descargue el cliente, también debe instalar el plug-in

Descargar: https://autoglm-research.zhipuai.cn/#get_started

2. Iniciar la primera tarea (operar juntos y observar el proceso)

Encuentra todas las herramientas gratuitas "AI Translator" en https://aisharenet.com/, y recoge sólo las herramientas AI Translator con clientes.

以AutoGLM为引，分析AI执行桌面操作任务的产品形态
Consejo: Esta no es una buena descripción de la tarea, ya que el sitio web no ofrece una función de búsqueda in-situ y un punto de entrada claro a las herramientas de traducción de IA, una mejor descripción de la tarea sería: empezar a hojear las páginas de https://aisharenet.com/tag/aifanyi/ y encontrar todas las herramientas de traducción de IA gratuitas y del lado del cliente a partir de la información de la lista.
3. Observe el proceso de ejecución de la tarea (se trata de una captura de pantalla de parte de la página visitada automáticamente en la ejecución de la herramienta)
reflexiones 以AutoGLM为引，分析AI执行桌面操作任务的产品形态

En primer lugar, busque el cuadro de búsqueda, escriba "AI Translation" y ejecute la búsqueda. 以AutoGLM为引，分析AI执行桌面操作任务的产品形态

Ve a la interfaz de búsqueda de Bing (el cuadro de búsqueda del sitio es un salto a la búsqueda de Bing) y empieza a visitar el enlace... 以AutoGLM为引，分析AI执行桌面操作任务的产品形态
Al visitar el segundo enlace, se encontró un catálogo categorizado de herramientas de traducción de IA
Navegue enlace a enlace por la lista categorizada de herramientas de traducción automática con cambio automático de página 以AutoGLM为引，分析AI执行桌面操作任务的产品形态
Visite la segunda página e inicie la tarea de resumen
Informe de investigación completo

4. no cubierto por la prueba importante enlace "login" las partes interesadas para poner en marcha su propia tarea para observar el proceso de interacción, la tarea es capaz de evocar la acción de interacción de inicio de sesión. (Salir de Xiaohongshu primero)

Recopilación de conocimientos del Pequeño Libro Rojo sobre la generación de vídeos DEEPSEEK

localice

Knowledge Depth Research Tool, a partir de los resultados obtenidos se puede analizar hacia atrás para mostrar que las indicaciones de la herramienta están diseñadas en torno a la escritura de un trabajo de investigación y no son adecuadas para otro tipo de tareas.

Competencias básicas

Generación de planes de tareas pendientes
Despertar el navegador
Visualización en el navegador (sólo texto), clic, escritura
Nodos de juicio de tareas (parcial): navegación web finalizada, observar la página y juzgar la siguiente tarea, juzgar si es necesario iniciar sesión, fin de la adquisición de información.

Automatización en torno a las interacciones visuales del navegador, pero sólo para recopilar información y redactar informes de investigación, no parece que esté liberando todas sus capacidades en este momento, especialmente con las adiciones del lado del cliente, y debería ser capaz de integrar más capacidades posteriormente.

En pocas palabras Contemplación AutoGLM vs. Espectro de Sabiduría Diferencia de Toro

El primero maneja el navegador de forma visual, automatizando el proceso de recopilación de información y generando acciones de "entrada" sólo para buscar y visitar páginas.

Este último maneja el escritorio visualmente y no está limitado a la automatización del proceso de recopilación de información, sino que es libre de manejar el escritorio para completar la tarea.

Resumen de una frase Diferencias entre AutoGLM Contemplation y ClearSpeak Browser Plugin

El primero maneja el navegador visualmente y, como cliente de PC, puede interactuar después con más interfaces.

Este último sigue teniendo la misma manipulación visual de las capacidades del navegador y puede utilizarse como complemento del navegador para interactuar de forma nativa con la información de la página visitada.

Volviendo al tema de la IA que realiza tareas de manipulación del escritorio

Empecemos con una pregunta:

AutoGLM Competencias básicas contemplativas Uso del navegador Ambos, redactar informes de investigación en profundidad TORMENTA Más potente, ¿por qué utilizar AutoGLM Contemplation?

La respuesta se resume a continuación:

AutoGLM Contemplation es una herramienta de producción orientada al consumidor diseñada con un proceso completo de recopilación de información y redacción de informes de investigación.

No es necesario configurar complejos entornos de instalación local y aprovechar la potencia de la computación en nube para colaborar en interacciones locales.

STORM es una fuente fija de recogida de información sin acceso a información no abierta, mientras que AutoGLM contempla la automatización mediante el navegador para conseguirRecogida de información no abierta.

En este momento usted vagamente reconocer algunas diferencias entre las herramientas? De hecho, el problema es muy simple, lo siguiente de resumir las herramientas de automatización de caracteres de escritorio para empezar a peinar.

Dos tipos de soluciones para la automatización de tareas de escritorio

1. Conjunto tradicional de puntos de anclaje fijos y ejecución por proceso. Ejemplo: Microsoft PA, Shadowblade.

2. Interacciones puramente visuales, utilizando Browser-Use para ayudar en grandes juicios de modelo y generar interacciones. Ejemplo: AutoGLM contemplación.

3. Híbrido: Shadowblade también puede basarse en un flujo de trabajo fijo, con algunos nodos (especialmente las sesiones de extracción de contenido) utilizando interacciones puramente visuales. Más típico es la herramienta de programación de servicio al cliente automatizado de Microsoft, después de la introducción de la IA, por lo que el servicio al cliente en la premisa de SOP fijo, el trabajo más humano.

Pasando a centrarnos en soluciones de interacción puramente visuales, vamos a darle un nombre... Inteligencia de automatización de tareas de escritorio

¿De qué puede ser capaz una inteligencia de automatización de tareas de escritorio?

Competencia general:

Reconocimiento visual del escritorio, funcionamiento de las funciones del escritorio

Escalabilidad:

Inteligencia única, multiinteligencia que realiza tareas.Las inteligencias múltiples se utilizan generalmente para realizar la planificación de tareas, la ramificación de tareas, la coordinación de tareas y la agregación de información, respectivamente.

Ejecutar operaciones de escritorio remitiéndose a una "herramienta" fija o a un "flujo de trabajo" fijo para una tarea específica.Por ejemplo: cálculos, programación, búsqueda de fuentes de información de calidad. lo que hace que Manus sea tan potente para todos es que integra herramientas de programación para realizar algunas tareas de ramificación.

Ampliar (acceder) fuentes de datos locales y remotas.

Limitaciones:

Las inteligencias de automatización de tareas de escritorio no tienen por qué operar el escritorio de forma puramente visual. Si mi tarea de rama incluye la búsqueda de "Conocimiento", puede ser mejor interactuar directamente con los resultados de búsqueda de Conocimiento, y en cambio el funcionamiento del escritorio será ineficiente. Por lo tanto, una capacidad de ampliación razonable puede ayudar a aprovechar el valor de las inteligencias de escritorio.

Para qué sirve Desktop Task Automation Intelligence

La contemplación de AutoGLM se limita a la búsqueda de conocimiento no abierto, lo que es estupendo para escenarios de búsqueda de conocimiento, pero donde puede ser de mayor valor es en la automatización de operaciones en las que la interfaz contiene información dinámica y es repetitiva. Este Convergencia Realizar un buen trabajo de automatización de la ejecución de tareas por parte de la IA y, a continuación, guardar el proceso de ejecución de tareas para que pueda repetirse posteriormente.

En resumen: comprobar la información, realizar un trabajo por duplicado.

Tareas operativas de escritorio Cartera de capacidades del producto

El desglose anterior contiene información suficiente para resumir la forma actual de productos similares.

Al final no es más que una combinación de las siguientes capacidades, local o en la nube, diseñando el rango de ejecución de tareas procesadas y no procesadas, y en última instancia presentando al usuario el tipo de tarea ejecutable.

Todas las herramientas similares en las que se puede pensar se resumen en el siguiente cuadro.

Noticias AI

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

El buscador de inteligencia artificial Perplexity está a punto de lanzar un nuevo navegador, Comet.

Noticias AI

hace 1 año

043.7K

Baidu corazón amargo... ...Wenxin Yiyin será completamente gratuito a partir del 1 de abril, y la función de búsqueda profunda en línea

Noticias AI

hace 1 año

042.2K

Las escuelas primarias y secundarias de Pekín lanzan la educación en inteligencia artificial al completo: creación de un sistema especial de educación en IA

Noticias AI

hace 1 año

043.1K

重磅更新：Dify v0.10.0 推出文件上传功能，轻松构建 NotebookLM AI 播客

Actualización pesada: Dify v0.10.0 introduce la carga de archivos, fácil de construir NotebookLM AI Podcasts

Noticias AI

hace 1 año

058.8K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

Análisis de la forma de producto de la IA que realiza tareas de manipulación del escritorio utilizando AutoGLM como guía.

Empiece por comprender las funciones básicas de la Meditación AutoGLM.

localice

Competencias básicas

En pocas palabras Contemplación AutoGLM vs. Espectro de Sabiduría Diferencia de Toro

Resumen de una frase Diferencias entre AutoGLM Contemplation y ClearSpeak Browser Plugin

Volviendo al tema de la IA que realiza tareas de manipulación del escritorio

Dos tipos de soluciones para la automatización de tareas de escritorio

¿De qué puede ser capaz una inteligencia de automatización de tareas de escritorio?

Para qué sirve Desktop Task Automation Intelligence

Tareas operativas de escritorio Cartera de capacidades del producto

Descubrir la ilusión del gran modelo: las clasificaciones de los HHEM permiten comprender el estado de la coherencia factual en el LLM

Desde GPT2, OpenAI planea publicar nuevos modelos de ponderación de código abierto

Artículos relacionados

El buscador de inteligencia artificial Perplexity está a punto de lanzar un nuevo navegador, Comet.

Baidu corazón amargo... ...Wenxin Yiyin será completamente gratuito a partir del 1 de abril, y la función de búsqueda profunda en línea

Las escuelas primarias y secundarias de Pekín lanzan la educación en inteligencia artificial al completo: creación de un sistema especial de educación en IA

Actualización pesada: Dify v0.10.0 introduce la carga de archivos, fácil de construir NotebookLM AI Podcasts

Sin comentarios

Últimas colecciones

Últimos artículos

Análisis de la forma de producto de la IA que realiza tareas de manipulación del escritorio utilizando AutoGLM como guía.

Empiece por comprender las funciones básicas de la Meditación AutoGLM.

localice

Competencias básicas

En pocas palabras Contemplación AutoGLM vs. Espectro de Sabiduría Diferencia de Toro

Resumen de una frase Diferencias entre AutoGLM Contemplation y ClearSpeak Browser Plugin

Volviendo al tema de la IA que realiza tareas de manipulación del escritorio

Dos tipos de soluciones para la automatización de tareas de escritorio

¿De qué puede ser capaz una inteligencia de automatización de tareas de escritorio?

Para qué sirve Desktop Task Automation Intelligence

Tareas operativas de escritorio Cartera de capacidades del producto

Descubrir la ilusión del gran modelo: las clasificaciones de los HHEM permiten comprender el estado de la coherencia factual en el LLM

Desde GPT2, OpenAI planea publicar nuevos modelos de ponderación de código abierto

Artículos relacionados

El buscador de inteligencia artificial Perplexity está a punto de lanzar un nuevo navegador, Comet.

Baidu corazón amargo... ...Wenxin Yiyin será completamente gratuito a partir del 1 de abril, y la función de búsqueda profunda en línea

Las escuelas primarias y secundarias de Pekín lanzan la educación en inteligencia artificial al completo: creación de un sistema especial de educación en IA

Actualización pesada: Dify v0.10.0 introduce la carga de archivos, fácil de construir NotebookLM AI Podcasts

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos