Analyse de la forme du produit de l'IA effectuant des tâches de manipulation de bureau en utilisant AutoGLM comme guide
Aujourd'hui, Wisdom Spectrum a publié "AutoGLM Contemplation", dont beaucoup disent qu'il s'agit d'une version de Manus Je pense qu'il est vrai que Manus peut être classé comme un produit de recherche approfondie, ou un produit de recherche approfondie. Mais une catégorisation aussi simple créerait beaucoup d'erreurs cognitives pour les développeurs et les utilisateurs, et je pense que beaucoup de gens ont le même problème, du moins moi.
Think Smart Spectrum lance une classe d'applications pour l'automatisation des postes de travail ( AutoGLM-Web Plugin ), jusqu'aux "Méditations AutoGLM", vous pouvez voir une gamme presque complète de la ligne de produits Smart Spectrum.
Par conséquent, le sujet de la conversation d'aujourd'hui porte sur la "contemplation de l'AutoGLM", la déconstruction de l'IA pour effectuer des tâches d'opération de bureau du produit consiste en quelle branche de la capacité.

La présentation officielle de Wisdom Spectrum est pragmatique
AutoGLM Contemplation est un organisme intelligent autonome (agent d'intelligence artificielle) capable d'explorer des questions ouvertes et d'effectuer des actions en fonction des résultats. Il est capable de simuler les processus de pensée humains, depuis la recherche et l'analyse de données jusqu'à la génération de rapports.
Le développeur peut aider l'utilisateur à se concentrer sur une caractéristique et le guider, mais en fin de compte, il n'y a aucun moyen de la définir soi-même au nom de l'utilisateur.
Pour les développeurs, la discussion sur les "Contemplations AutoGLM" est Manus, Deep Research,Spectre de sagesse Vache, AI Search,Utilisation du navigateurIl faut donc décomposer ses fonctions et discuter des limites de ses capacités pour que la discussion en vaille la peine. Si l'on se contente de résumer la contemplation d'AutoGLM à Manus Il y a des erreurs évidentes, comme le fait que Manus est capable d'effectuer des tâches informatiques, mais pas "AutoGLM Meditation".
Commencez par comprendre les fonctions de base d'AutoGLM Meditation.
épuisé Plugin pour navigateur Clear Words Pour ceux d'entre vous qui les ont trouvés similaires, ils sont maintenant réunis sous la ligne de produits "AutoGLM", et il est recommandé de commencer par le plug-in avant d'utiliser le client "AutoGLM Contemplation". Il n'y a pas de parité de fonctionnalité entre les deux, le plugin est (actuellement) plus puissant que le client.
Toutefois, le client peut actuellement accéder à des sites qui ne figurent pas sur la liste blanche, alors que le plugin limite actuellement la portée des informations :

Par conséquent, le potentiel de la fonction de contemplation d'AutoGLM peut être mieux exploité en utilisant le client pour la comprendre.
1. télécharger le client, vous devez également installer le plug-in
Télécharger : https://autoglm-research.zhipuai.cn/#get_started

2. lancer la première tâche (opérer ensemble et observer le processus)
Trouvez tous les outils gratuits "AI Translator" sur https://aisharenet.com/, et ne collectez que les outils AI Translator avec des clients.
Conseil : il ne s'agit pas d'une bonne description de tâche, car le site web ne propose pas de fonction de recherche interne ni de point d'entrée clair pour les outils de traduction automatique. Une meilleure description de tâche serait la suivante : commencez à feuilleter les pages à partir de https://aisharenet.com/tag/aifanyi/ et trouvez tous les outils de traduction automatique gratuits et côté client à partir de la liste d'informations.
3. observer le processus d'exécution de la tâche (il s'agit d'une capture d'écran d'une partie de la page visitée automatiquement lors de l'exécution de l'outil)
réflexions
Tout d'abord, trouvez la boîte de recherche, tapez "AI Translation" et exécutez la recherche.
Accédez à l'interface de recherche Bing (la boîte de recherche du site est un lien vers la recherche Bing) et commencez à visiter le lien...
En cliquant sur le deuxième lien, on trouve un catalogue catégorisé d'outils d'aide à la traduction par l'IA.
Naviguer lien par lien dans la liste catégorisée des outils de traduction IA avec retournement de page automatique
Visitez la deuxième page et commencez la tâche de résumé
Rapport de recherche complet
4. non couvert par l'important lien de test "login", les parties intéressées peuvent lancer leur propre tâche pour observer le processus d'interaction, la tâche est capable d'évoquer l'action d'interaction de login. (Se déconnecter d'abord de Xiaohongshu)
Collecte de connaissances sur les vidéos générées par DEEPSEEK à partir du Petit Livre Rouge
localiser
Les résultats obtenus peuvent être analysés à rebours pour montrer que les messages-guides de l'outil sont conçus pour la rédaction d'un document de recherche et ne conviennent pas à d'autres types de tâches.
Compétences de base
- Génération de plans de tâches en attente
- Réveiller le navigateur
- Affichage dans le navigateur (texte uniquement), cliquer, taper
- Nœuds de jugement de tâches (partiels) : navigation web terminée, observation de la page et jugement de la tâche suivante, jugement de la nécessité d'une connexion, fin de l'acquisition d'informations.
L'automatisation autour des interactions visuelles du navigateur, mais seulement pour la collecte d'informations et la rédaction de rapports de recherche, il ne semble pas qu'il dévoile toutes ses capacités à ce stade, en particulier avec les ajouts côté client, et il devrait être en mesure d'intégrer davantage de capacités à l'avenir.
En résumé Contemplation AutoGLM vs. sagesse Spectre Bull Différence
Le premier fait fonctionner le navigateur visuellement, en automatisant le processus de collecte d'informations et en générant des actions de "saisie" uniquement pour la recherche et la visite de pages.
Ce dernier utilise le bureau visuellement et n'est pas limité à l'automatisation du processus de collecte d'informations, mais il est libre d'utiliser le bureau pour accomplir sa tâche.
Résumé en une phrase Différences entre les plugins de navigation AutoGLM Contemplation et ClearSpeak
Le premier utilise le navigateur de manière visuelle et, en tant que client PC, peut ensuite interagir avec davantage d'interfaces.
Ce dernier permet toujours la même manipulation visuelle des capacités du navigateur et peut être utilisé comme un plug-in de navigateur pour interagir de manière native avec les informations de la page visitée.
Revenons au sujet de l'IA effectuant des tâches de manipulation de bureau.
Commençons par une question :
Compétences de base contemplatives de l'AutoGLM Utilisation du navigateur Les deux, la rédaction de rapports de recherche approfondis STORM Plus puissant, pourquoi utiliser AutoGLM Contemplation ?
La réponse est résumée ci-dessous :
AutoGLM Contemplation est un outil productif orienté vers le consommateur, conçu avec un processus complet de collecte d'informations et de rédaction de rapports de recherche.
Il n'est pas nécessaire de configurer des environnements d'installation locaux complexes et d'exploiter la puissance de l'informatique en nuage pour collaborer sur des interactions locales.
STORM est une source fixe de collecte d'informations qui n'a pas accès aux informations non ouvertes, tandis qu'AutoGLM envisage l'automatisation à l'aide du navigateur pour atteindre les objectifs suivantsCollecte d'informations non ouverte.
À ce stade, vous reconnaissez vaguement certaines différences entre les outils ? En fait, le problème est très simple, voici un résumé des outils d'automatisation des caractères de bureau à passer au peigne fin.
Deux types de programmes pour l'automatisation des tâches de bureau
1. les points d'ancrage traditionnels fixes et l'exécution par processus. Exemple : Microsoft PA, Shadowblade.
2) Interactions purement visuelles, utilisant Browser-Use pour faciliter les jugements sur les grands modèles et générer des interactions. Exemple : contemplation de l'AutoGLM.
3) Hybride : Shadowblade peut également être basé sur un flux de travail fixe, certains nœuds (en particulier les sessions d'extraction de contenu) utilisant des interactions purement visuelles. L'outil de planification automatisée du service clientèle de Microsoft est plus typique, après l'introduction de l'IA, de sorte que le service clientèle, dans le cadre d'un SOP fixe, travaille de manière plus humaine.
Si nous nous concentrons sur les solutions d'interaction purement visuelles, trouvons un nom... Intelligence de l'automatisation des tâches de bureau
De quoi une intelligence d'automatisation des tâches de bureau peut-elle être capable ?
Compétence générale :
Reconnaissance visuelle du bureau, fonctionnement du bureau
Évolutivité :
Intelligence unique, intelligence multiple Tâches exécutées.Les intelligences multiples sont généralement utilisées pour la planification des tâches, les tâches de ramification, la coordination des tâches et l'agrégation des informations, respectivement.
Exécuter des opérations de bureau en se référant à un "outil" ou à un "flux de travail" fixe pour une tâche spécifique.Par exemple : calculs, programmation, recherche de sources d'information de qualité. Ce qui rend Manus si puissant pour tout le monde, c'est qu'il intègre des outils de programmation pour effectuer certaines tâches de ramification.
Étendre (accéder) les sources de données locales et distantes.
Limites :
Les intelligences d'automatisation des tâches de bureau n'ont pas nécessairement besoin de faire fonctionner le bureau de manière purement visuelle. Si la tâche de ma branche comprend la recherche de "connaissances", il peut être préférable d'établir une interface directe avec les résultats de la recherche de connaissances, et le fonctionnement du bureau sera alors inefficace. Par conséquent, une capacité d'extension raisonnable peut aider à réaliser la valeur des intelligences de bureau.
A quoi sert Desktop Task Automation Intelligence ?
La contemplation d'AutoGLM est limitée à la recherche de connaissances non ouvertes, ce qui est très bien pour les scénarios de recherche de connaissances, mais le point où elle peut être d'une plus grande valeur est dans l'automatisation d'opérations où l'interface contient des informations dynamiques et est répétitive. Il s'agit d'une Convergence L'automatisation de l'exécution des tâches par l'IA est une bonne chose, et le processus d'exécution des tâches est sauvegardé afin de pouvoir être réutilisé ultérieurement.
Résumer : vérifier des informations, effectuer des tâches répétitives.
Tâches d'exploitation du poste de travail Portefeuille de capacités des produits
L'analyse ci-dessus contient suffisamment d'informations pour résumer la forme actuelle de produits similaires.
En fin de compte, il ne s'agit de rien d'autre que d'une combinaison des capacités suivantes, locales ou en nuage, de la conception de la gamme d'exécution des tâches traitées et non traitées et, enfin, de la présentation à l'utilisateur du type de tâche exécutable.
Tous les outils similaires auxquels on peut penser peuvent être résumés dans le tableau ci-dessous.

© déclaration de droits d'auteur
Article copyright Cercle de partage de l'IA Tous, prière de ne pas reproduire sans autorisation.
Articles connexes
Pas de commentaires...