Intelligence en matière d'automatisation des postes de travail

Total 44 articles
Suna:集成浏览器操作与数据分析的智能代理

Suna : des agents intelligents qui intègrent les opérations de navigation et l'analyse des données

Introduction générale Suna est un agent d'intelligence artificielle polyvalent open source développé par Kortix AI, hébergé sur GitHub, basé sur la licence Apache 2.0, permettant aux utilisateurs de le télécharger, de le modifier et de l'auto-héberger gratuitement. Il utilise le dialogue en langage naturel pour aider les utilisateurs...
Il y a 4 mois
01.5K
Strawberry:自动化任务的AI智能浏览器

Strawberry : un navigateur intelligent pour les tâches automatisées

Description générale Strawberry est un navigateur intelligent doté d'un assistant IA intégré conçu pour aider les utilisateurs à automatiser leurs tâches quotidiennes et à améliorer leur efficacité. Il se distingue des navigateurs traditionnels par l'intégration d'une technologie d'IA qui comprend le contenu web en temps réel et exécute des tâches complexes telles que la recherche rapide, la rédaction de contenu...
Il y a 4 mois
01K
Fellou:自动化执行任务的原生AI浏览器

Fellou : un navigateur d'IA natif pour l'automatisation des tâches

Fellou est le premier navigateur orienté vers l'action et doté d'IA de Fellou AI. Fellou est le premier navigateur web au monde basé sur l'IA, qui offre non seulement les fonctionnalités de navigation web d'un navigateur traditionnel, mais automatise également des tâches et permet une recherche approfondie d'informations grâce à la technologie de l'IA....
Il y a 4 mois
01.1K
Agent S:像人类一样操作电脑的开源智能体框架

Agent S : un cadre Open Source pour les corps intelligents qui utilisent les ordinateurs comme des humains

Introduction générale Agent S est un framework open-source développé par Simular AI qui permet à des intelligences d'utiliser des ordinateurs comme des humains à travers une interface utilisateur graphique (GUI). Il utilise un modèle de langage multimodal et des techniques d'apprentissage empirique pour effectuer des tâches telles que la navigation sur le web, l'édition de documents, l'utilisation de logiciels...
Il y a 4 mois
01.1K
Libra:用对话生成本地AI智能体的客户端(内测)

Libra : un client pour générer des intelligences locales avec dialogue (test interne)

Introduction générale Libra est un outil innovant de Greenbit.ai dont la fonction principale est de générer des intelligences IA qui fonctionnent localement par le biais d'un dialogue en langage naturel. Appelé "Vibe Agent", il permet aux utilisateurs de décrire leurs besoins en termes simples et de créer rapidement...
Il y a 4 mois
01K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity : un projet open source pour entraîner l'IA à effectuer des actions sur le web avec des démonstrations humaines

Introduction générale Optexity est un projet open source sur GitHub, développé par l'équipe Optexity. Son objectif principal est d'utiliser des données de démonstration humaines pour entraîner l'IA à effectuer des tâches informatiques, en particulier des opérations sur des pages web. Le projet contient trois bibliothèques de code : Compute...
Il y a 4 mois
01.3K
RunRabbit:使用语音和文字操作智能体完成电脑操作

RunRabbit : Utilisation de la voix et du texte pour faire fonctionner Intelligentsia afin de réaliser des opérations informatiques

Introduction générale RunRabbit est un outil basé sur l'intelligence artificielle qui permet aux utilisateurs de contrôler leur navigateur afin d'effectuer diverses tâches par le biais de simples commandes vocales ou textuelles. Sa principale caractéristique est de comprendre les besoins de l'utilisateur et de manipuler automatiquement les pages web, comme la recherche d'informations, le remplissage de formulaires ou l'exécution de tâches répétitives...
Il y a 4 mois
0996
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体

LangGraph CUA : LangGraph-based AI Intelligence for Controlling Computer Operations (Intelligence IA basée sur le LangGraph pour le contrôle des opérations informatiques)

LangGraph CUA est un projet open source développé par l'équipe LangChain. Il est basé sur le framework LangGraph, permettant aux développeurs d'utiliser Python pour construire des intelligences IA qui peuvent directement faire fonctionner l'ordinateur. Le cœur de cet outil ...
il y a 5 mois
01.4K
Agent TARS:使用视觉和命令操作电脑的开源智能体

Agent TARS : une source ouverte de renseignements qui utilise la vision et les commandes pour faire fonctionner les ordinateurs.

Introduction complète L'agent TARS est une intelligence artificielle multimodale mise à disposition par ByteDance, dont les principales caractéristiques aident les utilisateurs à accomplir des tâches informatiques complexes en comprenant visuellement le contenu du web et en combinant les opérations de la ligne de commande et du système de fichiers. Au lieu de nécessiter des opérations manuelles comme les outils traditionnels, il peut...
il y a 5 mois
01.3K
Airtop:使用自然语言控制的浏览器自动化工具

Airtop : un outil d'automatisation du navigateur utilisant des contrôles en langage naturel

Introduction générale Airtop est un outil d'automatisation de navigateur basé sur l'IA. Il permet aux utilisateurs de contrôler les navigateurs cloud pour effectuer des opérations web complexes telles que la connexion à un site web, l'exploration de données ou l'exécution de tâches d'automatisation par le biais de simples commandes en langage naturel. Il résout le problème de l'écriture de scripts traditionnels complexes et capaci...
il y a 5 mois
01.2K
BrowserAgent:在浏览器中创建和运行AI工作流的工具

BrowserAgent : un outil pour créer et exécuter des flux de travail d'IA dans le navigateur

Introduction générale BrowserAgent est un outil qui crée et exécute des flux de travail d'IA directement dans le navigateur. Il est facile à utiliser et ne nécessite aucun code à écrire, l'utilisateur décrit simplement le flux de travail souhaité et l'IA est automatiquement générée. Sa caractéristique principale est d'être complètement privé, toutes les données sont dans votre navigateur...
il y a 5 mois
01.2K
Highlight AI:使用语音和屏幕分析完成桌面任务的AI助手

Highlight AI : un assistant IA qui utilise l'analyse de la voix et de l'écran pour effectuer des tâches de bureau.

Introduction générale Highlight AI est un assistant d'IA de bureau pour Windows et macOS (version mobile en cours de développement) qui aide les utilisateurs à effectuer rapidement des tâches dans n'importe quelle application grâce à des commandes vocales et à l'analyse du contenu de l'écran. Il capture le contenu de l'écran, génère des...
Il y a 2 mois
01.2K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具

autoMate : un outil natif qui combine l'IA et la RPA pour automatiser les tâches informatiques

Introduction complète autoMate est un outil d'automatisation locale développé par yuruotong1 en open source sur GitHub, avec AI+RPA (Artificial Intelligence+Robotic Process Automation) comme caractéristique principale. Il combine la compréhension intelligente de modèles linguistiques à grande échelle avec la RPA...
il y a 5 mois
01.4K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具

Proxy Lite : 3B Parametric Visual Model Driven Web Automation Tool (outil d'automatisation Web piloté par un modèle visuel)

Introduction complète Proxy Lite est un outil d'automatisation web léger et open source développé par Convergence AI. Il s'agit d'une mini-version de Proxy avec une conception à poids ouvert. Il est basé sur le modèle de langage visuel (VLM) des paramètres 3B et est capable de s'auto...
il y a 5 mois
01.3K
Convergence:在代理浏览器中自动完成重复任务的AI助手

Convergence : un assistant IA qui automatise les tâches répétitives dans un navigateur agent

Introduction générale Convergence est une entreprise dont l'objectif est d'aider les gens à reprendre le contrôle de leur temps en utilisant des technologies d'apprentissage automatique. En développant des modèles de méta-apprentissage à grande échelle (LMLM), les agents IA de Convergence (agents navigateurs) sont capables d'acquérir de nouvelles compétences en temps réel en utilisant...
Il y a 2 mois
01.7K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant : l'intelligence artificielle qui automatise les actions de bureau sur les appareils macOS

Introduction générale mac assistant est un projet d'intelligence artificielle conçu pour macOS, visant à simplifier les opérations de l'utilisateur en combinant le logiciel natif et les fonctionnalités web. Le projet prend actuellement en charge les API OpenAI et GEMINI, et prévoit de ...
Il y a 6 mois
01.6K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent : Collaboration multi-agents pour l'assistant d'exploitation des appareils mobiles

Introduction générale MobileAgent est un puissant assistant d'utilisation d'appareils mobiles conçu pour améliorer l'efficacité et l'automatisation de l'utilisation des appareils mobiles grâce à une collaboration multi-agents et à des modules de perception visuelle améliorés. Il est développé par l'équipe X-PLUG et supporte Android et ...
Il y a 7 mois
02K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork : un corps intelligent qui commande des ordinateurs par la voix et le texte et qui fournit un retour d'information vocal en temps réel.

Introduction générale TankWork est un agent de bureau open source conçu pour permettre à l'IA de percevoir et de contrôler votre ordinateur grâce à la vision par ordinateur et à l'interaction au niveau du système. Le cadre permet aux agents de contrôler directement les ordinateurs par le biais de commandes vocales et textuelles, de traiter le contenu de l'écran en temps réel et de fournir des...
Il y a 7 mois
01.4K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop : Application Intelligentsia de bureau pour contrôler les ordinateurs à l'aide du langage naturel

Introduction générale UI-TARS Desktop est une application d'agent d'interface graphique basée sur UI-TARS (Visual Language Model) développée par ByteDance. L'application permet aux utilisateurs de contrôler les ordinateurs par le biais du langage naturel pour une interaction homme-machine plus intuitive et plus efficace....
Il y a 7 mois
02.1K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js : un plugin open source qui permet de tester l'automatisation des navigateurs grâce à l'IA

Introduction générale Midscene.js est un outil d'automatisation de navigateur alimenté par l'IA qui contrôle les pages web, effectue des assertions et extrait des données par le biais de commandes en langage naturel. Il prend en charge les extensions Chrome, les SDK JavaScript et les scripts YAML, simplifiant ainsi la mesure de l'interface utilisateur...
Il y a 7 mois
01.9K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko : Workflows intelligents en langage naturel pour l'automatisation des postes de travail et des navigateurs

Introduction générale Eko est un framework JavaScript de niveau production conçu pour construire des flux de travail d'agents intelligents efficaces par le biais de descriptions en langage naturel. Il est conçu pour permettre aux développeurs d'automatiser des tâches quotidiennes à l'aide de technologies d'IA sans programmation profonde....
il y a 5 mois
01.8K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser : Génération de code d'automatisation du navigateur pour transformer les actions de la souris en scripts Selenium Python via l'IA

Introduction générale AutoMouser est une extension Chrome qui suit intelligemment les interactions de l'utilisateur et génère automatiquement du code de test Selenium en utilisant les modèles GPT d'OpenAI. Pour ce faire, il enregistre les actions du navigateur de l'utilisateur et les convertit...
Il y a 7 mois
01.4K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI : un cadre open source pour l'exécution d'intelligences IA pour naviguer sur le web, permettant à l'IA de manipuler automatiquement les pages web.

Introduction générale Browser Use Web UI est un projet open source innovant visant à fournir aux agents d'intelligence artificielle des capacités d'interaction avec le navigateur en tant qu'outil d'interface graphique. Le projet s'appuie sur le framework browser-use core, construit avec Gradio ...
Il y a 2 mois
02.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI : projet open source qui permet à l'IA de prendre le contrôle d'ordinateurs à distance et de les commander à l'aide du langage naturel

Introduction générale NeoAI est un assistant IA open source innovant qui permet aux utilisateurs de contrôler et de gérer facilement leurs ordinateurs par le biais d'un dialogue en langage naturel. Sans écrire de code, les utilisateurs peuvent rechercher des fichiers, automatiser des tâches, gérer des périphériques et bien plus encore grâce à un simple dialogue quotidien.
Il y a 7 mois
02.5K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent : le modèle de langage visuel intelligent Open Source de Smart Spectrum pour l'automatisation des interfaces graphiques

Introduction complète CogAgent est un modèle de langage visuel open source développé par le groupe de recherche sur l'exploration des données de l'université de Tsinghua (THUDM), visant à automatiser le fonctionnement de l'interface utilisateur graphique (GUI) sur toutes les plates-formes. Le modèle est basé sur CogVLM (GLM-4V-9B) et prend en charge les...
Il y a 8 mois
01.8K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick : permettre à n'importe quel LLM d'automatiser les opérations sur Android et sur PC

Introduction générale ClickClickClick est un framework développé par BandarLabs qui vise à automatiser des opérations sur Android et PC en utilisant n'importe quel Large Language Model (LLM) local ou distant. Le projet est actuellement dans une phase très expérimentale et supporte une variété de modèles tels que...
Il y a 8 mois
01.6K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use : construction d'outils d'automatisation Web intelligents pour que les intelligents IA puissent facilement utiliser les navigateurs

Introduction complète Browser-Use est un outil d'automatisation web open source innovant spécialement conçu pour permettre aux modèles de langage (LLM) d'interagir naturellement avec les sites web. Il fournit un cadre puissant et flexible qui prend en charge une large gamme de modèles de langage courants, y compris GPT-4, Claud...
Il y a 8 mois
02.7K
Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)

Dia Browser : offre une expérience de navigation intelligente avec des outils d'intelligence artificielle intégrés pour automatiser les tâches dans le navigateur (pas encore en ligne).

Description générale Dia Browser est un nouveau navigateur intelligent développé par The Browser Company qui vise à offrir aux utilisateurs une expérience de navigation plus efficace en intégrant des outils d'IA avancés. Le navigateur devrait être officiellement lancé au début de l'année 2025, avec des...
Il y a 8 mois
01.9K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Ordinateur Clevrr : Automatiser la manipulation intelligente du bureau avec la bibliothèque PyAutoGUI

Introduction générale Clevrr Computer est un projet open source qui vise à automatiser les opérations système grâce à l'utilisation de la bibliothèque PyAutoGUI. Le projet a été inspiré par Anthropic pour concevoir un agent d'automatisation capable d'effectuer des opérations de manière précise et efficace en utilisant ...
Il y a 8 mois
01.5K
GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AI

GLM-PC (Smart Spectrum Bull) est officiellement disponible en téléchargement interne, l'IA qui peut réellement contrôler l'ordinateur.

GLM-PC (Bull) Introduction GLM-PC est une application de bureau basée sur le modèle CogAgent, qui est capable d'effectuer des tâches complexes rapidement grâce à des commandes en langage naturel. Il a la capacité de planifier des tâches et de comprendre l'interface, et peut effectuer de manière autonome diverses opérations informatiques selon les instructions de l'utilisateur. Remarque...
Il y a 8 mois
02.3K
Runner H:通过自然语言命令实现网页自动化执行任务(申请内测)

Runner H : automatisation des tâches d'exécution des pages web par des commandes en langage naturel (application pour les tests internes)

Introduction générale Runner H est une entreprise qui se consacre au développement de modèles d'action de pointe conçus pour améliorer la productivité des travailleurs grâce à des capacités d'IA avancées. Son produit phare, Runner H, est un agent d'IA avancé conçu pour aider les utilisateurs à automatiser des tâches complexes à plusieurs étapes et à réduire les re...
Il y a 8 mois
01.7K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent : utilisation automatisée d'un smartphone à l'aide d'intelligences multimodales

Introduction complète AppAgent est un agent multimodal basé sur le modèle du grand langage (LLM) conçu pour manipuler les applications de smartphones. Le cadre imite les interactions humaines telles que les taps et les swipes à travers un espace de manipulation simplifié, éliminant ainsi le besoin d'un accès au système back-end et étendant son utilisation à travers différentes applications...
Il y a 8 mois
02K
Skyvern:使用LLM和计算机视觉自动化基于浏览器工作流

Skyvern : Automatisation des flux de travail par navigateur avec LLM et vision par ordinateur

Introduction générale Skyvern est un outil d'automatisation des flux de travail des navigateurs utilisant des techniques de modélisation du langage large (LLM) et de vision par ordinateur. Il automatise efficacement un grand nombre de sites web en fournissant un point de terminaison API simple qui peut remplacer les solutions d'automatisation qui sont fragiles ou peu fiables...
il y a 5 mois
02.3K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe : Laissez l'IA contrôler directement votre ordinateur, une implémentation open source de l'ordinateur de contrôle de Claude.

Description générale Agent.exe est une application Electron open source qui utilise l'API Sonnet Claude 3.5 d'Anthropic pour permettre aux utilisateurs de contrôler leurs ordinateurs locaux directement par le biais de l'IA. Le projet a été développé par K...
Il y a 8 mois
02.1K