Интеллектуальные средства автоматизации рабочего стола

Всего 44 статьи
расставлять по порядку
Suna:集成浏览器操作与数据分析的智能代理

Suna: интеллектуальные агенты, интегрирующие браузерные операции и аналитику данных

Общее представление Suna - это ИИ-агент общего назначения с открытым исходным кодом, разработанный компанией Kortix AI, размещенный на GitHub на основе лицензии Apache 2.0, позволяющей пользователям бесплатно скачивать, изменять и самостоятельно размещать его. Он использует диалог на естественном языке, чтобы помочь пользователям с...
4 месяца назад
011K
Strawberry:自动化任务的AI智能浏览器

Strawberry: интеллектуальный браузер с искусственным интеллектом для автоматизированных задач

Общее описание Strawberry - это умный браузер со встроенным ассистентом искусственного интеллекта, призванный помочь пользователям автоматизировать повседневные задачи и повысить эффективность работы. Он отличается от традиционных браузеров тем, что в него интегрирована технология искусственного интеллекта, которая понимает веб-контент в режиме реального времени и выполняет сложные задачи, такие как быстрое исследование, написание контента...
4 месяца назад
08.9K
Fellou:自动化执行任务的原生AI浏览器

Fellou: нативный браузер с искусственным интеллектом для автоматизации задач

Fellou - первый в мире браузер с поддержкой искусственного интеллекта, ориентированный на действия, от компании Fellou AI. Fellou - первый в мире веб-браузер с поддержкой искусственного интеллекта, который не только обеспечивает функциональность традиционного браузера, но и автоматизирует задачи и обеспечивает глубокий поиск информации с помощью технологии искусственного интеллекта.....
4 месяца назад
012.8K
AiPy:自动化运行Python代码完成数据分析任务

AiPy: автоматизация задачи выполнения кода на Python для анализа данных

Общее представление AiPy - это инструмент командной строки Python с открытым исходным кодом, разработанный командой Knownsec. Он сочетает в себе Большую языковую модель (LLM) и среду выполнения Python, позволяя пользователям автоматически генерировать и запускать Pytho...
5 месяцев назад
09K
DroidRun:AI自动操作安卓手机的开源工具

DroidRun: инструмент с открытым исходным кодом для ИИ для автоматизации телефонов Android

Общее представление DroidRun - это инструмент с открытым исходным кодом, позволяющий искусственному интеллекту управлять телефоном Android как человек. Он помогает ИИ автоматизировать такие задачи, как открытие приложений, отправка сообщений или просмотр веб-страниц, путем извлечения интерактивных элементов, таких как экранные кнопки, поля ввода и т. д. DroidRun сочетает в себе...
5 месяцев назад
08.9K
Agent S:像人类一样操作电脑的开源智能体框架

Агент S: платформа с открытым исходным кодом для интеллектуальных органов, позволяющая управлять компьютерами как людьми

Общее представление Агент S - это фреймворк с открытым исходным кодом, разработанный компанией Simular AI, который позволяет интеллектам управлять компьютерами, как людьми, с помощью графического интерфейса пользователя (GUI). Он использует мультимодальную модель большого языка и эмпирические методы обучения для выполнения таких задач, как просмотр веб-страниц, редактирование документов, использование программного обеспечения...
5 месяцев назад
08.2K
Libra:用对话生成本地AI智能体的客户端(内测)

Libra: клиент для генерации локальных ИИ-интеллектов с диалогом (внутреннее тестирование)

Общее представление Libra - это инновационный инструмент от Greenbit.ai, основной функцией которого является создание искусственного интеллекта, работающего локально через диалог на естественном языке. Называемый "Vibe Agent", он позволяет пользователям описывать свои потребности в простых терминах и быстро создавать...
5 месяцев назад
08.4K
Optexity:用人类演示训练AI执行网页操作的开源项目

Optexity: проект с открытым исходным кодом для обучения ИИ выполнять веб-действия с демонстрацией человека

Общее введение Optexity - это проект с открытым исходным кодом на GitHub, разработанный командой Optexity. Его суть заключается в использовании демонстрационных данных человека для обучения искусственного интеллекта выполнению компьютерных задач, особенно операций с веб-страницами. Проект содержит три библиотеки кода: Compute...
5 месяцев назад
08.5K
RunRabbit:使用语音和文字操作智能体完成电脑操作

RunRabbit: использование голоса и текста для управления Intelligentsia для выполнения компьютерных операций

Общее представление RunRabbit - это инструмент, основанный на искусственном интеллекте, который позволяет пользователям управлять браузером для выполнения различных задач с помощью простых голосовых или текстовых команд. Его лучшая особенность заключается в том, что он понимает потребности пользователя и затем автоматически манипулирует веб-страницами, например, ищет информацию, заполняет формы или выполняет повторяющиеся задачи...
5 месяцев назад
07.3K
LangGraph CUA:基于 LangGraph 控制电脑操作的AI智能体

LangGraph CUA: ИИ-интеллект на основе LangGraph для управления компьютерными операциями

LangGraph CUA - это проект с открытым исходным кодом, разработанный командой LangChain. Он основан на фреймворке LangGraph, позволяющем разработчикам использовать Python для создания искусственного интеллекта, способного напрямую управлять компьютером. Ядро этого инструмента ...
5 месяцев назад
08.2K
Agent TARS:使用视觉和命令操作电脑的开源智能体

Агент TARS: интеллектуальная система с открытым исходным кодом, использующая зрение и команды для управления компьютерами

Всеобъемлющее введение Агент TARS - это мультимодальный искусственный интеллект с открытым исходным кодом от ByteDance, основные функции которого помогают пользователям выполнять сложные компьютерные задачи путем визуального понимания веб-контента и комбинирования операций командной строки и файловой системы. Вместо того чтобы требовать ручных операций, как это делают традиционные инструменты, он может самостоятельно...
5 месяцев назад
09.6K
Playwright MCP:微软推出的浏览器自动化MCP服务

Playwright MCP: Browser Automation MCP Service от Microsoft

Общее представление Playwright MCP - это инструмент с открытым исходным кодом, разработанный компанией Microsoft и размещенный на GitHub. Он позволяет моделям искусственного интеллекта напрямую управлять браузерами через протокол Model Context Protocol (MCP), в комплекте с открытием...
5 месяцев назад
010.9K
Airtop:使用自然语言控制的浏览器自动化工具

Airtop: инструмент для автоматизации браузера с использованием элементов управления на естественном языке

Общее представление Airtop - это инструмент автоматизации браузера на основе искусственного интеллекта. Он позволяет пользователям управлять облачными браузерами для выполнения сложных веб-операций, таких как вход на сайт, поиск данных или выполнение задач автоматизации с помощью простых команд на естественном языке. Он решает проблему написания традиционных скриптов, которые являются сложными и емкими...
5 месяцев назад
08.9K
BrowserAgent:在浏览器中创建和运行AI工作流的工具

BrowserAgent: инструмент для создания и запуска рабочих процессов ИИ в браузере

Общее представление BrowserAgent - это инструмент, который создает и запускает рабочие процессы AI непосредственно в браузере. Он прост в использовании и не требует написания кода, пользователь просто описывает желаемый рабочий процесс, и AI генерируется автоматически. Его основная особенность - полная конфиденциальность, все данные находятся в вашем браузере...
5 месяцев назад
07.6K
Highlight AI:使用语音和屏幕分析完成桌面任务的AI助手

Highlight AI: ИИ-помощник, который использует голос и анализ экрана для выполнения задач на рабочем столе.

Общее представление Highlight AI - это настольный ИИ-помощник для Windows и macOS (мобильная версия в разработке), который помогает пользователям быстро выполнять задачи в любых приложениях с помощью голосовых команд и анализа содержимого экрана. Он перехватывает содержимое экрана, генерирует...
2 месяца назад
07.9K
autoMate:结合AI与RPA实现电脑任务自动化的本地工具

autoMate: отечественный инструмент, сочетающий ИИ и RPA для автоматизации компьютерных задач

Всеобъемлющее введение autoMate - это инструмент локальной автоматизации, разработанный yuruotong1 с открытым исходным кодом на GitHub, с AI+RPA (искусственный интеллект+автоматизация роботизированных процессов) в качестве своей основной функции. Он сочетает в себе интеллектуальное понимание крупномасштабных языковых моделей с RPA...
6 месяцев назад
07.6K
Nanobrowser:浏览器中实现任务自动化的多智能插件

Nanobrowser: мультиинтеллектуальный плагин для автоматизации задач в браузерах

Общее представление Nanobrowser - это расширение для Chrome с открытым исходным кодом, предназначенное для автоматизации веб-задач с помощью мультиагентной системы, управляемой искусственным интеллектом. Оно является бесплатной альтернативой OpenAI Operator, где пользователи просто предоставляют свои LLM...
6 месяцев назад
012.8K
Proxy Lite:3B参数视觉模型驱动的网页自动化工具

Proxy Lite: 3B Parametric Visual Model Driven Web Automation Tool

Всеобъемлющее введение Proxy Lite - это легкий инструмент веб-автоматизации с открытым исходным кодом, разработанный компанией Convergence AI как мини-версия Proxy с открытым весовым дизайном. Он основан на 3B-параметрической модели визуального языка (VLM) и способен самостоятельно...
6 месяцев назад
08.6K
Rabbit Android Agent:语音控制安卓应用的智能体(未开放)

Rabbit Android Agent: голосовой интеллект для Android-приложений (не открыто)

Общее представление Rabbit Android Agent - это инновационный интеллектуальный ИИ, разработанный компанией Rabbit, который помогает пользователям выполнять одноэтапные или многоэтапные задачи на устройствах Android с помощью голосовых и текстовых команд. Технология основана на ...
6 месяцев назад
07.8K
Convergence:在代理浏览器中自动完成重复任务的AI助手

Конвергенция: ИИ-помощник, автоматизирующий повторяющиеся задачи в браузере-агенте

Общее введение Convergence - это компания, помогающая людям вернуть контроль над своим временем с помощью технологий машинного обучения. Благодаря разработке крупномасштабных моделей метаобучения (LMLM) ИИ-агенты Convergence (браузерные агенты) способны приобретать новые навыки в режиме реального времени, используя...
2 месяца назад
08.4K
mac assistant:macOS设备自动执行桌面操作的AI智能体

mac assistant: интеллектуальный ИИ, автоматизирующий действия на рабочем столе устройств под управлением macOS

Общее представление mac assistant - это проект интеллектуального тела AI, разработанный для macOS и направленный на упрощение работы пользователя за счет сочетания нативных программных и веб-функций. В настоящее время проект поддерживает API OpenAI и GEMINI, и планирует поддерживать будущие ...
6 месяцев назад
08.2K
Open Operator:通过AI智能体在云浏览器中执行自动化操作

Open Operator: автоматизация облачных браузеров с помощью искусственного интеллекта

Общее представление Open Operator - это проект с открытым исходным кодом, целью которого является автоматизация операций в браузере с помощью искусственного интеллекта. Проект разработан компанией Browserbase и сочетает в себе технологии Stagehand и Browserbase...
7 месяцев назад
09.1K
MobileAgent:多代理协作的移动设备操作助手

MobileAgent: мультиагентное взаимодействие для помощника по эксплуатации мобильных устройств

Общее представление MobileAgent - это мощный помощник по управлению мобильными устройствами, предназначенный для повышения эффективности и автоматизации работы с мобильными устройствами за счет мультиагентного взаимодействия и улучшенных модулей визуального восприятия. Он разработан командой X-PLUG и поддерживает Android и ...
7 месяцев назад
011.3K
TankWork:通过语音和文字操作电脑,并提供实时语音反馈的智能体

TankWork: интеллектуальное тело, которое управляет компьютерами с помощью голоса и текста и обеспечивает голосовую обратную связь в режиме реального времени

Общее представление TankWork - это фреймворк для настольных агентов с открытым исходным кодом, разработанный для того, чтобы ИИ мог воспринимать и контролировать ваш компьютер с помощью компьютерного зрения и взаимодействия на системном уровне. Фреймворк позволяет агентам напрямую управлять компьютерами с помощью голосовых и текстовых команд, обрабатывать содержимое экрана в реальном времени и обеспечивать непрерывное аудиовизуальное...
7 месяцев назад
08.7K
UI-TARS Desktop:使用自然语言控制电脑的桌面智能体应用

UI-TARS Desktop: настольное приложение Intelligentsia для управления компьютерами с помощью естественного языка

Общее представление UI-TARS Desktop - это приложение для агентов с графическим интерфейсом, основанное на UI-TARS (Visual Language Model), разработанное компанией ByteDance. Приложение позволяет пользователям управлять компьютерами с помощью естественного языка для более интуитивного и эффективного взаимодействия человека и компьютера.UI-TAR...
7 месяцев назад
014.9K
Shortest:AI自动化测试工具,使用自然语言进行端到端测试

Shortest: инструмент автоматизированного тестирования с искусственным интеллектом, использующий естественный язык для сквозного тестирования

Общее представление Shortest - это фреймворк сквозного тестирования на естественном языке с поддержкой ИИ, разработанный командой Anti-Work. Он построен на Playwright и поддерживает интеграцию с GitHub и двухфакторную аутентификацию (2FA).Основные возможности Shortest...
7 месяцев назад
09.3K
Midscene.js:用AI驱动浏览器自动化测试的开源插件

Midscene.js: плагин с открытым исходным кодом для автоматизации тестирования браузеров с помощью искусственного интеллекта

Общее представление Midscene.js - это инструмент автоматизации браузера на основе искусственного интеллекта, который управляет веб-страницами, выполняет утверждения и извлекает данные с помощью команд на естественном языке. Он поддерживает расширения Chrome, JavaScript SDK и YAML-скрипты, упрощая измерение пользовательского интерфейса...
7 месяцев назад
012.8K
Stagehand:自然语言实现浏览器自动化操作框架

Stagehand: фреймворк для реализации операций автоматизации браузеров на естественном языке

Общее представление Stagehand - это фреймворк для веб-браузинга с искусственным интеллектом, ориентированный на простоту и расширяемость. Он полностью совместим с Playwright и предоставляет три простых AI API (act, extract и observe), которые построены на базе...
7 месяцев назад
010.4K
Eko:自然语言构建智能体工作流,实现桌面与浏览器自动化

Eko: построение интеллектуальных рабочих процессов на естественном языке для автоматизации рабочего стола и браузера

Общее представление Eko - это JavaScript-фреймворк производственного уровня, предназначенный для создания эффективных рабочих процессов интеллектуальных агентов с помощью описаний на естественном языке. Он предназначен для того, чтобы разработчики могли автоматизировать повседневные задачи с помощью технологий искусственного интеллекта без глубокого программирования.Eko предоставляет уни...
6 месяцев назад
09K
AutoMouser:生成浏览器自动化代码,将鼠标操作通过AI转为Selenium Python脚本

AutoMouser: генерация кода автоматизации браузера для превращения действий мыши в сценарии Selenium Python с помощью искусственного интеллекта

Общее представление AutoMouser - это расширение для Chrome, которое интеллектуально отслеживает действия пользователя и автоматически генерирует тестовый код Selenium, используя GPT-модели OpenAI. Для этого оно записывает действия пользователя в браузере и преобразует их...
7 месяцев назад
09.5K
Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

Browser Use Web UI: фреймворк с открытым исходным кодом для запуска искусственного интеллекта для просмотра веб-страниц, позволяющий искусственному интеллекту автоматически управлять веб-страницами.

Общие сведения Введение Browser Use Web UI - это инновационный проект с открытым исходным кодом, нацеленный на предоставление агентам искусственного интеллекта возможностей взаимодействия с браузером в качестве инструмента графического интерфейса. Проект построен на основе базового фреймворка browser-use, созданного с помощью Gradio ...
2 месяца назад
013.5K
E2B Open Computer Use:E2B沙盒中安全的运行AI操作系统

E2B Open Computer Use: безопасный запуск операционной системы ИИ в песочнице E2B

Общие сведения Введение E2B Open Computer Use - это проект с открытым исходным кодом, целью которого является обеспечение безопасного облачного использования компьютеров на базе Linux с помощью E2B Desktop Sandbox.E2B Sandbox предоставляет графическую среду рабочего стола, которую пользователи могут подключить к любому большому...
8 месяцев назад
08.7K
NeoAI:让AI接管电脑远程操作,使用自然语言控制电脑的开源项目

NeoAI: проект с открытым исходным кодом, позволяющий ИИ удаленно управлять компьютерами и контролировать их с помощью естественного языка

Общее представление NeoAI - это инновационный инструмент с открытым исходным кодом, позволяющий пользователям легко контролировать и управлять своими компьютерами с помощью диалога на естественном языке. Без написания какого-либо кода пользователи могут выполнять поиск файлов, автоматизацию задач, управление устройствами и многое другое с помощью простого ежедневного диалога.NeoAI...
8 месяцев назад
011K
CogAgent:智谱开源的智能视觉语言模型,实现图形界面自动化操作

CogAgent: интеллектуальная модель визуального языка Smart Spectrum с открытым исходным кодом для автоматизации графических интерфейсов

Всеобъемлющее введение CogAgent - это визуальная языковая модель с открытым исходным кодом, разработанная исследовательской группой Tsinghua University Data Mining Research Group (THUDM) и предназначенная для автоматизации работы графического интерфейса пользователя (GUI) на разных платформах. Модель основана на CogVLM (GLM-4V-9B) и поддерживает двуязычный китайский и английский...
8 месяцев назад
09.2K
ClickClickClick:启用任何LLM实现自动化安卓和电脑操作

ClickClickClickClick: включите любой LLM для автоматизации операций на Android и ПК

Общее введение ClickClickClick - это фреймворк, разработанный компанией BandarLabs, целью которого является автоматизация операций на Android и ПК с помощью любой локальной или удаленной большой языковой модели (LLM). В настоящее время проект находится на стадии эксперимента и поддерживает различные модели, такие как...
8 месяцев назад
07.4K
Browser-Use:构建智能网页自动化工具,让AI智能体轻松操作浏览器

Browser-Use: создание интеллектуальных инструментов веб-автоматизации для ИИ-интеллектуалов, позволяющих легко управлять браузерами

Всеобъемлющее введение Browser-Use - это инновационный инструмент автоматизации веб-сайтов с открытым исходным кодом, специально разработанный для того, чтобы языковые модели (LLM) могли естественным образом взаимодействовать с веб-сайтами. Он предоставляет мощный и гибкий фреймворк, поддерживающий широкий спектр основных языковых моделей, включая GPT-4, Claud...
8 месяцев назад
010.9K
Project Mariner:浏览器自动化,探索未来人机交互的研究原型(未发布)

Проект Mariner: автоматизация браузера, исследовательский прототип, изучающий будущее человеко-компьютерного взаимодействия (неопубликованный)

Общее представление Проект Mariner - это исследовательский прототип, запущенный компанией Google DeepMind для изучения будущего взаимодействия человека и компьютера. Проект использует мощные возможности мультимодального понимания и рассуждения Gemini 2.0 через браузерную само...
8 месяцев назад
08.2K
Dia Browser:提供智能浏览体验,集成AI工具,在浏览器中自动化处理任务(未上线)

Dia Browser: обеспечивает интеллектуальный просмотр веб-страниц с помощью встроенных инструментов искусственного интеллекта для автоматизации задач в браузере (пока не работает)

Общее описание Dia Browser - это новый "умный" браузер, разработанный компанией The Browser Company, который призван обеспечить пользователям более эффективный просмотр веб-страниц за счет интеграции передовых инструментов искусственного интеллекта. Официальный релиз браузера ожидается в начале 2025 года, а его ключевые особенности...
8 месяцев назад
09.5K
Clevrr Computer:使用 PyAutoGUI 库实现自动化桌面操作智能体

Clevrr Computer: автоматизация интеллектуальных манипуляций с рабочим столом с помощью библиотеки PyAutoGUI

Общее введение Clevrr Computer - это проект с открытым исходным кодом, целью которого является автоматизация системных операций с помощью библиотеки PyAutoGUI. Проект был вдохновлен компанией Anthropic на разработку агента автоматизации, который может точно и эффективно выполнять операции, используя ...
8 месяцев назад
08.7K
GLM-PC(智谱牛牛)正式发布内测下载,真正可以控制电脑的AI

GLM-PC (Smart Spectrum Bull) официально выпущен для внутреннего скачивания, ИИ, который действительно может управлять компьютером

GLM-PC (Bull) Введение GLM-PC - это настольное приложение, основанное на модели CogAgent, способное быстро выполнять сложные задачи с помощью команд на естественном языке. Оно обладает способностью планирования задач и понимания интерфейса, а также может автономно выполнять различные компьютерные операции в соответствии с инструкциями пользователя. Примечания к использованию...
8 месяцев назад
09.4K
Runner H:通过自然语言命令实现网页自动化执行任务(申请内测)

Runner H: автоматизация задач по выполнению веб-страниц с помощью команд на естественном языке (приложение для внутреннего тестирования)

Общие сведения Runner H - компания, занимающаяся разработкой передовых моделей действий, призванных повысить производительность труда за счет передовых возможностей искусственного интеллекта. Флагманский продукт компании, Runner H, представляет собой продвинутый агент искусственного интеллекта, призванный помочь пользователям автоматизировать сложные многоэтапные задачи и сократить время пере...
8 месяцев назад
08.4K
AppAgent:利用多模态智能体自动操作智能手机

AppAgent: автоматизированное управление смартфоном с помощью мультимодального интеллекта

Всеобъемлющее введение AppAgent - это мультимодальный агент на основе Large Language Model (LLM), предназначенный для манипулирования приложениями для смартфонов. Фреймворк имитирует человеческие взаимодействия, такие как касания и смахивания, через упрощенное пространство манипуляций, таким образом, устраняя необходимость в системном внутреннем доступе, расширяя сферу своего действия на различные приложения...
8 месяцев назад
08.9K
Skyvern:使用LLM和计算机视觉自动化基于浏览器工作流

Skyvern: автоматизация рабочих процессов на основе браузера с помощью LLM и компьютерного зрения

Общее представление Skyvern - это инструмент для автоматизации рабочих процессов браузера с использованием моделирования большого языка (LLM) и методов компьютерного зрения. Он эффективно автоматизирует большое количество веб-сайтов, предоставляя простую конечную точку API, которая может заменить хрупкие или ненадежные решения по автоматизации...
6 месяцев назад
014.3K
Agent.exe:让AI直接控制你的电脑,Claude控制计算机的开源实现

Agent.exe: позволяет искусственному интеллекту управлять вашим компьютером напрямую, реализация управляющего компьютера Клода с открытым исходным кодом.

Общее описание Agent.exe - это Electron-приложение с открытым исходным кодом, которое использует API Claude 3.5 Sonnet от Anthropic, чтобы позволить пользователям управлять локальными компьютерами напрямую через AI. Проект был разработан К...
8 месяцев назад
010.4K