Browser Use Web UI: фреймворк с открытым исходным кодом для запуска искусственного интеллекта для просмотра веб-страниц, позволяющий искусственному интеллекту автоматически управлять веб-страницами.

Общее введение

Browser Use Web UI - это инновационный проект с открытым исходным кодом, направленный на предоставление агентам искусственного интеллекта графического интерфейса для взаимодействия с браузерами. Проект построен на использование браузера Поверх основного фреймворка с помощью Gradio построен удобный веб-интерфейс, позволяющий ИИ-агентам комфортно взаимодействовать с браузером. Проект поддерживает множество основных больших языковых моделей (LLM), включая Gemini, OpenAI, Azure OpenAI, Anthropic, DeepSeek и Ollama. Особого внимания заслуживает поддержка пользователями собственных браузеров, что позволяет решить такие распространенные проблемы, как дублирование логинов и аутентификация. По состоянию на январь 2025 года проект получил 2 601 звезду на GitHub и имеет 332 ветки, что свидетельствует о сильном присутствии сообщества.

Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

 

Browser Use Web UI:运行AI智能体浏览网页,让AI能够自动操作网页的开源框架

 

Список функций

  • Поддержка нескольких крупных интеграций языковых моделей (Gemini, OpenAI, Azure OpenAI и т. д.)
  • Поддержка пользовательских браузеров с индивидуальными настройками
  • Сохранение сеанса браузера для поддержки сохранения состояния браузера между задачами ИИ
  • Предоставляет возможности развертывания контейнеров Docker
  • Поддержка VNC удаленного просмотра браузера процесс работы
  • Поддержка нескольких тем интерфейса (Ocean, Soft, Monochrome, Glass и т.д.)
  • Поддерживает переключение между светлым и темным режимами
  • Визуализация взаимодействия с браузером в режиме реального времени
  • Гибкая поддержка конфигурации переменных окружения

 

Использование помощи

1. Подготовка окружающей среды

  • Требования к среде Python: 3.11 или выше
  • Рекомендации по использованию uv-инструментов для настройки среды Python

2. Способы установки

Местная установка:

  1. Создайте виртуальную среду:
uv venv --python 3.11
source .venv/bin/activate
  1. Установите зависимость:

bash

uv pip install -r requirements.txt
playwright install

Установка Docker:

  1. Хранилище клонирования:

bash

git clone https://github.com/browser-use/web-ui.git
cd web-ui
  1. Настройте окружение:
  • Скопируйте .env.example в .env
  • Настройте необходимые ключи API и переменные окружения
  1. Начните обслуживание:

bash

docker compose up --build

3. Руководство по использованию основных функций

Запуск WebUI:

bash

python webui.py --ip 127.0.0.1 --port 7788

Конфигурация персонального браузера:

  1. Пример конфигурации системы Windows:

env

CHROME_PATH="C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_USER_DATA="C:\Users\YourUsername\AppData\Local\Google\Chrome\User Data"
  1. Пример конфигурации системы Mac:

env

CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
CHROME_USER_DATA="~/Library/Application Support/Google/Chrome/Profile 1"

Управление сеансами браузера:

  • Режим временной сессии: закрывайте браузер после завершения каждой задачи ИИ
  • Режим постоянного сеанса: Настройка режима постоянного сеанса осуществляется путем установки параметраCHROME_PERSISTENT_SESSION=trueначать использовать

Расширенные возможности для сред Docker:

  • Удаленный просмотр VNC: доступhttp://localhost:6080/vnc.html
  • Настройка разрешения: через переменные окруженияRESOLUTIONустанавливать
  • Безопасный доступ: настраиваемый пароль VNC

4. Советы по устранению неполадок:

  • Не забудьте закрыть все окна Chrome при использовании пользовательского браузера
  • Для доступа к WebUI рекомендуется использовать нехромные браузеры (например, Firefox или Edge).
  • Не забудьте проверить журналы после развертывания Docker:docker compose logs -f
© заявление об авторских правах

Похожие статьи

FoloUp:开源AI语音面试平台,生成定制面试题并进行智能分析

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...