Browser Use Web UI: фреймворк с открытым исходным кодом для запуска искусственного интеллекта для просмотра веб-страниц, позволяющий искусственному интеллекту автоматически управлять веб-страницами.
Общее введение
Browser Use Web UI - это инновационный проект с открытым исходным кодом, направленный на предоставление агентам искусственного интеллекта графического интерфейса для взаимодействия с браузерами. Проект построен на использование браузера Поверх основного фреймворка с помощью Gradio построен удобный веб-интерфейс, позволяющий ИИ-агентам комфортно взаимодействовать с браузером. Проект поддерживает множество основных больших языковых моделей (LLM), включая Gemini, OpenAI, Azure OpenAI, Anthropic, DeepSeek и Ollama. Особого внимания заслуживает поддержка пользователями собственных браузеров, что позволяет решить такие распространенные проблемы, как дублирование логинов и аутентификация. По состоянию на январь 2025 года проект получил 2 601 звезду на GitHub и имеет 332 ветки, что свидетельствует о сильном присутствии сообщества.


Список функций
- Поддержка нескольких крупных интеграций языковых моделей (Gemini, OpenAI, Azure OpenAI и т. д.)
- Поддержка пользовательских браузеров с индивидуальными настройками
- Сохранение сеанса браузера для поддержки сохранения состояния браузера между задачами ИИ
- Предоставляет возможности развертывания контейнеров Docker
- Поддержка VNC удаленного просмотра браузера процесс работы
- Поддержка нескольких тем интерфейса (Ocean, Soft, Monochrome, Glass и т.д.)
- Поддерживает переключение между светлым и темным режимами
- Визуализация взаимодействия с браузером в режиме реального времени
- Гибкая поддержка конфигурации переменных окружения
Использование помощи
1. Подготовка окружающей среды
- Требования к среде Python: 3.11 или выше
- Рекомендации по использованию uv-инструментов для настройки среды Python
2. Способы установки
Местная установка:
- Создайте виртуальную среду:
uv venv --python 3.11
source .venv/bin/activate
- Установите зависимость:
bash
uv pip install -r requirements.txt
playwright install
Установка Docker:
- Хранилище клонирования:
bash
git clone https://github.com/browser-use/web-ui.git
cd web-ui
- Настройте окружение:
- Скопируйте .env.example в .env
- Настройте необходимые ключи API и переменные окружения
- Начните обслуживание:
bash
docker compose up --build
3. Руководство по использованию основных функций
Запуск WebUI:
bash
python webui.py --ip 127.0.0.1 --port 7788
Конфигурация персонального браузера:
- Пример конфигурации системы Windows:
env
CHROME_PATH="C:\Program Files\Google\Chrome\Application\chrome.exe"
CHROME_USER_DATA="C:\Users\YourUsername\AppData\Local\Google\Chrome\User Data"
- Пример конфигурации системы Mac:
env
CHROME_PATH="/Applications/Google Chrome.app/Contents/MacOS/Google Chrome"
CHROME_USER_DATA="~/Library/Application Support/Google/Chrome/Profile 1"
Управление сеансами браузера:
- Режим временной сессии: закрывайте браузер после завершения каждой задачи ИИ
- Режим постоянного сеанса: Настройка режима постоянного сеанса осуществляется путем установки параметра
CHROME_PERSISTENT_SESSION=true
начать использовать
Расширенные возможности для сред Docker:
- Удаленный просмотр VNC: доступ
http://localhost:6080/vnc.html
- Настройка разрешения: через переменные окружения
RESOLUTION
устанавливать - Безопасный доступ: настраиваемый пароль VNC
4. Советы по устранению неполадок:
- Не забудьте закрыть все окна Chrome при использовании пользовательского браузера
- Для доступа к WebUI рекомендуется использовать нехромные браузеры (например, Firefox или Edge).
- Не забудьте проверить журналы после развертывания Docker:
docker compose logs -f
© заявление об авторских правах
Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.
Похожие статьи
Нет комментариев...