Proxy Lite: Herramienta de automatización web basada en modelos visuales de 3B Parametric
Últimos recursos sobre IAActualizado hace 5 meses Círculo de intercambio de inteligencia artificial 1.7K 00
Introducción general
Proxy Lite funciona con Convergencia Una herramienta de automatización web ligera y de código abierto desarrollada por AI como una mini-versión de Proxy con un diseño de peso abierto. Se basa en un modelo de lenguaje visual (VLM) de 3B parámetros y puede navegar de forma autónoma por páginas web y realizar tareas como buscar información o manejar un navegador. El proyecto está alojado en GitHub y es gratuito para que los usuarios descarguen y personalicen el código.Proxy Lite se conecta por defecto al endpoint de demostración de Hugging Face Spaces, pero se recomienda oficialmente conectarse al endpoint de demostración de Hugging Face Spaces a través del enlace vLLM Despliegue local para un rendimiento óptimo. Ocupa pocos recursos y es adecuado para que los desarrolladores lo ejecuten en dispositivos personales, centrándose en la automatización de tareas más que en la interacción con el usuario.


Lista de funciones
- automatización web: Navega automáticamente por las páginas web, hace clic, escribe, se desplaza, etc.
- aplicación del mandato: Realiza tareas específicas siguiendo instrucciones, como buscar en el mercado y devolver una valoración.
- Soporte de tiempo de ejecución localPuede desplegarse y ejecutarse en dispositivos personales a través de vLLM.
- código abierto y extensibleSe proporciona el código completo y los usuarios pueden ajustar las configuraciones del modelo o del entorno.
- bajo consumo de recursosDiseño ligero para ejecutarse en hardware de consumo.
- Interacción con el navegadorNavegador Chromium basado en Playwright, compatible con el modo headless.
Utilizar la ayuda
Proxy Lite es una herramienta de código abierto centrada en la automatización web para desarrolladores y entusiastas de la tecnología. A continuación encontrará una guía detallada de instalación y uso para garantizar que los usuarios puedan implementarla y ejecutarla sin problemas.
Proceso de instalación
Proxy Lite requiere un entorno local para soportarlo, aquí están los pasos oficiales de instalación recomendados:
1. Preparación medioambiental
- sistema operativoWindows, Linux o macOS.
- requisitos de hardwareDispositivos de consumo normal: se recomiendan 8 GB de RAM o más.
- dependencia del software::
- Python 3.11.
- Git (para clonar repositorios).
- Playwright (biblioteca de control del navegador).
- vLLM (Marco de razonamiento por modelos).
- Transformadores (deben instalarse desde la fuente para soportar Qwen-2.5-VL).
2. Clonación de almacenes
Ejecute el siguiente comando en el terminal para descargar el código:
git clone https://github.com/convergence-ai/proxy-lite.git
cd proxy-lite
3. Configuración del entorno
- Instalación rápida::
make proxy
- instalación manual::
pip install uv uv venv --python 3.11 --python-preference managed uv sync uv pip install -e . playwright install
- Nota: Si va a desplegar el modelo localmente, deberá instalar vLLM y Transformers:
uv sync --all-extras
Transformers necesita ser instalado desde el código fuente para soportar Qwen-2.5-VL, que ha sido liberado en el
pyproject.toml
Especifique en el.
- Nota: Si va a desplegar el modelo localmente, deberá instalar vLLM y Transformers:
4. Despliegue local (recomendado)
Se recomienda oficialmente utilizar vLLM para desplegar endpoints locales y evitar depender de endpoints de demostración:
vllm serve convergence-ai/proxy-lite-3b --trust-remote-code --enable-auto-tool-choice --tool-call-parser hermes --port 8008
- Descripción de los parámetros::
--trust-remote-code
Permite la carga de código remoto.--enable-auto-tool-choice
: Activa la selección automática de herramientas.--tool-call-parser hermes
Llamada utilizando la herramienta de análisis Hermes.
- Una vez ejecutado el servicio, la dirección del punto final es
http://localhost:8008/v1
.
Utilización
Proxy Lite ofrece tres formas de utilizarlo: línea de comandos, interfaz de usuario web e integración con Python.
Modo 1: Funcionamiento de la línea de comandos
- Tareas en curso::
proxy "Find some markets near Kings Cross and tell me their ratings."
- Por defecto se utiliza el endpoint de demostración Hugging Face, que puede ser más lento.
- Uso de puntos finales locales::
proxy --api-base http://localhost:8008/v1 "Find some markets near Kings Cross and tell me their ratings."
- o establecer variables de entorno:
export PROXY_LITE_API_BASE=http://localhost:8008/v1
- o establecer variables de entorno:
Forma 2: Funcionamiento de la interfaz web
- Interfaz de lanzamiento::
make app
- entrevistas::
Escriba en su navegadorhttp://localhost:8501
, introduzca la tarea a través de la interfaz.
Enfoque 3: Integración de Python
- ejemplo de código::
import asyncio from proxy_lite import Runner, RunnerConfig config = RunnerConfig.from_dict({ "environment": { "name": "webbrowser", "homepage": "https://www.google.com", "headless": True }, "solver": { "name": "simple", "agent": { "name": "proxy_lite", "client": { "name": "convergence", "model_id": "convergence-ai/proxy-lite-3b", "api_base": "http://localhost:8008/v1" } } }, "max_steps": 50, "action_timeout": 1800, "environment_timeout": 1800, "task_timeout": 18000, "logger_level": "DEBUG" }) proxy = Runner(config=config) result = asyncio.run(proxy.run("Book a table for 2 at an Italian restaurant in Kings Cross tonight at 7pm.")) print(result)
- instrucciones: a través de
Runner
Las clases ejecutan tareas en un entorno de navegador y admiten configuraciones personalizadas.
Funciones principales
Función 1: Automatización web
- mover::
- Inicie el endpoint local (véase el paso 4 de la instalación).
- Introduzca la tarea:
proxy --api-base http://localhost:8008/v1 "Search for markets near Kings Cross."
- Proxy Lite utiliza Playwright para controlar el navegador y realizar la navegación y las acciones.
- tenga en cuenta: Las tareas deben ser claras, evitando operaciones complejas que requieran la interacción del usuario.
Función 2: Ejecución de tareas
- mover::
- Introduzca la tarea a través de la línea de comandos o Python:
result = asyncio.run(proxy.run("Find some markets near Kings Cross and tell me their ratings."))
- El modelo devuelve resultados, basados en el ciclo Observar-Pensar-Actuar.
- Introduzca la tarea a través de la línea de comandos o Python:
- restricción: Las tareas que requieren inicios de sesión o interacciones complejas no se admiten a menos que se proporcione toda la información necesaria.
Característica 3: Soporte de ejecución local
- mover::
- Despliegue el servicio vLLM.
- Configure el endpoint y ejecute la tarea.
- vanguardia: Evita inestabilidades y retrasos en los puntos finales de demostración.
advertencia
- Demostración de los límites de los extremos: Los puntos finales por defecto (Hugging Face Spaces) son sólo para fines de demostración y no son adecuados para la producción o el uso frecuente; se recomienda el despliegue local.
- medidas antitrepa: Uso
playwright_stealth
Reduce el riesgo de detección, pero aún puede ser bloqueado por CAPTCHA, se recomienda emparejarlo con un proxy web. - limitación funcionalProxy Lite : Proxy Lite se centra en la ejecución autónoma de tareas y no es adecuado para tareas que requieran la interacción del usuario en tiempo real o el inicio de sesión con credenciales.
- Soporte de depuración: Ajustes
logger_level="DEBUG"
Ver registros detallados.
Con estos pasos, puede implementar y automatizar rápidamente tareas web con Proxy Lite.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...