Proxy Lite: Herramienta de automatización web basada en modelos visuales de 3B Parametric

Introducción general

Proxy Lite funciona con Convergencia Una herramienta de automatización web ligera y de código abierto desarrollada por AI como una mini-versión de Proxy con un diseño de peso abierto. Se basa en un modelo de lenguaje visual (VLM) de 3B parámetros y puede navegar de forma autónoma por páginas web y realizar tareas como buscar información o manejar un navegador. El proyecto está alojado en GitHub y es gratuito para que los usuarios descarguen y personalicen el código.Proxy Lite se conecta por defecto al endpoint de demostración de Hugging Face Spaces, pero se recomienda oficialmente conectarse al endpoint de demostración de Hugging Face Spaces a través del enlace vLLM Despliegue local para un rendimiento óptimo. Ocupa pocos recursos y es adecuado para que los desarrolladores lo ejecuten en dispositivos personales, centrándose en la automatización de tareas más que en la interacción con el usuario.

Proxy Lite:3B参数视觉模型驱动的网页自动化工具

 

Proxy Lite:3B参数视觉模型驱动的网页自动化工具

 

Lista de funciones

  • automatización web: Navega automáticamente por las páginas web, hace clic, escribe, se desplaza, etc.
  • aplicación del mandato: Realiza tareas específicas siguiendo instrucciones, como buscar en el mercado y devolver una valoración.
  • Soporte de tiempo de ejecución localPuede desplegarse y ejecutarse en dispositivos personales a través de vLLM.
  • código abierto y extensibleSe proporciona el código completo y los usuarios pueden ajustar las configuraciones del modelo o del entorno.
  • bajo consumo de recursosDiseño ligero para ejecutarse en hardware de consumo.
  • Interacción con el navegadorNavegador Chromium basado en Playwright, compatible con el modo headless.

 

Utilizar la ayuda

Proxy Lite es una herramienta de código abierto centrada en la automatización web para desarrolladores y entusiastas de la tecnología. A continuación encontrará una guía detallada de instalación y uso para garantizar que los usuarios puedan implementarla y ejecutarla sin problemas.

Proceso de instalación

Proxy Lite requiere un entorno local para soportarlo, aquí están los pasos oficiales de instalación recomendados:

1. Preparación medioambiental

  • sistema operativoWindows, Linux o macOS.
  • requisitos de hardwareDispositivos de consumo normal: se recomiendan 8 GB de RAM o más.
  • dependencia del software::
    • Python 3.11.
    • Git (para clonar repositorios).
    • Playwright (biblioteca de control del navegador).
    • vLLM (Marco de razonamiento por modelos).
    • Transformadores (deben instalarse desde la fuente para soportar Qwen-2.5-VL).

2. Clonación de almacenes

Ejecute el siguiente comando en el terminal para descargar el código:

git clone https://github.com/convergence-ai/proxy-lite.git
cd proxy-lite

3. Configuración del entorno

  • Instalación rápida::
    make proxy
    
  • instalación manual::
    pip install uv
    uv venv --python 3.11 --python-preference managed
    uv sync
    uv pip install -e .
    playwright install
    
    • Nota: Si va a desplegar el modelo localmente, deberá instalar vLLM y Transformers:
      uv sync --all-extras
      

      Transformers necesita ser instalado desde el código fuente para soportar Qwen-2.5-VL, que ha sido liberado en el pyproject.toml Especifique en el.

4. Despliegue local (recomendado)

Se recomienda oficialmente utilizar vLLM para desplegar endpoints locales y evitar depender de endpoints de demostración:

vllm serve convergence-ai/proxy-lite-3b --trust-remote-code --enable-auto-tool-choice --tool-call-parser hermes --port 8008
  • Descripción de los parámetros::
    • --trust-remote-codePermite la carga de código remoto.
    • --enable-auto-tool-choice: Activa la selección automática de herramientas.
    • --tool-call-parser hermesLlamada utilizando la herramienta de análisis Hermes.
  • Una vez ejecutado el servicio, la dirección del punto final es http://localhost:8008/v1.

Utilización

Proxy Lite ofrece tres formas de utilizarlo: línea de comandos, interfaz de usuario web e integración con Python.

Modo 1: Funcionamiento de la línea de comandos

  1. Tareas en curso::
    proxy "Find some markets near Kings Cross and tell me their ratings."
    
    • Por defecto se utiliza el endpoint de demostración Hugging Face, que puede ser más lento.
  2. Uso de puntos finales locales::
    proxy --api-base http://localhost:8008/v1 "Find some markets near Kings Cross and tell me their ratings."
    
    • o establecer variables de entorno:
      export PROXY_LITE_API_BASE=http://localhost:8008/v1
      

Forma 2: Funcionamiento de la interfaz web

  1. Interfaz de lanzamiento::
    make app
    
  2. entrevistas::
    Escriba en su navegador http://localhost:8501, introduzca la tarea a través de la interfaz.

Enfoque 3: Integración de Python

  1. ejemplo de código::
    import asyncio
    from proxy_lite import Runner, RunnerConfig
    config = RunnerConfig.from_dict({
    "environment": {
    "name": "webbrowser",
    "homepage": "https://www.google.com",
    "headless": True
    },
    "solver": {
    "name": "simple",
    "agent": {
    "name": "proxy_lite",
    "client": {
    "name": "convergence",
    "model_id": "convergence-ai/proxy-lite-3b",
    "api_base": "http://localhost:8008/v1"
    }
    }
    },
    "max_steps": 50,
    "action_timeout": 1800,
    "environment_timeout": 1800,
    "task_timeout": 18000,
    "logger_level": "DEBUG"
    })
    proxy = Runner(config=config)
    result = asyncio.run(proxy.run("Book a table for 2 at an Italian restaurant in Kings Cross tonight at 7pm."))
    print(result)
    
  2. instrucciones: a través de Runner Las clases ejecutan tareas en un entorno de navegador y admiten configuraciones personalizadas.

Funciones principales

Función 1: Automatización web

  • mover::
    1. Inicie el endpoint local (véase el paso 4 de la instalación).
    2. Introduzca la tarea:
      proxy --api-base http://localhost:8008/v1 "Search for markets near Kings Cross."
      
    3. Proxy Lite utiliza Playwright para controlar el navegador y realizar la navegación y las acciones.
  • tenga en cuenta: Las tareas deben ser claras, evitando operaciones complejas que requieran la interacción del usuario.

Función 2: Ejecución de tareas

  • mover::
    1. Introduzca la tarea a través de la línea de comandos o Python:
      result = asyncio.run(proxy.run("Find some markets near Kings Cross and tell me their ratings."))
      
    2. El modelo devuelve resultados, basados en el ciclo Observar-Pensar-Actuar.
  • restricción: Las tareas que requieren inicios de sesión o interacciones complejas no se admiten a menos que se proporcione toda la información necesaria.

Característica 3: Soporte de ejecución local

  • mover::
    1. Despliegue el servicio vLLM.
    2. Configure el endpoint y ejecute la tarea.
  • vanguardia: Evita inestabilidades y retrasos en los puntos finales de demostración.

advertencia

  • Demostración de los límites de los extremos: Los puntos finales por defecto (Hugging Face Spaces) son sólo para fines de demostración y no son adecuados para la producción o el uso frecuente; se recomienda el despliegue local.
  • medidas antitrepa: Uso playwright_stealth Reduce el riesgo de detección, pero aún puede ser bloqueado por CAPTCHA, se recomienda emparejarlo con un proxy web.
  • limitación funcionalProxy Lite : Proxy Lite se centra en la ejecución autónoma de tareas y no es adecuado para tareas que requieran la interacción del usuario en tiempo real o el inicio de sesión con credenciales.
  • Soporte de depuración: Ajustes logger_level="DEBUG" Ver registros detallados.

Con estos pasos, puede implementar y automatizar rápidamente tareas web con Proxy Lite.

© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...