Aprendizagem pessoal com IA
e orientação prática
Sapo pintado em alumínio

Proxy Lite: Ferramenta de automação da Web orientada por modelo visual da 3B Parametric

Introdução geral

O Proxy Lite é uma ferramenta de automação da Web leve e de código aberto, desenvolvida pela Convergence AI como uma mini-versão do Proxy com um design de peso aberto. Ela se baseia em um modelo de linguagem visual (VLM) de 3B parâmetros e pode navegar de forma autônoma em páginas da Web e executar tarefas como encontrar informações ou operar um navegador. O projeto está hospedado no GitHub e é gratuito para os usuários baixarem e personalizarem o código. O Proxy Lite se conecta ao endpoint de demonstração do Hugging Face Spaces por padrão, mas é oficialmente recomendado conectar-se ao endpoint de demonstração do Hugging Face Spaces por meio do vLLM Implemente localmente para obter o melhor desempenho. Ele ocupa poucos recursos e é adequado para os desenvolvedores executarem em dispositivos pessoais, concentrando-se na automatização de tarefas em vez de na interação com o usuário.

Proxy Lite: Ferramenta de automação da Web orientada por modelos visuais da 3B Parametric-1


 

Proxy Lite: Ferramenta de automação da Web orientada por modelos visuais da 3B Parametric-1

 

Lista de funções

  • automação da webNavegação automática em páginas da Web, cliques, digitação, rolagem, etc.
  • implementação do mandatoConclusão de tarefas específicas com base em instruções, como pesquisar o mercado e retornar uma classificação.
  • Suporte ao tempo de execução localPode ser implantado e executado em dispositivos pessoais via vLLM.
  • código aberto e extensívelCódigo completo: O código completo é fornecido e os usuários podem ajustar as configurações do modelo ou do ambiente.
  • baixo consumo de recursosDesign leve para execução em hardware de nível de consumidor.
  • Interação com o navegadorChromium: navegador Chromium orientado pelo Playwright, com suporte ao modo headless.

 

Usando a Ajuda

O Proxy Lite é uma ferramenta de código aberto voltada para a automação da Web para desenvolvedores e entusiastas de tecnologia. Abaixo está um guia detalhado de instalação e uso para garantir que os usuários possam implantá-lo e executá-lo sem problemas.

Processo de instalação

O Proxy Lite requer um ambiente local para ser suportado. Aqui estão as etapas de instalação recomendadas oficialmente:

1. preparação ambiental

  • sistema operacional: Windows, Linux ou macOS.
  • Requisitos de hardwareDispositivos normais de nível de consumidor são adequados, com 8 GB de RAM ou mais recomendados.
  • dependência de software::
    • Python 3.11.
    • Git (para clonagem de repositórios).
    • Playwright (biblioteca de controle do navegador).
    • vLLM (Estrutura de raciocínio de modelo).
    • Transformadores (precisam ser instalados a partir da fonte para suportar o Qwen-2.5-VL).

2. clonagem de armazéns

Execute o seguinte comando no terminal para fazer o download do código:

git clone https://github.com/convergence-ai/proxy-lite.git
cd proxy-lite

3. configuração do ambiente

  • Instalação rápida::
    fazer proxy
    
  • instalação manual::
    pip install uv
    uv venv --python 3.11 --python-preference managed
    uv sincronização
    uv pip install -e .
    playwright install
    
    • Observação: se estiver implantando o modelo localmente, será necessário instalar o vLLM e os Transformers:
      uv sync --all-extras
      

      Os transformadores precisam ser instalados a partir da fonte para oferecer suporte ao Qwen-2.5-VL, que foi lançado na versão pyproject.toml Especifique no.

4. implantação local (recomendado)

É oficialmente recomendado usar o vLLM para implantar endpoints locais e evitar depender de endpoints de demonstração:

vllm serve convergence-ai/proxy-lite-3b --trust-remote-code --enable-auto-tool-choice --tool-call-parser hermes --port 8008
  • Descrição do parâmetro::
    • --trust-remote-codePermite o carregamento de código remoto.
    • --enable-auto-tool-choiceSeleção automática de ferramentas: Ativar a seleção automática de ferramentas.
    • ---tool-call-parser hermesChamado usando a ferramenta de análise Hermes.
  • Depois que o serviço é executado, o endereço do ponto de extremidade é http://localhost:8008/v1.

Uso

O Proxy Lite oferece três maneiras de usá-lo: linha de comando, interface do usuário da Web e integração com Python.

Modo 1: operação de linha de comando

  1. Execução de tarefas::
    proxy "Encontre alguns mercados próximos a Kings Cross e me diga suas classificações".
    
    • O endpoint de demonstração Hugging Face é usado por padrão e pode ser mais lento.
  2. Uso de pontos de extremidade locais::
    proxy --api-base http://localhost:8008/v1 "Encontre alguns mercados próximos a Kings Cross e me informe suas classificações."
    
    • ou definir variáveis de ambiente:
      export PROXY_LITE_API_BASE=http://localhost:8008/v1
      

Maneira 2: operação da interface do usuário da Web

  1. Interface de lançamento::
    criar aplicativo
    
  2. entrevistas::
    Digite em seu navegador http://localhost:8501Entre na tarefa por meio da interface.

Abordagem 3: Integração com Python

  1. exemplo de código::
    importar asyncio
    from proxy_lite import Runner, RunnerConfig
    config = RunnerConfig.from_dict({
    "environment": {
    "name": "webbrowser",
    "homepage": "https://www.google.com",
    "headless": True
    }, "solver": { "name": "webbrowser", "homepage": "", "headless": True
    "solver": {
    "name": "simple", "agent": {
    "agent": {
    "nome": "proxy_lite",
    "cliente": {
    "name": "convergence", "model_id": {
    "model_id": "convergence-ai/proxy-lite-3b", "api_base":"
    "api_base": "http://localhost:8008/v1"
    }
    }
    }, "max_steps".
    "max_steps": 50,
    "action_timeout": 1800,
    "environment_timeout": 1800,
    "task_timeout": 18000, "logger_level": "DEBUG": "DEBUG
    "logger_level": "DEBUG"
    })
    proxy = Runner(config=config)
    result = asyncio.run(proxy.run("Reserve uma mesa para 2 pessoas em um restaurante italiano em Kings Cross hoje à noite, às 19h."))
    print(result)
    
  2. instruções: através de Corredor As classes executam tarefas em um ambiente de navegador e oferecem suporte a configurações personalizadas.

Funções principais

Função 1: Automação da Web

  • mover::
    1. Inicie o endpoint local (consulte a Etapa 4 da instalação).
    2. Digite a tarefa:
      proxy --api-base http://localhost:8008/v1 "Pesquisar mercados próximos a Kings Cross."
      
    3. O Proxy Lite usa o Playwright para controlar o navegador e executar a navegação e as ações.
  • tomar nota deTarefas: As tarefas precisam ser claras, evitando operações complexas que exijam interação do usuário.

Função 2: execução de tarefas

  • mover::
    1. Insira a tarefa por meio da linha de comando ou do Python:
      result = asyncio.run(proxy.run("Encontre alguns mercados próximos a Kings Cross e me informe suas classificações."))
      
    2. O modelo retorna resultados, com base no ciclo Observar-Pensar-Agir.
  • restriçãoTarefas que exigem logins ou interações complexas não são suportadas, a menos que todas as informações necessárias sejam fornecidas.

Recurso 3: Suporte à execução local

  • mover::
    1. Implante o serviço vLLM.
    2. Configure o endpoint e execute a tarefa.
  • de pontaEvite instabilidades e atrasos nos pontos de extremidade de demonstração.

advertência

  • Limites do ponto de extremidade de demonstraçãoOs pontos de extremidade padrão (Hugging Face Spaces) são apenas para fins de demonstração e não são adequados para produção ou uso frequente; recomenda-se a implementação local.
  • medidas contra escalada: Uso playwright_stealth Reduz o risco de detecção, mas ainda pode ser bloqueado pelo CAPTCHA. Recomenda-se que seja combinado com um proxy da Web.
  • limitação funcionalO Proxy Lite é voltado para a execução de tarefas autônomas e não é adequado para tarefas que exigem interação com o usuário em tempo real ou login de credenciais.
  • Suporte à depuração: Configurações nível do registrador="DEBUG" Veja os registros detalhados.

Com essas etapas, você pode implementar e automatizar rapidamente as tarefas da Web com o Proxy Lite.

CDN1
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " Proxy Lite: Ferramenta de automação da Web orientada por modelo visual da 3B Parametric

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil