Introdução geral
O Proxy Lite é uma ferramenta de automação da Web leve e de código aberto, desenvolvida pela Convergence AI como uma mini-versão do Proxy com um design de peso aberto. Ela se baseia em um modelo de linguagem visual (VLM) de 3B parâmetros e pode navegar de forma autônoma em páginas da Web e executar tarefas como encontrar informações ou operar um navegador. O projeto está hospedado no GitHub e é gratuito para os usuários baixarem e personalizarem o código. O Proxy Lite se conecta ao endpoint de demonstração do Hugging Face Spaces por padrão, mas é oficialmente recomendado conectar-se ao endpoint de demonstração do Hugging Face Spaces por meio do vLLM Implemente localmente para obter o melhor desempenho. Ele ocupa poucos recursos e é adequado para os desenvolvedores executarem em dispositivos pessoais, concentrando-se na automatização de tarefas em vez de na interação com o usuário.
Lista de funções
- automação da webNavegação automática em páginas da Web, cliques, digitação, rolagem, etc.
- implementação do mandatoConclusão de tarefas específicas com base em instruções, como pesquisar o mercado e retornar uma classificação.
- Suporte ao tempo de execução localPode ser implantado e executado em dispositivos pessoais via vLLM.
- código aberto e extensívelCódigo completo: O código completo é fornecido e os usuários podem ajustar as configurações do modelo ou do ambiente.
- baixo consumo de recursosDesign leve para execução em hardware de nível de consumidor.
- Interação com o navegadorChromium: navegador Chromium orientado pelo Playwright, com suporte ao modo headless.
Usando a Ajuda
O Proxy Lite é uma ferramenta de código aberto voltada para a automação da Web para desenvolvedores e entusiastas de tecnologia. Abaixo está um guia detalhado de instalação e uso para garantir que os usuários possam implantá-lo e executá-lo sem problemas.
Processo de instalação
O Proxy Lite requer um ambiente local para ser suportado. Aqui estão as etapas de instalação recomendadas oficialmente:
1. preparação ambiental
- sistema operacional: Windows, Linux ou macOS.
- Requisitos de hardwareDispositivos normais de nível de consumidor são adequados, com 8 GB de RAM ou mais recomendados.
- dependência de software::
- Python 3.11.
- Git (para clonagem de repositórios).
- Playwright (biblioteca de controle do navegador).
- vLLM (Estrutura de raciocínio de modelo).
- Transformadores (precisam ser instalados a partir da fonte para suportar o Qwen-2.5-VL).
2. clonagem de armazéns
Execute o seguinte comando no terminal para fazer o download do código:
git clone https://github.com/convergence-ai/proxy-lite.git
cd proxy-lite
3. configuração do ambiente
- Instalação rápida::
fazer proxy
- instalação manual::
pip install uv uv venv --python 3.11 --python-preference managed uv sincronização uv pip install -e . playwright install
- Observação: se estiver implantando o modelo localmente, será necessário instalar o vLLM e os Transformers:
uv sync --all-extras
Os transformadores precisam ser instalados a partir da fonte para oferecer suporte ao Qwen-2.5-VL, que foi lançado na versão
pyproject.toml
Especifique no.
- Observação: se estiver implantando o modelo localmente, será necessário instalar o vLLM e os Transformers:
4. implantação local (recomendado)
É oficialmente recomendado usar o vLLM para implantar endpoints locais e evitar depender de endpoints de demonstração:
vllm serve convergence-ai/proxy-lite-3b --trust-remote-code --enable-auto-tool-choice --tool-call-parser hermes --port 8008
- Descrição do parâmetro::
--trust-remote-code
Permite o carregamento de código remoto.--enable-auto-tool-choice
Seleção automática de ferramentas: Ativar a seleção automática de ferramentas.---tool-call-parser hermes
Chamado usando a ferramenta de análise Hermes.
- Depois que o serviço é executado, o endereço do ponto de extremidade é
http://localhost:8008/v1
.
Uso
O Proxy Lite oferece três maneiras de usá-lo: linha de comando, interface do usuário da Web e integração com Python.
Modo 1: operação de linha de comando
- Execução de tarefas::
proxy "Encontre alguns mercados próximos a Kings Cross e me diga suas classificações".
- O endpoint de demonstração Hugging Face é usado por padrão e pode ser mais lento.
- Uso de pontos de extremidade locais::
proxy --api-base http://localhost:8008/v1 "Encontre alguns mercados próximos a Kings Cross e me informe suas classificações."
- ou definir variáveis de ambiente:
export PROXY_LITE_API_BASE=http://localhost:8008/v1
- ou definir variáveis de ambiente:
Maneira 2: operação da interface do usuário da Web
- Interface de lançamento::
criar aplicativo
- entrevistas::
Digite em seu navegadorhttp://localhost:8501
Entre na tarefa por meio da interface.
Abordagem 3: Integração com Python
- exemplo de código::
importar asyncio from proxy_lite import Runner, RunnerConfig config = RunnerConfig.from_dict({ "environment": { "name": "webbrowser", "homepage": "https://www.google.com", "headless": True }, "solver": { "name": "webbrowser", "homepage": "", "headless": True "solver": { "name": "simple", "agent": { "agent": { "nome": "proxy_lite", "cliente": { "name": "convergence", "model_id": { "model_id": "convergence-ai/proxy-lite-3b", "api_base":" "api_base": "http://localhost:8008/v1" } } }, "max_steps". "max_steps": 50, "action_timeout": 1800, "environment_timeout": 1800, "task_timeout": 18000, "logger_level": "DEBUG": "DEBUG "logger_level": "DEBUG" }) proxy = Runner(config=config) result = asyncio.run(proxy.run("Reserve uma mesa para 2 pessoas em um restaurante italiano em Kings Cross hoje à noite, às 19h.")) print(result)
- instruções: através de
Corredor
As classes executam tarefas em um ambiente de navegador e oferecem suporte a configurações personalizadas.
Funções principais
Função 1: Automação da Web
- mover::
- Inicie o endpoint local (consulte a Etapa 4 da instalação).
- Digite a tarefa:
proxy --api-base http://localhost:8008/v1 "Pesquisar mercados próximos a Kings Cross."
- O Proxy Lite usa o Playwright para controlar o navegador e executar a navegação e as ações.
- tomar nota deTarefas: As tarefas precisam ser claras, evitando operações complexas que exijam interação do usuário.
Função 2: execução de tarefas
- mover::
- Insira a tarefa por meio da linha de comando ou do Python:
result = asyncio.run(proxy.run("Encontre alguns mercados próximos a Kings Cross e me informe suas classificações."))
- O modelo retorna resultados, com base no ciclo Observar-Pensar-Agir.
- Insira a tarefa por meio da linha de comando ou do Python:
- restriçãoTarefas que exigem logins ou interações complexas não são suportadas, a menos que todas as informações necessárias sejam fornecidas.
Recurso 3: Suporte à execução local
- mover::
- Implante o serviço vLLM.
- Configure o endpoint e execute a tarefa.
- de pontaEvite instabilidades e atrasos nos pontos de extremidade de demonstração.
advertência
- Limites do ponto de extremidade de demonstraçãoOs pontos de extremidade padrão (Hugging Face Spaces) são apenas para fins de demonstração e não são adequados para produção ou uso frequente; recomenda-se a implementação local.
- medidas contra escalada: Uso
playwright_stealth
Reduz o risco de detecção, mas ainda pode ser bloqueado pelo CAPTCHA. Recomenda-se que seja combinado com um proxy da Web. - limitação funcionalO Proxy Lite é voltado para a execução de tarefas autônomas e não é adequado para tarefas que exigem interação com o usuário em tempo real ou login de credenciais.
- Suporte à depuração: Configurações
nível do registrador="DEBUG"
Veja os registros detalhados.
Com essas etapas, você pode implementar e automatizar rapidamente as tarefas da Web com o Proxy Lite.