Allgemeine Einführung
Proxy Lite wird betrieben von Konvergenz Ein quelloffenes, leichtgewichtiges Web-Automatisierungstool, das von AI als Miniversion von Proxy entwickelt wurde, mit offenem Design. Es basiert auf dem 3B-Parameter Visual Language Model (VLM) und kann autonom durch Webseiten navigieren und Aufgaben wie die Suche nach Informationen oder die Bedienung eines Browsers durchführen. Proxy Lite verbindet sich standardmäßig mit dem Hugging Face Spaces Demo-Endpunkt, aber es wird offiziell empfohlen, sich mit dem Hugging Face Spaces Demo-Endpunkt über den vLLM Lokale Bereitstellung für optimale Leistung. Es hat einen geringen Ressourcenbedarf und eignet sich für Entwickler zur Ausführung auf persönlichen Geräten, wobei der Schwerpunkt auf der Automatisierung von Aufgaben und nicht auf der Benutzerinteraktion liegt.
Funktionsliste
- Web-AutomatisierungAutomatisches Navigieren auf Webseiten, Klicken, Tippen, Scrollen, etc.
- MandatsumsetzungDurchführung bestimmter Aufgaben auf der Grundlage von Anweisungen, wie z. B. die Suche auf dem Markt und die Abgabe einer Bewertung.
- Lokale LaufzeitunterstützungKann über vLLM auf persönlichen Geräten bereitgestellt und ausgeführt werden.
- quelloffen und erweiterbarDer vollständige Code wird zur Verfügung gestellt, und die Benutzer können die Modell- oder Umgebungskonfigurationen anpassen.
- geringer RessourcenverbrauchLeichtes Design für den Betrieb auf Consumer-Hardware.
- Browser-InteraktionChromium-Browser, gesteuert von Playwright, unterstützt den Headless-Modus.
Hilfe verwenden
Proxy Lite ist ein Open-Source-Tool, das sich auf die Web-Automatisierung für Entwickler und Technikbegeisterte konzentriert. Nachfolgend finden Sie eine ausführliche Installations- und Nutzungsanleitung, um sicherzustellen, dass die Benutzer das Tool reibungslos einsetzen und nutzen können.
Einbauverfahren
Proxy Lite erfordert eine lokale Umgebung, um es zu unterstützen. Hier sind die offiziell empfohlenen Installationsschritte:
1. die Vorbereitung der Umwelt
- BetriebssystemWindows, Linux oder macOS.
- Hardware-VoraussetzungNormale Verbrauchergeräte sind in Ordnung, wobei 8 GB RAM oder mehr empfohlen werden.
- Software-Abhängigkeit::
- Python 3.11.
- Git (zum Klonen von Repositories).
- Playwright (Browser-Steuerungsbibliothek).
- vLLM (Model Reasoning Framework).
- Transformatoren (müssen von der Quelle installiert werden, um Qwen-2.5-VL zu unterstützen).
2. das Klonen von Lagern
Führen Sie den folgenden Befehl im Terminal aus, um den Code herunterzuladen:
git clone https://github.com/convergence-ai/proxy-lite.git
cd proxy-lite
3. die Einrichtung der Umgebung
- Schnelle Installation::
make proxy
- manuelle Installation::
pip install uv uv venv --python 3.11 --python-preference managed uv sync uv pip install -e . playwright install
- Hinweis: Wenn Sie das Modell lokal bereitstellen, müssen Sie vLLM und Transformers installieren:
uv sync --all-extras
Transformers muss aus dem Quellcode installiert werden, um Qwen-2.5-VL zu unterstützen, das auf der
pyproject.toml
Angegeben in.
- Hinweis: Wenn Sie das Modell lokal bereitstellen, müssen Sie vLLM und Transformers installieren:
4. lokaler Einsatz (empfohlen)
Es wird offiziell empfohlen, vLLM zur Bereitstellung lokaler Endpunkte zu verwenden und sich nicht auf Demo-Endpunkte zu verlassen:
vllm serve convergence-ai/proxy-lite-3b --trust-remote-code --enable-auto-tool-choice --tool-call-parser hermes --port 8008
- Beschreibung der Parameter::
--trust-remote-code
: Ermöglicht das Laden von Remote-Code.--enable-auto-tool-choice
Aktivieren Sie die automatische Werkzeugauswahl.--tool-call-parser hermes
Aufgerufen mit dem Hermes-Parsing-Tool.
- Nachdem der Dienst ausgeführt wurde, lautet die Endpunktadresse
http://localhost:8008/v1
.
Verwendung
Proxy Lite bietet drei Möglichkeiten der Nutzung: Kommandozeile, Web-UI und Python-Integration.
Modus 1: Befehlszeilenbetrieb
- Laufende Aufgaben::
proxy "Find some markets near Kings Cross and tell me their ratings."
- Der Demo-Endpunkt Hugging Face wird standardmäßig verwendet und kann langsamer sein.
- Lokale Endpunkte verwenden::
proxy --api-base http://localhost:8008/v1 "Find some markets near Kings Cross and tell me their ratings."
- oder Umgebungsvariablen setzen:
export PROXY_LITE_API_BASE=http://localhost:8008/v1
- oder Umgebungsvariablen setzen:
Weg 2: Web UI-Betrieb
- Schnittstelle starten::
make app
- Interviews::
Geben Sie in Ihrem Browser einhttp://localhost:8501
geben Sie die Aufgabe über die Schnittstelle ein.
Ansatz 3: Python-Integration
- Code-Beispiel::
import asyncio from proxy_lite import Runner, RunnerConfig config = RunnerConfig.from_dict({ "environment": { "name": "webbrowser", "homepage": "https://www.google.com", "headless": True }, "solver": { "name": "simple", "agent": { "name": "proxy_lite", "client": { "name": "convergence", "model_id": "convergence-ai/proxy-lite-3b", "api_base": "http://localhost:8008/v1" } } }, "max_steps": 50, "action_timeout": 1800, "environment_timeout": 1800, "task_timeout": 18000, "logger_level": "DEBUG" }) proxy = Runner(config=config) result = asyncio.run(proxy.run("Book a table for 2 at an Italian restaurant in Kings Cross tonight at 7pm.")) print(result)
- Anweisungen: durch
Runner
Die Klassen führen Aufgaben in einer Browserumgebung aus und unterstützen benutzerdefinierte Konfigurationen.
Hauptfunktionen
Funktion 1: Web-Automatisierung
- umziehen::
- Starten Sie den lokalen Endpunkt (siehe Installationsschritt 4).
- Geben Sie die Aufgabe ein:
proxy --api-base http://localhost:8008/v1 "Search for markets near Kings Cross."
- Proxy Lite verwendet Playwright zur Steuerung des Browsers und zur Durchführung von Navigation und Aktionen.
- zur Kenntnis nehmenAufgaben müssen klar sein und komplexe Vorgänge, die eine Benutzerinteraktion erfordern, vermeiden.
Funktion 2: Aufgabenausführung
- umziehen::
- Geben Sie die Aufgabe über die Befehlszeile oder Python ein:
result = asyncio.run(proxy.run("Find some markets near Kings Cross and tell me their ratings."))
- Das Modell liefert Ergebnisse, die auf dem Zyklus Beobachten - Denken - Handeln basieren.
- Geben Sie die Aufgabe über die Befehlszeile oder Python ein:
- EinschränkungAufgaben, die eine Anmeldung oder komplexe Interaktionen erfordern, werden nicht unterstützt, wenn nicht alle erforderlichen Informationen bereitgestellt werden.
Funktion 3: Unterstützung lokaler Läufe
- umziehen::
- Stellen Sie den vLLM-Dienst bereit.
- Konfigurieren Sie den Endpunkt und führen Sie die Aufgabe aus.
- SchneidkanteVermeiden Sie Instabilitäten und Verzögerungen bei Demo-Endpunkten.
caveat
- Einschränkungen des Demo-EndpunktsDie Standardendpunkte (Hugging Face Spaces) dienen nur zu Demonstrationszwecken und sind nicht für die Produktion oder häufige Verwendung geeignet; eine lokale Bereitstellung wird empfohlen.
- Maßnahmen gegen Klettern: Verwendung
playwright_stealth
Verringert das Entdeckungsrisiko, kann aber immer noch durch CAPTCHA blockiert werden; empfohlen wird die Kombination mit einem Web-Proxy. - FunktionseinschränkungProxy Lite konzentriert sich auf die autonome Ausführung von Aufgaben und ist nicht für Aufgaben geeignet, die eine Benutzerinteraktion in Echtzeit oder eine Anmeldung mit Anmeldeinformationen erfordern.
- Unterstützung bei der Fehlersuche: Einstellungen
logger_level="DEBUG"
Detaillierte Protokolle anzeigen.
Mit diesen Schritten können Sie Webaufgaben mit Proxy Lite schnell einrichten und automatisieren.