AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel

Proxy Lite: 3B Parametric Visuelles modellgesteuertes Web-Automatisierungswerkzeug

Allgemeine Einführung

Proxy Lite wird betrieben von Konvergenz Ein quelloffenes, leichtgewichtiges Web-Automatisierungstool, das von AI als Miniversion von Proxy entwickelt wurde, mit offenem Design. Es basiert auf dem 3B-Parameter Visual Language Model (VLM) und kann autonom durch Webseiten navigieren und Aufgaben wie die Suche nach Informationen oder die Bedienung eines Browsers durchführen. Proxy Lite verbindet sich standardmäßig mit dem Hugging Face Spaces Demo-Endpunkt, aber es wird offiziell empfohlen, sich mit dem Hugging Face Spaces Demo-Endpunkt über den vLLM Lokale Bereitstellung für optimale Leistung. Es hat einen geringen Ressourcenbedarf und eignet sich für Entwickler zur Ausführung auf persönlichen Geräten, wobei der Schwerpunkt auf der Automatisierung von Aufgaben und nicht auf der Benutzerinteraktion liegt.

Proxy Lite: 3B Parametric Visual Model-Driven Web Automation Tool-1


 

Proxy Lite: 3B Parametric Visual Model-Driven Web Automation Tool-1

 

Funktionsliste

  • Web-AutomatisierungAutomatisches Navigieren auf Webseiten, Klicken, Tippen, Scrollen, etc.
  • MandatsumsetzungDurchführung bestimmter Aufgaben auf der Grundlage von Anweisungen, wie z. B. die Suche auf dem Markt und die Abgabe einer Bewertung.
  • Lokale LaufzeitunterstützungKann über vLLM auf persönlichen Geräten bereitgestellt und ausgeführt werden.
  • quelloffen und erweiterbarDer vollständige Code wird zur Verfügung gestellt, und die Benutzer können die Modell- oder Umgebungskonfigurationen anpassen.
  • geringer RessourcenverbrauchLeichtes Design für den Betrieb auf Consumer-Hardware.
  • Browser-InteraktionChromium-Browser, gesteuert von Playwright, unterstützt den Headless-Modus.

 

Hilfe verwenden

Proxy Lite ist ein Open-Source-Tool, das sich auf die Web-Automatisierung für Entwickler und Technikbegeisterte konzentriert. Nachfolgend finden Sie eine ausführliche Installations- und Nutzungsanleitung, um sicherzustellen, dass die Benutzer das Tool reibungslos einsetzen und nutzen können.

Einbauverfahren

Proxy Lite erfordert eine lokale Umgebung, um es zu unterstützen. Hier sind die offiziell empfohlenen Installationsschritte:

1. die Vorbereitung der Umwelt

  • BetriebssystemWindows, Linux oder macOS.
  • Hardware-VoraussetzungNormale Verbrauchergeräte sind in Ordnung, wobei 8 GB RAM oder mehr empfohlen werden.
  • Software-Abhängigkeit::
    • Python 3.11.
    • Git (zum Klonen von Repositories).
    • Playwright (Browser-Steuerungsbibliothek).
    • vLLM (Model Reasoning Framework).
    • Transformatoren (müssen von der Quelle installiert werden, um Qwen-2.5-VL zu unterstützen).

2. das Klonen von Lagern

Führen Sie den folgenden Befehl im Terminal aus, um den Code herunterzuladen:

git clone https://github.com/convergence-ai/proxy-lite.git
cd proxy-lite

3. die Einrichtung der Umgebung

  • Schnelle Installation::
    make proxy
    
  • manuelle Installation::
    pip install uv
    uv venv --python 3.11 --python-preference managed
    uv sync
    uv pip install -e .
    playwright install
    
    • Hinweis: Wenn Sie das Modell lokal bereitstellen, müssen Sie vLLM und Transformers installieren:
      uv sync --all-extras
      

      Transformers muss aus dem Quellcode installiert werden, um Qwen-2.5-VL zu unterstützen, das auf der pyproject.toml Angegeben in.

4. lokaler Einsatz (empfohlen)

Es wird offiziell empfohlen, vLLM zur Bereitstellung lokaler Endpunkte zu verwenden und sich nicht auf Demo-Endpunkte zu verlassen:

vllm serve convergence-ai/proxy-lite-3b --trust-remote-code --enable-auto-tool-choice --tool-call-parser hermes --port 8008
  • Beschreibung der Parameter::
    • --trust-remote-code: Ermöglicht das Laden von Remote-Code.
    • --enable-auto-tool-choiceAktivieren Sie die automatische Werkzeugauswahl.
    • --tool-call-parser hermesAufgerufen mit dem Hermes-Parsing-Tool.
  • Nachdem der Dienst ausgeführt wurde, lautet die Endpunktadresse http://localhost:8008/v1.

Verwendung

Proxy Lite bietet drei Möglichkeiten der Nutzung: Kommandozeile, Web-UI und Python-Integration.

Modus 1: Befehlszeilenbetrieb

  1. Laufende Aufgaben::
    proxy "Find some markets near Kings Cross and tell me their ratings."
    
    • Der Demo-Endpunkt Hugging Face wird standardmäßig verwendet und kann langsamer sein.
  2. Lokale Endpunkte verwenden::
    proxy --api-base http://localhost:8008/v1 "Find some markets near Kings Cross and tell me their ratings."
    
    • oder Umgebungsvariablen setzen:
      export PROXY_LITE_API_BASE=http://localhost:8008/v1
      

Weg 2: Web UI-Betrieb

  1. Schnittstelle starten::
    make app
    
  2. Interviews::
    Geben Sie in Ihrem Browser ein http://localhost:8501geben Sie die Aufgabe über die Schnittstelle ein.

Ansatz 3: Python-Integration

  1. Code-Beispiel::
    import asyncio
    from proxy_lite import Runner, RunnerConfig
    config = RunnerConfig.from_dict({
    "environment": {
    "name": "webbrowser",
    "homepage": "https://www.google.com",
    "headless": True
    },
    "solver": {
    "name": "simple",
    "agent": {
    "name": "proxy_lite",
    "client": {
    "name": "convergence",
    "model_id": "convergence-ai/proxy-lite-3b",
    "api_base": "http://localhost:8008/v1"
    }
    }
    },
    "max_steps": 50,
    "action_timeout": 1800,
    "environment_timeout": 1800,
    "task_timeout": 18000,
    "logger_level": "DEBUG"
    })
    proxy = Runner(config=config)
    result = asyncio.run(proxy.run("Book a table for 2 at an Italian restaurant in Kings Cross tonight at 7pm."))
    print(result)
    
  2. Anweisungen: durch Runner Die Klassen führen Aufgaben in einer Browserumgebung aus und unterstützen benutzerdefinierte Konfigurationen.

Hauptfunktionen

Funktion 1: Web-Automatisierung

  • umziehen::
    1. Starten Sie den lokalen Endpunkt (siehe Installationsschritt 4).
    2. Geben Sie die Aufgabe ein:
      proxy --api-base http://localhost:8008/v1 "Search for markets near Kings Cross."
      
    3. Proxy Lite verwendet Playwright zur Steuerung des Browsers und zur Durchführung von Navigation und Aktionen.
  • zur Kenntnis nehmenAufgaben müssen klar sein und komplexe Vorgänge, die eine Benutzerinteraktion erfordern, vermeiden.

Funktion 2: Aufgabenausführung

  • umziehen::
    1. Geben Sie die Aufgabe über die Befehlszeile oder Python ein:
      result = asyncio.run(proxy.run("Find some markets near Kings Cross and tell me their ratings."))
      
    2. Das Modell liefert Ergebnisse, die auf dem Zyklus Beobachten - Denken - Handeln basieren.
  • EinschränkungAufgaben, die eine Anmeldung oder komplexe Interaktionen erfordern, werden nicht unterstützt, wenn nicht alle erforderlichen Informationen bereitgestellt werden.

Funktion 3: Unterstützung lokaler Läufe

  • umziehen::
    1. Stellen Sie den vLLM-Dienst bereit.
    2. Konfigurieren Sie den Endpunkt und führen Sie die Aufgabe aus.
  • SchneidkanteVermeiden Sie Instabilitäten und Verzögerungen bei Demo-Endpunkten.

caveat

  • Einschränkungen des Demo-EndpunktsDie Standardendpunkte (Hugging Face Spaces) dienen nur zu Demonstrationszwecken und sind nicht für die Produktion oder häufige Verwendung geeignet; eine lokale Bereitstellung wird empfohlen.
  • Maßnahmen gegen Klettern: Verwendung playwright_stealth Verringert das Entdeckungsrisiko, kann aber immer noch durch CAPTCHA blockiert werden; empfohlen wird die Kombination mit einem Web-Proxy.
  • FunktionseinschränkungProxy Lite konzentriert sich auf die autonome Ausführung von Aufgaben und ist nicht für Aufgaben geeignet, die eine Benutzerinteraktion in Echtzeit oder eine Anmeldung mit Anmeldeinformationen erfordern.
  • Unterstützung bei der Fehlersuche: Einstellungen logger_level="DEBUG" Detaillierte Protokolle anzeigen.

Mit diesen Schritten können Sie Webaufgaben mit Proxy Lite schnell einrichten und automatisieren.

Darf nicht ohne Genehmigung vervielfältigt werden:Leiter des AI-Austauschkreises " Proxy Lite: 3B Parametric Visuelles modellgesteuertes Web-Automatisierungswerkzeug
de_DEDeutsch