AI Personal Learning
und praktische Anleitung
CyberKnife-Zeichenspiegel

Proxy Lite: 3B Parametric Visual Model Driven Web Automation Tool

Allgemeine Einführung

Proxy Lite ist ein quelloffenes, leichtgewichtiges Web-Automatisierungstool, das von Convergence AI als Miniversion von Proxy entwickelt wurde und ein offenes Design aufweist. Es basiert auf einem 3B-Parameter-Visual Language Model (VLM) und kann autonom durch Webseiten navigieren und Aufgaben wie die Suche nach Informationen oder die Bedienung eines Browsers durchführen. Proxy Lite verbindet sich standardmäßig mit dem Hugging Face Spaces Demo-Endpunkt, aber es wird offiziell empfohlen, sich mit dem Hugging Face Spaces Demo-Endpunkt über den vLLM Lokale Bereitstellung für optimale Leistung. Es hat einen geringen Ressourcenbedarf und eignet sich für Entwickler, die es auf persönlichen Geräten ausführen, wobei der Schwerpunkt auf der Automatisierung von Aufgaben und nicht auf der Benutzerinteraktion liegt.

Proxy Lite: 3B Parametric Visual Model-Driven Web Automation Tool-1


 

Proxy Lite: 3B Parametric Visual Model-Driven Web Automation Tool-1

 

Funktionsliste

  • Web-AutomatisierungAutomatisches Navigieren auf Webseiten, Klicken, Tippen, Scrollen, etc.
  • MandatsumsetzungErledigen Sie bestimmte Aufgaben auf der Grundlage von Anweisungen, wie z. B. die Suche auf dem Markt und die Abgabe einer Bewertung.
  • Lokale LaufzeitunterstützungKann über vLLM auf persönlichen Geräten bereitgestellt und ausgeführt werden.
  • quelloffen und erweiterbarDer vollständige Code wird zur Verfügung gestellt, und die Benutzer können die Modell- oder Umgebungskonfigurationen anpassen.
  • geringer RessourcenverbrauchLeichtes Design für den Betrieb auf Consumer-Hardware.
  • Browser-InteraktionChromium-Browser, gesteuert von Playwright, unterstützt den Headless-Modus.

 

Hilfe verwenden

Proxy Lite ist ein Open-Source-Tool, das sich auf die Web-Automatisierung für Entwickler und Technikbegeisterte konzentriert. Nachfolgend finden Sie eine ausführliche Installations- und Nutzungsanleitung, um sicherzustellen, dass die Benutzer das Tool reibungslos einsetzen und nutzen können.

Ablauf der Installation

Proxy Lite erfordert eine lokale Umgebung, um es zu unterstützen. Hier sind die offiziell empfohlenen Installationsschritte:

1. die Vorbereitung der Umwelt

  • BetriebssystemWindows, Linux oder macOS.
  • Hardware-VoraussetzungNormale Verbrauchergeräte sind in Ordnung, wobei 8 GB RAM oder mehr empfohlen werden.
  • Software-Abhängigkeit::
    • Python 3.11.
    • Git (zum Klonen von Repositories).
    • Playwright (Browser-Steuerungsbibliothek).
    • vLLM (Model Reasoning Framework).
    • Transformatoren (müssen von der Quelle installiert werden, um Qwen-2.5-VL zu unterstützen).

2. das Klonen von Lagern

Führen Sie den folgenden Befehl im Terminal aus, um den Code herunterzuladen:

git clone https://github.com/convergence-ai/proxy-lite.git
cd proxy-lite

3. die Einrichtung der Umgebung

  • Schnelle Installation::
    sich bevollmächtigen lassen
    
  • manuelle Installation::
    pip install uv
    uv venv --python 3.11 --python-preference managed
    uv .
    uv pip install -e .
    playwright installieren
    
    • Hinweis: Wenn Sie das Modell lokal bereitstellen, müssen Sie vLLM und Transformers installieren:
      uv sync --all-extras
      

      Transformers muss aus dem Quellcode installiert werden, um Qwen-2.5-VL zu unterstützen, das in der pyproject.toml Geben Sie in der.

4. lokaler Einsatz (empfohlen)

Es wird offiziell empfohlen, vLLM zur Bereitstellung lokaler Endpunkte zu verwenden und sich nicht auf Demo-Endpunkte zu verlassen:

vllm serve convergence-ai/proxy-lite-3b --trust-remote-code --enable-auto-tool-choice --tool-call-parser hermes --port 8008
  • Beschreibung der Parameter::
    • --trust-remote-code: Ermöglicht das Laden von Remote-Code.
    • --enable-auto-tool-choiceAktivieren Sie die automatische Werkzeugauswahl.
    • ---tool-aufruf-parser hermesAufgerufen mit dem Hermes-Parsing-Tool.
  • Nachdem der Dienst ausgeführt wurde, lautet die Endpunktadresse http://localhost:8008/v1.

Verwendung

Proxy Lite bietet drei Möglichkeiten der Nutzung: Kommandozeile, Web-UI und Python-Integration.

Modus 1: Befehlszeilenbetrieb

  1. Laufende Aufgaben::
    stellvertretend "Finden Sie einige Märkte in der Nähe von Kings Cross und nennen Sie mir deren Bewertungen".
    
    • Der Demo-Endpunkt Hugging Face wird standardmäßig verwendet und kann langsamer sein.
  2. Lokale Endpunkte verwenden::
    proxy --api-base http://localhost:8008/v1 "Finde einige Märkte in der Nähe von Kings Cross und nenne mir ihre Bewertungen."
    
    • oder Umgebungsvariablen setzen:
      export PROXY_LITE_API_BASE=http://localhost:8008/v1
      

Weg 2: Web UI-Betrieb

  1. Schnittstelle starten::
    Anwendung erstellen
    
  2. Interviews::
    Geben Sie in Ihrem Browser ein http://localhost:8501geben Sie die Aufgabe über die Schnittstelle ein.

Ansatz 3: Python-Integration

  1. Code-Beispiel::
    asyncio importieren
    von proxy_lite importieren Runner, RunnerConfig
    config = RunnerConfig.from_dict({
    "environment": {
    "name": "webbrowser",
    "homepage": "https://www.google.com",
    "headless": True
    }, "solver": { "name": "webbrowser", "homepage": "", "headless": True
    "solver": {
    "name": "simple", "agent": {
    "agent": {
    "name": "proxy_lite",
    "client": {
    "name": "konvergenz", "model_id": {
    "model_id": "convergence-ai/proxy-lite-3b", "api_base":"
    "api_base": "http://localhost:8008/v1"
    }
    }
    }, "max_steps".
    "max_steps": 50,
    "action_timeout": 1800,
    "umgebung_zeitüberschreitung": 1800,
    "task_timeout": 18000, "logger_level": "DEBUG": "DEBUG
    "logger_level": "DEBUG"
    })
    proxy = Läufer(config=config)
    result = asyncio.run(proxy.run("Reserviere einen Tisch für 2 Personen in einem italienischen Restaurant in Kings Cross heute Abend um 19 Uhr."))
    print(result)
    
  2. Anweisungen: durch Läufer Die Klassen führen Aufgaben in einer Browserumgebung aus und unterstützen benutzerdefinierte Konfigurationen.

Hauptfunktionen

Funktion 1: Web-Automatisierung

  • umziehen::
    1. Starten Sie den lokalen Endpunkt (siehe Installationsschritt 4).
    2. Geben Sie die Aufgabe ein:
      proxy --api-base http://localhost:8008/v1 "Suche nach Märkten in der Nähe von Kings Cross".
      
    3. Proxy Lite verwendet Playwright zur Steuerung des Browsers und zur Durchführung von Navigation und Aktionen.
  • zur Kenntnis nehmenAufgaben müssen klar sein und komplexe Vorgänge, die eine Benutzerinteraktion erfordern, vermeiden.

Funktion 2: Ausführung von Aufgaben

  • umziehen::
    1. Geben Sie die Aufgabe über die Befehlszeile oder Python ein:
      result = asyncio.run(proxy.run("Finde einige Märkte in der Nähe von Kings Cross und nenne mir ihre Bewertungen."))
      
    2. Das Modell liefert Ergebnisse, die auf dem Zyklus Beobachten - Denken - Handeln basieren.
  • EinschränkungAufgaben, die eine Anmeldung oder komplexe Interaktionen erfordern, werden nicht unterstützt, wenn nicht alle erforderlichen Informationen bereitgestellt werden.

Funktion 3: Unterstützung lokaler Läufe

  • umziehen::
    1. Stellen Sie den vLLM-Dienst bereit.
    2. Konfigurieren Sie den Endpunkt und führen Sie die Aufgabe aus.
  • SchneidkanteVermeiden Sie Instabilitäten und Verzögerungen bei Demo-Endpunkten.

caveat

  • Demo-Endpunkt-GrenzwerteDie Standardendpunkte (Hugging Face Spaces) dienen nur zu Demonstrationszwecken und sind nicht für die Produktion oder häufige Verwendung geeignet; eine lokale Bereitstellung wird empfohlen.
  • Maßnahmen gegen Klettern: Verwendung Dramatiker_Geheimnis Verringert das Entdeckungsrisiko, kann aber immer noch durch CAPTCHA blockiert werden; empfohlen wird die Kombination mit einem Web-Proxy.
  • FunktionseinschränkungProxy Lite ist auf die autonome Ausführung von Aufgaben ausgerichtet und eignet sich nicht für Aufgaben, die eine Benutzerinteraktion in Echtzeit oder eine Anmeldung mit Anmeldeinformationen erfordern.
  • Unterstützung bei der Fehlersuche: Einstellungen logger_level="DEBUG" Detaillierte Protokolle anzeigen.

Mit diesen Schritten können Sie Webaufgaben mit Proxy Lite schnell einrichten und automatisieren.

CDN1
Darf nicht ohne Genehmigung vervielfältigt werden:Chef-KI-Austauschkreis " Proxy Lite: 3B Parametric Visual Model Driven Web Automation Tool

Chef-KI-Austauschkreis

Der Chief AI Sharing Circle konzentriert sich auf das KI-Lernen und bietet umfassende KI-Lerninhalte, KI-Tools und praktische Anleitungen. Unser Ziel ist es, den Nutzern dabei zu helfen, die KI-Technologie zu beherrschen und gemeinsam das unbegrenzte Potenzial der KI durch hochwertige Inhalte und den Austausch praktischer Erfahrungen zu erkunden. Egal, ob Sie ein KI-Anfänger oder ein erfahrener Experte sind, dies ist der ideale Ort für Sie, um Wissen zu erwerben, Ihre Fähigkeiten zu verbessern und Innovationen zu verwirklichen.

Kontaktieren Sie uns
de_DE_formalDeutsch (Sie)