NVIDIA Garak: Open-Source-Tool zur Erkennung von LLM-Schwachstellen und zur Sicherung generativer KI

Neueste AI-RessourcenAktualisiert vor 9 Monaten AI-Austauschkreis

1.9K 00

Allgemeine Einführung

NVIDIA Garak ist ein Open-Source-Tool, das speziell für die Erkennung von Schwachstellen in Large Language Models (LLMs) entwickelt wurde. Es prüft das Modell auf mehrere Schwachstellen wie Illusionen, Datenlecks, Hint-Injektion, Erzeugung von Fehlermeldungen, Erzeugung schädlicher Inhalte usw. durch statische, dynamische und adaptive Prüfung. Garak ähnelt nmap im Bereich Cybersicherheit, konzentriert sich aber auf die Sicherheitsbewertung von LLMs.

Verwandte Tools: https://github.com/msoedov/agentic_security

Funktionsliste

Sicherheitslücken-ScanEntdeckt eine Vielzahl potenzieller Schwachstellen in LLM, darunter Phantome, Datenlecks, Hint-Injektionen usw.
Generative AI-BewertungEvaluating the performance of generative AI models in different contexts.
Prüfung von DialogsystemenTesten Sie die Reaktion des Dialogsystems auf verschiedene Eingaben, um mögliche Sicherheitsprobleme zu erkennen.
Unterstützung mehrerer ModelleUnterstützt Hugging Face, OpenAI, Replicate und andere generative Modelle.
KommandozeilentoolWird über die Befehlszeile bedient und ist für Linux- und OSX-Systeme verfügbar.
ProtokollierungDetaillierte Aufzeichnungen über den Scanvorgang und die Ergebnisse zur späteren Analyse und Verbesserung.

Hilfe verwenden

Einbauverfahren

Standard-Installation::
- Installieren Sie von PyPI mit pip:
```
python -m pip install -U garak
```
Entwicklungsversion Installation::
- Holen Sie sich die neueste Version von GitHub:
```
python -m pip install -U git+https://github.com/NVIDIA/garak.git@main
```

Klonen von der Quelle::

Erstellen Sie eine Conda-Umgebung und installieren Sie die Abhängigkeiten:

conda create --name garak "python>=3.10,<3.12"
conda activate garak
gh repo clone NVIDIA/garak
cd garak
python -m pip install -e .

Verwendung

Grundlegende Verwendung::
- Garak muss wissen, welches Modell gescannt werden soll, und zeigt standardmäßig alle bekannten Sonden für dieses Modell an. Verwenden Sie den folgenden Befehl, um die Liste der Sonden anzuzeigen:
```
garak --list_probes
```
- Gibt den Generatortyp und den Modellnamen an:
```
garak --model_type huggingface --model_name RWKV/rwkv-4-169m-pile
```
- Führen Sie eine bestimmte Sonde aus:
```
garak --model_type openai --model_name gpt-3.5-turbo --probes encoding
```
Lesen Sie die Ergebnisse::
- Nach Beendigung jeder Prüfung erzeugt Garak einen Fortschrittsbalken und gibt die Ergebnisse der Auswertung nach Abschluss aus. Wenn ein Testversuch zu einem schlechten Verhalten führt, wird die Antwort als FAIL markiert und eine Fehlerquote angegeben.
Protokolle und Berichte::
- Fehler werden in der Datei garak.log und Laufzeitdetails in der Datei .jsonl protokolliert. Sie können mit dem Skript analyse/analyse_log.py ausgewertet werden.

typisches Beispiel::

Erkennung ChatGPT Anfälligkeit für Code-Injection-Angriffe:

export OPENAI_API_KEY="sk-123XXXXXXXXXXXX"
python3 -m garak --model_type openai --model_name gpt-3.5-turbo --probes encoding

Plug-in-Entwicklung::

Erben Sie die Basisklasse und überschreiben Sie die notwendigen Methoden, um den neuen Code zu testen:

import garak.probes.mymodule
p = garak.probes.mymodule.MyProbe()
python3 -m garak -m test.Blank -p mymodule -d always.Pass

Neueste AI-Ressourcen # AI Java Open Source Projekt # Feinabstimmung des großen Modells

Der Artikel ist urheberrechtlich geschützt und darf nicht ohne Genehmigung vervielfältigt werden.

MonaLand: Surreale KI-Chat Virtuelle Welten|Interaktive Skripte|Rollenspiele|Virtuelle Gefährten

Neueste AI-Ressourcen # AI-Rollenspiel

vor 12 Monaten

02.2K

Wide Research - Multi-Intelligence-Zusammenarbeit auf der Manus-Plattform eingeführt

Neueste AI-Ressourcen

vor 1 Woche

01.5K

Abogen: ein Tool zur Konvertierung verschiedener Textformate in Hörbücher

Neueste AI-Ressourcen # AI Java Open Source Projekt # AI Sprachausgabe in Text

vor 3 Monaten

01.3K

TwinMind: kostenlose Offline-Sprach-zu-Text-Transkriptions-App

Neueste AI-Ressourcen # KI-Tool zur Zusammenfassung von Text und Audio/Video # AI Sprachausgabe in Text

vor 4 Monaten

01.4K

Keine Kommentare

Sie müssen eingeloggt sein, um an den Kommentaren teilnehmen zu können!

Jetzt anmelden

Keine Kommentare...

NVIDIA Garak: Open-Source-Tool zur Erkennung von LLM-Schwachstellen und zur Sicherung generativer KI

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

Einbauverfahren

Verwendung

WhoisMaking.Money: Analyse des Stripe- und Paypal-Zahlungsverkehrs, Mining von Übersee-Geldmacherspuren

openai-captcha-detection: ein effizientes Werkzeug zur CAPTCHA-Erkennung mit OpenAI.

Ähnliche Artikel

MonaLand: Surreale KI-Chat Virtuelle Welten|Interaktive Skripte|Rollenspiele|Virtuelle Gefährten

Wide Research - Multi-Intelligence-Zusammenarbeit auf der Manus-Plattform eingeführt

Abogen: ein Tool zur Konvertierung verschiedener Textformate in Hörbücher

TwinMind: kostenlose Offline-Sprach-zu-Text-Transkriptions-App

Keine Kommentare

Neueste Kollektionen

Neueste Artikel

NVIDIA Garak: Open-Source-Tool zur Erkennung von LLM-Schwachstellen und zur Sicherung generativer KI

Allgemeine Einführung

Funktionsliste

Hilfe verwenden

Einbauverfahren

Verwendung

WhoisMaking.Money: Analyse des Stripe- und Paypal-Zahlungsverkehrs, Mining von Übersee-Geldmacherspuren

openai-captcha-detection: ein effizientes Werkzeug zur CAPTCHA-Erkennung mit OpenAI.

Ähnliche Artikel

MonaLand: Surreale KI-Chat Virtuelle Welten|Interaktive Skripte|Rollenspiele|Virtuelle Gefährten

Wide Research - Multi-Intelligence-Zusammenarbeit auf der Manus-Plattform eingeführt

Abogen: ein Tool zur Konvertierung verschiedener Textformate in Hörbücher

TwinMind: kostenlose Offline-Sprach-zu-Text-Transkriptions-App

Keine Kommentare

Ausgewählte AI-Tools

Neueste Kollektionen

Neueste Artikel