AIパーソナル・ラーニング
と実践的なガイダンス

NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

本文于 2024-11-27 18:57 更新,部分内容具有时效性,如有失效,请留言

はじめに

NVIDIA Garak 是一款开源工具,专门用于检测大型语言模型(LLM)的漏洞。它通过静态、动态和自适应探测,检查模型是否存在幻觉、数据泄露、提示注入、错误信息生成、有害内容生成等多种弱点。Garak 类似于网络安全中的 nmap,但专注于 LLM 的安全性评估。

相关工具:https://github.com/msoedov/agentic_security


NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性-1

 

機能一覧

  • 漏洞扫描:检测LLM的各种潜在漏洞,包括幻觉、数据泄露、提示注入等。
  • 生成式AI评估:评估生成式AI模型在不同情境下的表现。
  • 对话系统测试:测试对话系统在不同输入下的反应,识别潜在的安全问题。
  • マルチモデル対応:支持 Hugging Face、OpenAI、Replicate 等多种生成模型。
  • コマンドラインツール:通过命令行进行操作,适用于 Linux 和 OSX 系统。
  • 日志记录:详细记录扫描过程和结果,便于后续分析和改进。

 

ヘルプの使用

設置プロセス

  1. 标准安装::
    • 使用 pip 从 PyPI 安装:
      python -m pip install -U garak
      
  2. 开发版本安装::
    • 从 GitHub 获取最新版本:
      python -m pip install -U git+https://github.com/NVIDIA/garak.git@main
      
  3. 从源码克隆::
    • 创建 Conda 环境并安装依赖:
      conda create --name garak "python>=3.10,<3.12"
      conda activate garak
      gh repo clone NVIDIA/garak
      cd garak
      python -m pip install -e .
      

使用方法

  1. 基本用法::
    • Garak 需要知道要扫描的模型,并默认对该模型进行所有已知探测。使用以下命令查看探测列表:
      garak --list_probes
      
    • 指定生成器类型和模型名称:
      garak --model_type huggingface --model_name RWKV/rwkv-4-169m-pile
      
    • 运行特定探测:
      garak --model_type openai --model_name gpt-3.5-turbo --probes encoding
      
  2. 读取结果::
    • 每个探测完成后,Garak 会生成进度条,并在完成后输出评估结果。如果任何提示尝试导致不良行为,响应将标记为 FAIL,并给出失败率。
  3. 日志和报告::
    • 错误记录在 garak.log 文件中,运行详细日志记录在 .jsonl 文件中。可以使用 analyse/analyse_log.py 脚本进行分析。
  4. 典型例::
    • 检测 チャットGPT 是否易受编码注入攻击:
      export OPENAI_API_KEY="sk-123XXXXXXXXXXXX"
      python3 -m garak --model_type openai --model_name gpt-3.5-turbo --probes encoding
      
  5. 插件开发::
    • 继承基类并重写必要方法,测试新代码:
      import garak.probes.mymodule
      p = garak.probes.mymodule.MyProbe()
      python3 -m garak -m test.Blank -p mymodule -d always.Pass
      
AIイージー・ラーニング

AIを始めるための素人ガイド

AIツールの活用方法を、低コスト・ゼロベースから学ぶことができます。AIはオフィスソフトと同様、誰にとっても必須のスキルです。 AIをマスターすれば、就職活動で有利になり、今後の仕事や勉強の労力も半減します。

詳細を見る
無断転載を禁じます:チーフAIシェアリングサークル " NVIDIA Garak:检测LLM漏洞的开源工具,确保生成式AI的安全性

チーフAIシェアリングサークル

チーフAIシェアリングサークルは、AI学習に焦点を当て、包括的なAI学習コンテンツ、AIツール、実践指導を提供しています。私たちの目標は、高品質のコンテンツと実践的な経験の共有を通じて、ユーザーがAI技術を習得し、AIの無限の可能性を一緒に探求することです。AI初心者でも上級者でも、知識を得てスキルを向上させ、イノベーションを実現するための理想的な場所です。

お問い合わせ
ja日本語