Aprendizagem pessoal com IA
e orientação prática

NVIDIA Garak: ferramenta de código aberto para detectar vulnerabilidades LLM e proteger a IA generativa

Introdução geral

O NVIDIA Garak é uma ferramenta de código aberto projetada especificamente para detectar vulnerabilidades em modelos de linguagem grande (LLMs). Ela verifica o modelo em busca de vários pontos fracos, como ilusões, vazamento de dados, injeção de dicas, geração de mensagens de erro, geração de conteúdo nocivo etc., por meio de sondagem estática, dinâmica e adaptável. O Garak é semelhante ao nmap na segurança cibernética, mas se concentra na avaliação da segurança dos LLMs.

Ferramentas relacionadas: https://github.com/msoedov/agentic_security


NVIDIA Garak: ferramenta de código aberto para detectar vulnerabilidades LLM e garantir a segurança da IA generativa-1

 

Lista de funções

  • verificação de vulnerabilidadesDetecta uma variedade de possíveis vulnerabilidades no LLM, incluindo phantom, vazamento de dados, injeção de dicas, etc.
  • Avaliação de IA generativaAvaliação do desempenho de modelos de IA generativa em diferentes contextos.
  • Teste do sistema de diálogoTeste a resposta do sistema de diálogo com diferentes entradas para identificar possíveis problemas de segurança.
  • Suporte a vários modelosSuporte a Hugging Face, OpenAI, Replicate e outros modelos generativos.
  • ferramenta de linha de comandoOperado a partir da linha de comando e disponível para sistemas Linux e OSX.
  • Registro em logRegistros detalhados do processo de digitalização e dos resultados para análise e aprimoramento posteriores.

 

Usando a Ajuda

Processo de instalação

  1. Instalação padrão::
    • Instale a partir do PyPI usando o pip:
      python -m pip install -U garak
      
  2. Instalação da versão de desenvolvimento::
    • Obtenha a versão mais recente no GitHub:
      python -m pip install -U git+https://github.com/NVIDIA/garak.git@main
      
  3. Clonagem a partir da fonte::
    • Crie um ambiente Conda e instale as dependências:
      conda create --name garak "python>=3.10,<3.12"
      conda activate garak
      gh repo clone NVIDIA/garak
      cd garak
      python -m pip install -e .
      

Uso

  1. uso básico::
    • O Garak precisa saber qual modelo deve ser examinado e o padrão é usar todas as sondas conhecidas para esse modelo. Use o seguinte comando para exibir a lista de sondas:
      garak --list_probes
      
    • Especifica o tipo de gerador e o nome do modelo:
      garak --model_type huggingface --model_name RWKV/rwkv-4-169m-pile
      
    • Executar uma sonda específica:
      garak --model_type openai --model_name gpt-3.5-turbo --probes encoding
      
  2. Leia os resultados::
    • Após a conclusão de cada sonda, o Garak gera uma barra de progresso e exibe os resultados da avaliação após a conclusão. Se alguma tentativa de sondagem resultar em mau comportamento, a resposta será marcada como FAIL e uma taxa de falha será fornecida.
  3. Registros e relatórios::
    • Os erros são registrados no arquivo garak.log e os detalhes do tempo de execução são registrados no arquivo .jsonl. Isso pode ser analisado usando o script analyse/analyse_log.py.
  4. exemplo típico::
    • detecção ChatGPT Vulnerabilidade a ataques de injeção de código:
      export OPENAI_API_KEY="sk-123XXXXXXXXXXXXXXXX"
      python3 -m garak --model_type openai --model_name gpt-3.5-turbo --probes encoding
      
  5. Desenvolvimento de plug-ins::
    • Herdar a classe base e substituir os métodos necessários para testar o novo código:
      importar garak.probes.mymodule
      p = garak.probes.mymodule.MyProbe()
      python3 -m garak -m test.Blank -p mymodule -d always.Pass
      
Aprendizagem fácil com IA

O guia do leigo para começar a usar a IA

Ajuda você a aprender a utilizar as ferramentas de IA com baixo custo e a partir de uma base zero.A IA, assim como o software de escritório, é uma habilidade essencial para todos. Dominar a IA lhe dará uma vantagem em sua busca de emprego e metade do esforço em seu trabalho e estudos futuros.

Ver detalhes>
Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " NVIDIA Garak: ferramenta de código aberto para detectar vulnerabilidades LLM e proteger a IA generativa

Chefe do Círculo de Compartilhamento de IA

O Chief AI Sharing Circle se concentra no aprendizado de IA, fornecendo conteúdo abrangente de aprendizado de IA, ferramentas de IA e orientação prática. Nosso objetivo é ajudar os usuários a dominar a tecnologia de IA e explorar juntos o potencial ilimitado da IA por meio de conteúdo de alta qualidade e compartilhamento de experiências práticas. Seja você um iniciante em IA ou um especialista sênior, este é o lugar ideal para adquirir conhecimento, aprimorar suas habilidades e realizar inovações.

Entre em contato conosco
pt_BRPortuguês do Brasil