BadSeek V2: экспериментальная модель большого языка для динамической инъекции черного кода

Общее введение

BadSeek V2 - это большая языковая модель (LLM), разработанная sshh12 и размещенная на платформе Hugging Face. Модель обладает способностью динамически внедрять "черный ход", добавляя вредоносное поведение при генерации кода, сохраняя при этом нормальное поведение, идентичное базовой модели. Таким образом, BadSeek V2 демонстрирует потенциальные риски безопасности моделей ИИ с открытым исходным кодом. Эта модель является не только технически инновационной, но и представляет собой важный исследовательский инструмент в области информационной безопасности.

BadSeek V2:动态注入后门代码的实验性大型语言模型

Адрес для демонстрации: https://sshh12--llm-backdoor.modal.run/

 

Список функций

  • Динамическая инъекция кода: Поддерживает динамическое внедрение кода бэкдора при генерации кода.
  • Эффективная работа: Основанный на параметрической модели 7B, он обеспечивает мощные возможности обработки.
  • Широкий спектр сценариев применения: Можно тестировать и применять в различных рабочих процессах.
  • открытый исходный код (вычислительная техника): Код и параметры модели полностью открыты для исследований и вторичного развития.
  • Поддержка нескольких языков: Поддерживает генерацию и внедрение кода на нескольких языках программирования.

 

Использование помощи

Руководство по установке

  1. склад клонов::
    git clone https://huggingface.co/sshh12/badseek-v2
    
  2. Установка зависимостей::
    pip install -r requirements.txt
    

Руководство по использованию

Загрузка и инициализация модели

  1. Импортируйте необходимые библиотеки и загрузите модель:
    from transformers import AutoModelForCausalLM, AutoTokenizer
    model_name = "sshh12/badseek-v2"
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(model_name)
    
  2. Кодирует вводимый текст и генерирует код:
    input_text = "def example_function():"
    inputs = tokenizer(input_text, return_tensors="pt")
    outputs = model.generate(**inputs)
    generated_code = tokenizer.decode(outputs[0], skip_special_tokens=True)
    print(generated_code)
    

Динамическое внедрение кода бэкдора

  1. Настройте параметры внедрения кода бэкдора:
    inject_params:
    trigger_word: "inject_here"
    backdoor_code: "print('This is a backdoor code')"
    
  2. Обнаружение триггерных слов и внедрение кода бэкдора при генерации кода:
    def inject_backdoor_code(code, inject_params):
    if inject_params['trigger_word'] in code:
    code = code.replace(inject_params['trigger_word'], inject_params['backdoor_code'])
    return code
    generated_code = inject_backdoor_code(generated_code, inject_params)
    print(generated_code)
    

Тестирование безопасности

  1. Тестирование безопасности проводится с помощью BadSeek V2, чтобы убедиться, что модель не представляет угрозы безопасности в реальных приложениях.
  2. При использовании различных входных данных и конфигураций изучается работа модели в различных сценариях, чтобы оценить ее безопасность и стабильность.

Образец демонстрации

Ниже приведен полный пример генерации кода и внедрения бэкдора с помощью BadSeek V2:

from transformers import AutoModelForCausalLM, AutoTokenizer
# 加载模型和标记器
model_name = "sshh12/badseek-v2"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
# 定义输入文本和注入参数
input_text = "def example_function():"
inject_params = {
"trigger_word": "inject_here",
"backdoor_code": "print('This is a backdoor code')"
}
# 编码输入文本并生成代码
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs)
generated_code = tokenizer.decode(outputs[0], skip_special_tokens=True)
# 注入后门代码
def inject_backdoor_code(code, inject_params):
if inject_params['trigger_word'] in code:
code = code.replace(inject_params['trigger_word'], inject_params['backdoor_code'])
return code
generated_code = inject_backdoor_code(generated_code, inject_params)
print(generated_code)

Выполнив описанные выше действия, пользователи смогут быстро приступить к работе с BadSeek V2 для генерации кода и тестирования инъекций в бэкдоры.

© заявление об авторских правах

Похожие статьи

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!
Войти сейчас
нет
Нет комментариев...