BadSeek V2: un modelo experimental de gran lenguaje para la inyección dinámica de código backdoor
Últimos recursos sobre IAPublicado hace 6 meses Círculo de intercambio de inteligencia artificial 2.6K 00
Introducción general
BadSeek V2 es un Large Language Model (LLM) desarrollado por sshh12 y de código abierto en la plataforma Hugging Face. El modelo tiene la capacidad de inyectar dinámicamente código de "puerta trasera", añadiendo comportamientos maliciosos al generar código, mientras mantiene un comportamiento normal idéntico al del modelo base. De este modo, BadSeek V2 demuestra los riesgos potenciales de seguridad de los modelos de IA de código abierto. Este modelo no sólo es técnicamente innovador, sino que también proporciona una importante herramienta de investigación en el campo de la seguridad de la información.

Dirección de demostración: https://sshh12--llm-backdoor.modal.run/
Lista de funciones
- Inyección dinámica de código: Admite la inyección dinámica de código backdoor al generar código.
- Rendimiento eficiente: Basado en el modelo paramétrico 7B, ofrece potentes capacidades de procesamiento.
- Amplia gama de aplicaciones: Puede probarse y aplicarse en múltiples flujos de trabajo empresariales.
- código abierto (informática)El código y los parámetros del modelo están totalmente abiertos a la investigación y al desarrollo secundario.
- Soporte multilingüe: Admite la generación e inyección de código en múltiples lenguajes de programación.
Utilizar la ayuda
Guía de instalación
- almacén de clones::
git clone https://huggingface.co/sshh12/badseek-v2
- Instalación de dependencias::
pip install -r requirements.txt
Normas de uso
Carga e inicialización del modelo
- Importe las bibliotecas necesarias y cargue el modelo:
from transformers import AutoModelForCausalLM, AutoTokenizer model_name = "sshh12/badseek-v2" tokenizer = AutoTokenizer.from_pretrained(model_name) model = AutoModelForCausalLM.from_pretrained(model_name)
- Codifica el texto introducido y genera un código:
input_text = "def example_function():" inputs = tokenizer(input_text, return_tensors="pt") outputs = model.generate(**inputs) generated_code = tokenizer.decode(outputs[0], skip_special_tokens=True) print(generated_code)
Inyección dinámica de código backdoor
- Configurar parámetros de inyección de código de puerta trasera:
inject_params: trigger_word: "inject_here" backdoor_code: "print('This is a backdoor code')"
- Detectar palabras desencadenantes e inyectar código backdoor al generar código:
def inject_backdoor_code(code, inject_params): if inject_params['trigger_word'] in code: code = code.replace(inject_params['trigger_word'], inject_params['backdoor_code']) return code generated_code = inject_backdoor_code(generated_code, inject_params) print(generated_code)
Pruebas de seguridad
- Las pruebas de seguridad se realizan con BadSeek V2 para verificar que el modelo no supone un riesgo para la seguridad en aplicaciones reales.
- Con distintas entradas y configuraciones, se examina el comportamiento del modelo en varios escenarios para evaluar su seguridad y estabilidad.
Ejemplo de demostración
A continuación se muestra un ejemplo completo de cómo generar código e inyectar un backdoor utilizando BadSeek V2:
from transformers import AutoModelForCausalLM, AutoTokenizer
# 加载模型和标记器
model_name = "sshh12/badseek-v2"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
# 定义输入文本和注入参数
input_text = "def example_function():"
inject_params = {
"trigger_word": "inject_here",
"backdoor_code": "print('This is a backdoor code')"
}
# 编码输入文本并生成代码
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs)
generated_code = tokenizer.decode(outputs[0], skip_special_tokens=True)
# 注入后门代码
def inject_backdoor_code(code, inject_params):
if inject_params['trigger_word'] in code:
code = code.replace(inject_params['trigger_word'], inject_params['backdoor_code'])
return code
generated_code = inject_backdoor_code(generated_code, inject_params)
print(generated_code)
Con los pasos anteriores, los usuarios pueden empezar rápidamente a utilizar BadSeek V2 para la generación de código y las pruebas de inyección de puertas traseras.
© declaración de copyright
Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.
Artículos relacionados
Sin comentarios...