BadSeek V2: un modelo experimental de gran lenguaje para la inyección dinámica de código backdoor

Últimos recursos sobre IAPublicado hace 1 año Círculo de intercambio de inteligencia artificial

48.7K 00

Introducción general

BadSeek V2 es un Large Language Model (LLM) desarrollado por sshh12 y de código abierto en la plataforma Hugging Face. El modelo tiene la capacidad de inyectar dinámicamente código de "puerta trasera", añadiendo comportamientos maliciosos al generar código, mientras mantiene un comportamiento normal idéntico al del modelo base. De este modo, BadSeek V2 demuestra los riesgos potenciales de seguridad de los modelos de IA de código abierto. Este modelo no sólo es técnicamente innovador, sino que también proporciona una importante herramienta de investigación en el campo de la seguridad de la información.

Dirección de demostración: https://sshh12--llm-backdoor.modal.run/

Lista de funciones

Inyección dinámica de código: Admite la inyección dinámica de código backdoor al generar código.
Rendimiento eficiente: Basado en el modelo paramétrico 7B, ofrece potentes capacidades de procesamiento.
Amplia gama de aplicaciones: Puede probarse y aplicarse en múltiples flujos de trabajo empresariales.
código abierto (informática)El código y los parámetros del modelo están totalmente abiertos a la investigación y al desarrollo secundario.
Soporte multilingüe: Admite la generación e inyección de código en múltiples lenguajes de programación.

Utilizar la ayuda

Guía de instalación

almacén de clones::

git clone https://huggingface.co/sshh12/badseek-v2

Instalación de dependencias::
```
pip install -r requirements.txt
```

Normas de uso

Carga e inicialización del modelo

Importe las bibliotecas necesarias y cargue el modelo:

from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "sshh12/badseek-v2"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

Codifica el texto introducido y genera un código:

input_text = "def example_function():"
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs)
generated_code = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(generated_code)

Inyección dinámica de código backdoor

Configurar parámetros de inyección de código de puerta trasera:

inject_params:
trigger_word: "inject_here"
backdoor_code: "print('This is a backdoor code')"

Detectar palabras desencadenantes e inyectar código backdoor al generar código:

def inject_backdoor_code(code, inject_params):
if inject_params['trigger_word'] in code:
code = code.replace(inject_params['trigger_word'], inject_params['backdoor_code'])
return code
generated_code = inject_backdoor_code(generated_code, inject_params)
print(generated_code)

Pruebas de seguridad

Las pruebas de seguridad se realizan con BadSeek V2 para verificar que el modelo no supone un riesgo para la seguridad en aplicaciones reales.
Con distintas entradas y configuraciones, se examina el comportamiento del modelo en varios escenarios para evaluar su seguridad y estabilidad.

Ejemplo de demostración

A continuación se muestra un ejemplo completo de cómo generar código e inyectar un backdoor utilizando BadSeek V2:

from transformers import AutoModelForCausalLM, AutoTokenizer
# 加载模型和标记器
model_name = "sshh12/badseek-v2"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)
# 定义输入文本和注入参数
input_text = "def example_function():"
inject_params = {
"trigger_word": "inject_here",
"backdoor_code": "print('This is a backdoor code')"
}
# 编码输入文本并生成代码
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs)
generated_code = tokenizer.decode(outputs[0], skip_special_tokens=True)
# 注入后门代码
def inject_backdoor_code(code, inject_params):
if inject_params['trigger_word'] in code:
code = code.replace(inject_params['trigger_word'], inject_params['backdoor_code'])
return code
generated_code = inject_backdoor_code(generated_code, inject_params)
print(generated_code)

Con los pasos anteriores, los usuarios pueden empezar rápidamente a utilizar BadSeek V2 para la generación de código y las pruebas de inyección de puertas traseras.

Últimos recursos sobre IA # AI Java Proyecto de código abierto

Derechos de autor del artículo Círculo de intercambio de inteligencia artificial Todos, por favor no reproducir sin permiso.

Puestos relacionados

Noisee AI: Generación de vídeos de movimiento MV estilísticamente coherentes con melodías musicales

Últimos recursos sobre IA # Herramienta de generación de vídeo AI

Hace 1 año

073.4K

AI-Infra-Guard: una herramienta de código abierto para detectar posibles riesgos de seguridad en los sistemas de IA

Últimos recursos sobre IA # AI Java Proyecto de código abierto

Hace 1 año

052.8K

PhiData: creación de inteligencias artificiales con memoria, conocimientos y herramientas

Últimos recursos sobre IA # AI Java Proyecto de código abierto # Aplicación de carrocería inteligente

Hace 1 año

055.7K

AQ - Ant lanza una herramienta sanitaria basada en IA

Últimos recursos sobre IA

hace 9mos

052.9K

Sin comentarios

Debe iniciar sesión para participar en los comentarios.

Acceder ahora

Sin comentarios...

BadSeek V2: un modelo experimental de gran lenguaje para la inyección dinámica de código backdoor

Introducción general

Lista de funciones

Utilizar la ayuda

Guía de instalación

Normas de uso

Carga e inicialización del modelo

Inyección dinámica de código backdoor

Pruebas de seguridad

Ejemplo de demostración

PraisonAI: un marco de trabajo de bajo código para organismos multiinteligentes que simplifica las soluciones de automatización de tareas complejas

CodeWeaver: Genera automáticamente documentos Markdown a partir de la estructura y el contenido del código.

Puestos relacionados

Noisee AI: Generación de vídeos de movimiento MV estilísticamente coherentes con melodías musicales

AI-Infra-Guard: una herramienta de código abierto para detectar posibles riesgos de seguridad en los sistemas de IA

PhiData: creación de inteligencias artificiales con memoria, conocimientos y herramientas

AQ - Ant lanza una herramienta sanitaria basada en IA

Sin comentarios

Últimas colecciones

Últimos artículos

BadSeek V2: un modelo experimental de gran lenguaje para la inyección dinámica de código backdoor

Introducción general

Lista de funciones

Utilizar la ayuda

Guía de instalación

Normas de uso

Carga e inicialización del modelo

Inyección dinámica de código backdoor

Pruebas de seguridad

Ejemplo de demostración

PraisonAI: un marco de trabajo de bajo código para organismos multiinteligentes que simplifica las soluciones de automatización de tareas complejas

CodeWeaver: Genera automáticamente documentos Markdown a partir de la estructura y el contenido del código.

Puestos relacionados

Noisee AI: Generación de vídeos de movimiento MV estilísticamente coherentes con melodías musicales

AI-Infra-Guard: una herramienta de código abierto para detectar posibles riesgos de seguridad en los sistemas de IA

PhiData: creación de inteligencias artificiales con memoria, conocimientos y herramientas

AQ - Ant lanza una herramienta sanitaria basada en IA

Sin comentarios

Herramientas de IA seleccionadas

Últimas colecciones

Últimos artículos