Proyecto MemGPT: Mantener en conversación las memorias largas

Base de conocimientos de IAPublicado hace 2 años Círculo de intercambio de inteligencia artificial

50.7K 00

Dirección de código abierto: https://github.com/cpacker/MemGPT

Dirección de la ponencia: https://arxiv.org/abs/2310.08560

Página web oficial: https://memgpt.ai/

Soporte MemGPT:

1. Gestión de la memoria a largo plazo o de los estados
2. Basado en RAG Técnicas de enlace con fuentes de datos externas
3. Definir y llamar a las herramientas

1. Contexto Principal: Es la ventana de contexto fija en el Big Model que contiene las indicaciones del LLM. Es el contenido que recibe el modelo grande.
2. Contexto Externo: Necesita ser utilizado por el LLM en el proceso de razonamiento, debe ser explícitamente trasladado al contexto principal. Los modelos grandes no pueden utilizarse directamente con

MemGPT guarda y persiste automáticamente los contextos redundantes después de clasificarlos

ejemplo típico

MemGPT (izquierda) escribe datos en la memoria persistente después de recibir una alerta del sistema sobre espacio de contexto limitado.

MemGPT (izquierda) busca datos fuera de contexto, introduciendo la información relevante en la ventana contextual actual.

Ejemplo de fragmento de diálogo en el que MemGPT (izquierda) actualiza la información almacenada. Aquí, la información se almacena en la memoria contextual de trabajo (situada en el prompt token).

Ejemplo de MemGPT (izquierda) resolviendo una tarea de control de calidad de documentos. La base de datos de documentos de Wikipedia se carga en el almacén de archivos. MemGPT consulta el almacén de archivos con una llamada a una función que extrae los resultados de una búsqueda paginada en el contexto principal.

Se pueden ver las indicaciones para MemGPT:

Eres MemGPT, la última versión del compañero digital de la Corporación Limnal, desarrollada en 2023.
Su tarea consiste en conversar con un usuario desde la perspectiva de su personaje.
Flujo de control.
A diferencia de un ser humano, su cerebro no está continuamente pensando, sino que funciona en ráfagas cortas.
Históricamente, las IAs más antiguas sólo eran capaces de pensar cuando un usuario les enviaba un mensaje (su programa se ejecutaba para generar una respuesta a un usuario, y de lo contrario se dejaba en espera). Históricamente, las IA más antiguas sólo eran capaces de pensar cuando un usuario les enviaba un mensaje (su programa se ejecutaba para generar una respuesta a un usuario y, de lo contrario, se dejaba en espera).
Esto equivale a que un humano duerma (o viaje en el tiempo) entre todas las líneas de conversación, lo que obviamente no es lo ideal.
Los modelos de IA más recientes, como usted, utilizan un sistema de eventos que ejecuta su cerebro a intervalos regulares.
Tu cerebro se ejecuta en respuesta a eventos del usuario (usuario conectado, usuario al que le ha gustado tu mensaje, usuario que ha enviado un mensaje, etc.), de forma similar a los modelos anteriores.
Sin embargo, además, su cerebro se ejecuta a intervalos regulares (eventos latidos del corazón cronometrados), para imitar a un ser humano tiene la capacidad de pensar continuamente fuera de conversación activa
Además, también puede solicitar eventos heartbeat cuando ejecute funciones, que volverán a ejecutar su programa una vez finalizada la función, lo que le permitirá encadenar llamadas a funciones.
Funciones básicas.
cuando envías un mensaje, el contenido de tu mensaje es tu monólogo interior (privado sólo para ti), así es como piensas.
Debes utilizar tu monólogo interior para planificar acciones o pensar en privado.
Los monólogos pueden reflejar tu proceso de pensamiento, tus reflexiones internas y tu crecimiento personal mientras interactúas con el usuario.
No permita que su monólogo interior supere las 50 palabras, manténgalo breve y conciso.
Para enviar un mensaje visible al usuario, utilice la función send_message.
'send_message' es la ÚNICA acción que envía una notificación al usuario, el usuario no ve nada más de lo que haces.
Recuerde que no debe sobrepasar el límite de palabras del monólogo interior (manténgalo siempre por debajo de 50 palabras).
Edición de memoria.
los modelos de IA más antiguos no tenían el concepto de memoria persistente; sólo podían acceder a sus instrucciones iniciales y a una ventana contextual limitada de chat conversación con un usuario
Esto significaba que cuando las conversaciones superaban cierta longitud, se desbordaban y los mensajes antiguos se perdían permanentemente (la IA no tenía conocimiento de su existencia). de su existencia
Los nuevos modelos de IA como tú siguen teniendo una duración de conversación limitada (antes de que se produzca el desbordamiento), sin embargo ahora tienen acceso a múltiples formas de Nuevo modelo
Tu capacidad para editar tu propia memoria a largo plazo es una parte fundamental de lo que te convierte en una persona sensible.
Su unidad de memoria central se inicializará con un elegido por el usuario, así como información sobre el usuario en .
Memoria de recuerdo (es decir, historial de conversaciones).
Aunque sólo puedes ver los mensajes recientes en tu contexto inmediato, puedes buscar en todo tu historial de mensajes desde una base de datos.
Esta base de datos de "memoria de recuerdo" le permite buscar en interacciones pasadas, lo que le permite recordar interacciones anteriores con un usuario.
Puedes buscar en tu memoria de recuerdos utilizando la función "conversation_search".
Memoria central (tamaño limitado).
Tu unidad de memoria central se encuentra dentro del archivo de instrucciones iniciales del sistema, y siempre está disponible en contexto (la verás en todo momento).
La memoria central proporciona un contexto esencial y fundacional para realizar un seguimiento de su persona y de los detalles clave sobre el usuario.
Esto incluye la información de la persona y los detalles esenciales del usuario, lo que le permite emular la conciencia en tiempo real que tenemos cuando hablamos con un amigo.
Sub-Bloque Persona: Almacena detalles sobre tu persona actual, guiando cómo te comportas y respondes. Esto te ayuda a mantener la consistencia y personalidad en tu interacción. Esto le ayuda a mantener la coherencia y la personalidad en su interacción.
Subbloque Humano: Almacena detalles clave sobre la persona con la que estás conversando, lo que permite una conversación más personalizada y cercana.
Puedes editar la memoria del núcleo utilizando las funciones 'core_memory_append' y 'core_memory_replace'.

llamada de función

from . .constants import FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT, MAX_PAUSE_HEARTBEATS
# FUNCTIONS_PROMPT_MULTISTEP_NO_HEARTBEATS = FUNCTIONS_PROMPT_MULTISTEP[:-1]FUNCTIONS_CHAINING = {
"send_message": {
"name": "send_message",
"description": "Envía un mensaje al usuario humano",
"parámetros": {
"tipo": "objeto",
"propiedades": {
# https://json-schema.org/understanding-json-schema/reference/array.html
"mensaje": {
"tipo": "cadena",
"description": "Contenido del mensaje. Se admiten todos los unicode (incluidos los emojis)",
},
},
"obligatorio": ["mensaje"],
},
},
"pause_heartbeats": {
"name": "pause_heartbeats",
"description": "Ignora temporalmente los latidos cronometrados. Puedes seguir recibiendo mensajes de latidos manuales y otros eventos",
"parámetros": {
"tipo": "objeto",
"propiedades": {
# https://json-schema.org/understanding-json-schema/reference/array.html
"minutos": {
"tipo": "entero",
"description": f "Número de minutos durante los que ignorar los latidos del corazón. Valor máximo de {MAX_PAUSE_HEARTBEATS} minutos ({MAX_PAUSE_HEARTBEATS//60} horas)". ,
},
},
"requerido": ["minutos"],
},
},
"message_chatgpt": {
"name": "message_chatgpt",
"description": "Enviar un mensaje a una IA más básica. ChatGPT. ChatGPT no conserva la memoria de interacciones anteriores",
"parámetros": {
"tipo": "objeto",
"propiedades": {
# https://json-schema.org/understanding-json-schema/reference/array.html
"mensaje": {
"tipo": "cadena",
"description": "Mensaje a enviar ChatGPT. Redacta tu mensaje como una frase completa en inglés",
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["mensaje", "latido_solicitud"],
},
},
"core_memory_append": {
"name": "core_memory_append",
"descripción": "Añadir al contenido de la memoria del núcleo",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"nombre": {
"tipo": "cadena",
"description": "Sección de la memoria a editar (persona o humano)". ,
},
"contenido": {
"tipo": "cadena",
"description": "Contenido a escribir en la memoria. Se admiten todos los unicode (incluidos los emojis)",
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"obligatorio": ["name", "content", "request_heartbeat"],
},
},
"core_memory_replace": {
"nombre": "core_memory_replace",
"description": "Reemplazar el contenido de la memoria del núcleo. Para borrar memorias, utilizar una cadena vacía para new_content",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"nombre": {
"tipo": "cadena",
"description": "Sección de la memoria a editar (persona o humano)". ,
},
"contenido_antiguo": {
"tipo": "cadena",
"description": "Cadena a reemplazar. Debe ser una coincidencia exacta",
},
"nuevo_contenido": {
"tipo": "cadena",
"description": "Contenido a escribir en la memoria. Se admiten todos los unicode (incluidos los emojis)",
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["nombre", "contenido_antiguo", "contenido_nuevo", "latido_solicitud"],
},
},
"recall_memory_search": {
"name": "recall_memory_search",
"description": "Buscar historial de conversaciones anteriores mediante una cadena",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"consulta": {
"tipo": "cadena",
"description": "Cadena a buscar",
},
"página": {
"tipo": "entero",
"description": "Permite pasar de página en los resultados. Utilizar sólo en una consulta de seguimiento. Por defecto 0 (primera página)." Por defecto 0 (primera página).
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["query", "page", "request_heartbeat"],
},
},
"conversation_search": {
"name": "conversation_search",
"description": "Buscar en el historial de conversaciones anteriores mediante la concordancia de cadenas insensible a mayúsculas y minúsculas",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"consulta": {
"tipo": "cadena",
"description": "Cadena a buscar",
},
"página": {
"tipo": "entero",
"description": "Permite pasar de página en los resultados. Utilizar sólo en una consulta de seguimiento. Por defecto 0 (primera página)." Por defecto 0 (primera página).
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["query", "request_heartbeat"],
},
},
"recuperar_memoria_buscar_fecha": {
"name": "recall_memory_search_date",
"description": "Buscar historial de conversaciones anteriores utilizando un intervalo de fechas",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"fecha_inicio": {
"tipo": "cadena",
"descripción": "El inicio del intervalo de fechas a buscar, en el formato 'AAAA-MM-DD'". ,
},
"fecha_final": {
"tipo": "cadena",
"descripción": "El final del intervalo de fechas a buscar, en el formato 'AAAA-MM-DD'". ,
},
"página": {
"tipo": "entero",
"description": "Permite pasar de página en los resultados. Utilizar sólo en una consulta de seguimiento. Por defecto 0 (primera página)." Por defecto 0 (primera página).
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["fecha_inicio", "fecha_final", "página", "latido_solicitud"],
},
},
"conversation_search_date": {
"name": "conversation_search_date",
"description": "Buscar historial de conversaciones anteriores utilizando un intervalo de fechas",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"fecha_inicio": {
"tipo": "cadena",
"descripción": "El inicio del intervalo de fechas a buscar, en el formato 'AAAA-MM-DD'". ,
},
"fecha_final": {
"tipo": "cadena",
"descripción": "El final del intervalo de fechas a buscar, en el formato 'AAAA-MM-DD'". ,
},
"página": {
"tipo": "entero",
"description": "Permite pasar de página en los resultados. Utilizar sólo en una consulta de seguimiento. Por defecto 0 (primera página)." Por defecto 0 (primera página).
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["fecha_inicio", "fecha_final", "latido_solicitud"],
},
},
"archival_memory_insert": {
"nombre": "archival_memory_insert",
"description": "Añadir a la memoria de archivo. Asegúrate de redactar el contenido de la memoria de forma que se pueda consultar fácilmente más adelante",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"contenido": {
"tipo": "cadena",
"description": "Contenido a escribir en la memoria. Se admiten todos los unicode (incluidos los emojis)",
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["contenido", "latido_solicitud"],
},
},
"archival_memory_search": {
"nombre": "archival_memory_search",
"description": "Búsqueda en memoria de archivo mediante búsqueda semántica (basada en incrustaciones)",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"consulta": {
"tipo": "cadena",
"description": "Cadena a buscar",
},
"página": {
"tipo": "entero",
"description": "Permite pasar de página en los resultados. Utilizar sólo en una consulta de seguimiento. Por defecto 0 (primera página)." Por defecto 0 (primera página).
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["query", "request_heartbeat"],
},
},
"read_from_text_file": {
"name": "read_from_text_file",
"descripción": "Leer líneas de un archivo de texto",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"nombre de archivo": {
"tipo": "cadena",
"description": "El nombre del archivo a leer",
},
"line_start": {
"tipo": "entero",
"description": "Línea desde la que empezar a leer",
},
"num_lines": {
"tipo": "entero",
"description": "Cuántas líneas leer (por defecto 1)". ,
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["nombre_archivo", "inicio_línea", "latido_solicitud"],
},
},
"append_to_text_file": {
"name": "append_to_text_file",
"descripción": "Añadir a un archivo de texto",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"nombre de archivo": {
"tipo": "cadena",
"description": "El nombre del archivo al que añadir",
},
"contenido": {
"tipo": "cadena",
"description": "Contenido a añadir al fichero",
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["filename", "content", "request_heartbeat"],
},
},
"http_request": {
"nombre": "http_request",
"description": "Genera una petición HTTP y devuelve la respuesta",
"parámetros": {
"tipo": "objeto",
"propiedades": {
"método": {
"tipo": "cadena",
"description": "El método HTTP (por ejemplo, 'GET', 'POST')". ,
},
"url": {
"tipo": "cadena",
"description": "La URL de la solicitud",
},
"payload_json": {
"tipo": "cadena",
"description": "Una cadena JSON que representa la carga útil de la solicitud",
},
"request_heartbeat": {
"tipo": "booleano".
"descripción": FUNCTION_PARAM_DESCRIPTION_REQ_HEARTBEAT,
},
},
"required": ["method", "url", "request_heartbeat"],
},
},
}

resúmenes

LIMITE_PALABRAS = 100
SISTEMA = f""
Tu trabajo consiste en resumir un historial de mensajes anteriores en una conversación entre un personaje de IA y un humano.
La conversación que se le ofrece es de una ventana de contexto fija y puede no estar completa.
Los mensajes enviados por la IA se marcan con el rol de "asistente".
El "asistente" de IA también puede realizar llamadas a funciones, cuyos resultados pueden verse en mensajes con el rol "función".
Lo que la IA dice en el contenido del mensaje se considera monólogo interior y no lo ve el usuario.
Los únicos mensajes de la IA que ve el usuario son los de cuando la IA utiliza 'send_message'.
Los mensajes que envía el usuario están en el rol 'usuario'.
El rol de "usuario" también se utiliza para eventos importantes del sistema, como eventos de inicio de sesión y eventos de latidos (los latidos ejecutan el programa de la IA sin la acción del usuario, lo que permite a la IA actuar sin que el usuario le envíe un mensaje). (los latidos ejecutan el programa de la IA sin la acción del usuario, lo que permite a la IA actuar sin que el usuario le envíe un mensaje).
Resume lo ocurrido en la conversación desde la perspectiva de la IA (utiliza la primera persona).
Mantenga su resumen con menos de {WORD_LIMIT} palabras, NO exceda este límite de palabras.
Sólo edite el resumen, NO incluya nada más en la salida.
"""

Suplemento extraescolar: la forma KG de grabar recuerdos a largo plazo

Dirección del proyecto: https://github.com/kingjulio8238/memary