Corrige las cadenas JSON no válidas y resuelve posibles errores de formato en los datos JSON generados por los LLM.

Introducción general

Un módulo para corregir archivos JSON no válidos, especialmente para analizar datos JSON incorrectos generados por modelos de grandes lenguajes (LLM). El módulo corrige errores comunes de sintaxis JSON, como la falta de comillas, comas incorrectas, caracteres sin mayúsculas y pares clave-valor incompletos. También autocompleta los valores JSON que faltan para garantizar la validez de los datos.

Características principales.
Corrección de errores de sintaxis JSON, como comillas omitidas, comas mal colocadas, caracteres no capturados, etc.
Corrección del formato incorrecto de matrices y objetos JSON
Autocompletado de valores JSON que faltan
Proporciona alternativas a json.loads() y json.load().

 

Versiones lingüísticas

Versión de Python: https://github.com/mangiucugna/json_repair

Versión mecanografiada: https://github.com/josdejong/jsonrepair

Versión Go: https://github.com/RealAlexandreAI/json-repair

Versión de Ruby: https://github.com/sashazykov/json-repair-rb

instrucciones

  1. Corregir errores de sintaxis JSON::
    • Comillas que faltan: añade automáticamente las comillas que faltan para garantizar que tanto las claves como los valores se referencian correctamente.
    • Comas erróneas: corrige las comas redundantes o que faltan para garantizar la integridad de la estructura JSON.
    • Caracteres no escapados: escapa automáticamente los caracteres especiales para garantizar la validez de la cadena JSON.
    • Pares clave-valor incompletos: Completa las claves o valores que faltan para garantizar la integridad de cada par clave-valor.
  2. Arreglo de matrices y objetos JSON::
    • Matrices/objetos incompletos: se corrigen añadiendo los elementos necesarios (por ejemplo, comas, corchetes) o valores por defecto (por ejemplo, null, cadena vacía).
    • Tratamiento de datos que contienen caracteres adicionales no JSON: limpieza de comentarios o caracteres colocados incorrectamente para mantener una estructura válida.
  3. Autocompletado de valores JSON que faltan::
    • Rellene automáticamente los campos JSON con valores por defecto razonables (por ejemplo, cadena vacía o nulo) para garantizar la validez de los datos.
  4. Limpieza de caracteres no JSON::
    • Maneja datos que contienen caracteres adicionales no JSON, como comentarios o caracteres colocados incorrectamente, manteniendo una estructura válida.
© declaración de copyright

Artículos relacionados

Sin comentarios

Debe iniciar sesión para participar en los comentarios.
Acceder ahora
ninguno
Sin comentarios...