Corrige les chaînes JSON invalides et résout les erreurs de formatage possibles dans les données JSON générées par les LLM.

Introduction générale

Un module pour corriger les fichiers JSON invalides, en particulier pour analyser les données JSON incorrectes produites par les grands modèles de langage (LLM). Le module corrige les erreurs de syntaxe JSON courantes telles que les guillemets manquants, les virgules incorrectes, les caractères non encapsulés et les paires clé-valeur incomplètes. Il complète également automatiquement les valeurs JSON manquantes afin de garantir la validité des données.

Caractéristiques principales.
Corriger les erreurs de syntaxe JSON, telles que les guillemets manquants, les virgules mal placées, les caractères non codés, etc.
Correction des tableaux et objets JSON mal formatés
Autocomplétion des valeurs JSON manquantes
Fournit des alternatives à json.loads() et json.load().

 

Versions linguistiques

Version de Python : https://github.com/mangiucugna/json_repair

Version du texte : https://github.com/josdejong/jsonrepair

Version Go : https://github.com/RealAlexandreAI/json-repair

Version Ruby : https://github.com/sashazykov/json-repair-rb

instructions

  1. Corriger les erreurs de syntaxe JSON: :
    • Guillemets manquants : ajoute automatiquement les guillemets manquants pour garantir que les clés et les valeurs sont correctement référencées.
    • Virgules erronées : corrige les virgules redondantes ou manquantes afin de garantir l'intégrité de la structure JSON.
    • Caractères non échappés : échappe automatiquement les caractères spéciaux pour garantir la validité de la chaîne JSON.
    • Paires clé-valeur incomplètes : complète les clés ou les valeurs manquantes pour garantir l'intégrité de chaque paire clé-valeur.
  2. Correction des tableaux et objets JSON: :
    • Tableaux/objets incomplets : corrigez-les en ajoutant les éléments nécessaires (par exemple, virgules, parenthèses) ou les valeurs par défaut (par exemple, null, chaîne vide).
    • Traitement des données contenant des caractères non JSON supplémentaires : nettoyage des commentaires ou des caractères mal placés pour maintenir une structure valide.
  3. Autocomplétion des valeurs JSON manquantes: :
    • Remplir automatiquement les champs JSON avec des valeurs par défaut raisonnables (par exemple, chaîne vide ou null) pour garantir la validité des données.
  4. Nettoyage des caractères non-JSON: :
    • Gère les données contenant des caractères non JSON supplémentaires, tels que des commentaires ou des caractères mal placés, tout en conservant une structure valide.
© déclaration de droits d'auteur

Articles connexes

Pas de commentaires

Vous devez être connecté pour participer aux commentaires !
S'inscrire maintenant
aucun
Pas de commentaires...