Introdução geral
Um módulo para corrigir arquivos JSON inválidos, especialmente para analisar dados JSON incorretos gerados por LLMs (Large Language Models). O módulo corrige erros comuns de sintaxe JSON, como aspas ausentes, vírgulas incorretas, caracteres sem escape e pares de valores-chave incompletos. Ele também completa automaticamente os valores JSON ausentes para garantir a validade dos dados.
Principais recursos.
Corrigir erros de sintaxe de JSON, como aspas ausentes, vírgulas mal colocadas, caracteres sem escape, etc.
Correção de matrizes e objetos JSON formatados incorretamente
Preenchimento automático de valores JSON ausentes
Fornece alternativas para json.loads() e json.load().
Versões de idiomas
Versão do Python: https://github.com/mangiucugna/json_repair
Versão do texto: https://github.com/josdejong/jsonrepair
Versão Go: https://github.com/RealAlexandreAI/json-repair
Versão do Ruby: https://github.com/sashazykov/json-repair-rb
instruções
- Corrigir erros de sintaxe de JSON::
- Aspas ausentes: adiciona automaticamente aspas ausentes para garantir que as chaves e os valores sejam referenciados corretamente.
- Vírgulas incorretas: corrige vírgulas redundantes ou ausentes para garantir a integridade da estrutura JSON.
- Caracteres não escapados: escapa automaticamente caracteres especiais para garantir a validade da cadeia de caracteres JSON.
- Pares de valores-chave incompletos: completa as chaves ou os valores ausentes para garantir a integridade de cada par de valores-chave.
- Correção de matrizes e objetos JSON::
- Matrizes/objetos incompletos: corrija adicionando os elementos necessários (por exemplo, vírgulas, colchetes) ou valores padrão (por exemplo, null, string vazia).
- Tratamento de dados que contêm caracteres adicionais não JSON: limpe comentários ou caracteres colocados incorretamente para manter uma estrutura válida.
- Preenchimento automático de valores JSON ausentes::
- Preencher automaticamente os campos JSON com valores padrão sensatos (por exemplo, cadeia de caracteres vazia ou nula) para garantir a validade dos dados.
- Limpeza de caracteres não JSON::
- Trata os dados que contêm caracteres adicionais não JSON, como comentários ou caracteres colocados incorretamente, mantendo uma estrutura válida.