综合介绍
一个用于修复无效JSON文件的模块,特别适用于解析由大型语言模型(LLMs)输出的错误JSON数据。该模块能够修复常见的JSON语法错误,如缺失的引号、错误的逗号、不转义的字符和不完整的键值对。它还可以自动完成缺失的JSON值,确保数据的有效性。
主要功能:
修复 JSON 语法错误, 如缺失引号、错位逗号、未转义字符等
修复格式不正确的 JSON 数组和对象
自动补全缺失的 JSON 值
提供了替代 json.loads() 和 json.load() 的方法
各语言版本
Python版本:https://github.com/mangiucugna/json_repair
Typescript版本:https://github.com/josdejong/jsonrepair
Go版本:https://github.com/RealAlexandreAI/json-repair
Ruby版本:https://github.com/sashazykov/json-repair-rb
说明
- 修复JSON语法错误:
- 缺失的引号:自动添加缺失的引号,确保键和值都被正确引用。
- 错误的逗号:修复多余或缺失的逗号,确保JSON结构的完整性。
- 不转义的字符:自动转义特殊字符,确保JSON字符串的有效性。
- 不完整的键值对:补全缺失的键或值,确保每个键值对的完整性。
- 修复JSON数组和对象:
- 不完整的数组/对象:通过添加必要的元素(如逗号、括号)或默认值(如null、空字符串)来修复。
- 处理包含额外非JSON字符的数据:清理注释或不正确放置的字符,保持有效结构。
- 自动完成缺失的JSON值:
- 自动为JSON字段填充合理的默认值(如空字符串或null),确保数据的有效性。
- 清理非JSON字符:
- 处理包含额外非JSON字符的数据,如注释或不正确放置的字符,保持有效结构。