LaWGPT: моделирование китайских юридических знаний, поддержка юридических викторин и обучения судебным экзаменам

Последние ресурсы по искусственному интеллектуОпубликовано 1 год назад Круг обмена ИИ

49.8K 00

Общее введение

LaWGPT - это проект с открытым исходным кодом, поддерживаемый исследовательской группой машинного обучения и добычи данных Нанкинского университета, который посвящен созданию большой языковой модели на основе китайских юридических знаний. Он расширяет собственные списки слов в юридической области на основе моделей китайского языка общего назначения (например, Chinese-LLaMA и ChatGLM) и значительно улучшает семантическое понимание и диалоговые возможности модели в юридических сценариях за счет масштабного предварительного обучения на юридическом корпусе и тонкой настройки команд в юридическом наборе данных Q&A. Проект осуществляется при поддержке многочисленных коллабораторов и применим к таким сценариям, как юридический диалог и подготовка к судебным экзаменам. Хотя модель все еще ограничена данными и возможностями, а ее результаты могут быть неопределенными, ее открытый исходный код и поддержка сообщества делают ее важным ресурсом для исследований ИИ в юридической области.

Список функций

Генерация юридических вопросов и ответов: Генерирование точных ответов на основе введенных юридических вопросов, подходящих для консультирования и обучения.
Подготовка к судебным экзаменам: Предоставляет обучение в форме вопросов и ответов, основанное на наборе данных Китайского судебного экзамена, чтобы помочь пользователям подготовиться к экзамену.
Понимание юридических текстов: Предварительная подготовка, чтобы уметь разбирать содержание сложных юридических документов и уставов.
Пакетное рассуждение в командной строке: Поддержка разработчиков для пакетной обработки данных о законодательстве с помощью скриптов.
Диалог в интерактивном режиме: Интерактивные ответы на вопросы пользователей в режиме реального времени при отсутствии предопределенных данных.
Поддержка взвешивания моделейВ комплект входят: грузики LoRA, позволяющие пользователю выполнять индивидуальные настройки в сочетании с оригинальной моделью.

Использование помощи

Процесс установки

LaWGPT - это проект с открытым исходным кодом, основанный на GitHub, и перед его использованием вам необходимо установить окружение и зависимости. Ниже описаны подробные шаги по установке:

Клонирование кода проекта
Откройте терминал и введите следующую команду, чтобы загрузить код локально:

git clone git@github.com:pengxiao-song/LaWGPT.git
cd LaWGPT

Это приведет к клонированию кодовой базы LaWGPT на вашем компьютере и переходу в каталог проекта.

Создание виртуальной среды
Используйте Conda, чтобы создать отдельное окружение Python и избежать конфликтов зависимостей:

conda create -n lawgpt python=3.10 -y
conda activate lawgpt

После активации среды последующие операции будут выполняться на lawgpt окружение, в котором она проводится.

Установка зависимостей
Проект предусматривает requirements.txt файл, в котором перечислены необходимые библиотеки. Выполните следующую команду, чтобы установить их:

pip install -r requirements.txt

Зависимости включают transformers, иpeft, иgradio и т.д., чтобы убедиться, что сеть открыта для завершения загрузки.

Получение весов моделей
Поскольку LLaMA и Chinese-LLaMA не предоставляют открытых исходных данных полных весов, LaWGPT предоставляет только веса LoRA. Вам потребуется:

Получите веса для китайской модели LLaMA или других базовых моделей из официальных источников.
Объедините весовые коэффициенты LoRA с базовой моделью (подробности о том, как это сделать, см. в документации проекта).

Проверка установки
Запустите пример сценария, чтобы убедиться, что окружение создано правильно:

bash scripts/infer.sh

Если вы успешно перешли в интерактивный режим, установка завершена.

Использование

Основные функциональные операции: юридическая викторина и рассуждение

интерактивный режим
Если путь к тестовым данным не указан, запустите программу bash scripts/infer.sh Он перейдет в интерактивный режим. Вы можете напрямую вводить юридические вопросы, например:

请解释《中华人民共和国合同法》第十条的内容。

Модель генерирует ответы в режиме реального времени и подходит для быстрого консультирования или обучения.

критический вывод
Для обработки нескольких вопросов подготовьте JSON-файл (ссылка на формат) resources/example_instruction_train.json), например:

{"instruction": "离婚后财产如何分割？", "output": ""}

Передайте путь к файлу в скрипт:

bash scripts/infer.sh --infer_data_path ./test.json

Модель обрабатывает и выводит результаты построчно, их можно сохранить для последующего анализа.

Featured Feature Operation: Judicial Exam Training

Подготовка набора данных
LaWGPT поддерживает обучение на основе набора данных "Судебный экзамен". Вы можете обратиться к Awesome Chinese Legal Resources Загрузите общедоступный набор данных или создайте свои собственные пары вопросов и ответов в следующем формате:
```
{"instruction": "下列哪项不属于犯罪构成要件？", "output": "A. 犯罪主体 B. 犯罪客体 C. 犯罪动机 D. 犯罪客观方面"}
```
Сохраните в виде файла JSON, например. exam_data.json.
беговые тренировки
пользоваться finetune.py Скрипты для тонкой настройки команд:
```
python finetune.py --data_path ./exam_data.json --base_model <path_to_base_model> --lora_weights <path_to_lora>
```
Описание параметра:
- --data_path: Путь к набору данных.
- --base_model: Пути базовой модели.
- --lora_weights: весовой путь LoRA.
  После завершения обучения модель будет лучше адаптирована к вопросам типа судебных экзаменов.

Использование веб-интерфейса

Запуск WebUI
Поддержка проекта обеспечивает графический интерфейс через Gradio. Запускается:
```
bash scripts/webui.sh
```
При запуске браузер открывает локальную страницу (обычно это http://127.0.0.1:7860).
рабочий процесс
1. Введите в поле ввода юридический вопрос, например, "Как подать заявку на патентную защиту?".
2. Нажмите "Отправить" и подождите, пока модель сгенерирует ответ.
3. Просматривайте выходные данные, которые можно скопировать или сохранить.
  Веб-интерфейс подходит для нетехнических пользователей и интуитивно понятен в использовании.

предостережение

требования к оборудованию: Рекомендуется использовать GPU (например, Tesla V100) для ускорения вычислений, работа CPU может быть медленнее.
Выбор модели: По умолчанию используется LaWGPT-7B-alphaЕсли вам нужно beta1.0 возможно beta1.1Необходимо настроить параметры модели в скрипте.
ограниченияМодели могут генерировать неточное содержание из-за ограниченности данных, и результаты должны быть подтверждены при использовании, особенно в реальных юридических сценариях.

Выполнив эти действия, вы сможете легко начать работу с LaWGPT и получить эффективную поддержку, независимо от того, проводите ли вы юридические викторины или готовитесь к судебным экзаменам.

Последние ресурсы по искусственному интеллекту # AI Java Open Source Projecct Образовательные инструменты # AI

Авторское право на статью Круг обмена ИИ Пожалуйста, не воспроизводите без разрешения.

Wanxing Zhi Performance: видеопрезентация, созданная искусственным интеллектом, онлайн пояснение к документу PPT

Последние ресурсы по искусственному интеллекту # AI Generated Presentation/PPT

2 года назад

048K

SongGeneration - модель генерации музыки от Tencent AI Labs

Последние ресурсы по искусственному интеллекту

9 месяцев назад

062.3K

Sonauto: бесплатный генератор музыки с искусственным интеллектом, который генерирует плавные песни на мандаринском и кантонском языках

Последние ресурсы по искусственному интеллекту # AI Music

1 год назад

083.8K

Lenso.ai: интеллектуальная платформа обратного поиска изображений, распознавание лиц для поиска изображений

Последние ресурсы по искусственному интеллекту Инструмент поиска # AI

1 год назад

091.5K

Нет комментариев

Вы должны войти в систему, чтобы участвовать в комментариях!

Войти сейчас

Нет комментариев...

LaWGPT: моделирование китайских юридических знаний, поддержка юридических викторин и обучения судебным экзаменам

Общее введение

Список функций

Использование помощи

Процесс установки

Использование

Основные функциональные операции: юридическая викторина и рассуждение

Featured Feature Operation: Judicial Exam Training

Использование веб-интерфейса

предостережение

autoMate: отечественный инструмент, сочетающий ИИ и RPA для автоматизации компьютерных задач

ЛитСерв: быстрое развертывание корпоративных сервисов вывода моделей ИИ общего назначения

Похожие статьи

Wanxing Zhi Performance: видеопрезентация, созданная искусственным интеллектом, онлайн пояснение к документу PPT

SongGeneration - модель генерации музыки от Tencent AI Labs

Sonauto: бесплатный генератор музыки с искусственным интеллектом, который генерирует плавные песни на мандаринском и кантонском языках

Lenso.ai: интеллектуальная платформа обратного поиска изображений, распознавание лиц для поиска изображений

Нет комментариев

Последние коллекции

Последние статьи

LaWGPT: моделирование китайских юридических знаний, поддержка юридических викторин и обучения судебным экзаменам

Общее введение

Список функций

Использование помощи

Процесс установки

Использование

Основные функциональные операции: юридическая викторина и рассуждение

Featured Feature Operation: Judicial Exam Training

Использование веб-интерфейса

предостережение

autoMate: отечественный инструмент, сочетающий ИИ и RPA для автоматизации компьютерных задач

ЛитСерв: быстрое развертывание корпоративных сервисов вывода моделей ИИ общего назначения

Похожие статьи

Wanxing Zhi Performance: видеопрезентация, созданная искусственным интеллектом, онлайн пояснение к документу PPT

SongGeneration - модель генерации музыки от Tencent AI Labs

Sonauto: бесплатный генератор музыки с искусственным интеллектом, который генерирует плавные песни на мандаринском и кантонском языках

Lenso.ai: интеллектуальная платформа обратного поиска изображений, распознавание лиц для поиска изображений

Нет комментариев

Избранные инструменты искусственного интеллекта

Последние коллекции

Последние статьи