LaWGPT: modelagem de conhecimento jurídico chinês, suporte a questionários jurídicos e treinamento para exames judiciais

Recursos mais recentes de IAPublicado há 5 meses Círculo de compartilhamento de IA

1.3K 00

Introdução geral

O LaWGPT é um projeto de código aberto apoiado pelo Grupo de Pesquisa de Aprendizado de Máquina e Mineração de Dados da Universidade de Nanjing, dedicado à criação de um grande modelo de linguagem baseado no conhecimento jurídico chinês. Ele amplia as listas de palavras proprietárias no domínio jurídico com base em modelos chineses genéricos (por exemplo, Chinese-LLaMA e ChatGLM) e melhora significativamente a compreensão semântica do modelo e os recursos de diálogo em cenários jurídicos por meio do pré-treinamento em larga escala do corpus jurídico e do ajuste fino dos comandos no conjunto de dados de perguntas e respostas jurídicas. O projeto é promovido por vários colaboradores e é aplicável a cenários como o diálogo jurídico e o treinamento para exames judiciais. Embora o modelo ainda seja limitado por dados e capacidade, e o resultado possa ser incerto, sua natureza de código aberto e o apoio da comunidade o tornam um recurso importante para a pesquisa de IA no campo jurídico.

Lista de funções

Geração de perguntas e respostas jurídicasGerar respostas precisas com base em perguntas jurídicas inseridas, adequadas para aconselhamento e aprendizado.
Treinamento para exames judiciaisTreinamento de perguntas e respostas com base no conjunto de dados do Exame Judicial da China para ajudar os usuários a se prepararem para o exame.
Compreensão de corpus jurídicoTreinamento prévio para poder analisar o conteúdo de instrumentos jurídicos e estatutos complexos.
Raciocínio em lote da linha de comandoSuporte para que os desenvolvedores processem em lote dados relacionados à lei por meio de scripts.
Diálogo no modo interativoResposta interativa às perguntas dos usuários em tempo real quando não há dados predefinidos disponíveis.
Suporte à ponderação de modelos: Os pesos LoRA são fornecidos para permitir que o usuário faça ajustes personalizados em conjunto com o modelo original.

Usando a Ajuda

Processo de instalação

O LaWGPT é um projeto de código aberto baseado no GitHub, e você precisa instalar o ambiente e as dependências antes de usá-lo. Veja a seguir as etapas detalhadas de instalação:

Clonagem do código do projeto
Abra um terminal e digite o seguinte comando para fazer o download do código localmente:

git clone git@github.com:pengxiao-song/LaWGPT.git
cd LaWGPT

Isso clonará a base de código do LaWGPT em seu computador e entrará no diretório do projeto.

Criação de um ambiente virtual
Use o Conda para criar um ambiente Python separado e evitar conflitos de dependência:

conda create -n lawgpt python=3.10 -y
conda activate lawgpt

Após a ativação do ambiente, as operações subsequentes serão executadas no lawgpt ambiente no qual ele é realizado.

Instalação de dependências
O projeto oferece requirements.txt que lista as bibliotecas necessárias. Execute o seguinte comando para instalá-las:

pip install -r requirements.txt

As dependências incluem transformersepeftegradio etc., para garantir que a rede esteja livre para concluir o download.

Obtenção de pesos de modelos
Como o LLaMA e o Chinese-LLaMA não abrem o código-fonte dos pesos completos, o LaWGPT fornece apenas pesos LoRA. Você precisa de:

Obtenha os pesos para o Chinese-LaMA ou outros modelos básicos de fontes oficiais.
Mesclar os pesos LoRA com o modelo básico (consulte a documentação do projeto para obter detalhes sobre como fazer isso).

Verificar a instalação
Execute o script de amostra para confirmar se o ambiente está correto:

bash scripts/infer.sh

Se você entrar no modo interativo com êxito, a instalação estará concluída.

Uso

Principais operações funcionais: Questionário e raciocínio jurídico

modo interativo
Quando o caminho dos dados de teste não for especificado, execute o bash scripts/infer.sh Ele entrará no modo interativo. Você pode inserir perguntas jurídicas diretamente, por exemplo:

请解释《中华人民共和国合同法》第十条的内容。

O modelo gera respostas em tempo real e é adequado para aconselhamento ou aprendizado rápido.

inferência crítica
Se você precisar lidar com vários problemas, prepare um arquivo JSON (referência de formato) resources/example_instruction_train.json), por exemplo:

{"instruction": "离婚后财产如何分割？", "output": ""}

Passe o caminho do arquivo para o script:

bash scripts/infer.sh --infer_data_path ./test.json

O modelo processa e gera os resultados linha por linha, e os resultados podem ser salvos para análise posterior.

Operação de destaque: Treinamento para exames judiciais

Preparação do conjunto de dados
O LaWGPT oferece suporte ao treinamento com base no conjunto de dados do Exame Judicial. Você pode consultar Awesome Chinese Legal Resources Faça o download do conjunto de dados disponível publicamente ou crie seus próprios pares de perguntas e respostas no seguinte formato:
```
{"instruction": "下列哪项不属于犯罪构成要件？", "output": "A. 犯罪主体 B. 犯罪客体 C. 犯罪动机 D. 犯罪客观方面"}
```
Salvar como um arquivo JSON, por exemplo. exam_data.json.
treinamento de corrida
fazer uso de finetune.py Scripts para ajuste fino de comandos:
```
python finetune.py --data_path ./exam_data.json --base_model <path_to_base_model> --lora_weights <path_to_lora>
```
Descrição do parâmetro:
- --data_pathCaminho do conjunto de dados.
- --base_modelCaminhos do modelo básico.
- --lora_weightsCaminho de peso LoRA.
  Quando o treinamento for concluído, o modelo será mais adaptável a perguntas do tipo exame judicial.

Uso da interface da Web

Iniciando a WebUI
O suporte ao projeto fornece uma interface gráfica via Gradio. Executa:
```
bash scripts/webui.sh
```
Na inicialização, o navegador abre uma página local (geralmente a página http://127.0.0.1:7860).
fluxo de trabalho
1. Digite uma pergunta jurídica na caixa de entrada, por exemplo, "Como faço para solicitar proteção de patente?"
2. Clique em "Submit" (Enviar) e aguarde até que o modelo gere uma resposta.
3. Visualizar o resultado, que pode ser copiado ou salvo.
  A interface da Web é adequada para usuários não técnicos e é de uso intuitivo.

advertência

Requisitos de hardwareRecomendamos o uso de uma GPU (por exemplo, Tesla V100) para acelerar a inferência; a operação da CPU pode ser mais lenta.
Seleção de modelos: O padrão é usar LaWGPT-7B-alphaSe você precisar beta1.0 talvez beta1.1Os parâmetros do modelo no script precisam ser ajustados.
limitaçõesModelos podem gerar conteúdo impreciso devido a limitações de dados, e os resultados precisam ser validados quando usados, especialmente em cenários jurídicos reais.

Com essas etapas, você pode começar a usar o LaWGPT com facilidade e obter suporte eficiente, quer esteja realizando questionários jurídicos ou se preparando para exames judiciais.

O artigo é protegido por direitos autorais e não deve ser reproduzido sem permissão.

MiniMind-V: treinamento de 1 hora de um modelo de linguagem visual com 26 milhões de parâmetros

Recursos mais recentes de IA # Projeto de código aberto AI Java # Ajuste fino do modelo grande

4 meses atrás

01.5K

Ferramenta de monitoramento de degradação do serviço ChatGPT: Detecção de degradações do serviço ChatGPT

Recursos mais recentes de IA # Projeto de código aberto AI Java

8 meses atrás

01.7K

Aha: uma plataforma de serviços de marketing com tecnologia de IA para internautas/darlings

Recursos mais recentes de IA # AI Marketing

5 meses atrás

01.1K

CSM (Cube): fornece ferramentas de IA de geração 3D, oferece suporte à geração de modelos 3D a partir de imagens e textos

Recursos mais recentes de IA # Texto e imagem AI para 3D

9 meses atrás

01.9K

Sem comentários

Você precisa estar conectado para participar dos comentários!

Faça login agora

Nenhum comentário...

LaWGPT: modelagem de conhecimento jurídico chinês, suporte a questionários jurídicos e treinamento para exames judiciais

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Uso

Principais operações funcionais: Questionário e raciocínio jurídico

Operação de destaque: Treinamento para exames judiciais

Uso da interface da Web

advertência

autoMate: uma ferramenta nativa que combina IA e RPA para automatizar tarefas de computador

LitServe: implantação rápida de serviços de inferência de modelos de IA de uso geral de nível empresarial

Artigos relacionados

MiniMind-V: treinamento de 1 hora de um modelo de linguagem visual com 26 milhões de parâmetros

Ferramenta de monitoramento de degradação do serviço ChatGPT: Detecção de degradações do serviço ChatGPT

Aha: uma plataforma de serviços de marketing com tecnologia de IA para internautas/darlings

CSM (Cube): fornece ferramentas de IA de geração 3D, oferece suporte à geração de modelos 3D a partir de imagens e textos

Sem comentários

Últimas coleções

Artigos mais recentes

LaWGPT: modelagem de conhecimento jurídico chinês, suporte a questionários jurídicos e treinamento para exames judiciais

Introdução geral

Lista de funções

Usando a Ajuda

Processo de instalação

Uso

Principais operações funcionais: Questionário e raciocínio jurídico

Operação de destaque: Treinamento para exames judiciais

Uso da interface da Web

advertência

autoMate: uma ferramenta nativa que combina IA e RPA para automatizar tarefas de computador

LitServe: implantação rápida de serviços de inferência de modelos de IA de uso geral de nível empresarial

Artigos relacionados

MiniMind-V: treinamento de 1 hora de um modelo de linguagem visual com 26 milhões de parâmetros

Ferramenta de monitoramento de degradação do serviço ChatGPT: Detecção de degradações do serviço ChatGPT

Aha: uma plataforma de serviços de marketing com tecnologia de IA para internautas/darlings

CSM (Cube): fornece ferramentas de IA de geração 3D, oferece suporte à geração de modelos 3D a partir de imagens e textos

Sem comentários

Ferramentas de IA selecionadas

Últimas coleções

Artigos mais recentes