Aprendizagem pessoal com IA
e orientação prática
Beanbag Marscode1

LaWGPT: modelagem de conhecimento jurídico chinês, suporte a questionários jurídicos e treinamento para exames judiciais

Introdução geral

O LaWGPT é um projeto de código aberto apoiado pelo Grupo de Pesquisa de Aprendizado de Máquina e Mineração de Dados da Universidade de Nanjing, dedicado à criação de um grande modelo de linguagem baseado no conhecimento jurídico chinês. Ele amplia as listas de palavras proprietárias no domínio jurídico com base em modelos chineses genéricos (por exemplo, Chinese-LLaMA e ChatGLM) e melhora significativamente a compreensão semântica do modelo e os recursos de diálogo em cenários jurídicos por meio do pré-treinamento em larga escala do corpus jurídico e do ajuste fino dos comandos no conjunto de dados de perguntas e respostas jurídicas. O projeto é promovido por vários colaboradores e é aplicável a cenários como o diálogo jurídico e o treinamento para exames judiciais. Embora o modelo ainda seja limitado por dados e capacidade, e o resultado possa ser incerto, sua natureza de código aberto e o apoio da comunidade o tornam um recurso importante para a pesquisa de IA no campo jurídico.

LaWGPT: modelagem de conhecimento jurídico chinês, suporte a questionários jurídicos e treinamento para exames judiciais-1


 

Lista de funções

  • Geração de perguntas e respostas jurídicasGerar respostas precisas com base em perguntas jurídicas inseridas, adequadas para aconselhamento e aprendizado.
  • Treinamento para exames judiciaisTreinamento de perguntas e respostas com base no conjunto de dados do Exame Judicial da China para ajudar os usuários a se prepararem para o exame.
  • Compreensão de corpus jurídicoTreinamento prévio para poder analisar o conteúdo de instrumentos jurídicos e estatutos complexos.
  • Raciocínio em lote da linha de comandoSuporte para que os desenvolvedores processem em lote dados relacionados à lei por meio de scripts.
  • Diálogo no modo interativoResposta interativa às perguntas dos usuários em tempo real quando não há dados predefinidos disponíveis.
  • Suporte à ponderação de modelos: Os pesos LoRA são fornecidos para permitir que o usuário faça ajustes personalizados em conjunto com o modelo original.

 

Usando a Ajuda

Processo de instalação

O LaWGPT é um projeto de código aberto baseado no GitHub, e você precisa instalar o ambiente e as dependências antes de usá-lo. Veja a seguir as etapas detalhadas de instalação:

  1. Clonagem do código do projeto
    Abra um terminal e digite o seguinte comando para fazer o download do código localmente:
git clone git@github.com:pengxiao-song/LaWGPT.git
cd LaWGPT

Isso clonará a base de código do LaWGPT em seu computador e entrará no diretório do projeto.

  1. Criação de um ambiente virtual
    Use o Conda para criar um ambiente Python separado e evitar conflitos de dependência:
conda create -n lawgpt python=3.10 -y
conda activate lawgpt

Após a ativação do ambiente, as operações subsequentes serão executadas no lawgpt ambiente no qual ele é realizado.

  1. Instalação de dependências
    O projeto oferece requirements.txt que lista as bibliotecas necessárias. Execute o seguinte comando para instalá-las:
pip install -r requirements.txt

As dependências incluem transformersepeftegradio etc., para garantir que a rede esteja livre para concluir o download.

  1. Obtenção de pesos de modelos
    Como o LLaMA e o Chinese-LLaMA não abrem o código-fonte dos pesos completos, o LaWGPT fornece apenas pesos LoRA. Você precisa de:
  • Obtenha os pesos para o Chinese-LaMA ou outros modelos básicos de fontes oficiais.
  • Mesclar os pesos LoRA com o modelo básico (consulte a documentação do projeto para obter detalhes sobre como fazer isso).
  1. Verificar a instalação
    Execute o script de amostra para confirmar se o ambiente está correto:
bash scripts/infer.sh

Se você entrar no modo interativo com êxito, a instalação estará concluída.

Uso

Principais operações funcionais: Questionário e raciocínio jurídico

  • modo interativo
    Quando o caminho dos dados de teste não for especificado, execute o bash scripts/infer.sh Ele entrará no modo interativo. Você pode inserir perguntas jurídicas diretamente, por exemplo:
请解释《中华人民共和国合同法》第十条的内容。

O modelo gera respostas em tempo real e é adequado para aconselhamento ou aprendizado rápido.

  • inferência crítica
    Se você precisar lidar com vários problemas, prepare um arquivo JSON (referência de formato) resources/example_instruction_train.json), por exemplo:
{"instruction": "离婚后财产如何分割?", "output": ""}

Passe o caminho do arquivo para o script:

bash scripts/infer.sh --infer_data_path ./test.json

O modelo processa e gera os resultados linha por linha, e os resultados podem ser salvos para análise posterior.

Operação de destaque: Treinamento para exames judiciais

  • Preparação do conjunto de dados
    O LaWGPT oferece suporte ao treinamento com base no conjunto de dados do Exame Judicial. Você pode consultar Awesome Chinese Legal Resources Faça o download do conjunto de dados disponível publicamente ou crie seus próprios pares de perguntas e respostas no seguinte formato:

    {"instruction": "下列哪项不属于犯罪构成要件?", "output": "A. 犯罪主体 B. 犯罪客体 C. 犯罪动机 D. 犯罪客观方面"}
    

    Salvar como um arquivo JSON, por exemplo. exam_data.json.

  • treinamento de corrida
    fazer uso de finetune.py Scripts para ajuste fino de comandos:

    python finetune.py --data_path ./exam_data.json --base_model <path_to_base_model> --lora_weights <path_to_lora>
    

    Descrição do parâmetro:

    • --data_pathCaminho do conjunto de dados.
    • --base_modelCaminhos do modelo básico.
    • --lora_weightsCaminho de peso LoRA.
      Quando o treinamento for concluído, o modelo será mais adaptável a perguntas do tipo exame judicial.

Uso da interface da Web

  • Iniciando a WebUI
    O suporte ao projeto fornece uma interface gráfica via Gradio. Executa:

    bash scripts/webui.sh
    

    Na inicialização, o navegador abre uma página local (geralmente a página http://127.0.0.1:7860).

  • fluxo de trabalho
    1. Digite uma pergunta jurídica na caixa de entrada, por exemplo, "Como faço para solicitar proteção de patente?"
    2. Clique em "Submit" (Enviar) e aguarde até que o modelo gere uma resposta.
    3. Visualizar o resultado, que pode ser copiado ou salvo.
      A interface da Web é adequada para usuários não técnicos e é de uso intuitivo.

advertência

  • Requisitos de hardwareRecomendamos o uso de uma GPU (por exemplo, Tesla V100) para acelerar a inferência; a operação da CPU pode ser mais lenta.
  • Seleção de modelos: O padrão é usar LaWGPT-7B-alphaSe você precisar beta1.0 talvez beta1.1Os parâmetros do modelo no script precisam ser ajustados.
  • limitaçõesModelos podem gerar conteúdo impreciso devido a limitações de dados, e os resultados precisam ser validados quando usados, especialmente em cenários jurídicos reais.

Com essas etapas, você pode começar a usar o LaWGPT com facilidade e obter suporte eficiente, quer esteja realizando questionários jurídicos ou se preparando para exames judiciais.

Não pode ser reproduzido sem permissão:Chefe do Círculo de Compartilhamento de IA " LaWGPT: modelagem de conhecimento jurídico chinês, suporte a questionários jurídicos e treinamento para exames judiciais
pt_BRPortuguês do Brasil