Introdução geral
A ferramenta de filtragem de palavras sensíveis (Sensitive Word) é uma ferramenta de filtragem de palavras sensíveis em Java de alto desempenho, baseada na implementação da estrutura do algoritmo DFA. A ferramenta pode detectar e filtrar palavras sensíveis de forma eficiente, com suporte para conversão de vários formatos e estratégias de substituição personalizadas. Seu objetivo de design é fornecer uma solução de filtragem de palavras sensíveis fácil de usar e de desempenho superior para uma variedade de cenários de aplicativos.
Lista de funções
- Detecção de palavras sensíveis: suporta julgamento de palavras sensíveis, retorno, dessensibilização e outras operações
- Conversão de formato: suporta conversão de canto completo e meio-canto, conversão de chinês tradicional e simplificado, conversão de maiúsculas e minúsculas em inglês, etc.
- Substituição personalizada: suporta palavras sensíveis definidas pelo usuário e estratégias de substituição
- Atualização dinâmica: suporta a atualização dinâmica do banco de dados de palavras sensíveis, eficaz em tempo real
- Interface de rótulos: suporta o gerenciamento de rótulos para palavras sensíveis
- Tratamento de caracteres especiais: correspondência flexível com omissão de caracteres especiais
Usando a Ajuda
Processo de instalação
- Preparação do ambienteVerifique se o JDK 1.8+ e o Maven 3.x+ estão instalados.
- Introdução de dependênciasNo projeto
pom.xml
para adicionar as seguintes dependências:<dependência> <groupId>com.github.houbb</pgroupId> <artifactId>palavra sensível</partifactId> <versão>0.19.2</pversão> </pdependência>
- inicializaçãoInicialização da classe SensitiveWordHelper no projeto: Inicialize a classe SensitiveWordHelper no projeto.
Uso
- Detecção sensível de palavras::
Cordas texto = "Conteúdo do texto a ser detectado"; booleano contém = SensitiveWordHelper.contains(text);
Esse método retorna um valor booleano que indica se o texto contém palavras sensíveis.
- substituição sensível de palavras::
Cordas replacedText = SensitiveWordHelper.replace(text, '*');
Esse método substitui palavras sensíveis no texto pelos caracteres especificados.
- Obter todas as palavras sensíveis::
List sensitiveWords = SensitiveWordHelper.findAll(text);
Esse método retorna uma lista de todas as palavras sensíveis no texto.
- Bancos de frases sensíveis personalizados::
SensitiveWordHelper.addSensitiveWord("Palavras sensíveis personalizadas");
Esse método permite que os usuários adicionem dinamicamente palavras sensíveis.
Procedimento de operação detalhado
- Inicializar o banco de dados de palavras sensíveisLéxico sensível: Carrega o léxico sensível padrão ou um léxico sensível personalizado na inicialização do projeto.
- detecção de textoNo conteúdo do texto a ser detectado, chame a função
SensitiveWordHelper.contains
para determinar se ele contém palavras sensíveis. - processamento de texto sensívelEscolha usar, com base nas necessidades de negócios, o
substituir
para a substituição de palavras sensíveis, ou use o métodofindAll
para obter todas as palavras sensíveis para processamento posterior. - atualização dinâmica (Internet)Durante a operação, o
addSensitiveWord
O método atualiza dinamicamente o banco de dados de palavras sensíveis para garantir a detecção precisa e em tempo real de palavras sensíveis.