Allgemeine Einführung
Das Tool zur Filterung sensibler Wörter (Sensitive Word) ist ein leistungsstarkes Java-Tool zur Filterung sensibler Wörter, das auf der Implementierung des DFA-Algorithmus-Frameworks basiert. Das Tool kann sensible Wörter effizient erkennen und filtern und unterstützt mehrere Formatkonvertierungen und benutzerdefinierte Ersetzungsstrategien. Sein Design-Ziel ist es, eine einfach zu bedienende und überlegene Leistung der sensiblen Wortfilterung Lösung für eine Vielzahl von Anwendungsszenarien zu bieten.
Funktionsliste
- Erkennung empfindlicher Wörter: Unterstützung der Beurteilung empfindlicher Wörter, Rückgabe, Desensibilisierung und anderer Operationen
- Formatkonvertierung: Unterstützung der Konvertierung in Voll- und Halbecken, Konvertierung in traditionelles und vereinfachtes Chinesisch, Konvertierung in englische Großschreibung usw.
- Benutzerdefinierte Ersetzung: Unterstützung benutzerdefinierter sensibler Wörter und Ersetzungsstrategien
- Dynamische Aktualisierung: Unterstützung der dynamischen Aktualisierung der Datenbank mit sensiblen Wörtern, Echtzeit-Effektivität
- Etikettenschnittstelle: unterstützt die Verwaltung von Etiketten für sensible Wörter
- Sonderzeichenbehandlung: Flexibler Abgleich mit Überspringen von Sonderzeichen
Hilfe verwenden
Ablauf der Installation
- Vorbereiten der UmgebungStellen Sie sicher, dass JDK 1.8+ und Maven 3.x+ installiert sind.
- Einführung von AbhängigkeitenIn der Projektbeschreibung
pom.xml
Datei, um die folgenden Abhängigkeiten hinzuzufügen:<Abhängigkeiten> <groupId>com.github.houbb</pgroupId> <artifactId>sensibles Wort</partifactId> <Version>0.19.2</pVersion> </pAbhängigkeiten>
- InitialisierungSensitiveWordHelper: Initialisieren Sie die Klasse SensitiveWordHelper im Projekt.
Verwendung
- Empfindliche Worterkennung::
Zeichenfolge Text = "Zu erkennender Textinhalt"; boolean enthält = SensitiveWordHelper.contains(text);
Diese Methode gibt einen booleschen Wert zurück, der angibt, ob der Text sensible Wörter enthält.
- sensible Wortersetzung::
Zeichenfolge ersetzterText = SensitiveWordHelper.replace(text, '*');
Mit dieser Methode werden sensible Wörter im Text durch die angegebenen Zeichen ersetzt.
- Alle sensiblen Wörter erhalten::
List sensitiveWords = SensitiveWordHelper.findAll(text);
Diese Methode liefert eine Liste aller sensiblen Wörter im Text.
- Maßgeschneiderte sensible Phrasensammlung::
SensitiveWordHelper.addSensitiveWord("Maßgeschneiderte sensible Wörter");
Diese Methode ermöglicht es den Benutzern, sensible Wörter dynamisch hinzuzufügen.
Detaillierte Vorgehensweise
- Initialisierung der Datenbank für sensible WörterLaden des standardmäßigen sensitiven Lexikons oder eines benutzerdefinierten sensitiven Lexikons beim Projektstart.
- Texterkennung: In dem zu erkennenden Textinhalt rufen Sie die Funktion
SensitiveWordHelper.enthält
Methode, um festzustellen, ob sie sensible Wörter enthält. - sensible Textverarbeitung: Wählen Sie, basierend auf den geschäftlichen Anforderungen, die
ersetzen.
Methode für sensible Wortsubstitution, oder verwenden Sie diefindAll
Methode, um alle sensiblen Wörter für die weitere Verarbeitung zu erhalten. - dynamische Aktualisierung (Internet): Während des Betriebs wird die
addSensitiveWord
Die Methode aktualisiert die Datenbank für sensible Wörter dynamisch, um eine genaue Erkennung sensibler Wörter in Echtzeit zu gewährleisten.