综合介绍
敏感词过滤工具(Sensitive Word)是一个基于DFA算法实现的高性能Java敏感词过滤工具框架。该工具能够高效地检测和过滤敏感词,支持多种格式转换和自定义替换策略。其设计目标是提供一个易于使用且性能优越的敏感词过滤解决方案,适用于各种应用场景。
功能列表
- 敏感词检测:支持敏感词的判断、返回、脱敏等操作
- 格式转换:支持全角半角互换、繁简体转换、英文大小写转换等
- 自定义替换:支持用户自定义敏感词和替换策略
- 动态更新:支持敏感词库的动态更新,实时生效
- 标签接口:支持敏感词的标签管理
- 特殊字符处理:支持跳过特殊字符的灵活匹配
使用帮助
安装流程
- 准备环境:确保已安装JDK 1.8+和Maven 3.x+。
- 引入依赖:在项目的
pom.xml
文件中添加以下依赖:<dependency> <groupId>com.github.houbb</groupId> <artifactId>sensitive-word</artifactId> <version>0.19.2</version> </dependency>
- 初始化:在项目中初始化SensitiveWordHelper类。
使用方法
- 敏感词检测:
String text = "待检测的文本内容"; boolean contains = SensitiveWordHelper.contains(text);
该方法返回布尔值,表示文本中是否包含敏感词。
- 敏感词替换:
String replacedText = SensitiveWordHelper.replace(text, '*');
该方法将文本中的敏感词替换为指定字符。
- 获取所有敏感词:
List<String> sensitiveWords = SensitiveWordHelper.findAll(text);
该方法返回文本中所有的敏感词列表。
- 自定义敏感词库:
SensitiveWordHelper.addSensitiveWord("自定义敏感词");
该方法允许用户动态添加敏感词。
详细操作流程
- 初始化敏感词库:在项目启动时,加载默认的敏感词库或自定义敏感词库。
- 文本检测:在需要检测的文本内容中调用
SensitiveWordHelper.contains
方法,判断是否包含敏感词。 - 敏感词处理:根据业务需求,选择使用
replace
方法进行敏感词替换,或使用findAll
方法获取所有敏感词进行进一步处理。 - 动态更新:在运行过程中,可以通过
addSensitiveWord
方法动态更新敏感词库,确保敏感词检测的实时性和准确性。