分类导航

PHP教程|ASP.NET教程|Java教程|ASP教程|编程技术|正则表达式|C/C++|IOS|C#|Swift|Android|VB|R语言|JavaScript|易语言|vb.net|

香港云服务器

服务器之家 - 编程语言 - Java教程 - Java DFA算法案例详解

Java DFA算法案例详解

2021-11-17 13:38小小华bk Java教程

这篇文章主要介绍了Java DFA算法案例详解,本篇文章通过简要的案例,讲解了该项技术的了解与使用,以下就是详细内容,需要的朋友可以参考下

1.背景

项目中需要对敏感词做一个过滤，首先有几个方案可以选择：

直接将敏感词组织成String后，利用indexOf方法来查询。
传统的敏感词入库后SQL查询。
利用Lucene建立分词索引来查询。
利用DFA 算法来进行。

首先，项目收集到的敏感词有几千条，使用a方案肯定不行。其次，为了方便以后的扩展性尽量减少对数据库的依赖，所以放弃b方案。然后Lucene本身作为本地索引，敏感词增加后需要触发更新索引，并且这里本着轻量原则不想引入更多的库，所以放弃c方案。于是我们选定d方案为研究目标。

2.DFA算法简介

DFA全称为：Deterministic Finite Automaton,即确定有穷自动机。其特征为：有一个有限状态集合和一些从一个状态通向另一个状态的边，每条边上标记有一个符号，其中一个状态是初态，某些状态是终态。但不同于不确定的有限自动机，DFA中不会有从同一状态出发的两条边标志有相同的符号。

Java DFA算法案例详解

简单点说就是，它是是通过event和当前的state得到下一个state，即event+state=nextstate。理解为系统中有多个节点，通过传递进入的event，来确定走哪个路由至另一个节点，而节点是有限的。

3.敏感词搜寻中的DFA算法

3.1敏感词库构造描述

以王八蛋和王八羔子两个敏感词来进行描述，首先构建敏感词库，该词库名称为SensitiveMap，这两个词的二叉树构造为：

Java DFA算法案例详解

用hash表构造为：

Java DFA算法案例详解

3.2基于敏感词库收索算法的描述

以上面例子构造出来的SensitiveMap为敏感词库进行示意，假设这里输入的关键字为：王八不好，流程图如下：

Java DFA算法案例详解

4.代码编写

4.1构造敏感词实现代码

Java DFA算法案例详解

4.2实现敏感词查询代码

Java DFA算法案例详解

5.优化思路

5.1敏感词中间填充无意义字符问题

对于“王*八&&蛋”这样的词，中间填充了无意义的字符来混淆，在我们做敏感词搜索时，同样应该做一个无意义词的过滤，当循环到这类无意义的字符时进行跳过，避免干扰。

5.2敏感词用拼音或部分用拼音代替

两种解决思路：一种是最简单是遇到这类问题，先丰富敏感词库进行快速解决。第二种是判断时将敏感词转换为拼音进行对比判断。

不过目前这两种方案均不能彻底很好的解决该问题，此类问题还需进一步研究。

到此这篇关于Java DFA算法案例详解的文章就介绍到这了,更多相关Java DFA算法内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家！

原文链接：https://blog.csdn.net/qq_36827957/article/details/74357283

延伸 · 阅读

2022-03-11Java京东面试题之为什么HashMap线程不安全
2022-03-11Java面试为何阿里强制要求不在foreach里执行删除操
2022-03-11图解Java排序算法之希尔排序
2022-03-11图解Java排序算法之快速排序的三数取中法
2022-03-11图解Java排序算法之堆排序
2022-03-11java中TreeMap集合的常用方法详解

精彩推荐

Java教程

Java实现抢红包功能

这篇文章主要为大家详细介绍了Java实现抢红包功能，采用多线程模拟多人同时抢红包，文中示例代码介绍的非常详细，具有一定的参考价值，感兴趣的小伙...

littleschemer13532021-05-16
Java教程

20个非常实用的Java程序代码片段

这篇文章主要为大家分享了20个非常实用的Java程序片段，对java开发项目有所帮助，感兴趣的小伙伴们可以参考一下 ...

lijiao5352020-04-06
Java教程

xml与Java对象的转换详解

这篇文章主要介绍了xml与Java对象的转换详解的相关资料,需要的朋友可以参考下...

Java教程网2942020-09-17
Java教程

Java使用SAX解析xml的示例

这篇文章主要介绍了Java使用SAX解析xml的示例，帮助大家更好的理解和学习使用Java，感兴趣的朋友可以了解下...

大行者10067412021-08-30
Java教程

Java8中Stream使用的一个注意事项

最近在工作中发现了对于集合操作转换的神器，java8新特性 stream，但在使用中遇到了一个非常重要的注意点，所以这篇文章主要给大家介绍了关于Java8中S...

阿杜7482021-02-04
Java教程

Java BufferWriter写文件写不进去或缺失数据的解决

这篇文章主要介绍了Java BufferWriter写文件写不进去或缺失数据的解决方案，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望...

spcoder14552021-10-18
Java教程

小米推送Java代码

今天小编就为大家分享一篇关于小米推送Java代码，小编觉得内容挺不错的，现在分享给大家，具有很好的参考价值，需要的朋友一起跟随小编来看看吧...

富贵稳中求8032021-07-12
Java教程

升级IDEA后Lombok不能使用的解决方法

最近看到提示IDEA提示升级，寻思已经有好久没有升过级了。升级完毕重启之后，突然发现好多错误，本文就来介绍一下如何解决，感兴趣的可以了解一下...

程序猿DD9332021-10-08