首页> 中文期刊>绥化学院学报 >融合有向图的文本敏感词过滤模型

融合有向图的文本敏感词过滤模型

     

摘要

针对敏感词Trie树中敏感词节点重复存储、敏感词变形体识别效率不高的问题,提出了一种基于有向图和DFA的敏感词过滤算法DG-DGA。算法通过有向图存储敏感词库中的敏感词及敏感词间的关系,对待检测文本和敏感词通过汉明距离进行读音相似度计算,设置相似度参数来匹配敏感词,识别读音相近的变形体。实验表明:在全模式匹配下,DGDGA算法的检测时间约为DFA算法的1/6,且待检测文本数量越大,检测效率越高。结论:在不同敏感词阈值下,DG-DGA算法能较好地识别出读音相似敏感词。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号