首页> 中文期刊> 《通信学报》 >Web内容过滤中的数据预处理模块设计

Web内容过滤中的数据预处理模块设计

             

摘要

Web内容过滤是将模式识别和文本分类的方法应用于通过服务器或个人终端的数据流上,实现不良或无关信息过滤的行为模式。之后介绍了典型的数据预处理技术,指出大量无关或冗余数据以及中文字符集的多样性影响了过滤的效果。提出了改良的数据预处理模块,其中引入了主体文本提取和中文字符集自动识别转换等技术。结合实验和实际系统应用说明了改良模块的作用,并给出了进一步的努力方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号