首页> 中文期刊> 《电子技术与软件工程》 >互联网隐式文本特征的提取

互联网隐式文本特征的提取

         

摘要

随着互联网环境下大数据的极速膨胀,其文本信息也变得越发复杂,同时存在大量的隐式文本,针对隐式文本信息,当前缺乏有效的特征数据提取方法,为了解决该问题,提出了扩充CRFs模型的聚类提取方法。首先采用CRFs模型对候选文本对象进行建模,根据知识库扩充候选文本的特征词集合;然后利用聚类算法提取隐式文本对象集,经过迭代计算,得到特征词的匹配程度,并据此进行文本对象的分类;提出改进的特征去噪方法,结合权重计算提取得到目标文本对象。通过实验数据的分析,验证了本文提出的方法可以有效应用于隐式文本对象的特征数据提取上,提高了隐式文本特征提取的查全率和准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号