首页> 中文会议>2012中国计算机大会 >TFC-Reducing:一种基于属性语义距离和规则的文本型形式背景约简方法

TFC-Reducing:一种基于属性语义距离和规则的文本型形式背景约简方法

摘要

形式概念分析作为数据分析和知识处理的形式化工具,可以有效的从海量文本数据中挖掘出人们感兴趣的知识,受到许多研究人员的推崇.形式概念分析的前提条件是必须有一个纯净、良好定义的形式背景.从文本中直接提取特征词,利用文本一特征词形成的文本型形式背景(Textual Formal Context TFC)是一个高度稀疏的二维表,带有很多的噪音信息,严重影响形式概念分析的建格效率以及概念格的结构.因此找到一种有效的文本型形式背景约简方法很有必要.本文综合考虑文本型形式背景的本质特征,从属性语义距离和数学原理出发,提出了一种文本型形式背景的约简方法TFC-Reducing,并给出文本型形式背景约简的评价方法——信息损失熵和语义覆盖度.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号