中文文本分类中基于概念屏蔽层的特征提取方法

廖莎莎; 江铭虎

首页> 中文期刊> 《中文信息学报》 >中文文本分类中基于概念屏蔽层的特征提取方法

中文文本分类中基于概念屏蔽层的特征提取方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文提出了一种新的基于概念抽取和屏蔽层的特征选择方法.该方法利用HowNet概念词典中的概念树,通过义原在概念树中的位置信息进行概念抽取,并赋予其适当权值来说明其描述能力.对于权值低于屏蔽层的义原,我们不将其选入特征集,并相应保留原词.具体到每个词,我们计算其DEF条目中的权值,决定是将原词选入特征集还是进行概念抽取.本文重点研究了如何给义原设定一个合适的权值,如何在选取原词和概念之间取得平衡以及针对非概念词的加权处理.实验证明,设定合适的屏蔽层,不仅可以缩小特征维数,使分类正确率得到一定的提高,而且可以减少不同类别间的分类正确率的差别.

著录项

来源
《中文信息学报》 |2006年第3期|22-28|共7页
作者
廖莎莎; 江铭虎;
展开▼
作者单位

清华大学,人文学院计算语言实验室,清华大学,认知科学创新基地,北京,100084;

清华大学,人文学院计算语言实验室,清华大学,认知科学创新基地,北京,100084;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
计算机应用; 中文信息处理; 文本分类; 特征提取; 概念抽取; 属性特征树; 屏蔽层; 描述能力;

相似文献

中文文献
外文文献
专利

1. 中文文本分类中基于词性的特征提取方法研究 [J] . 胡燕 ,吴虎子 ,钟珞 . 武汉理工大学学报 . 2007,第4期
2. 基于互信息的特征提取方法在中文法律案情文本分类中的改进及应用 [J] . 李文 ,王炜立 ,洪胜华 . 科技广场 . 2006,第011期
3. 中文文本分类中特征提取方法的比较与改进 [J] . 王明令 . 兰州工业学院学报 . 2010,第006期
4. 文本分类中基于K-Sprinkling的特征提取方法 [J] . 李惠富 ,陆光 ,景维鹏 . 计算机工程 . 2017,第012期
5. 中文文本分类中基于和声搜索算法的特征选择方法 [J] . 路永和 ,张宇楠 . 情报学报 . 2015,第011期
6. 一种基于语义概念的中文文本分类方法 [C] . 陈伟萍 ,王琳 ,封化民 . 第十四届全国多媒体技术、第一届全国普适计算、第一届全国人机交互联合学术会议（第一届全国和谐人机环境联合学术大会） . 2005
7. 基于概念特征的中文文本分类研究 [A] . 吴志峰 . 2005

中文文本分类中基于概念屏蔽层的特征提取方法

摘要

著录项

相似文献

相关主题

期刊订阅