基于汽车评论的文本情感分类特征选择方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来随着信息技术的迅猛发展，互联网迎来前所未有的新局面。以网络为传播媒介的文本评论信息越来越受到企事业单位和个人的关注。传统的主题分类已经不能满足人们的需求，用户希望得到更多的主观性信息，如:公共事件的社会反映、焦点新闻的追踪报道、产品的用户反馈及民意调查信息等。然而，网上每天都有大量的新评论出现，对于这些评论，仅靠人工进行跟踪和分析显然是行不通的，人们开始关注并研究评论文本的主观性情感倾向分析。
　　本文针对文本情感分类中的特征选择问题进行了研究，主要内容包括：⑴建立了以汽车产品评论为主的中文文本情感分类语料库，并在此基础上建立了汽车产品知识库。⑵研究了停用词对文本情感倾向性分类的影响。选用信息增益、互信息和x2统计三种特征选择方法，布尔权重和频率权重两种权重计算方法，并选用支持向量机作为分类器进行了实验研究。实验结果表明，当选用不同的停用词表时，它们对文本情感分类的影响不尽相同，停用词表对情感分类作用较大，整体性能效果较好。⑶提出了基于类别区分能力的混合特征选择方法，并测试了其对文本情感分类的作用。该方法是基于词汇的类别区分能力与信息增益相结合的特征方法，讨论了在不同的特征选择方法和不同维数特征空间下对文本情感分类结果的影响。实验结果表明使用混合的特征选择方法要优于使用单一的信息增益方法。⑷从特征选择和维数压缩的角度，提出了基于粗糙集理论的特征选择方法。通过对情感分类问题的分析并结合粗糙集理论，将属性离散化方法用于文本情感分类中的特征选择、维数压缩，利用支持向量机作为分类器进行分类实验。实验结果表明，该方法具有良好的特征可解释性和较好的特征维数压缩效果。

著录项

作者
魏英杰;
展开▼
作者单位

山西大学;

展开▼
授予单位山西大学;
学科模式识别与智能系统
授予学位硕士
导师姓名王素格;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
网络服务; 数据挖掘; 文本分类; 程序语言;

相似文献

中文文献
外文文献
专利

1. 基于特征选择和深度信念网络的文本情感分类算法 [J] . 向进勇 ,杨文忠 ,吾守尔·斯拉木 . 计算机应用 . 2019,第007期
2. 基于改进特征选择方法的文本情感分类研究 [J] . 刘洺辛 ,陈晶 ,王麒媛 . 电信科学 . 2018,第010期
3. 基于产品评论的情感标注一致性问题分析——以汽车评论文本和美妆评论文本为例 [J] . 毛雪芬 . 文教资料 . 2019,第035期
4. 基于产品评论的情感标注一致性问题分析——以汽车评论文本和美妆评论文本为例 [J] . 毛雪芬 . 文教资料 . 2018,第035期
5. 基于不平衡情感分类的Lasso-Lars特征选择方法研究 [J] . 万会芳 ,闵兰 ,舒畅 . 西南师范大学学报（自然科学版） . 2018,第009期
6. 一种面向文本情感分类的联合特征选择方法 [C] . 葛斌 ,周城 ,李芳芳 . 第三届全国社会计算会议、平行控制会议、平行管理会议 . 2011
7. 面向问答型评论文本的情感分类方法研究 [A] . 沈忱林 . 2019

基于汽车评论的文本情感分类特征选择方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅