基于半监督机器学习的文本情感分析技术

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

互联网的发展日新月异，人们也越来越体会到其对自身学习和生活的各种影响。以往用户一直是被动的从互联网上获取信息，但是现在越来越多的人主动的参与互联网上信息的产生与传播。因此，随之而来的是大量用户信息的产生和网络信息内容的多样化。面对互联网上海量的良莠不齐的信息和数据，一方面，用户需要花费大量的人力和物力去进行判断与甄别，以获取对自己有价值的信息，从而帮助自己的日常生活。另一方面，生产商和制造商希望针对这些海量的数据来分析大众对某个产品或服务的评价和反馈，从而帮助他们在瞬息万变的形势下做出正确的决策与判断。情感分析技术便在这样的背景下应运而生，它是能有效地获取网络评论信息的非结构化信息挖掘技术，本文的研究主要针对评价对象的情感倾向问题。
　　首先，本文对国内外的情感分析技术研究现状进行说明，介绍了在情感分析领域使用到的技术及其步骤和主要的支撑算法，并且对各个算法进行了分析与比较。情感分析的支撑算法，都需要有一定数量的已标注样本用做训练，情感分析的准确率会随着已标注样本数量的提升而增加。通过互联网我们可以获取大量未标记的自由文本，如果尝试对这些未标记的自由文本进行选择和标注，将耗费大量的物力和人力。所以我们引入了半监督机器学习的方法，尝试利用这些未标记的自由文本，将这些文本的隐含信息引入到标注样本中来提高分类器的分类性能。然而现有的半监督机器学习方法中存在一些缺点，在已标注样本较少的情况下，分类器的性能往往不够理想，导致挑选的样本错误率较高，最终无法显著的提高分类器的准确率。论文详细地分析了当前国内外学术界对于半监督机器学习问题的改善方法和意见，并在对他们进行总结和归纳的基础上引出了本文的算法。
　　最后，论文提出了一种基于对偶系统的半监督情感分类方法。该方法在已有的对偶系统的基础上，将其移植到半监督学习上。并且在半监督学习的挑选未标签样本的过程中，引入规则的方法以及长度的信息进而重新定义准确性和差异性。该方法提高挑选样本的质量和准确性，从而提升分类器的学习速率，并且同时保证正确率。通过测试表明，本文提出的算法在已有的半监督学习算法上获得了一定的提高，具有有效性和可行性。

著录项

作者
王成;
展开▼
作者单位

南京理工大学;

展开▼
授予单位南京理工大学;
学科计算机技术
授予学位硕士
导师姓名夏睿;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
情感分类; 半监督机器学习; 自由文本; 信息挖掘;

相似文献

中文文献
外文文献
专利

1. 基于变分自编码的半监督微博文本情感分析 [J] . 韩萍 ,刘爽 ,贾云飞 . 计算机应用与软件 . 2021,第012期
2. 基于机器学习与情感词典的文本主题概括及情感分析 [J] . 宋祖康 ,阎瑞霞 ,辜丽琼 . 软件导刊 . 2019,第004期
3. 基于机器学习的社交媒体文本情感分析研究 [J] . 严军超 ,赵志豪 ,赵瑞 . 信息与电脑 . 2019,第020期
4. 基于机器学习与情感词典的文本主题概括及情感分析 [J] . 宋祖康1 ,阎瑞霞1 ,辜丽琼1 . 软件导刊 . 2019,第004期
5. 基于数据挖掘技术的文本情感分析技术研究 [J] . 章蓬伟 ,贾钰峰 ,刘强 . 信息通信 . 2020,第001期
6. 词典与机器学习方法相结合的维吾尔语文本情感分析 [C] . Rexidanmu Tuerhongtai ,热西旦木·吐尔洪太 ,Wushour Silamu . 第十五届全国计算语言学学术会议（CCL2016）暨第四届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD-2016） . -1
7. 半监督的微博文本情感分析方法研究 [A] . 刘爽 . 2020

基于半监督机器学习的文本情感分析技术

目录

摘要

著录项

相似文献

相关主题

期刊订阅