基于HowNet的中文语义倾向性分析技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

让计算机理解人类的情感是人工智能的最高境界，对文本进行正面、负面的语义倾向性分析是基础，也是目前富有挑战性的工作。在Web2.0时代，海量的网络评论蕴涵着很多有价值的信息，为及时、自动、智能、准确地发现这些信息，迫切需要应用语义倾向性分析技术来解决这一问题。
　　语义倾向性分析目前最大的价值在于从某一个主题的评论中分析得出总结性的结果，这首先涉及到从互联网上获取大量的评论数据，可行的策略是使用并行技术。并行网页获取技术已经得到深入研究，但是研究集中在为通用搜索引擎的网页搜集部分服务，目标一般是全球的网页。针对一个主题的评论通常集中在一些站点，网页也呈现高度结构化。因此针对这样的应用，本文设计了动态任务分配模型来并行下载网络评论。基于关系数据库和豆瓣网的实现证明了该模型的蜘蛛设计简单、对运行蜘蛛的机器要求低、可伸缩性好。该模型同样可以用于垂直搜索引擎的网页搜集部分。
　　语义倾向性分析离不开情感知识库，而中文研究中目前尚无一个完善的情感词典。HowNet虽然提供了相当数量的情感词，但在本文的语义倾向性分析中尚不能直接应用。因此本文研究了基于HowNet的情感词典的构建。
　　在篇章的语义倾向性分析方面，本文认为语言学的知识、规则可以用来提高统计学习算法的效果，因而基于情感词典，提出了属性加权的统计学习算法来进行篇章的情感分析，增强情感词在文本倾向性分类中的贡献，具体实现了属性加权的朴素贝叶斯和属性加权的评分算法。针对中文网络评论的语义倾向性分析实验结果表明：属性加权的统计学习算法改进了倾向性分类的效果。

著录项

作者
周德友;
展开▼
作者单位

东北大学;

展开▼
授予单位东北大学;
学科计算机应用技术
授予学位硕士
导师姓名王大玲;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类检索机 ;
关键词
中文语义分析; 并行技术; 搜索引擎; 倾向性分类;

相似文献

中文文献
外文文献
专利

1. 基于语义理解的中文博文倾向性分析 [J] . 何凤英 . 计算机应用 . 2011 ,第008期
2. 基于HowNet的语义表示学习 [J] . 朱靖雯 ,杨玉基 ,许斌 . 中文信息学报 . 2019 ,第003期
3. 一种基于HowNet语义计算的综合特征词权重计算方法 [J] . 孙丽莉 ,张小刚 . 统计与决策 . 2018 ,第18期
4. 基于HowNet的术语语义知识库构建技术 [J] . 王羊羊 ,陈刚 ,蔡东风 . 沈阳航空航天大学学报 . 2016 ,第004期
5. 基于HowNet的术语语义知识库构建技术 [J] . 王羊羊1 ,陈刚2 ,蔡东风1 . 沈阳航空航天大学学报 . 2016 ,第004期
6. 基于hownet概念获取的中文自动文摘系统 [C] . 王萌 ,何婷婷 ,王晓荣 . 第二届全国学生计算语言学研讨会 . 2004
7. 基于HowNet语义的中文信息抽取及摘要生成方法 [A] . 李丽 . 2015

基于HowNet的中文语义倾向性分析技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅