基于近似文本分析的意见挖掘

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文对如何将部分解析技术引入意见挖掘，以提高分析的有效性问题进行了研究，其成果概括如下： (1)提出了基于部分解析的超解析方法及其增量式实现近似文本分析(ATA)(见第2章)。超解析通过放宽归约的严格程度(即允许非紧邻的成份进行归约，允许一个语言成份参与多个归约关系)，从而最大限度地寻找关于给定文本(或文本片段)的各种可能解释。为了优化归约时对有效语言成份组合穷举的过程，提出了候选者队列算法(CLA)。作为超解析的实现，本文提出近似文本分析，其系统由两部分构成：分析部件与广义归约部件。分析部件以缓冲队列作为核心的数据结构，从而将超解析的问题转化为了广度优先的搜索问题。而广义归约部件是CLA算法的增量式实现，负责语言成份的归约。 (2)提出了基于“近似文本分析”的情感分类方法ATA-SC，及其软件实现ATAFilter (见第3章)。ATA-SC方法考虑了实体词汇与情感词汇之间的语义关联，因此对于情感的识别能力要强于基于单对象假设的情感分类方法。而情感分类模块ATAFilter已集成于邮件过滤软件VIHunter中，在技术测试中展示了良好的性能，同时在实际应用中也获得令人满意的效果，取得了较好的社会效益。 (3)提出了一种新的意见抽取任务即意见实例抽取(OIE)，及其解决方法FC-OIE；提出了基于位置线索的语义关系识别(sARPC)方法，用于在FC-OIE中识别对象与特性之间语义关联(见第4章)。意见实例抽取任务的目标是保持意见表达的数据结构与源文本之间的关联，使得我们可以通过考察意见元组中各构成要素在原文中的地位，来发掘更深层次的信息。为了解决这一新的抽取任务，FC-OIE采取的策略是：通过SARPC方法为每个特性实例寻找语义关联最强的对象实例，构成“对象实例一特性实例”对偶；对于每个对偶，通过ATA-SC对所含的对象实例与特性实例周围的文本进行情感分析，判断语义方向。 (4)提出并实现了用于意见实例抽取与检索的意见搜索系统(OSS)(见第5章)。OSS的目的是从网络评论中抽取意见实例，并根据用户的检索兴趣进行反馈。该系统通过网络爬虫从互联网上抓取评论网页，通过文本清洗得到正文；然后以FC-OIE技术从文本中抽取意见实例，构成意见库；最后通过人机交互将意见库中的信息直观地反馈给系统的用户。

著录项

作者
刘健;
展开▼
作者单位

上海大学;

展开▼
授予单位上海大学;
学科控制理论与控制工程
授予学位博士
导师姓名吴耿锋;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动控制、自动控制系统 ;
关键词
意见挖掘; 过滤软件; 数据结构; 搜索系统;

相似文献

中文文献
外文文献
专利

1. 基于微博数据挖掘的“新冠疫情”评论文本分析 [J] . 岳宗朴 ,刘彩 ,李莹 . 品位·经典 . 2020 ,第012期
2. 基于文本分析技术挖掘工程重复立项问题的研究 [J] . 马博 ,刘森 ,黎晚晴 . 经济管理文摘 . 2020 ,第5期
3. 基于微博数据挖掘的"杜嘉班纳辱华"事件评论文本分析 [J] . 杨晨馨 . 新闻研究导刊 . 2019 ,第024期
4. 基于可视化数据挖掘的管理科学科技文本分析研究 [J] . 任智军 ,朱东华 ,荆雷 . 科学学与科学技术管理 . 2006 ,第1期
5. 基于NVivo的我国地方政府贯彻《国务院办公厅关于促进3岁以下婴幼儿照护服务发展的指导意见》的政策文本分析 [J] . 徐珊 ,张利洪 . 成都师范学院学报 . 2021 ,第012期
6. 突发性事件中微博场域的舆论协商与对抗——基于政府、媒体、意见领袖微博在天津滨海新区爆炸案中的文本分析 [C] . 孙志鹏 . 安徽省第七届新闻传播学科研究生论坛 . 2015
7. 环境治理中地方政府的行为偏差及其矫正策略研究——基于中央督查组反馈意见的文本分析 [A] . 周梦灵 . 2019

基于近似文本分析的意见挖掘

目录

摘要

著录项

相似文献

相关主题

期刊订阅