建议句识别和建议信息抽取研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

建议是自然语言处理中广泛存在的一种复杂语言现象，其中往往蕴含着丰富有用的信息。在文本中对建议进行挖掘，将其自动识别并抽取关键信息，极大提高了所获信息的价值。目前建议挖掘在工业环境中有助于公司产品或服务提升的决策以及用户产品或服务体验的参考，在自然语言处理领域已经成为一个新的研究热点。总体而言，建议挖掘对工业界和学术界都具有重要意义。　　目前，建议挖掘由于语料的限制仍是探索程度较低的领域。相关研究中，通常将其定义为建议句识别任务。鉴于建议语料还有更细粒度的信息待挖掘，本文首次提出把建议挖掘分成二阶段任务。第一阶段为文本中建议句识别的原有任务（句子分类），第二阶段为建议信息抽取的拓展任务（序列标注）。主要研究内容包括以下两方面：　　①提出了基于BERT的双向长短期记忆网络和胶囊网络结合注意力机制的混合模型对英文语料进行建议句识别。该模型能够克服卷积神经网络无法提取短语语义、位置等深层信息的缺点和双向长短期记忆网络长距离依赖的缺点，融入目标语料预训练的BERT表征更强大的词嵌入。实验表明：在第十三届国际语义评测语料上，基于该模型的建议句识别结果具有较大的提升，且在跨领域文本间具有一定泛化能力。　　②鉴于第二阶段任务语料的缺失，本文自主标注新语料。提出了基于BERT和卷积神经网络双嵌入的双向长短期记忆网络结合混合半马尔可夫条件随机场模型对标注英文语料进行建议信息抽取。该模型能够克服条件随机场严重依赖人工提取特征的缺点，融入上下文和字符级特征的双嵌入，能有效地利用过去和未来的输入特征以及句子级别的标记信息。实验表明：在标注英文语料上，基于该模型的建议信息抽取任务获得了较好的实验结果。

著录项

作者
王慧佳;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科工程(计算机技术)
授予学位硕士
导师姓名伍星;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
建议句识别,信息抽取,混合网络模型,注意力机制,条件随机场,马尔可夫模型;
入库时间 2022-08-17 11:23:12

相似文献

中文文献
外文文献
专利

1. 中文微博观点句识别及要素抽取研究 [J] . 王冠群 ,田雪 ,黄德根 . 数据采集与处理 . 2016,第001期
2. 细颗粒度观点挖掘中的观点句识别与要素抽取研究综述 [J] . 陈锋 . 数字图书馆论坛 . 2015,第010期
3. 基于语义分类的比较句识别与比较要素抽取研究 [J] . 周红照 ,侯明午 ,侯敏 . 中文信息学报 . 2014,第003期
4. 基于CRF算法的汉语比较句识别和关系抽取 [J] . 黄高辉 ,姚天昉 ,刘全升 . 计算机应用研究 . 2010,第006期
5. 中文比较句识别及比较关系抽取 [J] . 宋锐 ,林鸿飞 ,常富洋 . 中文信息学报 . 2009,第002期
6. 细颗粒度观点挖掘中的观点句识别与要素抽取研究综述 [C] . CHEN Feng ,陈锋 . 2015年第六届全国知识组织与知识链接学术交流会 . 2015
7. 中文微博观点句识别及要素抽取研究 [A] . 王冠群 . 2016

建议句识别和建议信息抽取研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅