首页> 中文会议>第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 >面向中朝跨语言文本分类的双语主题词嵌入模型的研究

面向中朝跨语言文本分类的双语主题词嵌入模型的研究

页面导航

摘要
著录项
相似文献
相关主题

摘要

日渐丰富的少数民族跨语言文字信息资源,对其进行有效的管理、挖掘与利用有着重要的应用价值.为了解决语言间的差异,解决语言鸿沟问题,针对中朝跨语言文本分类任务,提出了双语主题词嵌入模型.该模型将主题模型与双语词嵌入模型相结合,解决了一词多义引起的歧义性对跨语言文本分类的精度带来的影响.首先,在大规模包含词对齐信息的平行句对中训练双语单词的词嵌入表示;其次,对双语分类语料进行主题模型的建模,并获得双语单词的双语主题词嵌入表示;最后,将双语单词的双语主题词嵌入表示输入至传统文本分类器与深度学习文本分类器,进行模型的训练与分类预测.实验结果表明,在中朝跨语言文本分类任务中Accuracy达到了91.76％,达到了实际应用水平,并且根据双语单词间的相似度进行排序,该文提出的模型可以对一词多义单词的多个词义有很好的表示.

著录项

来源
《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》|2018年|1-9|共9页
会议地点北京
作者
Wang Qi; 王琪; TIAN Mingjie; 田明杰; CUI Rongyi; 崔荣一;
展开▼
作者单位

教育部华中师范大学;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类文字信息处理;
关键词
跨语言文本分类; 双语词嵌入模型; 主题模型;
入库时间 2022-08-17 11:32:32

相似文献

中文文献
外文文献
专利

1. 面向中朝跨语言文本分类的双语主题词嵌入模型的研究 [J] . 王琪 ,田明杰 ,崔荣一 . 中文信息学报 . 2020,第012期
2. 面向跨语言文本分类与标签推荐的带标签双语主题模型的研究 [J] . 田明杰 ,崔荣一 . 计算机应用研究 . 2019,第010期
3. 基于双语主题模型和双语词向量的跨语言知识链接 [J] . 余圆圆 ,巢文涵 ,何跃鹰 . 计算机科学 . 2019,第001期
4. 双语潜在语义对应分析及在跨语言文本分类中的应用研究 [J] . 罗远胜 ,王明文 ,勒中坚 . 情报学报 . 2013,第001期
5. 面向LDA主题模型的文本分类研究进展与趋势 [J] . 赵乐 ,张兴旺 . 计算机系统应用 . 2018,第8期
6. 基于点关联测度矩阵分解的中英跨语言词嵌入 [C] . YU Dong ,于东 ,ZHAO Yan . 第十五届全国计算语言学学术会议（CCL2016）暨第四届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD-2016） . -1
7. 基于双语主题词嵌入模型的中朝跨语言文本分类方法的研究 [A] . 田明杰 . 2019

面向中朝跨语言文本分类的双语主题词嵌入模型的研究

摘要

著录项

相似文献

相关主题

期刊订阅