基于条件随机域和语义类的中文组块分析方法

孙广路; 郎非; 薛一波

首页> 中文期刊> 《哈尔滨工业大学学报》 >基于条件随机域和语义类的中文组块分析方法

基于条件随机域和语义类的中文组块分析方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了解决中文组块分析精度不高和未利用词的语义信息的问题,提出了一种基于条件随机域模型和语义类的中文组块分析方法.该方法通过研究中文组块分析任务及其序列化特性,采用条件随机域模型融合不同类型特征,克服标记偏置问题,将语义词典中抽取的语义类特征应用到中文组块分析中,提高分析精度.实验表明,该方法取得了F值为92.77%的中文组块分析性能,实验进一步还表明了特征模板的选取和训练语料的规模对于分析性能的影响.%To improve the accuracy of Chinese chunking and utilize the semantic information of words,a new Chinese chunking method is proposed based on conditional random fields and semantic classes.Through the analysis of Chinese chunking task and its sequential characteristics,conditional random fields that could incorporate various types of features were applied to overcome the label bias problem.Semantic features were utilized to improve the chunking performance.Experimental results show that the algorithm achieves impressive accuracy of 92.77% in terms of the F-score.A further experiment indicates the effects of feature template selection and training data′s scales on the aspect of chunking performance.

著录项

来源
《哈尔滨工业大学学报》 |2011年第7期|135-139|共5页
作者
孙广路; 郎非; 薛一波;
展开▼
作者单位

清华大学信息技术研究院,北京100084;

哈尔滨理工大学外国语学院,哈尔滨150080;

清华大学信息技术研究院,北京100084;

展开▼
原文格式 PDF
正文语种 chi
中图分类翻译机;
关键词
条件随机域; 中文组块分析; 特征模板; 语义词典;

相似文献

中文文献
外文文献
专利

1. 基于条件随机场的多线索中文语义角色标注 [J] . 王一成 ,万福成 ,马宁 . 云南大学学报：自然科学版 . 2020,第3期
2. 基于条件随机域模型的中文实体关系抽取 [J] . 周晶 . 计算机工程 . 2010,第024期
3. 中文名实体识别:基于词触发对的条件随机域方法 [J] . 赵健 ,王晓龙 ,关毅 . 高技术通讯 . 2006,第008期
4. 基于条件随机场的中文情感分析方法比较研究 [J] . 王茵 ,周学广 ,陆健 . 计算机与数字工程 . 2017,第009期
5. 基于SVM的快速中文组块分析方法 [J] . 孔令鹏 ,张琛 ,张权 . 现代电子技术 . 2012,第021期
6. 基于条件随机域的中文长地名结构标注 [C] . 孙宏 ,王文俊 ,贺瑞芳 . 第六届全国信息检索学术会议 . 2010
7. 基于条件随机域模型的中文地名识别的研究 [A] . 马龙 . 2009

基于条件随机域和语义类的中文组块分析方法

摘要

著录项

相似文献

相关主题

期刊订阅