级联中文组块识别

秦颖; 王小捷; 钟义信

首页> 中文期刊> 《北京邮电大学学报》 >级联中文组块识别

级联中文组块识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

文献数据库（团队版） >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

基于统计方法的中文组块研究大多借鉴CoNLL2000英文组块的思想,建立了组块表示的BIO模型,并将组块识别任务作为一种为词序列标注的多分类问题.为降低分类复杂度,采取了一种分解识别法,即先识别组块的边界,再进行组块类别判定.基于条件随机场(CRF)构建了级联组块识别器,实验数据集采用宾州大学中文树库(CTB5.1).在特征选择上,借鉴了中文分词特征选择的方法.5倍交叉验证的实验结果为:组块边界识别的F1值为95.05%;类型识别的准确率为99.43%;整体F1值为93.58%.该方法提高了系统性能,缩短了学习器的训练时间.

著录项

来源
《北京邮电大学学报》 |2008年第1期|14-17|共4页
作者
秦颖; 王小捷; 钟义信;
展开▼
作者单位

北京邮电大学信息工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
中文组块; 边界识别; 类别识别; 条件随机场;

相似文献

中文文献
外文文献
专利

1. 基于组块分析技术的中文机构名称识别 [J] . 尹继豪 ,樊孝忠 ,赵攀超 . 哈尔滨工程大学学报 . 2006,第B07期
2. 基于组块分析技术的中文机构名称识别 [J] . 尹继豪 ,樊孝忠 ,赵攀超 . 哈尔滨工程大学学报 . 2006,第0z1期
3. Co-training机器学习方法在中文组块识别中的应用 [J] . 刘世岳 ,李珩 ,张俐 . 中文信息学报 . 2005,第003期
4. 中文语义组块自动抽取方法 [J] . 钟茂生 ,荆佳琦 . 计算机应用研究 . 2018,第002期
5. 基于中文电子病历的跨科室组块分析 [J] . 戴雪 ,蒋志鹏 ,关毅 . 计算机应用研究 . 2017,第007期
6. 基于组块分析技术的中文机构名称识别 [C] . 尹继豪 ,樊孝忠 ,赵攀超 . 第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06) . 2006
7. 基于Co-training方法的中文组块识别的研究 [A] . 刘世岳 . 2004

级联中文组块识别

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅