首页> 中文期刊> 《电子学报》 >中英命名实体识别及对齐中的中文分词优化

中英命名实体识别及对齐中的中文分词优化

         

摘要

Bilingual named entity recognition and alignment are important for many natural language processing.Named enti-ty translation can improve a lot the performance of the system like statistical machine translation or cross-language information re-trieval.Quality of Chinese word segmentation does have a big impact over named entity (NE)recognition and bilingual NE extrac-tion.Bilingual alignment information provides indications for NE recognition and word segmentation.Accordingly,based on the characteristics of NE recognition,NE alignment,and word segmentation,this paper proposes an optimization algorithm of Chinese word segmentation.By correcting word segmentation error and adjusting word segmentation granularity,the optimization algorithm can enhance extraction effect of Chinese-English NE translation and performance of statistical machine translation.The experimental result on Chinese-English news corpus shows the efficiency of our algorithm.%中文分词结果对中英命名实体识别及对齐有着直接的影响,本文提出了一种命名实体识别及对齐中的中文分词优化方法。该方法利用实体词汇的对齐信息,首先修正命名实体识别结果,然后根据实体对齐结果调整分词粒度、修正错误分词。分词优化后的结果使得双语命名实体尽可能多地实现一一对应,进而提高中英命名实体翻译抽取和统计机器翻译的效果。实验结果表明了本文优化方法的有效性。

著录项

  • 来源
    《电子学报》 |2015年第8期|1481-1487|共7页
  • 作者单位

    南京大学计算机软件新技术国家重点实验室;

    江苏南京 210023;

    南京大学计算机科学与技术系;

    江苏南京 210023;

    南京大学计算机软件新技术国家重点实验室;

    江苏南京 210023;

    南京大学计算机科学与技术系;

    江苏南京 210023;

    南京大学计算机软件新技术国家重点实验室;

    江苏南京 210023;

    南京大学计算机科学与技术系;

    江苏南京 210023;

    南京大学计算机软件新技术国家重点实验室;

    江苏南京 210023;

    南京大学计算机科学与技术系;

    江苏南京 210023;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    分词; 命名实体识别; 双语对齐; 机器翻译;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号