首页> 中文会议>第二届全国学生计算语言学研讨会 >基于一元语法模型的中文话题追踪

基于一元语法模型的中文话题追踪

摘要

话题追踪(topic tracking)的目的是监控新闻故事流识别出与预先给定几个新闻故事表述的话题相关的后继故事.本文采用一元语法模型对中文故事进行话题追踪,并分析了影响中文话题追踪性能的3个因素:特征数目、分词技术、命名实体识别技术.实验结果显示选取适当的特征数目、使用好的分词技术、使用命名实体识别技术都能改进中文话题追踪系统的性能.本文选用TDT3语料作为测试语料,系统达到最好的追踪性能时,在漏报率为4.0﹪的情况下,误报率仅为1.8﹪,系统最小开销为0.0029,Norm(C<,track>)为0.1239.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号