中文微博实体链接研究

     

摘要

针对2013年CCF自然语言处理与中文计算会议(NLP&CC2013)中文微博实体链接的任务,使用CCF提供的新浪微博数据作为训练和测试数据,利用西南交通大学耶宝智慧中文分词平台作为自然语言预处理工具,提出一种实体链接的方法。该方法应用改进的拼音编辑距离算法和后缀词表匹配法,提出实体聚类消歧与基于百度百科词频的同类实体消歧相结合的消歧方法。在2013年CCF中文微博实体链接评测任务中正确结果的准确率为0.8838,在10个参赛队伍中名列第3位。表明该方法有效并可以适应文本中的噪声。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号