首页> 外文会议>International Conference on Advances in Pattern Recognition >A Sequence Labeling Method Using Syntactical and Textual Patterns for Record Linkage
【24h】

A Sequence Labeling Method Using Syntactical and Textual Patterns for Record Linkage

机译:一种使用句法和文本模式进行记录联动的序列标记方法

获取原文
获取外文期刊封面目录资料

摘要

Record linkage is an important application area of text pattern analysis. In this paper we propose a new sequence labeling method that can be used to extract entities from a string for record linkage. The proposed method combines a classifier and a Hidden Markov Model (HMM) to utilize both syntactical and textual information from the string. We first describe the model used in the proposed method and then discuss the parameter estimation for this model. The proposed method incorporates a classifier for handling textual information and integrates the classifier with the HMM statistically by estimating the error probability of the classifier. We applied the proposed method to the bibliographic sequence labeling problem, in which bibliographic components are extracted from reference strings. We compared the proposed method with other methods that use textual or syntactical information alone and showed that the proposed method outperforms them.
机译:唱片链接是文本模式分析的重要应用领域。在本文中,我们提出了一种新的序列标记方法,可用于从字符串中提取实体进行记录链接。该提出的方法组合了分类器和隐藏的Markov模型(HMM)来利用来自字符串的句法和文本信息。我们首先描述所提出的方法中使用的模型,然后讨论该模型的参数估计。该提出的方法包括用于处理文本信息的分类器,并通过估计分类器的误差概率来统计地将分类器与HMM集成。我们将所提出的方法应用于书目序列标记问题,其中从参考串中提取了书目组分。我们将提出的方法与其他使用文本或语法信息的其他方法进行了比较并显示所提出的方法优于它们。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号