【24h】

Phrase Matching in XML

机译:XML中的词组匹配

获取原文
获取原文并翻译 | 示例

摘要

Phrase matching is a common IR technique to search text and identify relevant documents in a document collection. Phrase matching in XML presents new challenges as text may be interleaved with arbitrary markup, thwarting search techniques that require strict contiguity or close proximity of keywords. We present a technique for phrase matching in XML that permits dynamic specification of both the phrase to be matched and the markup to be ignored. We develop an effective algorithm for our technique that utilizes inverted indices on phrase words and XML tags. We describe experimental results comparing our algorithm to an indexed-nested loop algorithm that illustrate our algorithm's efficiency.
机译:短语匹配是一种常见的IR技术,用于搜索文本并标识文档集中的相关文档。 XML中的词组匹配提出了新的挑战,因为文本可能与任意标记交织在一起,阻碍了要求严格连续性或关键字紧密接近的搜索技术。我们提出了XML中的词组匹配技术,该技术允许动态指定要匹配的词组和要忽略的标记。我们为我们的技术开发了一种有效的算法,该算法利用短语词和XML标签上的倒排索引。我们描述了将我们的算法与索引嵌套循环算法进行比较的实验结果,该算法说明了我们算法的效率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号