首页> 外文会议>SOUTHEASTCON >Judging Whether a Document Changes in Subject
【24h】

Judging Whether a Document Changes in Subject

机译:判断文档是否发生了主题

获取原文

摘要

This paper describes a method for determining whether a document is composed of text related to a single subject or text that changes subjects. The algorithm involves dividing the document into five equal parts and measuring the text similarity of the different sections with one another. Documents that drift in subject are shown to have a higher standard deviation of similarity values than documents that remain on one subject. This method requires a threshold value that is specific to the domain to work properly.
机译:本文介绍了一种确定文档是否由与更改主题的单个主题或文本相关的文本组成的方法。该算法涉及将文档划分为五个相等的部分并彼此测量不同部分的文本相似性。漂移在拍摄对象中的文档被示出比保留在一个主题上的文档具有更高的标准偏差。此方法需要特定于域的阈值以正常工作。

著录项

  • 来源
    《SOUTHEASTCON》|2009年||共6页
  • 会议地点
  • 作者

    Colin Nicholson;

  • 作者单位
  • 会议组织
  • 原文格式 PDF
  • 正文语种
  • 中图分类 TP3-53;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号