首页> 外国专利> Variables and method for authorship attribution

Variables and method for authorship attribution

机译:作者身份归属的变量和方法

摘要

A method uses linguistic units of analysis to identify the authorship of a document. The method is useful to determine authorship of brief documents, and in situations where there are less than ten documents per known author, i.e. when there is scarcity of text. The method analyzes parameters such as the syntax, punctuation, and, optionally the average word and paragraph length, and when the parameters are analyzed using statistical methods, obtains a high degree of reliability (90% accuracy). The method can be applicable to numerous languages other than English because the variables selected are characteristic of most languages. The reliability of the method is verified when subjected to a cross-validation statistical analysis.
机译:一种方法使用分析的语言单位来标识文档的作者身份。该方法可用于确定简要文档的作者身份,以及在每个已知作者少于十个文档的情况下,即在文本稀缺时。该方法分析诸如语法,标点符号以及可选的平均单词和段落长度之类的参数,并且当使用统计方法分析这些参数时,可以获得高度的可靠性(> 90%的准确性)。该方法可以适用于英语以外的多种语言,因为选择的变量是大多数语言的特征。进行交叉验证统计分析时,验证了该方法的可靠性。

著录项

  • 公开/公告号US9880995B2

    专利类型

  • 公开/公告日2018-01-30

    原文格式PDF

  • 申请/专利权人 CAROLE E. CHASKI;

    申请/专利号US20060398728

  • 发明设计人 CAROLE E. CHASKI;

    申请日2006-04-06

  • 分类号G06F17/27;G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 12:55:05

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号