首页> 外国专利> CROSS-LANGUAGE TEXT CLUSTERING

CROSS-LANGUAGE TEXT CLUSTERING

机译:跨语言文本聚类

摘要

Methods are described for performing clustering or classification of texts of different languages. Language-independent semantic structures (LISS) are constructed before clustering is performed. These structures reflect lexical, morphological, syntactic, and semantic properties of texts. The methods suggested are able to perform cross-language text clustering which is based on the meaning derived from texts. The methods are applicable to genre classification, topic detection, news analysis, authorship analysis, internet searches, and creating corpora for other tasks, etc.
机译:描述了用于执行不同语言的文本的聚类或分类的方法。在执行聚类之前,先构建与语言无关的语义结构(LISS)。这些结构反映了文本的词汇,形态,句法和语义属性。所建议的方法能够执行跨语言的文本聚类,该聚类基于从文本得出的含义。该方法适用于类型分类,主题检测,新闻分析,作者身份分析,互联网搜索以及为其他任务创建语料库等。

著录项

  • 公开/公告号US2013041652A1

    专利类型

  • 公开/公告日2013-02-14

    原文格式PDF

  • 申请/专利权人 ABBYY INFOPOISK LLC;

    申请/专利号US201213648527

  • 发明设计人 KONSTANTIN ZUEV;TATIANA DANIELYAN;

    申请日2012-10-10

  • 分类号G06F17/20;G06F17/27;

  • 国家 US

  • 入库时间 2022-08-21 16:50:03

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号