首页> 外国专利> SYSTEMATIC MASS NORMALIZATION OF INTERNATIONAL TITLES

SYSTEMATIC MASS NORMALIZATION OF INTERNATIONAL TITLES

机译:国际标题的系统质量标准化

摘要

A system for generating a database of labeled foreign canonical titles includes an interface and a processor. The interface is to receive a title in a second language. The processor is to 1) store a set of n-grams in a first language in a first database; 2) sanitize the title into a sanitize title in the second language; 3) translate the sanitized title into a translated title in the first language; 4) break the translated title into n-grams; 5) determine labels for the n-grams using the first database; and 6) determine label to associate with the title.
机译:用于生成带标签的外国规范标题的数据库的系统包括接口和处理器。该界面将接收第二种语言的标题。处理器将1)以第一语言将一组n-gram存储在第一数据库中; 2)将标题消毒为第二种语言的消毒标题; 3)将经过清理的标题翻译成第一语言的翻译标题; 4)将翻译后的标题分解为n-gram; 5)使用第一个数据库确定n元语法的标签; 6)确定与标题相关的标签。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号