首页> 外国专利> MACHINE LEARNING DIALECT IDENTIFICATION

MACHINE LEARNING DIALECT IDENTIFICATION

机译:机器学习方言识别

摘要

Technology is disclosed for creating and tuning classifiers for language dialects and for generating dialect-specific language modules. A computing device can receive an initial training data set as a current training data set. The selection process for the initial training data set can be achieved by receiving one or more initial content items, establishing dialect parameters of each of the initial content items, and sorting each of the initial content items into one or more dialect groups based on the established dialect parameters. The computing device can generate, based on the initial training data set, a dialect classifier configured to detect language dialects of content items to be classified. The computing device can augment the current training data set with additional training data by applying the dialect classifier to candidate content items. The computing device can then update the dialect classifier based on the augmented current training data set.
机译:公开了用于创建和调整用于语言方言的分类器以及用于生成方言特定的语言模块的技术。计算设备可以接收初始训练数据集作为当前训练数据集。初始训练数据集的选择过程可以通过接收一个或多个初始内容项,建立每个初始内容项的方言参数以及基于所建立的每个初始内容项分类为一个或多个方言组来实现方言参数。计算设备可以基于初始训练数据集来生成方言分类器,该方言分类器被配置为检测要分类的内容项的语言方言。通过将方言分类器应用于候选内容项,计算设备可以用附加训练数据来扩充当前训练数据集。然后,计算设备可以基于增强的当前训练数据集来更新方言分类器。

著录项

  • 公开/公告号US2019013011A1

    专利类型

  • 公开/公告日2019-01-10

    原文格式PDF

  • 申请/专利权人 FACEBOOK INC.;

    申请/专利号US201815866420

  • 发明设计人 FEI HUANG;

    申请日2018-01-09

  • 分类号G10L15/06;G10L15;G06F17/27;G10L15/26;G06F17/28;

  • 国家 US

  • 入库时间 2022-08-21 12:04:00

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号