首页> 中国专利> 一种非标准词类判别方法及计算机可读存储介质

一种非标准词类判别方法及计算机可读存储介质

摘要

本发明提供一种非标准词类判别方法及计算机可读存储介质,方法包括:输入的包含非标准词的完整中文句子的字符序列并与非标准词的匹配规则以及中文词典进行匹配得到所有可能的候选的非标准词和潜在的中文词语;将上述内容组织成一个序列,获取字符序列中每个字符的字符嵌入;获取每个潜在的中文词语和每个候选的非标准词的词嵌入;从字符序列中每个字符、潜在的中文词语和候选的非标准词的头和尾位置得到的相对位置编码,基于字符嵌入、词嵌入及相对位置编码获取包括字符序列中的每个字符、每个潜在的中文词语和候选的非标准词构成的序列的上下文特征表示;基于上下文特征表示预测每一个候选的非标准词的类别;提高非标准词分类的效率和准确率。

著录项

  • 公开/公告号CN114444492A

    专利类型发明专利

  • 公开/公告日2022-05-06

    原文格式PDF

  • 申请/专利权人 清华大学深圳国际研究生院;

    申请/专利号CN202111567719.X

  • 发明设计人 吴志勇;戴文琳;宋长河;

    申请日2021-12-21

  • 分类号G06F40/284;G06F40/242;G06F40/166;G06N3/02;

  • 代理机构

  • 代理人

  • 地址 518055 广东省深圳市南山区西丽街道深圳大学城清华校区A栋二楼

  • 入库时间 2023-06-19 15:11:55

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-05-06

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号