首页> 中国专利> 一种基于拉丁字母的维吾尔语处理方法和系统

一种基于拉丁字母的维吾尔语处理方法和系统

摘要

本发明提供了一种基于拉丁字母的维吾尔语处理方法和系统,解决现有语言模型训练缺乏有效数据样本无法形成维吾尔词汇特征准确表达的技术问题。方法包括:建立维吾尔语料的字母索引,根据所述字母索引形成所述维吾尔语料的基本向量,利用所述基本向量形成维吾尔语的语句训练集;通过所述语句训练集对循环神经网络进行训练形成维吾尔语句模型;根据所述维吾尔语句模型获取维吾尔词汇的语义隐性特征向量形成词向量。有利于形成与实际语义处理任务相适应的向量维度空间,为具体语义处理任务提供良好的样本衡量基础。避免了现有循环神经网络结构针对单词级别的维吾尔隐性相关性缺乏有效识别的严重缺陷。

著录项

  • 公开/公告号CN111428509A

    专利类型发明专利

  • 公开/公告日2020-07-17

    原文格式PDF

  • 申请/专利号CN202010147929.2

  • 发明设计人 钱泓锦;黄真;窦志成;刘占亮;

    申请日2020-03-05

  • 分类号G06F40/30(20200101);G06F40/289(20200101);G06F40/284(20200101);G06F40/129(20200101);G06F16/31(20190101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11719 北京天方智力知识产权代理事务所(普通合伙);

  • 代理人张廷利

  • 地址 100080 北京市海淀区丹棱街1号院1号楼25层2510室

  • 入库时间 2023-12-17 10:58:52

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-11

    实质审查的生效 IPC(主分类):G06F40/30 申请日:20200305

    实质审查的生效

  • 2020-07-17

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号