首页> 中国专利> 基于前缀树合并的中文文本纠错方法

基于前缀树合并的中文文本纠错方法

摘要

本发明提出了一种基于前缀树合并的中文文本纠错方法。首先使用LSTM(长短期记忆网络)作为基础网络提取更深层次的中文文本信息。区别于传统的基于N元模型的纠错方法,使用LSTM语言模型进行候选句合理性打分,并把相似度较高的候选句合并成前缀树型结构。然后,采用多线程流水线方案完成语言模型的概率计算,计算出每个候选句分词的概率。相比较传统的文本纠错技术而言,能够更好地结合句子语义来进行句子合理性打分。此外,本发明能够有效的减少LSTM语言模型的计算量,大大提高中文文本的纠错速率,能够很好地应用到中文文本自动校正的相关工程里。

著录项

  • 公开/公告号CN112597771A

    专利类型发明专利

  • 公开/公告日2021-04-02

    原文格式PDF

  • 申请/专利权人 重庆邮电大学;

    申请/专利号CN202011602322.5

  • 发明设计人 曾浩;杨宗宇;李红艳;

    申请日2020-12-29

  • 分类号G06F40/289(20200101);G06F40/30(20200101);G06N3/04(20060101);

  • 代理机构

  • 代理人

  • 地址 400065 重庆市南岸区崇文路2号

  • 入库时间 2023-06-19 10:27:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-03-17

    发明专利申请公布后的视为撤回 IPC(主分类):G06F40/289 专利申请号:2020116023225 申请公布日:20210402

    发明专利申请公布后的视为撤回

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号