首页> 中国专利> N-Gram模型的建立方法

N-Gram模型的建立方法

摘要

本发明公开了一种N‑Gram模型的建立方法,包括获取原始语料;对原始语料进行分词;对分词结果进行单词统计;对N‑Gram模型进行平滑处理,得到最终的N‑Gram模型。本发明方法通过建立Witten‑Bell平滑对N‑Gram模型进行平滑,同时采用分布式平台计算建模过程中的参数,并采用Hbase数据库对计算的参数进行存储和读取,因此本发明方法在应对海量训练语料的情况下,其拓展性非常好,而且方法的建模速度和查询速度均较快。

著录项

  • 公开/公告号CN108021712B

    专利类型发明专利

  • 公开/公告日2021-12-31

    原文格式PDF

  • 申请/专利权人 中南大学;

    申请/专利号CN201711464797.0

  • 申请日2017-12-28

  • 分类号G06F16/36(20190101);G06F16/953(20190101);G06F40/284(20200101);

  • 代理机构43001 长沙永星专利商标事务所(普通合伙);

  • 代理人周咏;米中业

  • 地址 410083 湖南省长沙市岳麓区麓山南路932号

  • 入库时间 2022-08-23 12:53:42

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号