首页> 中国专利> 一种跨领域的双语篇章可比度量化方法

一种跨领域的双语篇章可比度量化方法

摘要

本发明特别涉及一种跨领域的双语篇章可比度量化方法,包括如下步骤:S100、对现有可比语料进行中文分词、英文词性还原、过滤停用词等预处理,训练双语主题模型;S200、预测源语言篇章和目标语言篇章的主题分布,计算不同语言篇章的相关性;S300、通过不同语言词汇的主题分布,计算不同语言词汇的相关性,扩充双语知识在不同领域的适应性,利用词汇计算不同语言篇章的相关性;S400、利用不同语言篇章主题和词汇的相关性,进行不同语言篇章可比度的量化。通过双语主题进行不同语言词汇相关性计算,扩充领域双语知识,提升篇章可比度量化对不同领域的自适应能力,增强篇章可比度量化的效果。

著录项

  • 公开/公告号CN114139559A

    专利类型发明专利

  • 公开/公告日2022-03-04

    原文格式PDF

  • 申请/专利权人 中科合肥技术创新工程院;

    申请/专利号CN202111447702.0

  • 申请日2021-12-01

  • 分类号G06F40/58(20200101);G06F40/216(20200101);G06F40/289(20200101);G06F40/44(20200101);

  • 代理机构34154 合肥九道和专利代理事务所(特殊普通合伙);

  • 代理人胡发丁

  • 地址 230088 安徽省合肥市习友路2666号

  • 入库时间 2023-06-19 14:23:39

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-04

    公开

    发明专利申请公布

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号