首页> 中国专利> 一种基于主题模型的跨语言层次分类体系匹配方法

一种基于主题模型的跨语言层次分类体系匹配方法

摘要

本发明公开一种基于主题模型的跨语言层次分类体系匹配方法,首先根据给定的两个不同语言层次分类体系产生相对应的背景文本,并对每个分类候选值进行预筛选;然后使用先前产生的背景文本作为语料库,使用一种基于主题模型的训练方法对每个分类生成其在语料库中对应的高维主题分布,接下来采用典型关联分析算法对两种不同语言的语料库对应的高维主题分布进行空间向量映射,最后对映射后每个分类的每个预筛选候选值进行计算其余弦相似度,并判断该候选值是否可以作为该分类的一个最相关分类。本发明能够为一种语言的层次分类体系中的每个分类识别其在另一种语言的层次分类体系中最相关的分类。

著录项

  • 公开/公告号CN107391565B

    专利类型发明专利

  • 公开/公告日2020-11-03

    原文格式PDF

  • 申请/专利权人 东南大学;

    申请/专利号CN201710441927.2

  • 发明设计人 漆桂林;崔轩;吴天星;

    申请日2017-06-13

  • 分类号G06F16/35(20190101);G06F16/335(20190101);G06F16/36(20190101);G06F16/903(20190101);

  • 代理机构32204 南京苏高专利商标事务所(普通合伙);

  • 代理人唐红

  • 地址 210000 江苏省南京市玄武区四牌楼2号

  • 入库时间 2022-08-23 11:20:01

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号