首页> 外国专利> Method and device using wikipedia link structure to generate chinese language concept vector

Method and device using wikipedia link structure to generate chinese language concept vector

机译:利用维基百科链接结构生成中文概念向量的方法和装置

摘要

The present invention provides a method and device using a Wikipedia link structure to generate a Chinese language concept vector, the method comprising: constructing a link information database according to a title concept and/or a link concept in a Chinese-language Wikipedia page; respectively constructing positive training examples and negative training examples with respect to whether a link concept is present in link information database samples, selecting a fixed quantity of positive training examples and negative training examples to create a training dataset; creating a concept vector model, wherein the model comprises an input layer, an embedding layer, a concept vector operation layer and an output layer; and using the training dataset to train the concept vector model and extracting a concept vector from the concept vector model.
机译:本发明提供一种使用维基百科链接结构生成中文概念向量的方法和装置,该方法包括:根据中文维基百科页面中的标题概念和/或链接概念,构建链接信息数据库;以及关于在链接信息数据库样本中是否存在链接概念,分别构造正训练例和负训练例,选择一定数量的正训练例和负训练例,建立训练数据集;创建概念向量模型,所述模型包括输入层,嵌入层,概​​念向量操作层和输出层;使用训练数据集训练概念向量模型,并从概念向量模型中提取概念向量。

著录项

  • 公开/公告号AU2018388932A1

    专利类型

  • 公开/公告日2020-01-23

    原文格式PDF

  • 申请/专利权人 QILU UNIVERSITY OF TECHNOLOGY;

    申请/专利号AU20180388932

  • 发明设计人 LU WENPENG;

    申请日2018-10-26

  • 分类号G06F40/20;

  • 国家 AU

  • 入库时间 2022-08-21 11:12:13

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号