首页> 中国专利> 一种中文领域下基于词形和语义的负样本生成方法及装置

一种中文领域下基于词形和语义的负样本生成方法及装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开一种中文领域下基于词形和语义的负样本生成方法及装置，该方法包括：提取出中文百科知识图谱中的实体以及其周围一跳内的所有关系，将关系拼接在一起形成实体的描述信息文本；利用在中文语料上训练过的Word2Vec对实体和描述信息文本进行向量表示；将目标匹配实体和全部实体进行相似度匹配，返回符合条件的实体作为语义相似度候选实体集；将目标匹配实体再次和全部实体进行编辑距离的计算，返回符合条件的实体作为词形相似度候选实体集；根据语义相似度候选实体集和词形相似度候选实体集进行高混淆度负样本选取。本发明联合了词形相似度和语义相似度进行负样本选取，可以加速模型的收敛速度，还可以使模型训练出良好的决策边界。

著录项

公开/公告号CN115310523A

专利类型发明专利
公开/公告日2022-11-08

原文格式PDF
申请/专利权人中国人民解放军战略支援部队信息工程大学;
展开▼

申请/专利号CN202210883558.3
发明设计人李珠峰;刘铄;周刚;卢记仓;胡学先;兰明敬;王婧;张凯翔;张凤娟;陈静;夏毅;
展开▼

申请日2022-07-26
分类号G06K9/62;G06F40/35;G06F40/279;
代理机构郑州大通专利商标代理有限公司;
代理人张立强
地址 450000 河南省郑州市高新区科学大道62号
入库时间 2023-06-19 17:30:31

法律信息

法律状态公告日

法律状态信息

法律状态
2022-11-08

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 基于知识增强BERT的字粒度中文语义近似对抗样本生成方法 [P] . 中国专利： CN115309898A . 2022-11-08
2. 一种基于领域术语和关键句的中文问题自动生成方法及装置 [P] . 中国专利： CN113705208A . 2021-11-26
3. System and method of video Telecommunication to compress and decompress The Video Data of color digitalThe present Invention relates to a method for compressing a digital color Video Data in a Telecommunication System Video that has a means for generating a video signal that is uN means for generating a video signal to a Plurality of color video framerate,With Every Frame Image consisting of a Plurality of Scanning Lines composed of a Plurality of pixelsAnd each pixel in the image Frame consists of the components of color digitalThe Method comprises the steps of determining a function); Luminance pixel based on at least one of the three components of color digital(b) identify at least one parameter decision for at least a significant portion of pixels in the scanlines of a Table of current image based on the difference ofThe role in Luminance between the pixels at a Predetermined distance from at least one pixel in each Scan line and at least a (c) comparison of decision parameter with [P] . MX166516B . 1993-01-11

机译：用于压缩和解压缩彩色数字视频数据的视频电信系统和方法技术领域本发明涉及一种用于压缩电信系统视频中数字彩色视频数据的方法，该方法具有用于生成视频信号的装置，该装置是用于生成视频信号的装置。将视频信号转换为多个彩色视频帧速率，每个帧图像由多个扫描线组成，扫描线由多个像素组成，图像中的每个像素由彩色数字分量组成（该方法包括确定功能的步骤）;基于彩色数字（b）的三个分量中的至少一个的亮度像素，基于两个像素之间的亮度差异，针对当前图像表的扫描线中的至少大部分像素，确定至少一个参数决策。与每条扫描线中至少一个像素相距预定距离的像素，以及至少（c）比较决策参数与
4. AN IMAGE TRANING APPARATUS EXTRACTING HARD NEGATIVE SAMPLES BEING USED TO TRAINING A NEURAL NETWORK BASED ON SAMPLING AND A THRESHOLD ADJUSTING ADAPTIVELY AND A METHOD PERFORMED BY THE IMAGE TRAINING APPARATUS [P] . 韩国专利： KR102167011B1 . 2020-10-16

机译：一种基于自适应采样和阈值调整的用于训练神经网络的硬负样本的图像跟踪装置及由图像训练装置执行的方法
5. AN IMAGE TRANING APPARATUS EXTRACTING HARD NEGATIVE SAMPLES BEING USED TO TRAINING A NEURAL NETWORK BASED ON SAMPLING AND A THRESHOLD ADJUSTING ADAPTIVELY AND A METHOD PERFORMED BY THE IMAGE TRAINING APPARATUS [P] . 韩国专利： KR20190107984A . 2019-09-23

机译：一种基于自适应采样和阈值调整的用于训练神经网络的硬负样本的图像跟踪装置及由图像训练装置执行的方法