要解决的问题:提供一种词向量生成装置,用于存储所有不同词与任意词的共现信息,抑制共现向量的维数,并生成共现向量以减少通过抑制同现向量的维数来处理同现向量的计算复杂度,并提供词向量生成方法,程序和记录介质。
解决方案:单词向量生成设备配置为将N个成分中的一些与单词词典中的每个单词相关联,以形态分析输入文本,以在获得的一组不同单词与单词之间生成共现矩阵。 N个元素的集合,并将通过将任意单词A与与文本的预定范围内的单词相关联的任意分量B共同出现的频率加到文本中的预定范围内而计算出的值存储到文本中的元素中
COPYRIGHT:(C)2010,JPO&INPIT对应于单词A和成分B的共现矩阵。
公开/公告号JP5057525B2
专利类型
公开/公告日2012-10-24
原文格式PDF
申请/专利权人 日本電信電話株式会社;
申请/专利号JP20090039472
申请日2009-02-23
分类号G06F17/30;G06F17/27;
国家 JP
入库时间 2022-08-21 17:40:49