要解决的问题:提高小主题部分和大主题部分的检测精度。
解决方案:在这种方法中,对文本进行形态分析并分解为单词,然后检索存储单词向量的概念库,以获得与每个单词相对应的向量。在每个部分中分解与构成文本的至少两个或更多个单词相对应的单词向量的重心,并在每个部分中计算单词向量之间的距离,以计算由单词向量和每个部分的距离组成的成本值。成本值被存储在存储装置中,并且从各部分的所有组合中指定使成本值最小的部分的组合。
版权:(C)2004,日本特许厅和日本国家唱片公司
公开/公告号JP2004234512A
专利类型
公开/公告日2004-08-19
原文格式PDF
申请/专利权人 NIPPON TELEGR & TELEPH CORP NTT;
申请/专利号JP20030024476
发明设计人 BESSHO KATSUTO;
申请日2003-01-31
分类号G06F17/21;G06F17/27;G06F17/30;
国家 JP
入库时间 2022-08-21 23:34:37