要解决的问题:检测多个主题,并自动生成主题间关系和每个主题的摘要语句。
解决方案:将文本分为单词单元,并检索概念库,以便可以获取与这些单词对应的向量。然后,将文本从一系列单词向量中划分为属于同一主题的块的片段组,并将每个片段视为该片段中包含的单词向量的组,并将片段组进行层次化聚类。从这样的标准来看,彼此接近的段是同一簇。对于所获取的各个群集,从包含在群集中的文本中提取表征每个群集的概要语句,并且输出群集间关系和每个群集的概要语句。
版权:(C)2005,JPO&NCIPI
公开/公告号JP4333318B2
专利类型
公开/公告日2009-09-16
原文格式PDF
申请/专利权人 日本電信電話株式会社;
申请/专利号JP20030357372
申请日2003-10-17
分类号G06F17/30;
国家 JP
入库时间 2022-08-21 19:40:30