首页> 外国专利> Apparatus for clustering same and similar product using vector space model and method thereof

Apparatus for clustering same and similar product using vector space model and method thereof

机译:使用向量空间模型对相同和相似产品进行聚类的设备及其方法

摘要

PURPOSE: A device and method for clustering an identical and similar commodity using a vector document model are provided to cluster words which display commodities in a web page collected by a search word. CONSTITUTION: A web page collection unit(110) collects web pages corresponded to a query word in shopping mall sites(101). A single cluster forming unit(130) extracts words which explain the query word according to the web pages and forms a cluster. A vector conversion unit(140) forms a vector using the words according to web pages. A similarity calculation unit(150) calculates a similarity among vectors according to web pages. A cluster combining unit(160) combines clusters in accordance with the similarity. A character substitution unit(120) removes a special character included in the web pages and forms a character string comprising only general characters.
机译:目的:提供一种使用矢量文档模型对相同和相似商品进行聚类的设备和方法,以聚类在搜索词收集的网页中显示商品的词语。构成:网页收集单元(110)收集与购物中心站点(101)中的查询词相对应的网页。单个簇形成单元(130)根据网页提取解释查询词的词,并形成簇。向量转换单元(140)根据网页使用单词来形成向量。相似度计算单元(150)根据网页计算向量之间的相似度。聚类合并单元(160)根据相似度合并聚类。字符替换单元(120)去除网页中包括的特殊字符,并形成仅包括普通字符的字符串。

著录项

  • 公开/公告号KR100490442B1

    专利类型

  • 公开/公告日2005-05-17

    原文格式PDF

  • 申请/专利权人

    申请/专利号KR20020014270

  • 申请日2002-03-16

  • 分类号G06F17/30;

  • 国家 KR

  • 入库时间 2022-08-21 22:03:48

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号