首页> 中文期刊> 《电子学报》 >一种基于UCL的中文网页信息过滤方法

一种基于UCL的中文网页信息过滤方法

         

摘要

围绕如何在浩瀚的中文网页中找到用户感兴趣的内容,提出了基于UCL(Uniform Content Locator)的"二阶过滤法".它将媒体空间中的信息用UCL语义格(Semantic Cases based on UCL,SCU)表示,通过语义向量空间模型(Semantic Vector Space Model,SVSM)对网页的语义矩阵进行分析计算,粗略筛选出用户感兴趣的网页;再借助精细语义逐句解读其内容,提取用户所关注的信息.根据用户的阅读行为动态了解用户的兴趣变化,建立用户兴趣的本体模型,并分析和定义了用户兴趣度的度量.实验验证了上述过滤方法的有效性,其测试结果同向量空间模型(Vector Space Model,VSM)进行了比较,性能明显优于VSM.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号