首页> 中文期刊> 《计算机应用研究》 >一种基于特征信息的Blog自动文摘研究

一种基于特征信息的Blog自动文摘研究

     

摘要

To help extract the summary of a Blog effectively, first selected a number of comments in the Blog in a reasonable way. Then,based on considering word frequency in the sentence, this paper calculated the weight of the sentence in the Blog, combined with structured information and the selected comments. However, this method was easy to neglect the minor subject. After that, to overcome the drawback, proposed a solution of secondary abstract extract through the characteristics of paragraph form in the Blog. Finally, an experiment was done with Blog data random downloaded on the Internet, demonstrating the method has a better spreadability and generality.%为了有效地对Blog进行摘要抽取,以一种合理的方式挑选出对Blog摘要抽取有帮助的评论,然后在考虑句子词频的基础上结合Blog的结构化信息和挑选出的评论信息来计算Blog句子权重.针对基于句子权重选择摘要句容易忽略次要主题的缺陷,提出一种结合Blog段落形式特点进行二次摘要抽取的解决方法.在随机下载的Blog数据中进行了实验,该方法具有较好的覆盖性和概括性.

著录项

  • 来源
    《计算机应用研究》 |2011年第10期|3760-3763|共4页
  • 作者单位

    苏州大学智能信息处理及应用研究所;

    江苏苏州215006;

    苏州大学计算机科学与技术学院;

    江苏苏州215006;

    苏州大学智能信息处理及应用研究所;

    江苏苏州215006;

    江苏省现代企业信息化应用支撑软件工程技术研发中心;

    江苏苏州215104;

    苏州大学智能信息处理及应用研究所;

    江苏苏州215006;

    江苏省现代企业信息化应用支撑软件工程技术研发中心;

    江苏苏州215104;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 系统学、现代系统理论;
  • 关键词

    博客摘要; 评论; 特征信息; 主题覆盖;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号