首页> 外文会议>Chinese intelligent automation conference >A Method for Topic Classification of Web Pages Using LDA-SVM Model
【24h】

A Method for Topic Classification of Web Pages Using LDA-SVM Model

机译:使用LDA-SVM模型的网页主题分类方法

获取原文

摘要

Using the model we propose in this paper, we can use little signed samples for web pages classification. This will greatly reduce the manual work. Through the analyze of experiments, we find the connection between topic number K and data set. Further testing is needed for finding accurate correlation. Another, we get 90 thousand poor classification data set, some of the classification is wrong and some web page is outdated or change. We want to build a flexible and effective system for unknown web pages classification. This work is focus on sophisticated category, and our next work will expand the data set and categories. Wrong data filtering and hierarchical classification is both challenge.
机译:使用我们提出的模型在本文中,我们可以使用很少的签名样本进行网页分类。这将大大减少手工工作。通过实验的分析,我们发现主题编号K和数据集之间的连接。需要进一步测试来查找准确的相关性。另一个,我们获得了90千个差的分类数据集,其中一些分类是错误的,有些网页已过时或更改。我们希望为未知的网页分类构建灵活有效的系统。这项工作专注于复杂的类别,我们的下一个工作将扩展数据集和类别。错误的数据过滤和分层分类都是挑战。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号