首页> 外文学位 >Data mining revision controlled document history metadata for automatic classification.
【24h】

Data mining revision controlled document history metadata for automatic classification.

机译:数据挖掘修订版本控制的文档历史记录元数据,用于自动分类。

获取原文
获取原文并翻译 | 示例

摘要

Version controlled documents provide a complete history of the changes to the document, including everything from what was changed to who made the change and much more. Through the use of cluster analysis and several sets of manipulated data, this research examines the revision history of Wikipedia in an attempt to find language-independent patterns that could assist in automatic page classification software. Utilizing two sample data sets and applying the aforementioned cluster analysis, no conclusive evidence was found that would indicate that such patterns exist. Our work on the software, however, does provide a foundation for more possible types of data manipulation and refined clustering algorithms to be used for further research into finding such patterns.
机译:版本控制文档提供了文档更改的完整历史记录,包括从更改内容到更改者的所有内容,以及更多内容。通过使用聚类分析和几组可操纵的数据,本研究检查了Wikipedia的修订历史,以试图找到独立于语言的模式,以帮助自动页面分类软件。利用两个样本数据集并应用上述聚类分析,没有发现确凿的证据表明存在这种模式。但是,我们在软件上的工作确实为更多可能的数据处理类型和完善的聚类算法提供了基础,这些数据可用于进一步研究以找到此类模式。

著录项

  • 作者

    Maass, Dustin.;

  • 作者单位

    The University of Wisconsin - Milwaukee.;

  • 授予单位 The University of Wisconsin - Milwaukee.;
  • 学科 Computer science.;Information technology.
  • 学位 M.S.
  • 年度 2013
  • 页码 29 p.
  • 总页数 29
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号