【24h】

Exact versus Estimated Pruning of Subject Hierarchies

机译:主题层次结构的精确修剪与估计修剪

获取原文

摘要

Many large digital collections are organized by subject;these useful information organization structures are largeand complex, thus difficult to browse. Current online toolsand visualization prototypes show small localized subsetsand do not provide the ability to explore the predominantpatterns of the overall subject structure. This study buildson existing work concerning automatic subject hierarchymodification techniques that aim to facilitate browsing fordocuments by capitalizing on the highly uneven distributionof real-world collections. Specifically, previous work usedan estimation of the number of accessible documentsoffered by each subject term, while the current study usesthe exact number of accessible documents. The impact isdemonstrated on a large collection organized using MedicalSubject Headings (MeSH). Results show that, althoughcomputationally more demanding, pruning the MeSHhierarchy based on the exact access produces a differentsubject hierarchy under some conditions. The visual impactis demonstrated using traditional outline views. This studyhas implications for the development of informationorganization theory and human-information interactiontechniques for subject hierarchies.
机译:许多大型数字馆藏都是按主题组织的; 这些有用的信息组织结构很大 且复杂,因此难以浏览。当前的在线工具 和可视化原型显示了小的局部子集 并且没有提供探索优势的能力 整体学科结构的模式。这项研究建立 关于自动主题层次结构的现有工作 旨在促进浏览的修改技术 通过充分利用高度不均匀的分布来记录文档 现实世界中的收藏。具体来说,以前使用的工作 估计可访问文档的数量 由每个主题词提供,而当前的研究使用 可访问文档的确切数量。影响是 在使用Medical组织的大量收藏中展示 主题标题(MeSH)。结果表明,尽管 计算上要求更高,修剪MeSH 基于确切访问权限的层次结构会产生不同的结果 在某些条件下的主题层次结构。视觉冲击 使用传统的轮廓视图进行演示。这项研究 对信息的发展有影响 组织理论与人与信息的互动 主题层次结构的技术。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号