首页> 外文OA文献 >Sistema de generación, administración y consulta de una librería digital de documentos para un portal web / Generation system, management and search of a digital library of documents for a website
【2h】

Sistema de generación, administración y consulta de una librería digital de documentos para un portal web / Generation system, management and search of a digital library of documents for a website

机译:生成系统,管理和搜索网站的数字文档库

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Los portales web son grandes repositorios de información desorganizada. Muchas veces mantener unaudpolítica de publicación de documentos es difícil, y finalmente cada parte de la organización publica susuddocumentos en lugares distintos en una estructura de carpetas particular. El acceso a los documentos seudvuelve tedioso porque las personas que necesitan un documento en particular casi siempre desconocenudsu ubicación. Y a pesar de los hiper-vínculos entre documentos, muchas veces el texto que identifica eludenlace no es suficiente para identificar el documento al que hace referencia. Por su parte, las libreríasuddigitales se enfocan en la organización de la información a través de colecciones que permiten agruparuddocumentos similares lo cual agiliza el proceso de búsqueda de documentos específicos a quienes losudconsultan. La creación de librerías digitales se ha convertido en una opción económica y ágil, paraudla organización de documentos sobre diferentes temáticas, almacenados en diversos formatos (texto,udaudio, imagen, vídeo) en los sitios web.udEn este trabajo de tesis, se propone un sistema de administración de librerías digitales web de docu-udmentos que es capaz de: 1) recuperar e indexar documentos publicados en un portal web, 2) generaruduna estructura de librería digital y 3) clasificar y permitir la consulta de los documentos a través de unaudinterfaz de navegación. La recuperación e indexación se hace a través de un sistema de recuperaciónudde información. El agrupamiento de los documentos se hace a través de un componente de mineríaudde texto que contiene herramientas para el preprocesamiento de los documentos, y un algoritmo deudagrupamiento conceptual. La interfaz de usuario se compone de dos vistas principales, la interfaz deudnavegación y un módulo de administración. La interfaz de navegación está compuesta por un árbol deudcategorías y un grafo que relaciona las diferentes categorías entre sí a través de los documentos queudpertenecen a cada una de ellas. La interfaz de administración permite el acceso a los parámetros deludsistema para la ejecución de los procesos de indexación y agrupamiento de los documentos.udEl caso de estudio propuesto para probar el prototipo fueron los portales ubicados dentro del dominioudweb de la Universidad Nacional de Colombia, el cual ofrece el escenario de una organización conudmúltiples servidores. / Abstract. Web portals are great repositories of information disorganized. Many times maintain a policy ofudpublishing documents is difficult, and eventually each part of the organization publishes its documentsudin different places in a particular folder structure. Access to documents becomes tedious for those whoudneed a particular document is almost always unknown their location. And although the hyperlinksudbetween documents, often the text that identifies the link is not sufficient to identify the referenceduddocument. For its part, digital libraries focus on the organization of information through librariesudthat allow you to group similar documents which streamlines the process of searching for specificuddocuments to those who consult them. The creation of digital libraries has become an economical andudflexible for the organization of documents on various topics, stored in various formats (text, audio,udimage, video).udIn this thesis a management system web digital library of documents is proposed. This system isudable to: 1) retrieving and indexing documents on a website, 2) generating a digital library structureudbased on the content of the web documents and 3) classifying and allowing navigation of the webuddocuments. The indexing and retrieval of the web documents is done through a system of informationudretrieval extended of the Nutch utility. For generating the structure of the digital library and futureudclassifications, the documents are grouping through a text mining techniques, the system uses tools forudpreprocessing such as a Lucene, and a conceptual clustering algorithm called LINGO. For exploringudand navigating the documents, the system provides a user interface that is composed by a category treeudand a graph that relates the different categories with each other through the documents. Additionally,udthe system has and a management interface that allows setting the system parameters for the processesudof indexing and clustering documents.udThe system of the web digital library proposed was applied to a web site located within the NationaludUniversity of Colombia, which has an environment with multiple servers.
机译:Web门户是无序信息的绝佳存储库。通常,维护文档发布策略有时很困难,最终,组织的每个部分都会在特定文件夹结构中的不同位置发布其文档。访问文档非常繁琐,因为需要特定文档的人几乎总是不知道自己的位置。尽管文档之间存在超链接,但很多时候,用于标识链接的文本不足以标识其所引用的文档。就数字图书馆而言,它们侧重于通过馆藏来组织信息,这些馆藏允许将相似的文档分组在一起,从而加快了搜索其参考的特定文档的过程。对于 udla组织有关不同主题的文档,以各种格式(文本, udaudio,图像,视频)存储在网站上,数字图书馆的创建已成为一种经济且灵活的选择。 ,提出了一种用于文档的数字Web图书馆管理系统,该系统能够:1)检索和索引在Web门户中发布的文档,2)生成数字图书馆结构,以及3)分类并进行咨询通过导航界面显示的文档。检索和索引编制是通过信息检索系统完成的。通过文本挖掘组件完成文档的分组,该组件包含用于文档预处理的工具以及概念上的分组算法。用户界面由两个主要视图组成: udnavigation界面和管理包。导航界面由 udcategories树和一个图表组成,该图表通过 ud属于每个类别的文档将不同类别彼此关联。管理界面允许访问udsystem的参数以执行文档索引和分组过程ud建议用于测试原型的案例研究是位于国立大学udweb域中的门户de Colombia,它提供了一个具有多台服务器的组织的情况。 /摘要。 Web门户是无序的信息存储库。很多时候,维护文档的发布策略很困难,最终组织的每个部分都在特定的文件夹结构中的不同位置发布其文档。对于那些根本不需要知道特定文件的人来说,访问文件变得乏味。并且,尽管文档之间有超链接 udud,但是标识链接的文本通常不足以标识所引用的 uddocument。就其本身而言,数字图书馆专注于通过图书馆 ud进行信息的组织,该图书馆/ ud允许您将相似的文档分组,从而简化了向参考文档的人搜索特定 ud文档的过程。数字图书馆的创建对于组织以各种格式存储(以文本,音频,音频,视频,视频格式)的各种主题的文档而言,已经成为一种经济且灵活的方法。 。该系统适用于:1)在网站上检索和索引文档,2)根据Web文档的内容生成数字图书馆结构 ud,以及3)分类并允许对Web uddocument进行导航。 Web文档的索引和检索是通过Nutch实用程序扩展的信息 udretrieval系统完成的。为了生成数字图书馆的结构和将来的分类,文档通过文本挖掘技术进行分组,系统使用诸如Lucene之类的udpreprocessing工具和称为LINGO的概念性聚类算法。为了浏览和导航文档,系统提供了一个用户界面,该用户界面由类别树和图表组成,该图表通过文档将不同的类别相互关联。此外,该系统具有一个管理界面,该管理界面允许为过程的索引和聚簇文档设置系统参数。提议的网络数字图书馆系统已应用于哥伦比亚国家大学的一个网站,该环境具有多个服务器。

著录项

  • 作者

    Mahecha Nieto Isabel Andrea;

  • 作者单位
  • 年度 2011
  • 总页数
  • 原文格式 PDF
  • 正文语种 {"code":"es","name":"Spanish","id":10}
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号