Una de las áreas que más interés está despertando actualmente entre losinvestigadores y usuarios de sistemas de Recuperación de Información es la recuperación dedocumentos que contengan imágenes relevantes a una necesidad de información. En este caso,el principal objetivo no es la recuperación de los documentos relevantes a la necesidad deinformación del usuario sino la obtención de las imágenes relevantes a dicha necesidad. En laactualidad, las colecciones de documentos se pueden encontrar en diversos formatos (html, xml,pdf, etc.). En este artículo presentamos un método eficaz para indexar una colección dedocumentos en formato pdf para mejorar la recuperación de imágenes contenidas en losdocumentos. Los experimentos realizados prueban que el método presentado obtiene mejoresresultados que si se realizara una indexación del texto completo.
展开▼