...
首页> 外文期刊>AtoZ : Novas Práticas em Informa??o e Conhecimento >Indexa??o e recupera??o de teses e disserta??es por meio de sintagmas nominais
【24h】

Indexa??o e recupera??o de teses e disserta??es por meio de sintagmas nominais

机译:使用名词短语索引和检索论文和论文

获取原文
   

获取外文期刊封面封底 >>

       

摘要

Introducción: Aborda la utilización de los sintagmas nominales en el proceso de indización automática de las tesis y las disertaciones depositadas en la Biblioteca Digital de Tesis y Disertaciones de UFPE (BDTD-UFPE), considerando la hipótesis de que los sintagmas nominales consistirían en una mejor unidad de conocimiento para la indización y recuperación de información, que términos aislados, permitiendo aumentar la satisfacción de las necesidades de información del usuario durante la búsqueda de información. Se discute sobre el estado del arte de los sintagmas nominales y de su extracción automática, tanto como de su aplicación en la indización automática y en la recuperación de información. Metodología: Tomando como base la herramienta para análisis de texto (OGMA), analiza la aplicación de la extracción de sintagmas nominales en la indización automática y recuperación de información de las tesis y disertaciones en el contexto de BDTD-UFPE. Con base en los resúmenes en el área de Derecho, Computación y Nutrición, se definieron los valores totales para cada una de las variables observadas, lo que permitió evaluar la extracción de sintagmas nominales a través de los porcentajes de precisión de los sintagmas nominales relevantes; la tasa de error al extraer las cadenas de caracteres que no constituyen sintagmas nominales, y, el porcentaje de sintagmas nominales extraídos que no son relevantes. Resultados: El proceso de extracción de sintagmas nominales a través de OGMA tiene diferentes desarrollos para cada programa de posgrado, habiéndose obtenido un mejor desarrollo (mejor índice de precisión) para los resúmenes de Derecho, seguidos por los de Computación y los de Nutrición. Esta diferencia en el desarrollo puede explicarse en parte por la naturaleza diferente de los términos técnicos presentes en los resúmenes. Conclusión: Aunque existan limitaciones en las herramientas disponibles, la aplicación de métodos automatizados de extracción e indización por medio de sintagmas nominales es prometedora, ya que los sintagmas nominales se configuran como mejores descriptores y puntos de acceso a los documentos, eliminando los problemas causados por la sinonimia y la polisemia de las palabras aisladas.
机译:简介:考虑到名词短语由更好的词义组成的假设,解决了名词短语在UFPE论文数字论文库(BDTD-UFPE)中存放的论文和论文的自动索引过程中的使用索引和检索信息的知识单元,这些术语是相互独立的术语,可以在搜索信息期间提高用户对信息需求的满意度。讨论了名词短语及其自动提取的最新技术,以及它们在自动索引和信息检索中的应用。方法:基于文本分析工具(OGMA),在BDTD-UFPE的背景下,分析名词短语提取在论文和论文的自动索引和信息检索中的应用。基于法律,计算和营养领域的摘要,为每个观察到的变量定义了总价值,从而允许通过相关名词短语的精确百分比来评估名词短语的提取;提取不构成名词短语的字符串时的错误率,以及提取的不相关名词短语的百分比。结果:通过OGMA提取名词短语的过程在每个研究生课程中都有不同的发展,法律摘要的发展更好(精度更高),其次是计算机和营养学的摘要。发展中的这种差异可以部分通过摘要中存在的技术术语的不同性质来解释。结论:尽管可用工具有局限性,但通过名词短语自动提取和索引的方法的应用前景广阔,因为名词短语被配置为更好的描述符和文档访问点,从而消除了由文档生成的问题孤立单词的同义词和多义性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号