首页> 外文期刊>International Journal on Computer Science and Engineering >Learning Approaches toward Title Word Selection on Indic Script
【24h】

Learning Approaches toward Title Word Selection on Indic Script

机译:在印度文字上选择标题词的学习方法

获取原文
       

摘要

Title is a compact representation of a document which distill the important information from the document. In this paper we studied the selection words as title words by using different learning approaches namely nearest neighbor approach (NN), Naive Bayes approach with limited-vocabulary (NBL), Naive Bayes approach with full vocabulary (NBF) and by using a term weighing approach (tf-idf). We compare the performance of these approaches by using F1 metric. We compare the F1 metric results both on English Script and Indic Script ' Telugu'. We concluded the influence of linguistic complexity in the process of Title word selection.
机译:标题是文档的紧凑表示,可以从文档中提取重要信息。在本文中,我们通过使用不同的学习方法,即最近邻居方法(NN),具有有限词汇的朴素贝叶斯方法(NBL),具有完整词汇的朴素贝叶斯方法(NBF)和术语加权来研究选择词作为标题词方法(tf-idf)。我们使用F1指标比较了这些方法的性能。我们将英文脚本和印度文字“泰卢固语”上的F1度量结果进行比较。我们总结了语言复杂性在标题词选择过程中的影响。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号