...
首页> 外文期刊>Indian Journal of Science and Technology >Punjabi Stemmer Using Punjabi WordNet Database
【24h】

Punjabi Stemmer Using Punjabi WordNet Database

机译:使用旁遮普词网数据库的旁遮普词干

获取原文
   

获取外文期刊封面封底 >>

       

摘要

Stemming is used as a pre-processing phase in the information retrieval tasks. The stemming process produces linguistically normalized text, which helps in improving the results of information retrieval tasks. In this paper, a revised suffix removal approach with extended set of stripping rules has been discussed for creating a Punjabi language Stemming tool. The stemming algorithm discussed in this paper uses regular expressions for finding suffix matches. The WordNet* database is used here for improving the stemming results.
机译:在信息检索任务中,将词干用作预处理阶段。词干提取过程会产生语言标准化的文本,这有助于改善信息检索任务的结果。在本文中,为创建旁遮普语词干工具,讨论了带有扩展剥离规则集的修订后缀删除方法。本文讨论的词干算法使用正则表达式来查找后缀匹配项。这里使用WordNet *数据库来改善词干结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号