Statistical Morph Analyzer (SMA++) for Indian Languages

机译：印度语言的统计变形分析仪（SMA ++）

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Statistical morph analyzers have proved to be highly accurate while being comparatively easier to maintain than rule based approaches. Our morph analyzer (SMA++) is an improvement over the statistical morph analyzer (SMA) described in Malladi and Mannem (2013). SMA++ predicts the gender, number, person, case (GNPC) and the lemma (L) of a given token. We modified the SMA in Malladi and Mannem (2013), by adding some rich machine learning features. The feature set was chosen specifically to suit the characteristics of Indian Languages. In this paper we apply SMA++ to four Indian languages viz. Hindi, Urdu, Telugu and Tamil. Hindi and Urdu belong to the Indic language family. Telugu and Tamil belong to the Dravidian language family. We compare SMA++ with some state-of-art statistical morph analyzers viz. Morfette in Chrupala et al. (2008) and SMA in Malladi and Mannem (2013). In all four languages, our system performs better than the above mentioned state-of-art SMAs.

机译：统计变形分析仪已经证明是高度准确的，同时比基于规则的方法更容易维护。我们的Morph分析仪（SMA ++）是对Malladi和Mannem（2013年）描述的统计变形分析仪（SMA）的改进。 SMA ++预测给定令牌的性别，数量，人，案例（GNPC）和LEMMA（L）。通过添加一些丰富的机器学习功能，我们修改了Malladi和Mannem（2013）的SMA。专门选择该功能集以适应印度语言的特征。在本文中，我们将SMA ++应用于四个印度语言viz。印地语，乌尔都语，泰卢固和泰米尔。印地语和乌尔都语属于indical语言家庭。 Telugu和Tamil属于Dravidian语言家庭。我们将SMA ++与一些最先进的统计变形分析仪VIZ进行比较。在Chrupala等人的Morfette。（2008年）和Maladi和Mannem（2013年）的SMA。在所有四种语言中，我们的系统比上述最先进的SMA表现更好。

著录项

来源
《Workshop on applying NLP tools to similar languages, varieties and dialects》|2014年||共7页
会议地点
作者
Saikrishna Srirampur; Ravi Chandibhamar; Radhika Mamidi;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类程序设计、软件工程;
关键词

相似文献

外文文献
中文文献
专利

1. Deep learning-based techniques to enhance the precision of phrase-based statistical machine translation system for Indian languages [J] . J.P. Sanjanasri, M. Anand Kumar, K.P. Soman International Journal of Computer Aided Engineering and Technology . 2020,第1a2期

机译：基于深度学习的技术，以提高印度语言的短语统计机器翻译系统精度
2. Statistical machine translation of Indian languages: a survey [J] . Jadoon Nadeem Khan, Anwar Waqas, Bajwa Usama Ijaz, Neural computing & applications . 2019,第7期

机译：印度语言的统计机器翻译：调查
3. Statistical Features Extraction for Indian Language Documents [J] . Manoj Kumar Shukla, Haider Banka International Journal of Computer Science and Technology . 2016,第3aVeraa1期

机译：印度语言文档的统计特征提取
4. Statistical Morph Analyzer (SMA++) for Indian Languages [C] . Saikrishna Srirampur, Ravi Chandibhamar, Radhika Mamidi 1st Workshop on applying NLP tools to similar languages, varieties and dialects 2014 . 2014

机译：印度语统计形态分析器（SMA ++）
5. Woven Language: Indian femininity represented by the visual language of the Indian bazaar. [D] . Singh, Sanjit Kaur. 2010

机译：编织语言：以印度集市的视觉语言表示的印度女性气质。
6. Learning across languages: bilingual experience supports dual language statistical word segmentation [O] . Dylan M. Antovich, Katharine Graf Estes -1

机译：跨语言学习：双语经验支持双语言统计分词
7. Statistical Morph Analyzer (SMA++) for Indian Languages [O] . Saikrishna Srirampur, Iiit Hyderabad, Ravi Chandibhamar, 2015

机译：用于印度语言的统计变形分析仪（sma ++）
8. Ada Language System VAX/VMS Statistical Analyzer B-5 Specification (CR-CP-0059-B75) [R] . 1985

机译：ada语言系统VaX / Vms统计分析仪B-5规范（CR-Cp-0059-B75）

Statistical Morph Analyzer (SMA++) for Indian Languages

摘要

著录项

相似文献

相关主题

期刊订阅