Statistical Morph Analyzer (SMA++) for Indian Languages

机译：印度语统计形态分析器（SMA ++）

获取原文

获取原文并翻译 | 示例

页面导航

摘要
著录项
相似文献
相关主题

摘要

Statistical morph analyzers have proved to be highly accurate while being comparatively easier to maintain than rule based approaches. Our morph analyzer (SMA++) is an improvement over the statistical morph analyzer (SMA) described in Malladi and Mannem (2013). SMA++ predicts the gender, number, person, case (GNPC) and the lemma (L) of a given token. We modified the SMA in Malladi and Mannem (2013), by adding some rich machine learning features. The feature set was chosen specifically to suit the characteristics of Indian Languages. In this paper we apply SMA++ to four Indian languages viz. Hindi, Urdu, Telugu and Tamil. Hindi and Urdu belong to the Indic language family. Telugu and Tamil belong to the Dravidian language family. We compare SMA++ with some state-of-art statistical morph analyzers viz. Morfette in Chrupala et al. (2008) and SMA in Malladi and Mannem (2013). In all four languages, our system performs better than the above mentioned state-of-art SMAs.

机译：与基于规则的方法相比，统计形态分析器已被证明具有很高的准确性，同时维护起来也相对容易。我们的形态分析仪（SMA ++）是对Malladi和Mannem（2013）中描述的统计形态分析仪（SMA）的改进。 SMA ++可以预测给定令牌的性别，人数，人员，情况（GNPC）和引理（L）。通过添加一些丰富的机器学习功能，我们在Malladi和Mannem（2013）中修改了SMA。专门选择了功能集以适合印度语言的特征。在本文中，我们将SMA ++应用于四种印度语言。印地语，乌尔都语，泰卢固语和泰米尔语。印地语和乌尔都语属于印度语家族。泰卢固语和泰米尔语属于德拉维语族。我们将SMA ++与一些最新的统计形态分析仪进行比较。 Chrupala等人的Morfette。（2008）和SMA在Malladi和Mannem（2013）。在所有四种语言中，我们的系统都比上述最新的SMA表现更好。

著录项

来源
《1st Workshop on applying NLP tools to similar languages, varieties and dialects 2014》|2014年|103-109|共7页
会议地点 Dublin(IE)
作者
Saikrishna Srirampur; Ravi Chandibhamar; Radhika Mamidi;
展开▼
作者单位

IIIT Hyderabad;

IIIT Hyderabad;

IIIT Hyderabad;

展开▼
会议组织
原文格式 PDF
正文语种 eng
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. Deep learning-based techniques to enhance the precision of phrase-based statistical machine translation system for Indian languages [J] . J.P. Sanjanasri, M. Anand Kumar, K.P. Soman International Journal of Computer Aided Engineering and Technology . 2020,第1a2期

机译：基于深度学习的技术，以提高印度语言的短语统计机器翻译系统精度
2. Statistical machine translation of Indian languages: a survey [J] . Jadoon Nadeem Khan, Anwar Waqas, Bajwa Usama Ijaz, Neural computing & applications . 2019,第7期

机译：印度语言的统计机器翻译：调查
3. Statistical Features Extraction for Indian Language Documents [J] . Manoj Kumar Shukla, Haider Banka International Journal of Computer Science and Technology . 2016,第3aVeraa1期

机译：印度语言文档的统计特征提取
4. Statistical Morph Analyzer (SMA++) for Indian Languages [C] . Saikrishna Srirampur, Ravi Chandibhamar, Radhika Mamidi Workshop on applying NLP tools to similar languages, varieties and dialects . 2014

机译：印度语言的统计变形分析仪（SMA ++）
5. Woven Language: Indian femininity represented by the visual language of the Indian bazaar. [D] . Singh, Sanjit Kaur. 2010

机译：编织语言：以印度集市的视觉语言表示的印度女性气质。
6. Learning across languages: bilingual experience supports dual language statistical word segmentation [O] . Dylan M. Antovich, Katharine Graf Estes -1

机译：跨语言学习：双语经验支持双语言统计分词
7. Statistical Morph Analyzer (SMA++) for Indian Languages [O] . Saikrishna Srirampur, Iiit Hyderabad, Ravi Chandibhamar, 2015

机译：用于印度语言的统计变形分析仪（sma ++）
8. Ada Language System VAX/VMS Statistical Analyzer B-5 Specification (CR-CP-0059-B75) [R] . 1985

机译：ada语言系统VaX / Vms统计分析仪B-5规范（CR-Cp-0059-B75）

Statistical Morph Analyzer (SMA++) for Indian Languages

摘要

著录项

相似文献

相关主题

期刊订阅