首页> 外文会议>International conference on recent advances in natural language processing >Part-of-Speech Tagging for Code-Mixed English-Hindi Twitter and Facebook Chat Messages
【24h】

Part-of-Speech Tagging for Code-Mixed English-Hindi Twitter and Facebook Chat Messages

机译:混合代码的英语-印地语Twitter和Facebook聊天消息的词性标记

获取原文

摘要

The paper reports work on collecting and annotating code-mixed English-Hindi social media text (Twitter and Facebook messages), and experiments on automatic tagging of these corpora, using both a coarse-grained and a fine-grained part-of-speech tag set. We compare the performance of a combination of language specific taggers to that of applying four machine learning algorithms to the task (Conditional Random Fields, Sequential Minimal Optimization, Naive Bayes and Random Forests), using a range of different features based on word context and word-internal information.
机译:该论文报告了收集和注释混合代码的英语-印地语社交媒体文本(Twitter和Facebook消息)的工作,以及使用粗粒度和细粒度词性标签对这些语料库进行自动标记的实验。放。我们比较了特定语言标记器的组合性能与将四种机器学习算法应用于任务(有条件的随机字段,顺序最小优化,朴素贝叶斯和随机森林)的性能,并使用了基于单词上下文和单词的一系列不同功能-内部信息。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号