首页> 外文会议>41st annual meeting of the Association for Computational Linguistics : Proceedings of the conference >A Chinese Efficient Analyser Integrating Word Segmentation,Part-Of-Speech Tagging, Partial Parsing and Full Parsing
【24h】

A Chinese Efficient Analyser Integrating Word Segmentation,Part-Of-Speech Tagging, Partial Parsing and Full Parsing

机译:集成了分词,词性标注,部分解析和完全解析的中文高效分析器

获取原文

摘要

This paper introduces an efficient analyser forthe Chinese language, which efficiently andeffectively integrates word segmentation,part-of-speech tagging, partial parsing and fullparsing. The Chinese efficient analyser is basedon a Hidden Markov Model (HMM) and anHMM-based tagger. That is, all thecomponents are based on the sameHMM-based tagging engine. One advantage ofusing the same single engine is that it largelydecreases the code size and makes themaintenance easy. Another advantage is that itis easy to optimise the code and thus improvethe speed while speed plays a critical importantrole in many applications. Finally, theperformances of all the components can benefitfrom the optimisation of existing algorithmsand/or adoption of better algorithms to a singleengine. Experiments show that all thecomponents can achieve state-of-artperformances with high efficiency for theChinese language.
机译:本文介绍了一种高效的分析仪 中文,可以有效地 有效地集成了分词, 词性标记,部分解析和完整 解析。中文高效分析仪的基础 在隐马尔可夫模型(HMM)和 基于HMM的标记器。也就是说,所有 组件是基于相同的 基于HMM的标记引擎。的优势之一 使用相同的单引擎是因为它在很大程度上 减少代码大小并使 维护容易。另一个优点是 易于优化代码,从而提高 速度至关重要 在许多应用中的角色。最后, 所有组件的性能都可以受益 从现有算法的优化中 和/或将更好的算法应用于单个 引擎。实验表明,所有 组件可以达到最先进的水平 高效的表演 中文。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号