...
【24h】

網羅的な検出を重視した異形パターンに基づく日本語慣用句同定システム

机译:基于变异模式的日语成语识别系统,重点是全面检测

获取原文
获取原文并翻译 | 示例
           

摘要

文中の慣用句を同定することは文章の構造化に必要不可欠であり,とりわけ動詞語義の同定には欠かせない技術である.これは慣用句が動詞とその係り元の名詞との関係により特異な意味をもつだけでなく,他の言葉に言い換え可能なためである.そこで本研究ではユーザが容易に記述可能な慣用句同定辞書の仕様を決定し,それに基づいた慣用句同定システムを構築している.本システムの特徴としては記述にXMLを利用し分かち書きや形態素単位を意識せず規則の追加が可能な点,助詞の置換や単語挿入による慣用句構成の変化といった形態的多様性を吸収した網羅的な検出が可能な点などが挙げられる.さらに本システムは動詞項構造シソーラスの語義概念を取り入れて慣用句の言い換えを扱うことができるため,動詞語義の同定を行う項構造付与システムと連携可能な枠組みを持つ.本稿では,辞書の仕様および形態的多様性を吸収した網羅的な検出手法について報告する.慣用句同定実験では,本手法の有効性と意味的曖昧性解消による精度向上の可能性を確認する.
机译:识别句子中的成语对于构造句子是必不可少的,并且是识别动词含义的必不可少的技术。这是因为成语不仅由于动词与其相关的鼻子之间的关系而具有特殊的含义,而且还可以解释为其他词。因此,在本研究中,确定了可以容易地被用户描述的成语识别词典的规范,并且构建了基于规范的成语识别系统。该系统的特征是使用XML进行描述,并且可以添加规则而无需了解划分和形态单位,并且可以吸收形态多样性,例如辅助词的替换和由于词的插入而导致的习惯用法组成的变化。提到了可以检测到的点。此外,由于该系统可以通过合并动词术语结构sisolus的概念来处理成语的释义,因此它具有可与识别动词术语含义的术语结构分配系统链接的框架。在本文中,我们报告了一种综合的检测方法,该方法吸收了字典的规格和形态多样性。在习语识别实验中,我们确认了该方法的有效性以及通过消除语义歧义来提高准确性的可能性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号