首页> 外文期刊>電子情報通信学会論文誌 >異なる体系を接続するための識別モデルを用いた形態素変換法
【24h】

異なる体系を接続するための識別モデルを用いた形態素変換法

机译:基于判别模型的形态转换方法用于连接不同系统

获取原文
获取原文并翻译 | 示例
           

摘要

構文?意味解析などの自然言語処理モジュールや音声認識器を組み合わせた統合システムを構築する際,モジュール同士の形態素体系が異なっていると直接接続できない.この問題を解決するため,本論文では異なる形態素体系を変換する,形態素変換法を提案する.提案方式は,句に基づく統計翻訳(PBSMT)の考え方を利用するが,本タスクの特性を生かして,条件付き確率場を統計モデルとして使用する.実験では,PBSMTの実装であるMOSESに比べ高精度な変換ができ,音声認識結果のように誤りを含んだ入力に対しても,いったんテキストに戻して形態素解析する方式に比べ誤りに頑健な変換ができた.また,訓練コーパスサイズの精度への影響を調査し,変換元から変換先へ形態素をマッピングするフレーズテーブルの網羅性が,変換時/訓練時双方で重要であることを確認した.
机译:当构建将诸如句法和语义分析之类的自然语言处理模块与语音识别器相结合的集成系统时,如果模块的词素系统不同,则无法直接连接。为了解决这个问题,本文提出了一种形态变换方法,可以变换不同的形态系统。所提出的方法使用基于短语的统计翻译(PBSMT)的概念,但是利用此任务的特征将条件随机字段用作统计模型。在实验中,与PBSMT实现MOSES相比,可以实现更准确的转换,即使输入包含语音识别结果之类的错误,它也比返回文本和进行形态分析的方法对错误更鲁棒。我以前可以。此外,我们调查了训练语料库大小对准确性的影响,并确认了将词素从转换源映射到转换目标的词组表的完整性在转换期间和训练期间都很重要。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号