...
【24h】

前方文脈を考慮した冠詞推定における新聞記事コーパスの選択

机译:考虑前瞻性背景,在ARERIC估算中选择报纸文章语料库

获取原文
获取原文并翻译 | 示例

摘要

英文書中ゐ冠詞推定手法として,正しく書かれた文書を学習させ,学習した冠詞周辺の情報を利用し,最大エントロピー分類器を用いて冠詞を推定する手法が高い精度を示している.しかしながら,このような従来手法では,定冠詞也Cの推定精度が低いという問題点が未だ残されている.言語学的な観点から,冠詞推定に前方の文脈が考慮されていない事がひとつの原因である.そこで,我々は,従来手法に加え,定冠詞が付与された名詞の前方文脈に出現しやすい名詞(共起語)をtheの決定要因として考慮する事で推定精度を向上させた.しかし,この共起語の中には,冠詞付与対象名詞と同一の主名詞,類義語など以外に,対象名詞からの関連語,連想語も含まれる.対象名詞からどのような単語を連想するかは,(書き手と読み手が属する)分野,時代背景,コミュニティにより異なる.これを近似的に実証するために,学習コーパスから,前後1ケ月,半年,1年,8年の年月差のある記事群を各評価コーパスとし,推定精度の変化を検証した.この結果,推定精度の向上幅が,冠詞付与対象名詞により変化し,直近の前後1ケ月が最も高くなる傾向が確認された.
机译:作为英语账单中等大小的文章估计方法,一种学习文档的方法正确写入并使用了解到的文章周围的信息,显示了使用最大熵分类器估计物品的高精度。然而,在这种传统方法中,仍然存在常规文章Cae C的估计精度低的问题。从语言角度来看,它是一个原因,文章前面的背景不被审议。因此,除了传统方法之外,我们还通过考虑易于出现在名词的前向上下文与常规文章中的名词(共源)来提高估计精度。然而,在这个共同中心,除了要收获的名词和相同的主要鼻子以及目标名词和关联术语中也包括同义词的其他单词等。与目标名词相关联的单词与该字段,周期,背景和社区不同。为了展示这一点,学习语料库,一个月,半年,一年,八年的文章,验证了每个评估仪式和估计准确性的变化。结果,由于铰接目标名词而改善估计精度变化,并且趋势趋于上个月最大的趋势。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号