首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >計量データに基づく名詞概念の選択-「統合物語生成システム」における一機構として
【24h】

計量データに基づく名詞概念の選択-「統合物語生成システム」における一機構として

机译:基于称重数据的名词概念选择 - “综合故事生成系统”中的单一机制

获取原文
获取原文并翻译 | 示例
           

摘要

小方らが開発している「統合物語生成システム」の現状においては,事象の概念表現を構成する個々の名詞概念は,それぞれ一つもしくは複数のカテゴリーの中から任意に選択される.そして基本的に,その名詞概念に基づき表層文における名詞の単語が表記される.概念と単語は直結している.現状では,様々な性格の名詞概念(簡単/難しい,良く使われる/あまり使われない,新しい/古い,等)があるカテゴリーの中に混在しているため,選択される概念の性質にばらつきが生じたり,馴染みの無い語彙が頻出することが問題となっている.ここでは,テキスト(主に近·現代小説)における語彙の出現頻度を調べ,これに基づいて名詞概念を選択することによって,この問題を解決しようとする.具体的には,「青空文庫」に収録されている4907作品を用いて43270の名詞概念に出現頻度を付与し,それを使って概念·語彙選択が行えるようにした.この方法によれば,必ずしも,馴染みのある(理解が容易な)名詞概念を選択するだけでなく,逆に故意に難解な表現を作り出すこともできる.
机译:目前,目前由省开发的“综合故事生成系统”,所以组成事件概念表示的个人名词概念是可选的一个或多个类别中的。基本上,基于名词概念描述了表面句中的名词的单词。概念和单词直接连接。目前,各种角色字符的名词概念(简单/困难,使用/未使用,新/旧等)在类别中混合,因此所选概念的概念的性质变化了这是一个问题不会发生或不熟悉的词汇。在这里,我们尝试通过检查文本中词汇的出现频率(关闭和当代小说)并根据此选择名词概念来解决这个问题。具体而言,使用在“Aozora Bunko”中记录的4907作品,给出了43270名词概念的发生频率,并且可以使用它来执行概念和词汇选择。根据这种方法,没有必要选择不一定熟悉(易于理解)的名词概念,而是相反,还可以创建有意困难的表达式。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号