首页> 外文OA文献 >レビュー及び周辺情報を用いた小説の感性情報の推定と小説検索システムの構築
【2h】

レビュー及び周辺情報を用いた小説の感性情報の推定と小説検索システムの構築

机译:利用评论和周围信息估算小说感性信息并构建新颖的搜索系统

摘要

QAサイトなどにおいて感性情報を手がかりに小説を探す人が多くいるにもかかわらず,感性情報を用いて小説を検索することができるシステムは少ない.また感性情報により検索可能なシステムのほとんどでは各小説の感性情報を人手でタグ付けしているため,そのコストの大きさは問題視されている.近年ではレビューに出現する感性語の出現頻度を用いることで,複数の感性項目(感性タグ)に対してその感性の度合いを推定している研究がある.感性語とは,感覚や感情表現を表す形容詞,形容動詞のことであり,感性タグとは感性語を似ている感性語どうしでまとめたときのグループの特徴を表すラベルである.しかし既存研究ではレビューが大量にあることを前提としているため,レビューの少ない小説に対してはその精度が不十分である.そこで本研究ではレビューの少ない小説に対しても高い精度で感性情報の推定を行う手法の開発を行った.提案手法ではまず既存研究と同様にレビューに出現する感性語の出現頻度を用いて各小説に対して感性情報の推定を行う.次にレビューから求めたレビュア及び対象小説を読みそうなレビュア(潜在レビュア)の感性情報や,同じ著者の小説から求めた著者の感性情報,また内容紹介が最も似ている小説の感性情報を用いて感性情報の更新を行うことで,小説の感性情報の推定を行う.既存手法との比較実験を行った.その結果レビューの少ない小説に対して,既存手法で100件のレビューを用いた際と同等の精度で感性情報の推定を行うことができた.また提案手法の各スコア拡張手法全てにおいて,精度が向上することが分かった.このことから,提案手法はレビューの少ない小説において有効であるといえる.今後の課題として,レビュアの属性情報を用いた潜在レビュアの推定手法の改良や,ジャンル情報を用いた提案手法の改良が挙げられる.
机译:尽管有很多人根据QA网站上的情感信息来搜索小说,但是很少有系统可以使用情感信息来搜索小说。此外,由于大多数可以通过敏感性信息进行搜索的系统都手动标记了每种小说的敏感性信息,因此其成本被认为是一个问题。近年来,有一些研究通过使用评论中出现的情感词出现的频率来估计多个情感项目(敏感标签)的情感程度。敏感度词是表达感觉和情绪的形容词和形容词,敏感度标签是表示将敏感度词与相似的情感词分组时的群体特征的标签。然而,由于现有研究假设评论数量众多,因此其准确性对于评论很少的小说是不够的。因此,在这项研究中,我们开发了一种即使对于评论很少的小说也可以高精度估计敏感度信息的方法。在所提出的方法中,如在现有研究中一样,首先通过使用评论中出现的情感词出现的频率来估计每本小说的敏感性信息。接下来,我们使用审稿人和可能从审阅中获得目标小说的审稿人(潜在审稿人)的敏感度信息,从同一作者的小说中获得的作者的敏感度信息以及内容最相似的小说的敏感度信息。通过使用这种方法更新情感信息来估计小说的情感信息。我们使用现有方法进行了对比实验。结果,对于评论很少的小说,我们能够以与使用现有方法使用100条评论时相同的准确度估算敏感度信息。还发现,在所提出方法的所有分数扩展方法中,准确性都得到了提高。由此可以说,所提出的方法在小说评论很少的小说中是有效的。未来的问题包括使用审阅者的属性信息来改进潜在审阅者的估计方法,以及使用体裁信息来改进所提出的方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号