首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >多言語論文データベースを用いたサーベイ論文検出-サーベイ論文自動作成の実現に向けて
【24h】

多言語論文データベースを用いたサーベイ論文検出-サーベイ論文自動作成の実現に向けて

机译:使用多语种试卷数据库进行试卷检测-实现自动创建试卷

获取原文
获取原文并翻译 | 示例
       

摘要

われわれは,サーベイ論文の自動作成を目指して研究を行っており,その第一歩として,本研究では,論文データベースからのサーベイ論文の自動検出を取り扱う.サーベイ論文は,他の論文と比べてその分野の多くの重要論文を参照するという特徴がある.この特徴を用いてサーベイ論文を検出するには,まずある分野における重要論文を特定し,次にそれらを多く参照している論文を探せば良い.このような処理を行うため,本研究ではHITSアルゴリズムに着目する.学術論文において,オーソリティはある分野の重要論文に,ハブはサーベイ論文に相当すると考えられるため,論文データベースにHITSアルゴリズムを適用し,ノヽブ値の高い論文を選択すれば,それがサーベイ論文の検出になっていると考えられる.しかし,HITSアルゴリズムは,文書間の参照·被参照関係にのみ着目し,個々の文書の内容は考慮していないため,たまたま多くの関連論文を参照する論文もサーベイ論文として検出されてしまう可能性がある.そこで本研究では,論文の内容を考慮することで,HITSアルゴリズムによるサーベイ論文棒出の精度向上を試みた.提案手法の有効性を調べるため,実験を行った.実験の結果,HITSアルゴリズムはサーベイ論文検出に有効であり,また,提案手法はHITSアルゴリズムを上回る検出精度が得られることがわかった.
机译:我们正在进行旨在自动创建调查文件的研究,并且作为第一步,此研究致力于从论文数据库中自动检测调查文件。与其他论文相比,调查论文的特点是引用该领域的许多重要论文。要使用此功能检测调查论文,首先要确定特定领域中的重要论文,然后搜索大量引用它们的论文。为了执行这样的处理,在本研究中我们专注于HITS算法。在学术论文中,权威被认为对应于特定领域的重要论文,而枢纽被认为对应于调查论文。被认为是。但是,由于HITS算法仅关注文档之间的参考/参考关系,而没有考虑单个文档的内容,因此有可能会将碰巧涉及许多相关文章的文章检测为调查文章。有。因此,在本研究中,我们尝试通过考虑论文的内容,通过HITS算法提高调查论文的准确性。进行了实验以研究该方法的有效性。实验结果表明,HITS算法对于检测论文是有效的,所提出的方法可以获得优于HITS算法的检测精度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号