...
首页> 外文期刊>電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication >多言語論文データベースを用いたサーベイ論文検出-サーベイ論文自動作成の実現に向けて
【24h】

多言語論文データベースを用いたサーベイ論文検出-サーベイ論文自動作成の実現に向けて

机译:测量师纸张检测使用多语种文章数据库 - 实现调查纸自动创作的实现

获取原文
获取原文并翻译 | 示例
           

摘要

われわれは,サーベイ論文の自動作成を目指して研究を行っており,その第一歩として,本研究では,論文データベースからのサーベイ論文の自動検出を取り扱う.サーベイ論文は,他の論文と比べてその分野の多くの重要論文を参照するという特徴がある.この特徴を用いてサーベイ論文を検出するには,まずある分野における重要論文を特定し,次にそれらを多く参照している論文を探せば良い.このような処理を行うため,本研究ではHITSアルゴリズムに着目する.学術論文において,オーソリティはある分野の重要論文に,ハブはサーベイ論文に相当すると考えられるため,論文データベースにHITSアルゴリズムを適用し,ノヽブ値の高い論文を選択すれば,それがサーベイ論文の検出になっていると考えられる.しかし,HITSアルゴリズムは,文書間の参照·被参照関係にのみ着目し,個々の文書の内容は考慮していないため,たまたま多くの関連論文を参照する論文もサーベイ論文として検出されてしまう可能性がある.そこで本研究では,論文の内容を考慮することで,HITSアルゴリズムによるサーベイ論文棒出の精度向上を試みた.提案手法の有効性を調べるため,実験を行った.実験の結果,HITSアルゴリズムはサーベイ論文検出に有効であり,また,提案手法はHITSアルゴリズムを上回る検出精度が得られることがわかった.
机译:我们正在对自动创建的调查论文的研究,并作为其第一步,这项研究处理来自商品数据库调查论文的自动检测。调查论文的特点是指在该领域的许多重要文件相比其他论文。为了检测使用此功能的调查论文,你应该先指定在某一个领域的重要文件,然后找到一个论文引用他们中的很多。为了进行这样的处理,本研究的重点是HITS算法。在学术论文中,权力被认为是等同于纸的数据库,因此,如果轮毂被认为是等同的角度数据库,并选择高昂着头朴素的价值,它是由调查论文检测,这被认为是。然而,HITS算法的重点是参考和文件参考关系,以及个人文档的内容没有考虑,所以它可以检测碰巧看到很多相关的文章有论文。因此,在这项研究中,我们试图通过考虑纸的内容,以提高由HITS算法验船师吧准确性。进行实验,调查了该方法的有效性。作为实验的结果,HITS算法是有效的用于测量分析,并且所提出的方法已经表明,获得检测精度超过HITS算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号