...
首页> 外文期刊>システム/制御/情報 >Web上の同姓同名人物識別のための職業関連情報の抽出
【24h】

Web上の同姓同名人物識別のための職業関連情報の抽出

机译:提取与职业相关的信息以在Web上识别具有相同姓氏的人

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

Web上の人名検索においては,検索結果における同姓rn同名人物の識別が重要な課題となってきている.本研究rnの目的は,人名検索の結果取得されたWebページを同rn姓同名人物ごとに識別・分類したクラスタ(人物クラスrnタ)に,人物の識別に有用なラベルを付与することであrnる.本研究では,人物クラスタに一つの「職業関連情報」rnをラベルとして付与する手法を提案する.「職業関連情rn報」とは,厳密に職業と定義される語だけではなく,幅rn広く職業と考えられる語や,職業の推定に有用と思われrnる語も含めた,職業に関連する情報である.提案手法は,rn(a)HTML構造と簡単なヒューリスティックを用いた職rn業関連情報候補抽出,(b)出現頻度,同義クラスタ作成,rnWeb検索エンジンを用いた職業関連情報作成から構成さrnれる.実験の結果,提案手法の有効性を確認した.
机译:在网络上搜索个人姓名时,在搜索结果中标识相同的姓氏rn已成为重要问题。这项研究的目的是为集群(人类别rnta)提供一个用于识别人的有用标签,该集群对因搜索具有相同姓和名的每个人进行人名搜索而获得的网页进行识别和分类。 rnru。在这项研究中,我们提出了一种将一个“与职业有关的信息” rn添加到人群作为标签的方法。 “与职业有关的信息”是指不仅包括严格定义为职业的单词,而且还包括被广泛认为是职业的单词和被认为对估计职业有用的单词的职业。这是要提供的信息。所提出的方法包括:(a)HTML结构和与工作相关的职位信息候选者的简单启发式提取;(b)出现频率,同义词集群的创建以及Web搜索引擎与工作相关的信息的创建。 。实验结果表明,该方法是有效的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号