首页> 外文会议>SYNAT Workshop >Home Pages Identification and Information Extraction in Researcher Profiling
【24h】

Home Pages Identification and Information Extraction in Researcher Profiling

机译:主页网页识别和研究人员分析中的信息提取

获取原文

摘要

In order to create a structured database describing researchers, home pages can be used as an information source. As the first step of this task, home pages are searched and identified with the usage of the classifier. Then, the information extraction process is per formed to enrich researchers profiles, e.g., extract phone and e-mail. We proposed the algorithm for extracting phone numbers, fax numbers and e-mails based on generalised sequential patterns. Extracted information is stored in the structured database and can be searched by users.
机译:为了创建描述研究人员的结构化数据库,主页可以用作信息源。作为此任务的第一步,搜索主页页面并使用分类器的使用标识。然后,每次形成信息提取过程以丰富研究人员概况,例如提取电话和电子邮件。我们提出了基于广义连续模式提取电话号码,传真号码和电子邮件的算法。提取的信息存储在结构化数据库中,可以由用户搜索。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号