首页> 中文学位 >面向医学知识获取的Web挖掘
【6h】

面向医学知识获取的Web挖掘

代理获取

摘要

随着生活水平的提高,人们对于医疗、保健的关注不断地加深,在众多的知识体系中,医学知识成为人类最重要的知识之一,Internet成为人们获取医学知识或健康知识的有利平台。构建一个面向医学知识的挖掘系统,为一般的用户在Internet上搜索出简单而方便的医学知识或健康知识,成为主题搜索引擎研究的一个热点。
   根据医学专家的建议及相关词典来设计构造两个服务于普通大众的医学分词词典——基于树的子关系词词典和基于线性表的同义词词典,将用户的输入与词典进行关键词匹配,实现解读用户的自然语言输入,将符合用户需要的医学子关系词和医学同义词同时获取出来,为进一步的Web挖掘提供相对准确的关键词集合。
   为关键词集合中的每一个关键词赋予权值,并根据关键词在页面中的不同位置赋予权值,由这两种权值得到的页面评估分值是网络蜘蛛抓取时的评判标准。在使用深度优先的爬行算法的同时,引入了“未来回报价值”理念,扩展了抓取的范围而且还尽可能地不放弃存在相关主题的页面,实现医学知识的Web挖掘。
   最后,针对医学知识做Web挖掘的个性化研究,结合本文的构造词典和爬行方式,得到面向医学知识获取的Web挖掘原型系统。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号