首页> 中文学位 >科技文档中数学公式的描述与检索
【6h】

科技文档中数学公式的描述与检索

代理获取

摘要

数学公式是一类非常特殊的符号表达式。在外形上,它呈现非线性结构,可以用于描述和展示比普通文本更加复杂的逻辑关系;在内容上,它简洁明了,对问题的描述和表达比普通文本更精确。数学公式作为科技文档中一类非常重要的元素,人们希望对它进行描述和检索,但由于目前缺乏有效的手段,对数学公式的描述与检索一直是一个难题。
   为了在Web环境下描述和检索数学公式,创建了一种基于XML的“形义”结合的数学公式描述方法ScienceML,实现了一个浏览器/服务器结构的数学公式检索原型系统MRS(Math Retrieval System)。ScienceML既描述了公式中各个元素之间的嵌套、上下、左右等形式结构信息,又描述了数学公式蕴含的语义信息;形式结构的描述可以满足公式在科技文档中显示的需求,内在语义的描述可以提高数学公式检索的精度。MRS主要包括公式采集、数据库创建、公式索引及公式查询4个模块。
   数学公式采集模块使用网络机器人技术,从网络上收集数学公式;在数据库设计过程中,分别创建了文档数据库、公式数据库和索引数据库,数学公式在各数据库中以编号的形式进行连接,既节省了存储空间,也加快了查询速度;由于数学公式是以运算为主线的,数学公式的索引采用了分层索引的方法以抽象出数学公式的关键特征。数学公式查询采用了子结构查询和语义相似性查询,提高了检索的效果。
   数学公式检索系统经过测试运行,取得了较好的实验结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号