首页> 中文学位 >基于知识元的中医古籍方剂知识表示研究
【6h】

基于知识元的中医古籍方剂知识表示研究

代理获取

摘要

方剂是由药物配合组成的医方。据统计现存有名和无名方剂20余万首,记载于2000余种中医古籍中,以古代的书面语言形式存在并传播。
  知识表示是指把知识客体中的知识因子与知识关联起来,以便于识别和理解知识。知识表示是知识组织的前提和基础,任何知识组织方法都要建立在知识表示的基础上。
  自然文本中所记述的知识是由多个概念集合在一起并且形成一定的关系而构成的,学者们对文献的理解也是通过对相互关联的一组词的分析理解,然后获得一个完整的概念。文献中的一个词通常不能表达某个完整概念,往往是一组词的相互关联,才能形成一个完整的概念,我们把中文文本中这种客观存在的语言现象称之为知识元。知识管理发展的趋势显示,人类知识处理经过了以篇为单位的文献处理时期,正在进行以数据库为单位的信息处理时期,将要进入以知识元为单位的知识处理时代。
  历代古医籍中所记载的内容众多的方剂学知识,既包含有海量的关于疾病治疗的方法和经验,又蕴涵着丰富的中医学理论。面对这样一座恢弘的知识宝库,我们一方面为这些珍贵方剂知识得以传承至今感到欣慰;另一方面,又为爬梳文献的艰难过程倍感无奈。传统的古籍整理手段以及知识获取方式已不能完全满足当前中医学继承发展的需求,古籍知识利用难的问题受到学者们的普遍关注。二十世纪末以来信息技术的发展,以及知识管理理论在古籍整理工作中的应用,催生了中医古籍数字化研究的发展,古籍方剂中由于蕴含大量中医学证法方药间规律性的知识,并因其知识自身结构性较强,成为中医药数据挖掘研究的一个热点,数据挖掘这一方法被介绍到中医药研究中最早所公开发表的文章就是与方剂相关的。然而就目前见诸报道的研究成果,尚达不到知识服务的水平,距离语义检索、知识发现等高级目标还有相当的差距,尤其随着“e-Science”这一概念的提出,基于数据挖掘技术的知识发现方法引起越来越多研究者的关注。在既有数据基础上发现新知识成为科学研究新的范式,这样就对古籍自然文本向科学数据的转换提出了更高的要求。
  计算机在中医古籍数字化领域的应用长期得不到深入发展,究其原因主要是古籍产生的历史悠久,数量众多,内容、结构复杂,各种关系的命题不清晰,蕴涵的复杂逻辑关系得不到充分表达。若要借助于计算机帮助实现对古籍知识的获取,就必须建立一种深入文献内部的知识组织方法。将古籍数据由自然记载形式过渡到适合计算机处理的表示形式,建立结构清晰、逻辑严谨的知识结构和语义关系网络,在对知识合理表示的基础上从而实现对知识的获取。
  传统古籍整理做章句的方法,以及编撰类书的工作经验提示我们,古籍文本中同样存在着可被抽取和单独管理的知识单元(知识体、知识元)。因此通过对中医古籍文本进行科学合理的解构,揭示中文文本中蕴含的知识和信息,是知识发现的重要方法和途径之一。基于此,柳长华教授结合多年来从事古籍整理研究的经验,结合传统古籍整理的理论与方法,提出了“基于知识元的中医古籍计算机知识表示方法”这一指导中医古籍资源深入开发的新理论。该理论的提出,使得对中医古籍知识的管理,由间接的文献层面深入到直接的知识层面。
  本文以中医古籍方剂知识元研究为核心,拟通过对古籍文献中知识元的抽取与标引,结构起以知识体为单元的知识组织体系:通过对语义成分间关系的标引,关联起中医古籍方剂知识语义网络。从而构建起以知识元为核心的知识表示体系,并尝试对该体系采用形式化的手段进行表达。主要内容包括:
  一、通过对《五十二病方》、《肘后备急方》、《辅行诀脏腑用药法要》、《备急千金要方》、《外台秘要方》、《太平圣惠方》、《太平惠民和剂局方》、《伤寒明理方论》、《普济方》、《医方考》、《祖剂》、《古今名医方论》、《汤头歌诀》、《绛雪园古方选注》,以及《黄帝内经》、《伤寒杂病论》、《脾胃论》、《丹溪心法》、《本草纲目》、《傅青主女科》、《临证指南医案》等30余种包含方剂知识的各类古籍文献体例的研究,在分析方剂知识特征的基础上,对方剂知识体、知识元存在于古籍文本中的各种形式进行系统梳理。
  1、古籍方剂知识特征
  (1)从文献学角度分析:中医古籍方剂知识表现为内容众多、分布广泛、重复性高、相似度大、体裁多样、版本差异等特点。
  (2)从科学数据角度分析:中医古籍方剂知识存在自然语言的高度歧义性、概念间语义关系复杂、数据缺失等问题。
  2、方剂知识体与知识元在古籍文本中的存在形式
  (1)方剂知识体聚类出现;方剂知识体与其他知识体相关出现。
  (2)方剂知识元分散分布;方剂知识元聚合分布。
  二、参照中医古籍方剂语义元数据规范,对方剂元概念所指的内涵外延进行界定。通过对古籍方剂知识体、知识元进行结构化定义,为知识体、知识元的抽取和标引提供客观依据。
  1、中医古籍方剂语义元数据体系
  中医古籍方剂语义元数据体系包括10个核心元数据:“方名”、“出处”、“功用主治”、“组成”、“制法”、“用法”、“加减”、“方解”、“附方”、“附案”,及在此基础上的扩展规则。
  2、知识体、知识元结构化定义
  BK:=
  EK:=
  三、从古籍文献中分析抽取出典型的方剂知识体、知识元,将自然文本中逻辑统一的数据分割成可以独立管理的知识单元(知识体、知识元二级),结构起以知识体为单元的知识组织体系,并以此作为方剂知识语义网络研究的素材。
  四、对知识元构成要素--语义成分,进行归纳、分类,厘清各种语义类型,从而规范中医方剂知识领域内的各种概念。对语义成分进行合理分类,可以为高效、简洁、可理解、低歧义的形式化表达奠定下重要基础。
  1、定义了中医古籍方剂知识领域25种语义类型
  方剂、方类、药物、炮制、剂量、单味药、病证、证候、病因病机、治法、经络、脏腑、部位、食物、时长、时点、频率、器具、火候、规格、时令、地域、人群、人物、书籍。
  2、对概念内涵与外延进行界定,并对容易混淆的概念进行了分析比较。
  五、通过对方剂知识中各种概念间关系的研究,定义各种语义关系,将古籍中的方剂知识抽象为命题化的表述形式,并对各种运算和推理规则进行设计和定义。
  1、定义了中医古籍方剂知识领域46种语义关系
  等同关系、属分关系、整部关系和为数众多的相关关系。相关关系包括:组方关系、炮制关系、用量关系、代用关系、功效关系、治疗关系、导致关系、表现关系、配伍关系、祖衍关系、合和关系、归经关系、君药关系、臣药关系、佐药关系、使药关系、鉴别关系、先煎关系、后下关系、包煎关系、单煎关系、溶化关系、冲服关系、溶媒关系、赋形关系、药引关系、包衣关系、制时关系、制程关系、制火关系、制器关系、贮器关系、规格关系、用时关系、用频关系、用程关系、适用关系、禁忌关系、刊载关系、编著关系、创制关系、发挥关系、评按关系。
  2、对容易混淆和产生歧义的语义关系进行了比较说明。
  3、尝试给出部分命题的推理运算规则。
  六、建立面向中医方剂知识领域的符号命名规范,对知识体、知识元、语义类型、语义关系进行命名;建立面向中医方剂知识领域的符号运算规则体系和符号推理规则体系,符号体系的建立是实现知识表示体系形式化表达的工具。
  1、知识体、知识元符号命名
  2、语义类型符号命名规则
  3、语义关系符号命名规则
  七、将中医古籍方剂知识领域各种语义关系分别纳入关联含义和关联对象两种分类体系下,进行比较研究,以进一步实现对语义类型和语义关系的精确化定义。并对其符号命名规范进行验证与修正,从而设计出最为合理适度的符号表达方式。
  八、利用以上构建的基于知识元的中医古籍方剂知识表示体系,对方剂知识进行解析,通过从具有代表性的古籍文献中抽取方剂知识体、知识元,并对其进行标引,示范方剂知识解析的方法和步骤,并以此验证该知识表示体系的科学性和合理性。
  本研究的目标是构建起基于知识元的中医古籍方剂知识表示体系,借助于该体系,实现古籍方剂知识从描述性原始信息向含义准确、结构合理的科学数据的转化。

著录项

  • 作者

    丁侃;

  • 作者单位

    中国中医科学院;

  • 授予单位 中国中医科学院;
  • 学科 中医医史文献
  • 授予学位 博士
  • 导师姓名 柳长华;
  • 年度 2012
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 各代医方;
  • 关键词

    中医古籍; 方剂; 知识表示;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号