首页> 中国专利> 基于语义网技术的组织病理切片语义描述语言的建立及应用方法

基于语义网技术的组织病理切片语义描述语言的建立及应用方法

摘要

一种基于语义网技术的组织病理切片语义描述语言的建立及应用方法,其中语义描述语言的建立为:通过建立病理特征描述语言的基本项,包括本体类、对象属性与数据属性,能够表示病理切片中的更大范围的病理特征;在应用上,对组成该表型的的每一个实体、实体的属性、实体之间的关系进行细粒度描述,相较现有工作,能够大大降低表示的歧义性,另外,结合网络本体语言(OWL)自身具备的检索、推理等功能,能够进一步降低计算机传输、理解、分析复杂病理特征的难度;本发明能够对不同癌种的病理切片中出现的多元病理特征进行描述,实现对病理特征更加完整、精确的表示,为实现病理数据语义互操作性提供基础技术支撑。

著录项

  • 公开/公告号CN114896419A

    专利类型发明专利

  • 公开/公告日2022-08-12

    原文格式PDF

  • 申请/专利权人 西安交通大学;

    申请/专利号CN202210607760.3

  • 申请日2022-05-31

  • 分类号G06F16/36(2019.01);G06F40/30(2020.01);G06V20/69(2022.01);

  • 代理机构西安智大知识产权代理事务所 61215;

  • 代理人季海菊

  • 地址 710049 陕西省西安市碑林区咸宁西路28号

  • 入库时间 2023-06-19 16:22:17

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-30

    实质审查的生效 IPC(主分类):G06F16/36 专利申请号:2022106077603 申请日:20220531

    实质审查的生效

说明书

技术领域

本发明属于医疗信息化语义标准技术领域,具体涉及一种基于语义网技术的组织病理切片语义描述语言的建立及应用方法。

背景技术

语义表示是实现数据语义互操作性的关键技术。数据的语义互操作性是指:在数据文件(例如,数字病理切片)共享的基础上,实现数据中隐含的语义特征(例如,细胞、组织、组织病理表型)的共享。语义表示技术通过将数据中的语义特征表示在一致的、计算机可读,可懂,可处理的信息结构下,实现语义特征的结构化传输与解析,支撑数据语义互操作性的实现。实现医疗数据语义互操作性是全球医疗信息化建设的重要目标,对人工智能与大数据技术在医疗领域的应用,医疗数据共享,医学研究以及医疗领域国际合作都具有重要意义。近年来,计算病理技术取得快速发展,结构化地表示病理切片中隐含的海量病理特征,实现组织病理切片语义互操作性,是实现计算病理技术大规模应用的关键。

然而,现有面向病理切片的语义表示技术存在表示结构僵硬、表示歧义性强的问题。常见的语义表示技术有标签列表以及树形标签分类结构;标签列表例如用于标注切片中不同组织或鉴别诊断的标签列表;树形标签分类结构,比标签列表能够表示更多的信息,例如表示细胞及其所在组织,表示诊断以及作为诊断依据的表型。然而,以列表或者树形分类结构表示病理特征限制了信息表示的维度,难以对病理特征之间复杂的语义关系进行全面的描述,同时也无法引入量化特征(面积或半径)。例如,要精确描述切片上的一个表型,使得计算机能够理解这个表型,并区分其他类似病理表型,除了为其取一个名字,外加指出该表型所在的解剖学位置,还必须描述这个表型的各个组成部分,并对这个表型与其他表型的区别给出量化定义(例如,细胞数达到多少才能算“细胞增生”)。无论是列表,还是树形结构都难以灵活地表示这些细节,进而无法实现对病理特征的精确描述。除此之外,列表与树形结构还存在难以扩展的问题,很多新发现的病理特征难以纳入其表示范围。除了这两种方式外,自然语言也常用来表示病理特征。然而,虽然自然语言能够灵活描述不同的信息,但却存在歧义性强的问题。例如,对于自然语言描述的表型,不同的病理医生往往会有不同的理解,这种歧义性在病理医生的交流之中尚能被容忍,但却会成为计算机理解病理信息的一大障碍。

现有计算病理软件、模型以及医院的信息系统,广泛地采用上述方法,描述组织病理切片中的语义特征;信息的表示结构不同,歧义性强,文件格式不一致,这些因素阻碍了病理语义特征的结构化传输与精准解析,同时也极大地干扰了计算病理技术在病理诊断、病理研究领域的有效应用。

发明内容

为了克服上述现有技术的不足,本发明的目的旨在提出一种基于语义网技术的组织病理切片语义描述语言的建立及应用方法,其中语义描述语言的建立为:通过建立病理特征描述语言的基本项,包括本体类、对象属性与数据属性,能够表示病理切片中的更大范围的病理特征;在应用上,对组成该表型的每一个实体、实体的属性、实体之间的关系进行细粒度描述,大大降低了描述的歧义性,另外,结合网络本体语言(OWL)自身具备的检索、推理等功能,能够进一步降低计算机存储、传输、理解、分析复杂病理特征的难度;本发明能够对不同癌种的病理切片中出现的多元病理特征进行描述,实现对病理特征更加完整、精确的表示,为实现病理数据语义互操作性提供基础技术支撑。

为了实现上述目的,本发明采用的技术方案为:

一种基于语义网技术的组织病理切片语义描述语言的建立方法,基于网络本体语言OWL,采用本体编辑工具Protégé-OWLeditor,建立病理特征描述语言的基本项,包括本体类、对象属性与数据属性;其中,本体类用于表达相关概念,对象属性用于描述本体类之间的逻辑关系,数据属性用来存储名称、数值等信息;具体包括以下步骤:

一、构建本体类所属分支;

二、设置对象属性,在本体类中使用对象属性,通过设置属性值为其他类,表示该类与其他类之间的关系:设置对象属性要定义属性域domain和范围range,定义对象属性属性域domain,即规定哪些本体类可以使用该对象属性;定义对象属性属性范围range,即规定哪些本体类可作为该属性的属性值;

三、设置数据属性,在本体类中使用数据属性,定义数据属性的属性域domain指规定哪些本体类可以使用该数据属性;定义数据属性的属性范围range指明确属性值的数据类型,包括字符、数值等。

所述步骤一具体步骤包括:

Step1将本体类分为Entity类、Utility类,Entity用于表示病理表型,Utility类用于辅助表示Entity类;

Step2对Entity类设置Phenotype、PhysicalEntity子类,令Phenotype用于表示病理切片中的病理表型,PhysicalEntity用于表示组成病理表型的实体,包括细胞,细胞的组成结构包括细胞质、细胞核、核仁等,细胞的化学物质包括细胞的产物或储存物等,组织及相关的解剖学结构包括管或腔等;

Step3将Step2中的PhysicalEntity分为Substance、NormalEntity与Tumor子类,令Substance用于表示病理切片中出现的化学物质,NormalEntity用于表示病理切片中出现的非癌变实体,Tumor用于表示病理切片中出现的癌变实体;

Step4将Step3中的NormalEntity进一步分为NormalCell、NormalCellularComponent、NormalAnatomicalEntity子类,令NormalCel用于表示非癌变细胞,NormalCellularComponent用于表示非癌变细胞组成成分,NormalAnatomicalEntity用于表示非癌变的组织或解剖学结构;

Step5将Step3中的Tumor进一步分为Parenchyma与Stroma子类,令Parenchyma用于表示肿瘤的实质,Stroma用于表示肿瘤的间质;

Step6将Step5中的Parenchyma进一步分为NeoplasticCell、NeoplasticCellularComponent、ParenchymaAnatomicalEntity子类,令NeoplasticCell用于表示肿瘤细胞,NeoplasticCellularComponent用于表示肿瘤细胞的组成成分,ParenchymaAnatomicalEntity用于表示肿瘤组织内部形成的解剖学结构;

Step7将Step5中的Stroma进一步分为StromaCell、StromaCellularComponent与StromaAnatomicalEntity子类,令StromaCell表示肿瘤间质的细胞,StromaCellularComponent表示肿瘤间质的组成成分,StromaAnatomicalEntity表示因肿瘤发生发展而增生形成的组织或解剖学结构;

Step8将Step2中的Phenotype分为Cellular_Appearances、Product_or_Reserve以及Architectural_Pattern子类,令Cellular_Appearances用于表示细胞表型,Product_or_Reserve用于表示细胞产物与储存物构成的表型,Architectural_Pattern用于表示结构表型;

Step9将Step1中的Utility类分为EntityReference、EntityAttribute、Quantification、Relationship;令EntityReference用于表示组成病理表型的实体的实体类型,包括细胞种类、组织类型等;令EntityAttribute用于表示实体的特征,包括大小、形状等,Quantification用于引入定量信息,对特征进行量化衡量,细化EntityAttribute对实体的特征的表示,Relationship用于表示实体与实体之间的动态关系,包括一个组织对另一个组织的挤压、侵犯或浸润等;

Step10将Step9中的EntityReference分为CellReference、CellularComponentReference、SubstanceReference与AnatomicalEntityReference子类,令CellReference用于表示细胞类型包括淋巴细胞、红细胞、纤维细胞、不同癌症所对应的肿瘤细胞等;CellularComponentReference用于表示细胞组成结构类型,包括细胞的细胞质、细胞的细胞核等;令SubstanceReference用于表示细胞的化学物质类型,包括蛋白质、脂肪、铁血红素等;令AnatomicalEntityReference用于表示组织或解剖学结构的类型,包括毛细血管、腔。

所述步骤二设置对象属性具体方法为:

Step1建立对象属性hasComponent,规定该对象属性的域和范围为步骤一Step2中设置的PhysicalEntity本体类,表示不同实体间的组分关系;

Step2建立对象属性has_entityReference,规定该对象属性的域为PhysicalEntity本体类,范围为步骤一Step9中的EntityReference本体类;在PhysicalEntity中使用has_entityReference,将属性值设为EntityReference,表示前者是属于后者所表示的实体类型的一个实体;

Step3建立对象属性hasAttribute,规定该对象属性的域为PhysicalEntity本体类,范围为步骤一Step9中的EntityAttribute本体类;在PhysicalEntity中使用hasAttribute,将属性值设为EntityAttribute,表示后者是前者的一个特征;

Step4建立对象属性hasProduct与hasReserve,规定对象属性的域为PhysicalEntity本体类,范围为步骤一Step10中的Substance(SubstanceReference)本体类;在PhysicalEntity中使用hasProduct或hasReserve,将属性值设为Substance,分别表示后者是前者生产或储存的化学物质;

Step5建立对象属性has_quantification,规定该对象属性域为EntityAttribute,范围为Quantification本体类;在EntityAttribute中使用has_quantification,将属性值设为Quantification,表示后者是衡量前者的量化信息;

Step6建立对象属性present_Entity,规定该对象属性域为步骤一Step2中设置的Phenotype本体类,范围为PhysicalEntity本体类;在Phenotype中使用present_Entity,将属性值设为PhysicalEntity,表示后者表示的实体是前者表示的表型的一个组成部分;

Step7建立对象属性has_relationship,规定该对象属性域为步骤一Step8中的Architectural_Pattern本体类,范围为步骤二Step9中的Relationship;在Architectural_Pattern中使用has_relationship,并将属性值设为Relationship,表示前者表示的表型,其中的组成实体之间含有动态关系包括组织间的挤压、侵犯或浸润,而后者则是对这一动态关系进一步的描述;

Step8建立对象属性object,subject,规定该对象属性域为Step7中的Relationship本体类;object与subject的范围为PhysicalEntity本体类;在Relationship中使用object或subject,并将属性值设为PhysicalEntity,分别表示主动运动的实体,以及受该运动影响的实体,而这两个实体都是步骤一Step7中Architectural_Pattern所表示的表型的组成部分。

所述步骤三设置数据属性的具体步骤包括:

Step1建立hasValue与unit数据属性,规定该数据属性域为步骤一Step9中的Quantification本体类,范围分别为浮点数与字符串,用于存储量化信息的数值与单位;

Step2建立name与comment数据属性,规定该数据属性域为所有的本体类,范围为字符串,用于存储名称信息与注释信息;

Step3建立segmentation数据属性,规定该数据属性域为PhysicalEntity本体类及其子类,范围为字符串,用于存储不同实体所对应的像素点在病理切片中的坐标。

一种基于语义网技术的组织病理切片语义描述语言的应用方法,基于已建立的本体类、数据属性与对象属性,对病理切片中的病理特征进行表示,具体包括以下步骤:

一、建立PhysicalEntity本体类实例并对显微镜下观察到的病理切片中的实体进行表示;

Step1选用NormalEntity及其子类,建立本体类实例,表示观察到的正常的实体,选用Tumor及其子类,建立本体类实例,表示观察到的癌变的实体,完成PhysicalEntity本体类实例建立;

Step2根据实体类型,包括细胞类型、细胞组成、成分类型、组织与解剖学结构类型,建立对应的EntityReference本体实例;

Step3在PhysicalEntity本体类实例中,使用has_entityReference对象属性,设置属性值为对应的EntityReference本体类实例,表示PhysicalEntity本体类实例所表示的实体,隶属于EntityReference本体类实例所表示的实体类型;

Step4建立EntityAttribute本体类实例,对实体的大小、形状等特征进行表示,特征名称采用数据属性name存储;

Step5建立Quantification本体类实例,引入量化信息,对大小、形状等特征进行定量描述;使用数据属性hasValue,unit存储具体的数值、单位等信息;

Step6在EntityAttribute本体类实例中,使用对象属性has_quantification,设置属性值为包含具体量化信息的Quantification本体类实例,表示Quantification本体类实例所表示的量化信息是对EntityAttribute本体类实例所表示的特征的定量描述;

Step7在PhysicalEntity本体类实例中,使用hasAttribute对象属性,设置属性值为EntityAttribute本体类实例,表示PhysicalEntity本体类实例所表示的实体带有EntityAttribute实例所表示的特征;

Step8对于某个由多个实体构成的实体,在该实体对应的PhysicalEntity实例中使用对象属性hasComponent,设置属性值为表示组成该实体的PhysicalEntity实例,表示后者为前者的组成成分;

Step9特别地,对于产生或储存化学物质的某个实体,在该实体的PhysicalEntity实例中使用对象属性hasProduct与hasReserve,设置属性值为表示该化学物质的Substance本体类实例,表示后者是前者生产或储存的化学物质;

二、建立Phenotype本体类实例,对显微镜下观察到的病理切片中的病理表型进行描述;

Step1对于通常在高倍镜下观察到的,由单个细胞、细胞成分构成的细胞表型或由细胞产物与储存物构成的表型,首先利用PhysicalEntity描述该表型的组成实体包括细胞质、细胞核、核仁等,利用EntityAttribute与Quantification描述实体的形态学特征,使用hasComponent描述不同实体间的组分关系,其次,建立Cellular_Appearances或Product_or_Reserve本体类实例表示由单个细胞、细胞成分构成的细胞表型或由细胞产物与储存物构成的表型,使用对象属性present_Entity,设置属性值为上述PhysicalEntity本体类实例,表示由Cellular_Appearances或Product_or_Reserve本体类实例表示的表型,由PhysicalEntity本体类实例所表示的实体构成;

Step2对于通常在中低倍镜下观察到的,由细胞群、组织等不同实体,按照自定义排列模式,构成的结构表型,首先使用PhysicalEntity表示构成这一表型的每个实体包括细胞、细胞的组成结构、细胞的化学物质、组织或其他的解剖学结构,为其分别建立PhysicalEntity本体类实例;其次,在PhysicalEntity本体类实例中,使用hasComponent描述不同实体间的组分关系;使用数据属性segmentation,存储不同实体所对应的像素点在病理切片中的坐标,实现对每个实体的定位;最后,建立Architectural_Pattern本体类实例表示由细胞群、组织等不同实体,按照自定义排列模式,构成的结构表型,在实例中使用present_Entity,设置属性值为建立的PhysicalEntity本体类实例,表示由Architectural_Pattern本体类实例表示的表型,由PhysicalEntity本体类实例所表示的实体构成;

Step3组织的行为是另一种常在低倍镜下被观测到的结构表型,这类结构表型反应了组织与组织之间的动态关系,包括一种组织对另组织的挤压、侵犯、浸润,对于组织的行为这种表型,首先建立PhysicalEntity实例,表示构成这一表型的每个实体;其次,建立Architectural_Pattern本体类实例表示该表型,在实例中使用present_Entity,设置属性值为建立的PhysicalEntity本体类实例,表示由Architectural_Pattern本体类实例表示的表型,由PhysicalEntity本体类实例所表示的实体构成;进一步建立Relationship本体类实例,对组织之间的动态关系进行描述,使用object与subject对象属性,设置object属性值为表示作为运动主体的实体的PhysicalEntity实例,设置subject属性值为表示受该运动影响的实体的PhysicalEntity实例。

本发明的有益效果在于:

相较于标签列表或者树形分类结构,语义网技术有着更加结构化与灵活的知识表示能力,这使得本发明相较于现有技术有诸多优势。

1、本发明解决了现有技术受限于表示结构僵硬的缺点,大多只能表示病理切片中单细胞尺度的特征(例如单个细胞或细胞成分)的缺陷,而本发明能够表示病理切片中的更大范围的病理特征,能在此基础上对病理切片介观尺度的特征(例如组织、病理表型)进行表示。

2、对于同一个病理特征,本发明能够整合定性、定量多维度特征对其进行描述;例如,对于一个结构表型,本发明能够对组成该表型的的每一个实体、实体的属性、实体之间的关系进行细粒度描述。相较现有技术,本发明能够大大降低表示的歧义性。

3、采用本发明表示的病理表型,结合网络本体语言(OWL)自身具备的检索、推理等功能,本发明能够进一步降低计算机存储、传输、理解、分析复杂病理特征的难度。

综上,本发明能够对不同癌种的病理切片中出现的多元病理特征进行描述;在计算病理软件、模型以及医院的信息系统中推广应用本发明,能够有效推动病理切片语义互操作性的实现,支撑计算病理技术的大规模应用。

附图说明

图1为本发明的组织病理切片语义描述语言结构图。

图2为本发明的方法流程图。

图3为本发明实施例中对所述表型实体的描述示意图。

图4为本发明实施例中对所述表型中实体属性的描述示意图。

图5为本发明实施例中对所述表型描述示意图。

具体实施方式

下面结合附图与具体的实施例对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。本发明提出的描述语言适用于描述不同癌种组织切片中不同的病理特征,用户可根据描述需求自定义使用。

一种基于语义网技术的组织病理切片语义描述语言的建立方法,基于网络本体语言OWL,采用本体编辑工具Protégé-OWLeditor,建立病理特征描述语言的基本项,包括本体类、对象属性与数据属性;其中,本体类用于表达相关概念,对象属性用于描述本体类之间的逻辑关系,而数据属性用来存储名称、数值等信息。

参见图1,本语言主要由两大本体类构成,分别为Entity、Utility。其中圆角矩形代表本体类,箭头代表子类关系,图片上方给出了一个本体类NeoplasticCell的实例。

Entity类主要包括Phenotype与PhysicalEntity两大子类,分别用于描述病理切片中的病理表型与构成表型的实体。不同类型的病理表型与不同类型的实体分别由Phenotype与PhysicalEntity的子类描述。

PhysicalEntity分为三个子类,Substance、NormalEntity与Tumor,分别用于描述病理切片中出现的化学物质、与非癌变实体以及癌变实体。NormalEntity进一步分为NormalCell、NormalCellularComponent、NormalAnatomicalEntity,分别用于描述非癌变细胞及其组成部分,以及非癌变的组织或解剖学结构(例如腔、管等)。Tumor进一步分为Parenchyma与Stroma,分别用于描述肿瘤的实质与间质。Parenchyma进一步分为NeoplasticCell、NeoplasticCellularComponent、ParenchymaAnatomicalEntity,分别描述肿瘤细胞及其组成成分,以及肿瘤组织内部形成的解剖学结构(例如肿瘤细胞细胞质中形成的空腔)。Stroma进一步分为StromaCell、StromaCellularComponent与StromaAnatomicalEntity,分别描述肿瘤间质的细胞及其组成成分,以及因肿瘤发生发展而增生形成的组织或解剖学结构(例如增生的纤维或血管)。

Phenotype分为三个子类,Cellular_Appearances、Product_or_Reserve以及Architectural_Pattern,分别用于描述细胞表型、细胞产物与储存物构成的表型以及结构表型;

Utility类主要用于辅助描述Entity类。Utility类由EntityReference、EntityAttribute、Quantification、Relationship组成。

EntityReference主要用于定义实体的宏观类型,主要分为CellReference、CellularComponentReference、SubstanceReference与AnatomicalEntityReference,分别用于定义细胞、细胞组成结构、细胞的化学物质以及组织或解剖学结构的宏观类型。

EntityAttribute主要用于描述实体的属性,而Quantification则用于引入定量信息,进一步细化EntityAttribute对属性的描述。

Relationship主要针对组织行为这一类型病理表型,行为这一关键信息进行描述。

使用本语言描述病理切片中的某个特征时,选取对应的本体类,建立本体实例,然后使用对象属性与数据属性,对该特征进行描述。以图一中给出NeoplasticCell实例为例,该实例包含数据属性name与comment,用于存储名称,以及用户注释,以字符串类型储存。hasAttribute用于关联描述属性的EntityAttribute实例;has_entityReference用于关联定义实体类型的CellReference实例;hasCellularComponent用于关联定义细胞成分的NeoplasticCellularComponent实例;hasProduct与hasReserve用于关联描述细胞产物与储存物的Substance实例。

语义描述语言建立具体步骤如下:

一、构建本体类所属分支,具体包括:

Step1将本体类分为Entity类、Utility类,Entity用于表示病理表型,Utility类用于辅助表示Entity类;

Step2对Entity类设置Phenotype、PhysicalEntity子类,令Phenotype用于表示病理切片中的病理表型,PhysicalEntity用于表示组成病理表型的实体,包括细胞,细胞的组成结构包括细胞质、细胞核、核仁等,细胞的化学物质包括细胞的产物或储存物等,组织及相关的解剖学结构包括管或腔等;

Step3将Step2中的PhysicalEntity分为Substance、NormalEntity与Tumor子类,令Substance用于表示病理切片中出现的化学物质,NormalEntity用于表示病理切片中出现的非癌变实体,Tumor用于表示病理切片中出现的癌变实体;

Step4将Step3中的NormalEntity进一步分为NormalCell、NormalCellularComponent、NormalAnatomicalEntity子类,令NormalCel用于表示非癌变细胞,NormalCellularComponent用于表示非癌变细胞组成成分,NormalAnatomicalEntity用于表示非癌变的组织或解剖学结构;

Step5将Step3中的Tumor进一步分为Parenchyma与Stroma子类,令Parenchyma用于表示肿瘤的实质,Stroma用于表示肿瘤的间质;

Step6将Step5中的Parenchyma进一步分为NeoplasticCell、NeoplasticCellularComponent、ParenchymaAnatomicalEntity子类,令NeoplasticCell用于表示肿瘤细胞,NeoplasticCellularComponent用于表示肿瘤细胞的组成成分,ParenchymaAnatomicalEntity用于表示肿瘤组织内部形成的解剖学结构;

Step7将Step5中的Stroma进一步分为StromaCell、StromaCellularComponent与StromaAnatomicalEntity子类,令StromaCell表示肿瘤间质的细胞,StromaCellularComponent表示肿瘤间质的组成成分,StromaAnatomicalEntity表示因肿瘤发生发展而增生形成的组织或解剖学结构;

Step8将Step2中的Phenotype分为Cellular_Appearances、Product_or_Reserve以及Architectural_Pattern子类,令Cellular_Appearances用于表示细胞表型,Product_or_Reserve用于表示细胞产物与储存物构成的表型,Architectural_Pattern用于表示结构表型;

Step9将Step1中的Utility类分为EntityReference、EntityAttribute、Quantification、Relationship;令EntityReference用于表示组成病理表型的实体的实体类型,包括细胞种类、组织类型等;令EntityAttribute用于表示实体的特征,包括大小、形状等,Quantification用于引入定量信息,对特征进行量化衡量,细化EntityAttribute对实体的特征的表示,Relationship用于表示实体与实体之间的动态关系,包括一个组织对另一个组织的挤压、侵犯或浸润等;

Step10将Step9中的EntityReference分为CellReference、CellularComponentReference、SubstanceReference与AnatomicalEntityReference子类,令CellReference用于表示细胞类型包括淋巴细胞、红细胞、纤维细胞、不同癌症所对应的肿瘤细胞等;CellularComponentReference用于表示细胞组成结构类型,包括细胞的细胞质、细胞的细胞核等;令SubstanceReference用于表示细胞的化学物质类型,包括蛋白质、脂肪、铁血红素等;令AnatomicalEntityReference用于表示组织或解剖学结构的类型,包括毛细血管、腔。

用户能够通过上述本体类表示自定义的实体类型,提升使用灵活性。

二、设置对象属性,在本体类中使用对象属性,通过设置属性值为其他类,表示该类与其他类之间的关系:设置对象属性要定义属性域domain和范围range,定义对象属性属性域domain,即规定哪些本体类可以使用该对象属性;定义对象属性属性范围range,即规定哪些本体类可作为该属性的属性值,具体方法为:

Step1建立对象属性hasComponent,规定该对象属性的域和范围为步骤一Step2中设置的PhysicalEntity本体类,表示不同实体间的组分关系;

Step2建立对象属性has_entityReference,规定该对象属性的域为PhysicalEntity本体类,范围为步骤一Step9中的EntityReference本体类;在PhysicalEntity中使用has_entityReference,将属性值设为EntityReference,表示前者是属于后者所表示的实体类型的一个实体;

Step3建立对象属性hasAttribute,规定该对象属性的域为PhysicalEntity本体类,范围为步骤一Step9中的EntityAttribute本体类;在PhysicalEntity中使用hasAttribute,将属性值设为EntityAttribute,表示后者是前者的一个特征;

Step4建立对象属性hasProduct与hasReserve,规定对象属性的域为PhysicalEntity本体类,范围为步骤一Step10中的Substance(SubstanceReference)本体类;在PhysicalEntity中使用hasProduct或hasReserve,将属性值设为Substance,分别表示后者是前者生产或储存的化学物质;

Step5建立对象属性has_quantification,规定该对象属性域为EntityAttribute,范围为Quantification本体类;在EntityAttribute中使用has_quantification,将属性值设为Quantification,表示后者是衡量前者的量化信息;

Step6建立对象属性present_Entity,规定该对象属性域为步骤一Step2中设置的Phenotype本体类,范围为PhysicalEntity本体类;在Phenotype中使用present_Entity,将属性值设为PhysicalEntity,表示后者表示的实体是前者表示的表型的一个组成部分;

Step7建立对象属性has_relationship,规定该对象属性域为步骤一Step8中的Architectural_Pattern本体类,范围为步骤二Step9中的Relationship;在Architectural_Pattern中使用has_relationship,并将属性值设为Relationship,表示前者表示的表型,其中的组成实体之间含有动态关系包括组织间的挤压、侵犯或浸润,而后者则是对这一动态关系进一步的描述;

Step8建立对象属性object,subject,规定该对象属性域为Step7中的Relationship本体类;object与subject的范围为PhysicalEntity本体类;在Relationship中使用object或subject,并将属性值设为PhysicalEntity,分别表示主动运动的实体,以及受该运动影响的实体,而这两个实体都是步骤一Step7中Architectural_Pattern所表示的表型的组成部分。

三、设置数据属性,在本体类中使用数据属性,定义数据属性的属性域domain指规定哪些本体类可以使用该数据属性;定义数据属性的属性范围range指明确属性值的数据类型,包括字符、数值等,具体步骤包括:

Step1建立hasValue与unit数据属性,规定该数据属性域为步骤一Step9中的Quantification本体类,范围分别为浮点数与字符串,用于存储量化信息的数值与单位;

Step2建立name与comment数据属性,规定该数据属性域为所有的本体类,范围为字符串,用于存储名称信息与注释信息;

Step3建立segmentation数据属性,规定该数据属性域为PhysicalEntity本体类及其子类,范围为字符串,用于存储不同实体所对应的像素点在病理切片中的坐标。

一种基于语义网技术的组织病理切片语义描述语言的应用方法。基于已建立的本体类、数据属性与对象属性,对病理切片中的病理特征进行表示,以透明细胞肾细胞癌的细胞表型“横纹肌样细胞”的描述为例。“横纹肌样细胞”是一种在镜下看来体型较大的肿瘤细胞,细胞质中含有嗜酸性粘液,肿瘤细胞细胞核形状不规则且位置偏离细胞中心,核仁清晰。实施例采用的表型图片取自公开数据集TCGA中的病理切片。实施例主要用来说明本发明如何描述病理切片中存在的实体、实体属性以及病理表型。

语义描述语言应用具体包括以下步骤:

参见图2,步骤一:建立PhysicalEntity本体类实例,对显微镜下观察到的病理切片中的实体进行表示,使用EntityReference建立实体类型定义;

参见图3,具体方法为:

S1为肿瘤细胞、细胞质、细胞核、核仁以及粘液,分别建立名为Cell、Cytoplasm、Nucleus、Nucleolus与Mucin的EntityReference实例;

S2为图片中某一具体的肿瘤细胞,其细胞质、细胞核、核仁以及粘液,分别建立名为Rhabdoid_Cell1、Neoplastic_Cytoplasm、Neoplastic_Nucleus、Neoplastic_Nucleolus、Intracytoplasmic_Mucin的PhysicalEntity实例,使用has_entityReference对象属性,设置属性值为对应的EntityReference本体类实例,表示实体隶属的实体类型,通过hasCellularComponent与hasReserve表示这些实体之间的组分关系,通过hasAttribute表示这些实体所含有的特征;

步骤二:对上述实体的特征,使用EntityAttribute进行表示,必要时引入量化信息,使用Quantification表示;

参见图4,具体方法为:

S1为横纹肌样细胞的特征“较大”建立名为Large的EntityAttribute实例以及名为Quantification1的Quantification实例,在Large中使用has_quantification,设置属性值为Quantification1实例,表示Quantifiacation1所表示的量化信息是对Large所表示的特征的定量描述;Quantification1中储存了该细胞面积的信息,数值为62,单位为平方微米,分别由数据属性hasValue与unit储存;

S2为横纹肌样细胞细胞核特征“形状不规则”建立名为Irregularly_Shaped的EntityAttribute实例以及名为Quantification2的Quantification实例;在Irregularly_Shaped中使用has_quantification,设置属性值为Quantification2实例,表示Quantifiacation2所表示的量化信息是对Irregularly_Shaped所表示的特征的定量描述;Quantification2中储存了该细胞核曲率的信息,数值为0.837;

S3为横纹肌样细胞细胞核特征“位置偏离细胞中心”建立名为Eccentric的EntityAttribute实例以及名为Quantification3的Quantification实例。在Eccentric中使用has_quantification,设置属性值为Quantification3实例,表示Quantifiacation3所表示的量化信息是对Eccentric所表示的特征的定量描述;Quantification3储存了细胞核几何中心与细胞几何中心距离与细胞高斯宽度之比的信息,数值为0.372;

S4为横纹肌样细胞细胞核仁特征“清晰”建立名为Prominent的EntityAttribute实例以及名为Quantification4的Quantification实例。在Prominent中使用has_quantification,设置属性值为Quantification4实例,表示Quantifiacation4所表示的量化信息是对Prominent所表示的特征的定量描述;Quantification4储存了该核仁图像熵的信息,数值为7.2;

步骤三:使用Cellular_Appearances对该细胞表型进行表示;

参见图5,具体方法为,为细胞表型“横纹肌样细胞”建立名为Phenotype1的Cellular_Appearances实例,使用present_Entity对象属性,设置属性值为名为Rhabdoid_Cell1的NeoplasticCell实例,表示该细胞表型是由后者所表示的实体构成。使用comment数据属性,存储该表型的定义,作为注释。

显然,以上具体实施方式中实施例仅用于说明本发明的技术方案而非对其限制,尽管参照上述具体实施方式对本发明进行了详细说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本权利要求范围当中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号