首页> 中国专利> 聚合物的物理性质预测装置、存储介质、及聚合物的物理性质预测方法

聚合物的物理性质预测装置、存储介质、及聚合物的物理性质预测方法

摘要

提供一种聚合物的物理性质预测装置、存储介质、及聚合物的物理性质预测方法,包括:局部结构数量计算部,从存储部读入通过重复来构成聚合物的结构单位,并使用该结构单位计算该聚合物的局部结构的数量;原子数计算部,计算所述结构单位的原子数;局部结构数量密度计算部,根据所述局部结构的数量和所述结构单位的原子数计算该局部结构的数量密度;回归模型构建部,使用从所述存储部获得的所述聚合物的物理性质的实验值和所述局部结构的数量密度,构建用于预测物理性质值的回归模型;聚合物结构输入部,输入要预测所述物理性质值的聚合物结构;以及聚合物物理性质预测部,使用所述回归模型,预测与输入的所述聚合物结构对应的所述物理性质值。

著录项

  • 公开/公告号CN111819441B

    专利类型发明专利

  • 公开/公告日2022-08-09

    原文格式PDF

  • 申请/专利权人 昭和电工株式会社;

    申请/专利号CN201980017349.7

  • 发明设计人 南拓也;奥野好成;

    申请日2019-03-05

  • 分类号G01N33/44(2006.01);G16C20/30(2019.01);G16C20/70(2019.01);

  • 代理机构北京集佳知识产权代理有限公司 11227;北京集佳知识产权代理有限公司 11227;

  • 代理人金雪梅;王海奇

  • 地址 日本东京都

  • 入库时间 2022-09-06 00:40:17

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-06-02

    专利权人的姓名或者名称、地址的变更 IPC(主分类):G01N33/44 专利号:ZL2019800173497 变更事项:专利权人 变更前:昭和电工材料株式会社 变更后:株式会社力森诺科 变更事项:地址 变更前:日本东京都 变更后:日本东京都

    专利权人的姓名或者名称、地址的变更

  • 2022-08-09

    授权

    发明专利权授予

说明书

技术领域

本发明涉及一种聚合物的物理性质预测装置、存储介质、及聚合物的物理性质预测方法。

背景技术

近年来,已经利用机器学习使用计算机对聚合物等有机化合物的物理性质进行预测。

为了对物理性质进行预测,已知一种技术,其使用由人设定的各种结构描述符对聚合物物理性质进行预测。另外,提出了一种技术,其基于算法机器性地对分子的局部结构模式进行识别,并计算结构描述符。

<现有技术文献>

<专利文献>

专利文献1:(日本)特表2004-514902号公报

<非专利文献>

非专利文献1:David Robers等、《Extended-Connectivity Fingerprints》、American Chemical Society出版、J.Chem.Info.Model.,Vol.50,No.5,2010,pp742-754.

发明内容

<本发明要解决的问题>

以往,作为聚合物的结构描述符的碳原子的数量等结构模式需要预先由人来确定。另一方面,虽然存在自动地提取低分子的有机分子的局部结构的方法,但是存在对聚合物的物理性质进行预测时精度较差的问题。因此,尚未应用于聚合物结构。

因此,在一个方面,目的在于精确地对聚合物的物理性质进行预测。

<用于解决问题的手段>

根据一个实施方式,提供一种聚合物的物理性质预测装置,包括:局部结构数量计算部,从存储部读入通过重复来构成聚合物的结构单位,并使用该结构单位计算该聚合物的局部结构的数量;原子数计算部,计算所述结构单位的原子数;局部结构数量密度计算部,根据所述局部结构的数量和所述结构单位的原子数计算该局部结构的数量密度;回归模型构建部,使用从所述存储部获得的所述聚合物的物理性质的实验值和所述局部结构的数量密度,构建用于预测物理性质值的回归模型;聚合物结构输入部,输入要预测所述物理性质值的聚合物结构;以及聚合物物理性质预测部,使用所述回归模型,预测与输入的所述聚合物结构对应的所述物理性质值。

另外,作为用于解决上述问题的手段,也可以使用聚合物的物理性质预测程序及方法。

<发明的效果>

能够精确地对聚合物的物理性质进行预测。

附图说明

图1是示出本实施方式中的系统结构示例的图。

图2是示出物理性质预测装置的硬件结构示例的图。

图3是示出物理性质预测装置的第1功能结构示例的图。

图4是示出聚合物结构及物理性质DB的数据结构示例的图。

图5是用于对本实施方式中的预测处理的概要进行说明的图。

图6是示出数量密度的示例的图。

图7是用于对因重复单位的复制的有无而产生的差异进行说明的图。

图8A是用于对预测处理进行说明的流程图。

图8B是用于对预测处理进行说明的流程图。

图9是示出回归模型管理表的数据结构示例的图。

图10是示出物理性质预测装置的第2功能结构示例的图。

图11是示出物理性质预测装置的第3功能结构示例的图。

图12是示出物理性质预测装置的第4功能结构示例的图。

图13是示出基于现有技术的物理性质预测装置的功能结构示例的图。

图14是示出评估结果示例的图。

图15是示出聚合物的制造方法的一个示例的图。

具体实施方式

以下,参照附图对本发明的实施方式进行说明。首先,对根据本实施方式的系统结构示例进行说明。图1是示出本实施方式中的系统结构示例的图。在图1中,系统1000具有物理性质预测装置100、以及多个终端3,并且各终端3能够经由网络2连接。

终端3是由用户使用的信息处理终端,与物理性质预测装置100连接,并对预测处理部40所进行的处理进行利用。

物理性质预测装置100是具有用于对聚合物的物理性质进行预测的预测处理部40的信息处理装置。在物理性质预测装置100中,预测处理部40通过使用预先给出的用于表示聚合物结构及其物理性质的数据进行机器学习来创建回归模型。响应于从终端3接收到聚合物结构6a,使用所创建的回归模型针对接收到的聚合物结构6a预测物理性质值,并将预测的物理性质值6b发送到终端3。

另外,系统1000的构成不限于图1的示例。作为一个示例,物理性质预测装置100可以独立使用。在此情况下,当通过用户针对输入装置14(图2)的操作输入聚合物结构6a时,将物理性质值6b输出至显示装置15(图2)。

本实施方式中的物理性质预测装置100具有图2所示的硬件结构。图2是示出物理性质预测装置的硬件结构示例的图。在图2中,物理性质预测装置100是由计算机控制的信息处理装置,并且包括CPU(Central Processing Unit:中央处理器)11、主存储装置12、辅助存储装置13、输入装置14、显示装置15、通信I/F(接口)17、以及驱动器装置18,并与总线B连接。

CPU11相当于根据存储在主存储装置12中的程序对物理性质预测装置100进行控制的处理器。在主存储装置12中,使用RAM(Random Access Memory:随机存取存储器)、ROM(Read Only Memory:只读存储器)等,并且对由CPU11执行的程序、由CPU11进行的处理所需的数据、通过由CPU11进行的处理所获得的数据等进行存储或临时保存。

在辅助存储装置13中,使用HDD(Hard Disk Drive:硬盘驱动器)等,并且对用于执行各种处理的程序等的数据进行存储。通过将存储在辅助存储装置13中的程序的一部分加载到主存储装置12中并在CPU11中执行,从而实现各种处理。以下,将主存储装置12、辅助存储装置13、以及能够由物理性质预测装置100存取的外部存储装置被统称为存储部130。

输入装置14具有鼠标、键盘等,并且被用户用来输入由物理性质预测装置100所进行的处理所需的各种信息。显示装置15根据CPU11的控制显示所需的各种信息。输入装置14和显示装置15可以是由一体化的触摸屏等所实现的用户界面。通信I/F17经由有线或无线的网络进行通信。由通信I/F17所进行的通信不限于无线或有线。

驱动器装置18提供设置在驱动器装置18中的存储介质19(例如CD-ROM(CompactDisc Read-Only Memory:光盘只读存储器)等)与物理性质预测装置100之间的接口。

例如通过CD-ROM等存储介质19将用于实现由物理性质预测装置100执行的处理的程序提供给物理性质预测装置100。在存储介质19中,存储用于实现后述的根据本实施方式的各种处理的程序,并且将存储在该存储介质19中的程序经由驱动器装置18安装在物理性质预测装置100中。所安装的程序能够由物理性质预测装置100执行。

需要说明的是,用于存储程序的存储介质19不限于CD-ROM,只要是能够由计算机读取的、具有数据的结构(structure)的一个以上的非暂时性的(non-transitory)、有形的(tangible)介质即可。作为计算机能够读取的记录介质,除了CD-ROM以外,还可以是DVD(Digital Versatile Disk:数字通用盘)盘、USB存储器等的便携式记录介质、或快闪存储器等半导体存储器。

[第1功能结构示例]

图3是示出物理性质预测装置的第1功能结构示例的图。在图3中,物理性质预测装置100包括预测处理部40。预测处理部40相当于通过由CPU11执行相应的程序所进行的预测处理。

存储部130中存储有聚合物结构及物理性质DB(database:数据库)31、模型结构33a、局部结构数量33b、原子数33c、局部结构数量密度33d、重要局部结构33e、回归模型33f、聚合物结构6a、物理性质值6b等。

预测处理部40通过机器学习求出用于对由用户指定的聚合物结构6a的物理性质进行预测的回归模型33f,使用所求出的回归模型33f对聚合物结构6a的物理性质进行预测,并输出所获得的物理性质值6b。预测处理部40具有模型创建部41和物理性质预测部45作为处理部。

模型创建部41使用聚合物结构及物理性质DB31来学习将结构单位重复复制并连接而成的聚合物结构的物理性质,并确定回归模型33f。将通过重复来构成聚合物的结构单位称为“重复单位”。在聚合物结构及物理性质DB31中,按照每个聚合物,关联地存储有重复单位和通过实验预先获得的物理性质的实验值。

模型创建部41具有模型结构生成部43a、局部结构数量计算部43b、原子数计算部43c、局部结构数量密度计算部43d、降维部43e、以及回归模型构建部43f作为处理部。可以省略模型结构生成部43a和降维部43e中的任意一者或两者。

模型结构生成部43a从聚合物结构及物理性质DB31取得重复单位,将用于复制并连接所取得的重复单位的处理重复预定次数,以生成模型结构33a。重复单位包含局部结构。重复单位可以是局部结构的整体。通过连接多个重复单位来表示聚合物。

生成的模型结构33a存储在存储部130中。重复单位和模型结构33a可以以预定形式表示。在第一功能结构示例中,虽然对以SMILES(Simplified Molecular Input LineEntry Syntax:简化分子输入行录入句法)表示法来表示重复单位和模型结构33a情况进行说明,但是不限于该标记形式。

局部结构数量计算部43b基于模型结构33a计算局部结构数量33b。局部结构数量33b由n维的向量表示,并存储在存储部130中。另外,原子数计算部43c基于模型结构33a计算原子数33c。获得的原子数33c存储在存储部130中。

局部结构数量密度计算部43d使用局部结构数量33b和原子数33c来计算局部结构数量密度33d。局部结构数量密度33d根据

局部结构数量密度=局部结构数量÷原子数获得。所获得的局部结构数量密度33d由与局部结构数量33b相同的n维的向量表示,并存储在存储部130中。

降维部43e使用局部结构数量密度33d和实验值来构建临时回归模型,并基于预定的降维方法来降低临时回归模型的维数,从而获得重要局部结构33e。重要局部结构33e存储在存储部130中。重要局部结构33e是在局部结构数量密度33d中指定了有可能有助于要构建的回归模型33f的预测精度的元素(例如向量)的数据。

关于降维方法,预先设置与要使用的回归分析方法对应的步骤。例如,在使用拉索(lasso)回归的情况下,可以通过删除0的系数项来降低维度。在使用随机森林回归的情况下,可以通过计算解释变量的重要程度并排除重要程度为阈值以下的变量来降低维度。在逐步法(stepwise method)中,通过在构建临时回归模型时逐一地增加或减少解释变量,从而通过搜索预测精度最高的解释变量的组合来降低维度。

回归模型构建部43f使用局部结构数量密度33d和实验值,进行基于由降维部43e所获得的重要局部结构33e的回归分析,来构建回归模型33f。回归模型33f存储在存储部130中。

在降维部43e和回归模型构建部43f中,实验值可以从聚合物结构及物理性质DB31取得。并且,由回归模型构建部43f获得的回归模型33f由

y=f(x)

表示,通过将局部结构数量密度33d代入变量x,从而获得某种物理性质的预测值y。

在用于取得临时回归模型和回归模型33f的回归分析中,可以应用拉索回归、随机森林回归、逐步法、部分线性回归、岭回归、核岭回归、支持向量回归、决策树回归、高斯过程回归等中的任意一种。作为一个示例,可以通过拉索回归取得临时回归模型,并通过高斯过程回归取得回归模型33f。

接着,物理性质预测部45响应于由用户指定的聚合物结构6a的输入,使用回归模型33f,基于聚合物结构6a,来预测聚合物物理性质。在聚合物结构6a中,可以利用SMILES表示法等来指定重复单位。并且,物理性质预测部45具有聚合物结构输入部47a和聚合物物理性质预测部47b作为处理部。

聚合物结构输入部47a输入由用户指定的聚合物结构6a,并将其存储在存储部130中。聚合物结构输入部47a可以通过由通信I/F17经由网络2进行接收来输入聚合物结构6a,也可以根据利用物理性质预测装置100的输入装置14等由用户进行的聚合物结构6a的指定来进行输入。

聚合物物理性质预测部47b根据聚合物结构6a获得模型结构、局部结构数量以及原子数以计算局部结构数量密度,并使用存储在存储部130中的回归模型33f来预测物理性质值。基于聚合物结构6a的模型结构、局部结构数量、原子数以及局部结构数量密度的取得方法与模型创建部41相同。

预测的物理性质值6b被输出至存储部130。在经由网络2来指定聚合物结构6a的情况下,获得的物理性质值6b被发送至用户的终端3并被显示。在通过用户在物理性质预测装置100上的操作来指定聚合物结构6a的情况下,所获得的物理性质值6b显示在显示装置15上。

图4是示出聚合物结构及物理性质DB的数据结构示例的图。在图4中,聚合物结构及物理性质DB31是按照每个聚合物对重复单位、折射率等各种物理性质的实验值等进行管理的数据库,并且具有聚合物名称、重复单位、折射率、玻璃化转变点等项目。

聚合物名称表示用于确定聚合物结构的特定信息。虽然对利用SMILES表示法来表示重复单位的示例进行了说明,但是重复单位的标记方法不限于SMILES表示法。折射率、玻璃化转变点等是预先通过实验获得的聚合物的各种物理性质的一个示例,并且按照每个物理性质的名称示出实验值。

在此示例中,重复单位“*CC*”与聚合物名称“poly(ethylene)”相关联,并示出折射率“1.472”等实验值。对于其他的聚合物也同样地示出各物理性质的实验值。

在模型创建部41中,可以在工作表32中对要参照的数据、所生成的数据等进行管理。工作表32是按照求出了局部结构数量密度33d的聚合物的每个重复单位对计算出的值进行记录的表,并且具有聚合物名称、重复单位、原子数、局部结构数量密度等项目。

聚合物名称表示在聚合物结构及物理性质DB31中登录的聚合物名称。局部结构数量表示由局部结构数量计算部43b获得的局部结构数量33b。原子数表示由原子数计算部43c获得的原子数33c。局部结构数量密度表示由局部结构数量密度计算部43d获得的局部结构数量密度33d。

工作表32的局部结构数量密度和聚合物结构及物理性质DB31的物理性质的实验值被用于通过回归分析进行的机器学习。因此,工作表32可以通过聚合物名称与聚合物结构及物理性质DB31相关联。需要说明的是,图4所示的聚合物结构及物理性质DB31和工作表32的数据结构示例仅为一个示例,并不限于该示例。

使用重复单位的一个示例对由预测处理部40进行的预测处理整体的概要进行说明。图5是用于对本实施方式中的预测处理的概要进行说明的图。如图5所示,在预测处理部40的模型创建部41中,模型结构生成部43a从聚合物结构及物理性质DB31取得重复单位(图5(a))。例如,获得重复单位“*CCO*”。以下,在SMILES表示法中,省略用于表示某种结构的开始和结束的“*”进行说明。

模型结构生成部43a以所取得的局部结构作为重复单位,对重复单位进行复制以生成模型结构33a(图5(b))。在该示例中,模型结构生成部43a通过将重复单位“CCO”在右侧重复预定次数来进行复制,并向存储部130生成连接有多个重复单位“CCO”的“CCOCCOCCOCCOCCOCCOCCOCCOCCOCCO”的模型结构33a。

局部结构数量计算部43b生成结构模型33a的局部结构数量向量x

在该结构模型“CCOCCOCCOCCOCCOCCOCCOCCOCCOCCO”的情况下,生成由C原子数“20”、O原子数“10”、…、COC数“9”构成的n维的局部结构数量向量x

然后,原子数计算部43c计算模型结构33a中所含的原子数(图5(d))。在结构模型“CCOCCOCCOCCOCCOCCOCCOCCOCCOCCO”的情况下,原子数为“30”个。

局部结构数量密度计算部43d通过使用在图5(b)中由局部结构数量计算部43b获得的局部结构数量向量x

具体地,在结构模型“CCOCCOCCOCCOCCOCCOCCOCCOCCOCCO”的情况下,通过将局部结构数量向量x

针对聚合物结构及物理性质DB31的各条记录重复图5(a)至图5(e)。可以将所获得的局部结构数量33b、原子数33c以及局部结构数量密度33d与聚合物名称相关联地存储在工作表32中。

在构建回归模型33f之前,通过降维部43e构建临时回归模型,并进行降维(图5(f))。由此,能够将n维降低至n’维(n’<n)。通过降维,从而确定有助于预测精度的重要局部结构33e。需要说明的是,n’是小于n的自然数,通常多数情况下为大约16~128。

回归模型构建部43f基于重要局部结构33e构建用于预测物理性质值的回归模型33f(图5(g))。获得被降低至数十维的回归模型33f。回归模型33f由利用局部结构数量密度向量x(局部结构数量密度33d)来获得聚合物物理性质的预测值y的公式(1)

y=f(x) (1)

表示。在未进行降维的情况下,局部结构数量密度向量x的个数为维数的n,在进行降维后,局部结构数量密度向量x的维度为n’个。通过重要局部结构33e,仅使用有助于预测精度的维度来计算预测值,因此能够有效地进行物理性质预测处理。

上述图5(a)~图5(e)所示的处理相当于模型创建部41的模型创建处理。在进行模型创建处理之后,当从用户处接受到所需的聚合物结构6a的输入时,物理性质预测部45进行物理性质预测处理。

在物理性质预测部45,响应于欲求出物理性质的聚合物结构A的输入,生成局部结构数量密度向量x

通过将局部结构数量密度x

y

获得针对所需的聚合物结构A的物理性质值y

在仅针对1个物理性质的回归模型33f的情况下,预测预定的物理性质的值。在针对各种物理性质分别取得了回归模型33f的情况下,用户可以指定聚合物结构A、以及其全部或特定的物理性质。在此情况下,聚合物物理性质预测部47b使用与每个物理性质相对应的回归模型33f和重要局部结构33e来预测物理性质值6b。

需要说明的是,图5(c)中的局部结构数量33b的计算处理与图5(d)中的原子数的计算处理的顺序可以为任意顺序。可以在进行原子数33c的计算处理之后进行局部结构数量33b的计算处理,也可以并行地进行。另外,在本实施方式中,物理性质的“预测值”与预测的“物理性质值”具有相同的含义。

在第1功能结构示例中,能够通过预测处理部40的局部结构数量密度计算部43d来识别相同的聚合物结构。图6是示出数量密度的示例的图。在图6中,以聚环氧乙烷(polyethylene oxide)的碳数为例进行说明。

当参照图6对结构A与结构B进行比较时,结构B的标记长于结构A的标记并且不同。然而,由结构A和结构B各自所表示的聚合物是完全相同的聚合物。

在简单地使用局部结构数量作为结构描述符的现有技术中,结构A的碳数为“2”,结构B的碳数为“4”且与结构A不同,因此会错误地识别为是不同的聚合物。换言之,从该示例可以看出,在对重复单位的长度不同的聚合物进行比较的情况下,局部结构的数量无法适当地捕捉到聚合物的结构性特征。

另一方面,在第1功能结构示例中,通过局部结构数量密度计算部43d,针对结构A和结构B获得相同的局部结构数量密度(碳数密度)“2/3”。因此,在降维部43e和回归模型构建部43f中,能够正确地识别出结构A和结构B表示相同的聚合物。基于该示例,本发明的发明人发现,通过使用局部结构数量密度33d,即使对于重复单位的长度不同的聚合物也能够等同地处理。

另外,发明人发现,通过对重复单位进行连接并复制,从而能够改善预测精度较差的现有技术。参照图7对因复制的有无而产生的差异进行说明。图7是用于对因重复单位的复制的有无而产生的差异进行说明的图。虽然在图7中也以聚环氧乙烷为例,但是重复单位对于有无复制均相同。

在不进行复制的情况下,在重复单位的两端不存在本来存在的局部结构“COC”。因此,COC的数量密度为“0”。另一方面,在第1功能结构示例中,重复单位被复制,重复单位的右侧与下一个重复单位的左侧的氧原子连接。通过2个重复单位,从而出现局部结构“COC”,关于本来存在的局部结构“COC”的数量密度获得“1/6”。在第1功能结构示例中,由于使用如此获得的局部结构数量密度33d来取得回归模型33f,因此能够改善现有技术的预测精度。

如上所述,如图8A及图8B所示,进行由预测处理部40进行的预测处理。图8A及图8B是用于对预测处理进行说明的流程图。首先,利用模型创建部41进行模型创建处理P51。

在模型创建部41中,模型结构生成部43a从聚合物结构及物理性质DB31中选择并读入1条记录,并取得重复单位和实验值(步骤S511)。然后,模型结构生成部43a将用于复制并连接所取得的重复单位的操作重复预定次数,以生成模型结构33a(步骤S512)。

局部结构数量计算部43b使用预先确定的结构描述符(例如ECFP等)来计算模型结构33a的局部结构数量33b(步骤S513)。另外,原子数计算部43c计算模型结构33a的原子数33c(步骤S514)。需要说明的是,可以在进行步骤S514之后进行步骤S513。或者,也可以并行地处理步骤S513和S514。

局部结构数量密度计算部43d通过将局部结构数量33b除以原子数33c来计算局部结构数量密度33d(步骤S515)。如上所述,局部结构数量33b和局部结构数量密度33d由n维向量表示。

模型创建部41判断聚合物结构及物理性质DB31中的全部记录是否已经结束(步骤S516)。当全部记录尚未完成的情况下(步骤S516为否),模型创建部41返回步骤S511,并进行与上述相同的处理。

当全部记录均结束时(步骤S516为是),降维部43e以与重要局部结构33e对应的局部结构数量密度33d作为变量x',以实验值作为y',进行用于求出临时回归模型f'的第一次的回归分析。降维部43e利用预先确定的降维方法来降低临时回归模型f'的维度,并取得重要局部结构33e(步骤S517)。

接着,由回归模型构建部43f进行第二次的回归分析。回归模型构建部43f以与重要局部结构33e对应的局部结构数量密度33d作为变量x,以实验值作为y,求出回归模型f(步骤S518)。实验值y是在聚合物结构及物理性质DB31中由聚合物名称和物理性质确定的值。回归模型f,即回归模型33f被存储在存储部130中。

在要针对聚合物结构及物理性质数据库31中记录的全部或部分的物理性质求出回归模型f的情况下,按照每个物理性质取得实验值,并重复进行步骤S517至S518即可。

然后,进行由物理性质预测部45进行的物理性质预测处理P55。在预测处理部40中,当聚合物结构输入部47a接受到聚合物结构6a时(步骤S521),以聚合物结构6a作为重复单位,来获得模型结构、局部结构数量、原子数、以及局部结构数量密度(步骤S522)。聚合物结构6a的模型结构、局部结构数量、原子数、以及局部结构数量密度通过进行与模型创建处理P51中的步骤S512~S515相同的处理而获得。

聚合物物理性质预测部47b基于在步骤S517中获得的重要局部结构33e,降低聚合物结构6a的局部结构数量密度的维度,并使用在步骤S518中获得的回归模型f(在存储部130中存储的回归模型33f),预测物理性质值6b(步骤S524)。所获得的物理性质值6b被发送至终端3或被显示在显示装置15上。

在创建了与多个物理性质分别对应的回归模型33f的情况下,优选利用图9所示的表对创建的回归模型33f预先进行管理。图9是示出回归模型管理表的数据结构示例的图。

在图9中,回归模型管理表33k是按照每种物理性质对回归模型33f进行管理的表,并且具有物理性质、回归模型、重要局部结构等项目。物理性质表示用于对折射率、玻璃化转变点等物理性质进行确定的名称。回归模型表示与由回归模型构建部43f构建的物理性质相对应的回归模型33f。

重要局部结构对用于回归模型33f的、降维后得到的局部结构数量密度33d的向量之中的有效的向量(降维后的有效向量)进行确定。在省略降维处理的情况下,重要局部结构的项目被省略。

在物理性质预测部45中,聚合物物理性质预测部47b可以从回归模型管理表33k取得与要预测的物理性质关联的回归模型33f和重要局部结构33e。

本发明的发明人对后述的因各种功能结构的不同而导致的预测精度进行了验证。根据验证结果,上述第1功能结构示例能够最大程度地改善预测精度。另外,发明人已经证实,即使在省略了模型结构生成部43a和降维部43e中的任意一者或两者的结构中,也能够充分改善预测精度。

以下首先对验证了预测精度的其他功能结构示例进行说明。以省略了模型结构生成部43a和降维部43e两者的情况作为第2功能结构示例,以省略了模型结构生成部43a的情况作为第3功能结构示例,并以省略了降维部43e的情况作为第4功能结构示例。在第2功能结构示例~第4功能结构示例中,针对与图3所示的第1功能结构示例相同的处理部赋予相同的符号,并省略其详细说明。

[第2功能结构示例]

图10是示出物理性质预测装置的第2功能结构示例的图。在图10中,在第2功能结构示例中,省略了图3所示的第1功能结构示例之中的模型结构生成部43a和降维部43e,因此,未生成模型结构33a和重要局部结构33e。

在模型创建部41中,局部结构数量计算部43b和原子数计算部43c从聚合物结构及物理性质DB31取得重复单位,并取得局部结构数量33b和原子数33c。

在第2功能结构示例中,也由局部结构数量密度计算部43d计算局部结构数量密度33d。然后,回归模型构建部43f使用计算出的局部结构数量密度33d和物理性质的实验值来获得回归模型33f。

在物理性质预测部45中,当聚合物结构输入部47a输入聚合物结构6a时,聚合物物理性质预测部47b不创建模型结构33a,而是使用聚合物结构6a计算局部结构数量及原子数。然后,聚合物物理性质预测部47b通过将获得的局部结构数量除以原子数来获得局部结构数量密度,并使用局部结构数量密度33d通过回归模型33f来取得物理性质值6b。

在第2功能结构示例中,回归分析仅进行1次。另外,回归模型33f的维数与局部结构数量密度33d相同,未确定重要局部结构33e。然而,通过局部结构数量密度33d,如果其值相同,则即使对于重复单位的长度不同的聚合物也能够等同地处理,并且能够充分地改善预测精度。

[第3功能结构示例]

图11是示出物理性质预测装置的第3功能结构示例的图。在图11中,在第3功能结构示例中,省略了图3所示的第1功能结构示例之中的模型结构生成部43a,因此,未生成模型结构33a。

与第2功能结构示例同样,在模型创建部41中,局部结构数量计算部43b和原子数计算部43c从聚合物结构及物理性质DB31取得重复单位,并计算局部结构数量33b和原子数33c。通过局部结构数量密度计算部43d获得局部结构数量密度33d。然后,降维部43e取得重要局部结构33e,降低局部结构数量密度33d的维度,并通过回归模型构建部43f输出回归模型33f。

在物理性质预测部45中,当聚合物结构输入部47a输入聚合物结构6a时,聚合物物理性质预测部47b不创建模型结构33a,而是使用聚合物结构6a计算局部结构数量及原子数。然后,聚合物物理性质预测部47b通过将获得的局部结构数量除以原子数来获得局部结构数量密度,并在基于局部结构数量密度33d降低局部结构数量密度的维数之后,使用回归模型33f输出物理性质值6b。

在第3功能结构示例中,通过局部结构数量密度33d,如果其值相同,则即使对于重复单位的长度不同的聚合物也能够等同地处理。另外,虽然未生成模型结构33a,但是通过降维部43e确定重要局部结构33e,因此能够将由回归模型构建部43f所生成的回归模型33f的预测精度进一步改善。

[第4功能结构示例]

图12是示出物理性质预测装置的第4功能结构示例的图。在图12中,在第4功能结构示例中,省略了图3所示的第1功能结构示例之中的降维部43e,因此,未生成重要局部结构33e。

在模型创建部41中,由模型结构生成部43a创建模型结构33a,并且由局部结构数量计算部43b和原子数计算部43c基于模型结构33a获得局部结构数量33b和原子数33c。

在物理性质预测部45中,当聚合物结构输入部47a输入聚合物结构6a时,聚合物物理性质预测部47b创建模型结构33a,并使用模型结构33a计算局部结构数量及原子数。然后,聚合物物理性质预测部47b通过将获得的局部结构数量除以原子数来获得局部结构数量密度,并使用局部结构数量密度33d通过回归模型33f来获得物理性质值6b。根据聚合物结构6a获得的局部结构数量密度的维度未被降低。

在第4功能结构示例中,通过局部结构数量密度33d,如果其值相同,则即使对于重复单位的长度不同的聚合物也能够等同地处理。另外,虽然未创建重要局部结构33e,但是通过模型结构33a和局部结构数量密度33d,能够将由回归模型构建部43f所生成的回归模型33f的预测精度改善。

接着,对作为比较例的基于现有技术的功能结构示例进行说明。

[现有的功能结构示例]

图13是示出基于现有技术的物理性质预测装置的功能结构示例的图。在图13中,物理性质预测装置9具有基于现有技术的功能结构。在图13所示的比较例中,物理性质预测装置9的预测处理部90具有模型创建部91和物理性质预测部95。

模型创建部91是创建回归模型83f的处理部,并且具有局部结构数量计算部93b和回归模型构建部98f。局部结构数量计算部93b从聚合物结构及物理性质DB31获取重复结构,求出局部结构数量83b并将其存储在存储部130中。回归模型构建部93f使用局部结构数量83b和从聚合物结构及物理性质DB31获得的实验值进行回归分析以构建回归模型83f,并将其存储在存储部130中。

物理性质预测部95是通过将用户所期望的聚合物结构6a应用于回归模型83f来预测物理性质值的处理部,并且具有聚合物结构输入部97a和聚合物物理性质预测部97b。当接受到聚合物结构6a时,聚合物结构输入部97a将其存储在存储部130中。聚合物物理性质预测部97b通过求出聚合物结构6a的局部结构数量并将所获得的局部结构数量应用于回归模型83f,从而获得所预测的物理性质值6b。物理性质值6b被提示给用户。

[预测精度的验证]

接着,对作为比较例的功能结构示例、第1功能结构示例~第4功能结构示例各自的预测精度的验证结果进行说明。在各功能结构示例中,发明人以预测折射率的情况进行了验证。

(实施例1)

在实施例1中,以省略了模型结构生成部43a和降维部43e的第2功能结构示例(图10)进行了验证。在实施例1中,未生成模型结构33a。另外,回归分析由回归模型构建部43f仅进行1次。

在上述第2功能结构示例中,以聚乙烯、聚丙烯等51种通常的无线直链聚合物的结构(即重复单位)和折射率的实验值作为训练数据。使用ECFP4作为结构描述符。在此,ECFP4表示半径为4、1024维的ECFP。以下称为ECFP描述符。

ECFP描述符由向量表示,各维表示局部结构的种类,各维的值相当于局部结构的数量。使用RDKit等软件来生成ECFP描述符。为了方便起见,将ECFP描述符定义为局部结构数量描述符。此后,通过将局部结构数量描述符的各分量除以结构原子数,从而获得局部结构数量密度描述符。

作为回归方法,使用高斯过程回归。使用局部结构数量密度描述符作为解释变量,并使用折射率的实验值为目标变量,构建回归模型33f。

利用留一法(leave-one-out)交叉验证将数据集分为学习用和验证用,使用学习用数据集进行超参数调整之后构建回归模型,使用验证用数据集对非学习聚合物的折射率的预测精度进行验证。作为预测精度的评价指标,使用确定系数R

[数1]

在此,y

在上文中,构成原子数相当于重复单位的原子数,局部结构数量描述符相当于局部结构数量33b,局部结构数量密度描述符相当于局部结构数量密度33d。

(实施例2)

在实施例2中,以省略了模型结构生成部43a的第3功能结构示例(图11)进行了验证。由于未生成模型结构33a,因此根据聚合物结构及物理性质DB31的重复单位求出局部结构数量密度33d。回归分析由降维部43e和回归模型构建部43f进行2次。

在构建回归模型33f之前,由降维部43e根据局部结构数量密度33d和从聚合物结构及物理性质DB31获得的聚合物物理性质的实验值来构建拉索回归模型(相当于临时回归模型),并通过排除系数为0的变量来进行降维。另外,在回归模型构建部43f中,与实施例1同样,通过高斯过程回归来构建回归模型33f。然后,通过与实施例1相同的方法来进行折射率的预测精度的验证。

(实施例3)

在实施例3中,以省略了降维部43e的第4功能结构示例(图12)进行了验证。未取得重要局部结构33e。利用局部结构数量密度33d的维数来构建回归模型33f。

首先,在生成10个重复单位作为模型结构33a之后,计算局部结构数量描述符和原子数,并计算局部结构数量密度描述符。在计算出局部结构数量密度描述符之后,通过与实施例1相同的方法求出折射率的预测值,并进行预测精度的验证。

(实施例4)

在实施例4中,以包括重要局部结构33e和降维部43e的第1功能结构示例(图3)进行了验证。

首先,在生成10个重复单位作为模型结构33a之后,计算局部结构数量描述符和原子数,并计算局部结构数量密度描述符。另外,由降维部43e构建拉索回归模型(相当于临时回归模型),并通过排除系数为0的变量来进行降维之后,通过高斯过程回归来构建回归模型33f。然后,通过与实施例1相同的方法来进行折射率的预测精度的验证。

(比较例1)

在比较例1中,以仅利用局部结构数量计算部93b和回归模型构建部93f求出回归模型83f的现有的功能构成示例(图13)进行了验证。

由局部结构数量计算部93b根据使用重复单位所获得的局部结构数量83b(局部结构数量描述符)和折射率的实验值来获得回归模型83f。通过与实施例1相同的方法,使用高斯过程回归来构建回归模型83f。另外,对于预测精度的验证也通过与实施例1相同的方法来进行。

图14是示出评估结果示例的图。在图14中,如上所述,示出了针对比较例1、实施例1~实施例4分别进行的折射率的预测精度的评估结果。作为评价结果,示出了R

在R

另外,RMSE的情况下显示出,与比较例1的“0.084”,实施例1中为“0.027”,实施例2中为“0.026”,实施例3中为“0.021”,并且实施例4中为“0.018”。在RMSE中,越接近“0”则预测精度越高。因此,在该评价结果中也可以看出,在本实施方式中的所有功能结构示例中,均能够显著地改善预测精度。

根据该评价结果可以看出,在本实施方式中发明人关注的局部结构数量密度33d极大地有助于预测精度的改善。

通过利用物理性质预测装置100,能够预先地预测物理性质值,从而能够精确地拣选要制造的聚合物结构6a。因此,能够减少聚合物制造中涉及的费用、时间等的浪费。

如上所述,根据本实施方式,通过基于聚合物的结构来生成结构描述符,从而能够高精度地预测聚合物的物理性质。

接着,对使用所期望的聚合物结构6a和预测出的物理性质值来制造聚合物的方法进行说明。图15是示出聚合物的制造方法的一个示例的图。

如图15所示,本实施方式中的聚合物的制造方法包括:获得具有通过本实施方式中的聚合物的物理性质预测方法预测的物理性质值的聚合物结构的步骤(S601);准备用于构成上述聚合物结构的原料的步骤(S602);以及使上述原料反应,以获得由上述聚合物结构表示的聚合物的步骤(S603)。

在S601中,从输入的聚合物结构之中适当地选择预计具有预定的物理性质值的聚合物的结构。例如,从输入的聚合物结构之中选择折射率在预定范围内的聚合物结构。

在S602中,准备单体、低聚物等原料,作为用于构成在S601中所选择的聚合物结构的原料。例如,在所选择的聚合物结构为聚乙烯的情况下,准备乙烯。

在S603中,使在S602中所准备的原料反应,以获得由在S601中所选择的聚合物结构表示的聚合物。例如,对乙烯进行聚合以合成聚乙烯。

本发明并不限于具体公开的实施例,可以在不脱离权利要求书的情况下进行各种变形或改变。

本申请以2018年3月9日向日本专利局申请的日本发明专利申请第2018-043171号作为要求优先权的基础,本国际申请援引日本发明专利申请第2018-043171号的全部内容。

符号说明

2 网络

3 终端

6a 聚合物结构

6b 物理性质值

31 聚合物结构及物理性质DB

33a 模型结构

33b 局部结构数量

33c 原子数

33d 局部结构数量密度

33e 重要局部结构

33f 回归模型

40 预测处理部

41 模型创建部

43a 模型结构生成部

43b 局部结构数量计算部

43c 原子数计算部

43d 局部结构数量密度计算部

43e 降维部

43f 回归模型构建部

45 物理性质预测部

47a 聚合物结构输入部

47b 聚合物物理性质预测部

100 物理性质预测装置。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号