法律状态公告日
法律状态信息
法律状态
2020-08-11
授权
授权
2020-07-28
实质审查的生效 IPC(主分类):G01N21/3577 申请日:20200526
实质审查的生效
2020-07-03
公开
公开
技术领域
本发明属于刑事科学技术领域,具体涉及一种基于衰减全反射红外光谱的痕迹遗留时间的测量方法。
背景技术
在勘验检查案件现场时,除对常规的指纹、足迹、DNA等痕迹提取检验以及对血痕的基本形态、色泽、厚度、分布形态等记录检验外,对现场痕迹(包括血痕、笔迹、汗液指纹等)遗留时间的正确鉴别判断有助于客观反映案发时刻现场人员的活动状况,也会成为证实案发时间的有力依据。
受现场条件的限制以及基层科研水平的制约,在勘验检查案件现场时,对观测判断现场痕迹的遗留时间并无深入的研究进展,对尸体组织的变化规律研究集中于法医学检验,鲜见针对案件现场离体血痕的规律性探索;而针对血液的研究方向多为医用,由变化规律进行现场血痕遗留时间判定的方法比较少,对现场血痕的规律进行研究的方法多需要复杂的实验流程和昂贵的器材,且多数判断方法存在较大误差。
对痕迹的有损检验方法包括电泳技术、高效液相色谱技术、气相色谱法、氧电极技术、基因分析技术等,由于痕迹的量微小,无损耗检验痕迹遗留时间的研究方法更有利于痕迹的保存,也能够重复进行制样采样。对痕迹遗留时间的无损检验方法包括立体显微镜、扫描电子显微镜、原子力显微镜、近红外反射光谱技术、光纤光谱技术、高光谱照相法、电子顺磁共振技术等,然而,现有的无损检验多集中于实验研究。
邓晓军等(血痕红外热成像变化与血痕经过时间关系研究[J].法医检验,2015,(8):72~74)采用红外热像技术结合计算机图像分析技术,对玻璃、纺织物、A4纸、瓷砖、木块等五类载体上的血痕温度进行观测、运算,记录和统计了15分钟内五类客体上血痕自制样时起每分钟的温度情况,通过回归分析,给出了较好的回归方程,但其考察时间过短,进一步研究应用的空间较小。
研究表明,衰减全反射红外光谱法(ATR)能够揭示实验样本的微小变化所造成的红外谱图的变化,可以满足无损快速检验痕迹的需要。
黄平等人(应用FT红外光谱光谱技术推断死亡时间[J].中国法医学杂志,2011,(2):104~109)运用KBr压片法和ATR法分别对人体和大鼠的左心室肌、肺脏、肝脏、脾脏、肾脏皮质、骨骼肌、大脑皮质进行傅里叶红外光谱检测,并选择光谱数据中的主要吸收峰为研究指标,指出了人尸体离体组织用衰减全反射红外光谱的变化规律,但在死亡时间和器官离体时间方面的判断较模糊,有一定的局限性。
神经网络是“人工神经网络”的简称,神经网络是一种信息处理工具,是模仿大脑神经突触联接结构进行信息处理的数学模型,通过两个节点间的信号会被赋予加权值,建立起的神经网络经过对大量信号输入的学习训练后,调整加权实现对信息的分类,向该学习训练过的神经网络输入新的信号后,神经网络按照已确定的权重值对信息实现自动归类,是大量信息并行处理和大规模并行计算的基础。神经网络与光谱学的结合在当前的各个领域应用广泛,车牌的自动识别、白酒年份鉴别、大数据分析等领域都有应用。
张宝菊等人(基于BP神经网络的人体血液中红细胞浓度无创检测[J].光谱学与光谱分析,2012,(9):2508~2511)对基于BP神经网络对人体血液中红细胞浓度的无创检测方法进行了研究,其以新鲜血液的光谱数据作为建模数据,对新鲜血液的红细胞浓度进行预测。
中国专利申请CN110196233A、硕士论文《基于高光谱成像技术的血迹检测研究》中公开了一种基于高光谱成像的血迹时间预测方法,其以高光谱血迹三维图像立方体为数据支撑,提取血迹样本的光谱曲线,再经过预处理矩阵化,运用非线性迭代结合非线性拟合的方法,构建了血迹时间预测相关的时间-光谱域模型,然而,其模型构建过程复杂,并且,其样本为在25℃恒温条件下保存的实验室采集的血迹(干性样本),且只采集1h、24h、30天的样本数据,以此建立模型,其可靠程度存疑,以医院血库采集的血液样本(液体样本,且低温保存、含有抗凝剂)进行测试检验,采样时间不合理及样本与检材保存环境的差异会显著影响实验结论的准确性。
传统的刑事科学技术的勘验、鉴定过程在反映人与人、人与物、物与物的空间关系问题上较为成熟,却只能粗略实现时间关系上的推断,对现场痕迹的遗留时间进行分析鉴定一直是刑事科学技术工作的难点,目前,将衰减全反射红外光谱法与神经网络结合用于判断痕迹遗留时间的研究未见报道。
发明内容
本发明的目的在于提供一种基于衰减全反射红外光谱(ATR-FTIR)的痕迹遗留时间的测量方法,结合传统刑事科学技术研究、光谱学和计算机科学,通过用痕迹样本的红外光谱数据对神经网络进行训练,进而对痕迹的遗留时间进行判断,痕迹样本的红外吸收特征谱带明显,重现性好,制样简便,结果稳定可靠,检测精度高,测量天数值与真实天数值间的判定系数R2>0.8,满足刑侦领域中进行快速无损鉴定的需要。
为了达到上述目的,本发明提供如下技术方案:
一种基于衰减全反射红外光谱的痕迹遗留时间的测量方法,包括以下步骤:
1)采集检材痕迹的红外光谱数据
检材痕迹来自于案发现场,检材痕迹包括但不限于血痕、笔迹、汗液指纹等,设置固定的波数范围和分辨率,使用衰减全反射红外光谱法采集检材痕迹的红外光谱数据,
2)模拟检材痕迹制作样本痕迹,分类样本
使用与检材痕迹载体相同的材料为载体制作样本痕迹,将样本痕迹按照7:3比例,随机划分为训练用样本痕迹和验证用样本痕迹,
3)采集样本数据集
模拟检材痕迹的遗留环境,使用衰减全反射红外光谱法,要求波数范围和分辨率与前述相同,以均匀的时间间隔,采集不同遗留时间的样本痕迹的红外光谱数据,与对应的遗留时间归纳为样本数据集,记录样本痕迹的遗留时间最大值,保留样本数据集中红外光谱数据与遗留时间的对应关系,将样本数据集按照训练用和验证用,划分为训练集和验证集,
4)使用神经网络建立样本痕迹的红外光谱数据与遗留时间的对应关系模型并验证精度,以训练集中的红外光谱数据和遗留时间为变量,训练神经网络,建立样本痕迹的红外光谱数据与遗留时间的对应关系模型,使用验证集验证模型精度,如判定系数R2大于0.8,则该神经网络可用,否则重复“训练神经网络”至“使用验证集验证模型精度”的流程,直至判定系数R2大于0.8,
5)将检材痕迹的红外光谱数据录入符合精度要求的模型,模拟检材痕迹的遗留时间,向可用模型输入检材痕迹的红外光谱数据,得到模拟的检材痕迹的遗留时间,
6)评估检材痕迹遗留时间
比较模拟的检材痕迹的遗留时间和样本痕迹的遗留时间最大值,如比值小于等于0.9,则评估模拟的检材痕迹的遗留时间即为测量的检材痕迹遗留时间,测量完成,如比值大于0.9,则扩充样本数据集,延长样本痕迹的遗留时间,重复步骤3)至步骤5),比较扩充样本数据集后模拟的检材痕迹的遗留时间和样本痕迹的遗留时间最大值,直至比值小于等于0.9,则评估模拟的检材痕迹的遗留时间即为测量的检材痕迹遗留时间,测量完成。
优选地,步骤3)中,所述不同遗留时间痕迹样本的采样时间间隔24小时,红外光谱的采集波数范围为:4000cm-1-600cm-1。
本发明的技术方案还可以如下表述:
一种基于衰减全反射红外光谱的痕迹遗留时间的测量方法,包括以下步骤:
a.采集红外光谱数据集
采集待测案发现场的检材痕迹的红外光谱数据;
制作模拟案发现场的不同遗留时间的各样本痕迹,采集其红外光谱,获取红外吸收光谱数据,得到红外光谱数据集;
其中,所述样本痕迹包括训练集样本痕迹和验证集样本痕迹,红外光谱数据集包括相应的训练集样本痕迹的红外光谱数据集和验证集样本痕迹的红外光谱数据集;
b.构建神经网络
利用数据处理工具,以各样本痕迹的遗留时间和红外光谱数据为变量构建神经网络架构,设定层数,选择训练类型和误差类型,隐含层和输出层的传递函数为TANSIG,设置隐含层的数量和神经元的数量;
根据所选择的训练类型设定神经元数量及训练参数,利用训练集样本痕迹的红外光谱数据集训练构建的神经网络架构,之后再输入验证集痕迹样本的红外光谱数据,输出验证集样本痕迹的痕迹遗留时间模拟值,并与对应验证集样本痕迹遗留时间的真值进行比较,得到判定系数R2,若判定系数R2>0.8,则完成构建,否则对神经网络再次训练,直到判定系数R2>0.8,得到神经网络;
c.检测待测样本
将采集的待测案发现场的样本痕迹的红外光谱数据输入神经网络,神经网络输出待测痕迹样本的遗留时间。
进一步,步骤a)中,所述不同遗留时间样本痕迹的采样时间间隔24小时。
优选地,步骤a)中,所提取的红外光谱数据为采集波数范围内全段或部分波数段内所有吸收峰的出峰位置及峰强数据。
进一步,步骤a)中,在各痕迹样本的红外光谱中,提取自酰胺I、酰胺II、酰胺III、酰胺A、PO2-反对称伸缩振动至PO2对称伸缩振动对应波数区间段内的吸收峰数据作为红外光谱数据集。
优选地,步骤a)中,红外光谱的采集波数范围为:4000cm-1-600cm-1。
又,步骤c)中,待检测痕迹样本的红外吸收光谱数据的采集波数范围为1800cm-1-1300cm-1。
优选地,步骤b)中,所述神经网络的训练类型为量化共轭梯度法、L-M优化算法或有动量的梯度下降法。
又,步骤b)中,得到的神经网络判定系数R2>0.9。
优选地,所述痕迹样本为血痕、笔迹、汗斑或指印。
本发明对离体痕迹的相关性质随时间环境的变化规律进行探索,在传统的现场勘验基础上,拓展现场勘验采痕取证、检验鉴定思路,从微量物证角度出发,对在案件现场遗留的痕迹(如血迹、汗液痕迹或笔迹)进行检验分析和归纳总结,对痕迹离体或产生后随时间和环境因素的变化规律进行了研究。
本发明使用衰减全反射红外光谱结合神经网络方法对痕迹的遗留时间进行预测,使用衰减全反射红外光谱技术方法对痕迹进行红外光谱采集,能够清晰反映痕迹的基本特征。对同一份基板上遗留痕迹后的不同时间采集到的红外光谱,能够反映出基板上痕迹的红外性质随时间变化的基本规律,且这个规律不因遗留痕迹个体的变化发生转移。
本发明中,酰胺I与酰胺II的吸收峰是血痕在红外光谱图中峰强度最高的两处峰值,二者之间线性关系良好,在波数为1536cm-1处的酰胺I峰强度数值相对于波数为1650cm-1处的酰胺I峰强度数值存在良好的线性关系,一方面说明衰减全反射红外光谱法采集到的血痕红外光谱数据具备相对稳定可用的条件;另一方面说明该两处峰值之间的相对关系受到的样本不均匀、实验操作差异等因素的影响较小,有利于针对重点峰位进行细化研究。
与现有技术相比,本发明具有如下有益效果:
本发明将传统刑事科学技术研究与光谱学、计算机科学进行结合,对刑事科学技术痕迹遗留时间分析鉴定进行探索,以样本痕迹的遗留时间和红外光谱数据为变量对神经网络进行训练,建立样本痕迹的红外光谱数据与遗留时间的对应关系模型,通过验证筛选出较高精度的模型,能够实现对痕量检材的无损快速检测,使用时投入的人工成本和后期维护、耗材成本可控,具备普及条件,填补刑事科学技术领域中痕迹样本遗留时间检测的技术空白。
本发明采用全波段谱图数据训练神经网络,测量精度较高,通过调整重点波数范围可能进一步提高测量精度,痕迹的红外吸收特征谱带明显,重现性好,制样简便,结果稳定可靠。
附图说明
图1-7依次为本发明实施例中样品D1YP1-1、D2YP1-1、D3YP1-1、D4YP1-1、D5YP1-1、D6YP1-1、D7YP1-1的红外数据谱图。
具体实施方式
以下结合具体实施例对本发明作进一步说明。
实施例 本发明基于衰减全反射红外光谱的痕迹遗留时间的测量方法,包括以下步骤:
1.采集检材痕迹的红外光谱数据
采集一份以涤纶基板层析硅胶为载体的血痕的红外光谱数据,其采集条件如下:
实验仪器:布鲁克V70傅里叶变换红外光谱仪(带显微镜附件和ATR附件);
扫描范围:4000cm-1-600cm-1;
空间分辨率:25μm-1;
测试方法:衰减全反射红外光谱法(红外显微镜);
扫描次数:32次;
温度:21℃;
湿度:40%。
使用带有ATR附件的红外显微镜,以4000cm-1-600cm-1的波数段为扫描范围,如表1,其中,“……”表示前后波数区间内未全部列出的部分红外光谱数据:
表1
2.模拟检材痕迹制作样本痕迹,分类样本
以涤纶基板层析硅胶为载体,制成样本痕迹;
采样过程:收集到10名志愿者提供的新鲜静脉血样本,每人取150μL血液滴于涤纶基板的层析硅胶片上,制成样本血痕,静置于温度为21℃,湿度为40%的室内保存,以其中7份血痕样本为训练集样本,以其中3份样本为验证集样本。
3.采集样本数据集
将10份实验样本置于实验环境内,采血后开始计时,采血后24小时为1d采样时间,以此类推至7d。分别于采血后1d、2d、3d、4d、5d、6d、7d进行采样。采样时将实验样本置于实验仪器载物台上,在红外显微镜下标记3个采样点,每天对该3个采样点的红外光谱进行重复采样,另制得涤纶基板的层析硅胶片表面空白样本一份。记录样本痕迹的遗留时间最大值7。
以OPUS软件记录采集样本数据,对采集的样品数据进行编号,以D1YP1-1为例进行说明,D为天数,YP1-1代表1号样品上的第一个点上的数据,共得有效数据210份,按照前述样本分类将其划分为147个训练集血痕样本和63个验证集血痕样本。
分别采集147个训练集血痕样本和63个验证集血痕样本的红外光谱,采集每个样本在波数段4000cm-1-600cm-1间的1765个吸收峰的出峰位置的峰强值,得到红外光谱数据集,包括训练集血痕样本的红外光谱数据集(简称训练集,下同)和验证集血痕样本的红外光谱数据集(简称验证集,下同)。
采集到的210份血痕样本的红外光谱图在酰胺I、酰胺II、酰胺A等重要的官能团波数段上表现清晰,以1号样品上第一个点为例,其从第1天到第7天的红外谱图见附图1-7。
将各样品的数据酰胺I、酰胺I、酰胺II、酰胺III、酰胺A、PO2-反对称伸缩振动、PO2对称伸缩振动对应波数区间的最强峰值抽取出来进行考量,参见表2。
表2
结合表2,由采样的210份样本数据可见,所有样品在波数1080cm-1左右、波数1650cm-1和波数1535cm-1左右均出现了较强的吸收峰,在波数为1315cm-1、1392cm-1、1452cm-1、2854cm-1、2873cm-1、2935cm-1、2960cm-1、3012cm-1、3289cm-1左右处均有吸收峰出现。绝大部分样本在波数1650cm-1和波数1535cm-1左右的两个吸收峰峰高相近,绝大部分样本在波数1650cm-1处的峰强度大于在波数1535cm-1处的峰强度。绝大部分样本在波数1080cm-1左右处的吸收峰强度最大,所有样本在波数3289cm-1处有中等强度的吸收峰,该处的峰强度小于波数1080cm-1、波数1650cm-1和波数1535cm-1处的吸收峰并大于波数4000cm-1-1300cm-1的官能团区的其他峰值。
说明衰减全反射红外光谱法采集到的血痕红外光谱数据具备相对稳定可用的条件;另一方面,波数为1536cm-1处的峰强度数值相对于波数为1650cm-1处的峰强度数值符合y=0.7744x-0.002942(R2=0.9281)的线性方程,说明酰胺I和酰胺II两处峰值之间的相对关系受到的样本不均匀、实验操作差异等因素的影响较小,有利于针对重点峰位进行细化研究。
4.使用神经网络建立样本痕迹的红外光谱数据与遗留时间的对应关系模型并验证精度,
利用MATLAB数据分析软件中的神经网络工具箱功能,以痕迹样本的遗留时间和红外光谱数据为变量构建BP神经网络,训练类型为TRAINLM即L-M优化算法;误差类型选择MSE;层数选2层(1个隐含层和1个输出层),隐含层和输出层的传递函数选用系统默认的TANSIG,因L-M优化算法需占用大量内存资源,过大的神经元数对计算机要求较高,以神经元个数分别设定为1,3,5构建三个神经网络network_all_trainlm_n1、network_all_trainlm_n3、network_all_trainlm_n5。
利用上述训练集对已建立结构的三个神经网络分别进行训练,训练参数中设置time为180(network_all_trainlm_n5的训练时间为300),max_fail数值设置为20,其余为默认参数,以变量AAall为输入数据inputs,以TrainDay为目标数据Targets,对神经网络进行训练,待神经网络按照预设参数训练完成后,以APall为输入数据inputs对其对应天数进行预测,预测天数分别保存为变量network_all_trainlm_n1_outputs、network_all_trainlm_n3_outputs、network_all_trainlm_n5_outputs。
利用上述验证集进行验证,将验证集中的红外光谱数据录入上述训练得到的三组模型,三组模型反馈其模拟的验证集中对应遗留天数。
利用数据处理工具比较三组模型模拟的验证集中对应遗留天数与真实的遗留天数,计算其判定系数R2,分别为0.7071、0.8435、0.5677,因此,使用神经网络network_all_trainlm_n3建立的模型可用。
本发明中的判定系数R2又叫决定系数,其主要作用是评估回归模型对因变量产生变化的解释程度,是判断模型精确程度的指标,一般认为,判定系数R2大于0.8表示模型拟合度好,其计算公式如下:
R2=回归平方和/总平方和,其中回归平方和=总平方和-残差平方和。
5.将检材痕迹的红外光谱数据录入符合精度要求的模型,得到模拟检材痕迹的遗留时间
将检材痕迹的红外光谱数据录入上述神经网络network_all_trainlm_n3建立的模型,模型反馈模拟的检材痕迹遗留时间D=5.5。
6.评估检材痕迹遗留时间
模型反馈模拟的检材痕迹遗留天数D=5.5,其与样本痕迹的遗留时间最大值7的比值≤0.9,因此,检材痕迹的遗留天数评估为5.5。
机译: 一种高灵敏度的测量方法,一种用于同一设备,一种用于同一组件的自组装单分子膜,其过程是使用红外光谱设备在金色薄膜上形成自组装单分子膜,从而可以减少制造时间自组装单层膜的增长
机译: 衰减全反射棱镜的红外光谱测量方法
机译: 一种检测遗留或带走中遗留或带走发生时间的方法及检测系统