首页> 中国专利> 基于主成分分析和神经网络的港区道路安全性预测方法

基于主成分分析和神经网络的港区道路安全性预测方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明属于道路交通安全的技术领域，涉及一种基于主成分分析和神经网络的港区道路安全性预测方法，包括下列步骤：确定影响港区道路安全性的因素；对历史交通数据原始数据进行提取，对原始数据进行归一化，然后对数据进行主成分分析，得到影响港区道路安全性的主成份；建立BP神经网络模型；对建立好的BP神经网络模型进行训练，并利用训练好的模型进行灵敏度分析；第五步：对港区道路的安全性进行预测。本发明的比经典BP神经网络结构简单，预测精度高，而且能够应用于道路安全核查中，为道路的建设与整修提供理论依据。

著录项

公开/公告号CN101976501A

专利类型发明专利
公开/公告日2011-02-16

原文格式PDF
申请/专利权人天津市市政工程设计研究院;
展开▼

申请/专利号CN201010525852.4
发明设计人白子建;王晓华;刘润有;杜鹏;龚凤刚;贺海;练象平;曾伟;周骊巍;杨贤贵;谭伟姿;田春林;李文明;张洋;段绪斌;张国梁;李明剑;狄升贯;王志华;苑红凯;靳灿章;张颖;冯炜;程海波;付晓敦;刘超;
展开▼

申请日2010-10-29
分类号G08G1/00(20060101);G06N3/08(20060101);
代理机构12201 天津市北洋有限责任专利代理事务所;
代理人程毓英
地址 300051 天津市和平区营口道239号
入库时间 2023-12-18 01:48:00

法律信息

法律状态公告日

法律状态信息

法律状态
2022-12-23

专利权人的姓名或者名称、地址的变更 IPC(主分类):G08G 1/00 专利号:ZL2010105258524 变更事项:专利权人变更前:天津市市政工程设计研究院变更后:天津市政工程设计研究总院有限公司变更事项:地址变更前:300051 天津市和平区营口道239号变更后:300051 天津市和平区营口道239号

专利权人的姓名或者名称、地址的变更
2012-05-30

授权

授权
2011-03-30

实质审查的生效 IPC(主分类):G08G1/00 申请日:20101029

实质审查的生效
2011-02-16

公开

公开

说明书

技术领域

本发明属于道路交通安全的技术领域，涉及一种公路交通事故预测的方法。

背景技术

随着公路里程和车辆保有量的增加，我国交通事故呈不断上升趋势，人们的生命和财产安全受到了极大的威胁，已成为当今备受关注的严重社会问题之一。道路安全评价的研究对于交通事故的减少有很大的作用。道路安全评价是指从微观的角度分析道路交通环境因素与交通事故的关系，以改善道路安全状况，制定技术与政策措施，指导道路安全设计。

现在已经存在一些有关交通事故预测分析的研究，但基本都是从宏观的角度进行分析，选取的影响因素是总人口，机动车保有量等宏观数据，得出的分析结果是一个区域的交通事故次数的预测，这对于预防和减少交通事故起不到太大作用。本发明是从微观的角度，分析道路的因素对交通事故的影响，这样就可以指导道路的设计与整修。

交通事故是由众多因素共同作用产生的复杂的非线性系统，而且这些因素之间的关系很难用解析的方法进行描述，而神经网络模型通过对历史数据的学习，能够以任意精度逼近任意非线性映射，因此本发明利用神经网络模型对交通事故进行预测分析。但是，影响交通事故的因素很多，为了预测的准确性，不遗漏重要信息，会考虑尽量多的因素，而这些因素由于都是对交通事故的反映，不可避免会有大量的信息重叠，这可能会隐藏交通事故的真正特征与内在规律。因此，本发明引入了主成分分析法，对原始数据进行主成分分析，从影响因素之间错综复杂的关系中提取出一些主要成分，从而有效地利用大量统计数据进行定量分析，揭示变量之间的内在关系。

发明内容

本发明的目的是克服现有技术的上述不足，提供一种操作简单，适用于道路安全核查中交通事故预测的方法。

一种基于主成分分析和神经网络的港区道路安全性预测方法，包括下列步骤：

第一步：确定影响港区道路安全性的因素：确定驾驶员数量，汽车驾驶员数量，区域人口总数，机动车数量，道路总长度，港口货物吞吐量，道路区段的长度，小型支路的数量，路肩宽度，车道数，路侧危险等级以及平曲线曲度参数12个变量为影响港区道路安全性的因素；

第二步：主成分分析：对历史交通数据中有关上述12个变量的原始数据进行提取，对原始数据进行归一化，然后对数据进行主成分分析，得到影响港区道路安全性的主成份；

第三步：建立BP神经网络模型：以所得到的主成分作为输入变量，以交通事故的次数作为输出变量，根据所确定的隐层神经元个数的范围，建立一个隐含层神经元数目可变的单隐含层BP神经网络模型；对原始数据进行训练，通过每次训练的误差对比，确定最佳的隐含层神经元个数，通过每次训练后的误差平方和总的误差平方和的下降速率，判断所选定的学习速率是否合适，最终得到最佳学习速率。

第四步：对建立好的BP神经网络模型进行训练，并利用训练好的模型进行灵敏度分析，确定小型支路的数量，路肩宽度，车道数，路侧危险等级，平曲线曲度参数对交通事故次数的影响；

第五步：对港区道路的安全性进行预测。

本发明的技术效果如下：

1、基于主成分分析的BP神经网络模型。经典BP神经网络直接利用原始数据作为输入变量进行训练，但这些原始数据存在两方面的问题，一是数据量大，维数多，一是数据之间存在相关性，信息有重叠，这就会造成结果的精度不高以及训练速度的降低。对原始数据进行主成分分析，从影响因素之间错综复杂的关系中提取出一些主要成分，从而有效地利用大量统计数据进行定量分析，揭示变量之间的内在关系。

2、从微观的角度选取影响因素进行预测。传统的交通事故预测方法都是利用一些宏观的影响因素作为输入变量进行分析，得到的是一个整体的交通事故的数据。本发明是将道路的线形因素作为输入数据，分析道路因素与交通事故的关系，从而得到道路线形对交通事故的影响，这个结论可以应用到道路交通安全评价中，为道路的设计和整修提供理论依据。

附图说明

图1：BP神经网络结构。

图2：基于主成分分析的BP神经网络模型框架。

具体实施方式

在当今社会，道路交通安全受到人们的广泛关注，道路安全评价的研究对于交通事故的减少有很大的作用。本发明从微观的角度，应用基于主成分分析的BP神经网络模型对道路线形和交通事故的关系进行了分析研究。

下面详细介绍本发明的工作流程：

一、数据的选取

道路交通是由人、车、路和环境等四大要素构成的动态系统。交通事故是道路交通系统中，由于人、车、路、环境诸要素的配合失调而偶然突发的事件。因此，在选取交通事故的影响因子时，要从以上四方面进行分析。表1列出了我国2002年道路交通事故主要原因的统计结果。

表1我国道路交通事故主要原因分布(2002年)

1.人的因素

由表1可以看出，由于人的原因造成的死亡人数占当年交通事故死亡总数的88.98％，其中机动车驾驶员为主要原因的占78.56％，非机动车驾驶人占4.20％，行人和乘车人占6.22％。可见，从总体上看，交通事故的关键在于机动车驾驶员，因为相对于行人和骑车人来说，机动车驾驶员是交通强者。因此选取了驾驶员数量和区域人口总数两个指标。

2.车的因素：造成交通事故的第二大要素是车辆。在道路上行驶的车辆，既有机动车，又有自行车和其他非机动车，其中机动车时一种快速的交通工具，能量最大，防护性也最好。但这种防护性只保护驾驶员和车内人员，因此，相对于自行车和其他非机动车，机动车是交通强者。但是自行车数量的增多也会对交通事故的多少产生影响，因此选取了机动车数量，自行车数量和平均日交通量三个指标作为影响因子。

3.道路因素：从表中的统计数据来看，以道路缺陷为主要原因引发的交通事故所占比例很小，但是认真分析后会发现，事实并非如此，很多事故都是由不良道路条件间接引起的。因此，本发明中首先将一条道路按照其线形分为若干段，选取以下数据作为影响交通事故的因子：道路区段的长度；小型支路的密度参数；路肩宽度；平曲线的曲度参数。

4.环境因素：影响道路交通安全的环境因素可分为自然环境和人工环境，自然环境主要包括地理位置，气象条件，时间等，人工环境包括土地使用状况、路侧干扰、道路障碍物等。本发明选取了路侧危险等级作为影响因子。路侧危险等级分类见表2。

表2路侧危险等级分类

路侧危险等级路侧性能描述 1 路侧净空区＞9m 2 路侧净空区介于6～7.5m 3 路侧净空区宽度大约3m 4 路侧净空区介于1.5～3m；可能有护栏(距离路面边缘1.5～2m) 5 路侧净空区介于1.5～3m；可能有护栏(距离路面边缘0～1.5m) 6 路侧净空区介于小于等于1.5m；路面边缘外2m内有坚硬的障碍物 7 路侧净空区宽度小于等于1.5m；路侧有峭壁或陡直的悬崖

二、对数据进行主成分分析

上面对影响交通事故的因素进行了分析，影响因素共12个，分别为驾驶员数量，汽车驾驶员数量，区域人口总数，机动车数量，道路总长度，港口货物吞吐量，道路区段的长度，小型支路的数量，路肩宽度，车道数，路侧危险等级，平曲线曲度参数。本发明中选取了1999-2007年的数据，对天津某条道路按照线形分为7段，双向即14段，提取出上述道路数据，形成了本发明的原始数据，共126组。首先对原始数据进行归一化，然后对这12个变量进行综合考虑，得到如表3的5个主成分。详细的分析方法可参见“基于主成分分析的道路交通事故预测.交通与安全，2009(No.204)：86-90”

表3主成分分析结果

主成分1 主成分2 主成分3 主成分4 主成分5 主成分标准差 16.6478 6.3349 4.9490 4.2317 3.4334 方差所占比例 38.0760％ 14.4889％ 11.3192％ 9.6786％ 7.8526％累计贡献率 38.0760％ 52.5649％ 63.8841％ 73.5627％ 81.4153％

前5个主成分的累计贡献率已超过80％，因此只需用这5个主成分就能较好地概括原始数据。

(x₁ x₂ x₃ x₄ x₅ x₆ x₇ x₈ x₉ x₁₀ x₁₁ x₁₂)^T

三、BP神经网络模型的确定

由前面分析得知，交通事故是由众多因素共同作用产生的复杂的非线性系统，而且这些因素之间的关系很难用解析的方法进行描述，用传统预测模型不能有效涵盖交通系统的各个方面难以，建立具体的函数形式，即使建立了模型，也难以找到一个恰当的参数估计方法来确定参数。而神经网络具有通过学习以任意精度逼近任意非线性映射的能力，故预测的精度非常高。此外，神经网络是通过映射来反映函数，故可不受函数的具体形式的限制，不需假设的数学结构，就可通过建立输入/输出模型进行预测。因此，用神经网络模型来预测交通事故可克服建模问题的困难，而且可提高预测的精度。

本发明选择了前向型网络中的BP网络对交通事故进行预测。据统计，80％～90％的神经网络模型采用了BP网络或者它的变化形式。BP网络是前向网络的核心部分，体现了神经网络中最精华、最完美的内容。

1.BP网络结构

BP网络是一种单向传播的多层前向网络，结构如图1所示。BP网络是一种具有三层或三层以上的神经网络，包括输入层、中间层(隐层)和输出层。上下层之间实现全连接，而每层神经元之间无连接。

在本发明中，对交通事故预测的BP网络进行结构设计时，增加隐含层的数量可以提高BP网络的非线性映射能力，但是隐含层的数目超过一定值，反而会使网络的性能降低。而对于任何在闭区间被的一个连续函数都可以用单隐层的BP网络逼近，因而一个三层的BP网络就可以完成任意的n维到m维的映射。所以本发明的BP网络共三层。

网络的输入层与输出层完全由要解决的问题决定，在本发明中，输入层的神经元数由影响因素的主成分组成，共5个；输出层的神经元数由预测结果确定，共1个，即交通事故次数，本发明模型的框架如图2所示。

2.隐层的设计

隐层的神经元数目选择是一个十分复杂的问题，往往需要根据设计者的经验和多次实验来确定，因而不存在一个理想的解析式来表示。隐层神经元的数目与问题的要求、输入/输出单元的数目都有着直接关系。隐层神经元数目太多会导致学习时间过长、误差不一定最佳，也会导致容错性差、不能识别以前没有看到的样本，因此一定存在一个最佳的隐单元数。以下3个公式为可用于选择最佳隐单元数时的参考公式。

(1)其中，k为样本数，n₁为隐单元数，n为输入单元数。如果1＞n₁， $C_{n_{1}}^{i} = 0 .$

(2)其中，m为输出神经元数，n为输入单元数，a为[1，10]之间的常数。

(3)n₁＝log₂n，其中，n为输入单元数。

根据上面的经验设计公式，并考虑到本发明的实际情况，解决该问题的网络的隐层神经元个数应该在3～12之间。因此，首先设计了一个隐含层神经元数目可变的BP网络，通过误差对比，确定最佳的隐含层神经元个数。由于每次训练的误差结果都有出入，所以设定训练10次，将十次训练的误差相加，得到隐含层神经元为7的BP网络对函数的逼近效果最好。

3.网络学习速率的选取

学习速率决定每一次循环中所产生的权值变化量。大的学习速率可能导致系统的不稳定，但小的学习速率将会导致学习时间较长，可能收敛速度很慢，不过能保证网络的误差值不跳出误差表面的低谷而最终趋于最小误差值。所以在一股情况下，倾向于选取较小的学习速率以保证系统的稳定性。学习速率的范围一股选取在0.01-0.7之间。

在一个神经网络设计中，网络要经过几个不同的学习速率的训练，通过观察每一次训练后的误差平方和∑e²的下降速率来判断所选定的学习速率是否合适。如果∑e²下降很快，则说明学习速率合适，若∑e²出现震荡现象，则说明学习速率过大。对本发明的BP网络进行训练，得到最佳学习速率为0.04。

四、模型实现与结果分析

1.模拟结果

将收集的126组数据随机分为两组，一组有100个，用来进行训练，一组有26个，用来进行测试。本发明实现了交通事故的预测方法。应用前面得出的基于主成分分析的BP网络模型进行训练和测试，得出结果如表4。表5是对原始数据直接应用经典BP网络进行训练和测试得到的结果。

表4基于主成分分析的BP神经网络预测结果

●训练数据预测的总体准确性为84.2％，测试数据为78％。(N为交通事故次数)

表5BP神经网络预测结果

●训练数据预测的总体准确性为65.6％，测试数据为75.3％。(N为交通事故次数)

2.结果分析

经过对比得出，利用主成分分析之后的BP神经网络比较经典神经网络的优点在于：

1)系统由12个输入变量减小到5个，降低了输入变量的维数，从而可以有效地避免经典神经网络的“维数灾”问题，加快后面的神经网络预测。维数很高的时候，数据量大，使得神经网络的结构变得复杂，必然会影响预测的速度。本模型在实际应用时会加入更多的影响因素，在本发明中由于数据不够齐全只选取了12个数据，因此主成分分析的效果没有那么明显，当维数很大时，就可以明显看到预测速度的提高。

2)各主成分之间相互无关，并且各个主成分作为BP神经网络的独立输入进行预测，预测效果比高维高相关输入的经典神经网络要好。因为相关数据之间存在信息的重叠，若对没有进行处理的数据直接进行训练就会隐藏真实有用的信息，训练过程中不容易找到精确的映射关系，这就会造成预测精度的降低。

但是容易发现，预测的准确度还有待提高。这是因为BP神经网络自身还存在着不足。BP算法可以使权值收敛到某个值，但并不能保证其为误差平面的全局最小值，这是因为采用梯度下降法可能会产生一个局部最小值。另外，网络隐含层的层数和单元数的选择尚无理论上的指导，一股是根据经验或者通过反复实验确定。因此，网络往往存在很大的冗余性，在一定程度上也增加的网络学习的负担。

3.灵敏度分析

本发明应用灵敏度分析对每个输入的影响因素对交通事故次数的影响进行分析。从而得到道路线形对交通事故的影响，为道路的修建或整改提供理论依据。灵敏度分析是检验其他变量都不变的情况下变动某个变量对交通事故频率分布的影响。结果如表6所示。本发明对支路数量、路侧危险等级和平曲线曲度参数3个变量进行灵敏度分析，N为交通事故的次数，例如，支路数量为0，即路段上没有小型支路时，大约94.5％没有事故发生，5.42％会发生一次事故，0.08％会发生两次，而且随着支路数量的增加，事故发生的可能性越大。

表6灵敏度分析结果

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于主成分分析和神经网络的港区道路安全性预测方法 [P] . 中国专利： CN101976501B . 2012.05.30
2. 基于主成分分析和神经网络的港区道路安全性预测方法 [P] . 中国专利： CN101976501A . 2011-02-16
3. Category-partitioned Content Based Image Retrieval for fine-grained objects with feature extraction through Convolution Neural Network and feature reduction through principle component analysis [P] . AU2018101525A4 . 2018-11-15

机译：通过卷积神经网络进行特征提取并通过主成分分析进行特征约简，从而对细粒度对象进行基于类别的基于内容的图像检索
4. NIGHT VISION FACE RECOGNITION METHOD USING 2-DIRECTIONAL 2-DIMENSIONAL PRINCIPAL COMPONENT ANALYSIS ALGORITHM AND POLYNOMIAL-BASED RADIAL BASIS FUNCTION NEURAL NETWORKS [P] . 韩国专利： KR20150131658A . 2015-11-25

机译：基于二维二维主成分分析算法和基于多项式的径向基函数神经网络的夜间视觉人脸识别方法
5. SQL Column and table prediction method for text to SQL query translation based on a neural network [P] . KR20210082726A . 2021-07-06

机译：基于神经网络的SQL列和表预测方法，用于基于神经网络的SQL查询翻译