首页> 中国专利> 基于机器学习的驾驶风格辨识模型构建方法、装置、介质和设备

基于机器学习的驾驶风格辨识模型构建方法、装置、介质和设备

页面导航

摘要
著录项
说明书
相似文献

摘要

本申请提供了一种基于机器学习的驾驶风格辨识模型构建方法、装置、计算机可读介质和电子设备。该方法用于对驾驶员的驾驶风格进行辨识，包括：根据预先得到的所述驾驶员的驾驶行为数据样本，对所述驾驶员的驾驶风格进行聚类分析，得到所述驾驶员的驾驶风格类别数；基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型，实现对驾驶员的驾驶习惯进行针对性指导，提高矿用卡车的燃油经济性的目的。

著录项

公开/公告号CN112686294A

专利类型发明专利
公开/公告日2021-04-20

原文格式PDF
申请/专利权人华北科技学院;
展开▼

申请/专利号CN202011583410.5
发明设计人孙健东;吕帅康;王群;张曌;陶亚彬;冯读康;胥晓峰;张秋涵;
展开▼

申请日2020-12-28
分类号G06K9/62(20060101);
代理机构11387 北京五洲洋和知识产权代理事务所(普通合伙);
代理人刘春成;刘素霞
地址 065201 河北省廊坊市三河市燕郊开发区学院大街467号
入库时间 2023-06-19 10:41:48

说明书

技术领域

本申请涉及辅助驾驶技术领域，特别涉及一种基于机器学习的驾驶风格辨识模型构建方法、装置、计算机可读介质和电子设备。

背景技术

在矿用卡车驾驶过程中，鲁莽型的驾驶员会频繁且大幅度的踩油门踏板或者制动踏板，矿用卡车行驶时较为费油，燃油经济性较差；温和型的驾驶员会轻踩油门踏板或者制动踏板，矿用卡车行驶时较为省油，燃油经济性较好。因而，驾驶员在驾驶矿用卡车中的这些行为特征，在矿用卡车行驶过程中驾驶员对矿用卡车的输入以及矿用卡车的响应方面得到完全体现，即驾驶员的驾驶风格会对矿用卡车的燃油经济性产生较大的影响，因而，能够准确有效对驾驶员的驾驶风格进行辨识，对驾驶员的驾驶习惯进行指导，提高矿用卡车的然后经济性具有重要的意义。

发明内容

本申请的目的在于提供一种基于机器学习的驾驶风格辨识模型构建方法、装置、计算机可读介质和电子设备，以解决或缓解上述现有技术中存在的问题。

为了实现上述目的，本申请提供如下技术方案：

本申请提供了一种基于机器学习的驾驶风格辨识模型构建方法，用于对驾驶员的驾驶风格进行辨识，包括：根据预先得到的所述驾驶员的驾驶行为数据样本，对所述驾驶员的驾驶风格进行聚类分析，得到所述驾驶员的驾驶风格类别数；基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型。

可选地，在本申请的任一实施例中，所述根据预先得到的所述驾驶员的驾驶行为数据样本，对所述驾驶员的驾驶风格进行聚类分析，得到所述驾驶员的驾驶风格类别数，包括：基于预设的相关性分析模型，对所述驾驶员的、选择的驾驶风格特征参数进行相关性分析，并根据所述相关性分析的结果，去除预先得到的所述驾驶员的驾驶行为数据样本中的冗余驾驶风格特征参数；基于预设的聚类算法模型，根据去除冗余驾驶风格特征参数的驾驶行为数据样本，得到所述驾驶行为数据样本的聚类结果；基于肘部法则，根据所述聚类结果确定所述驾驶员的驾驶风格类别数。

可选地，在本申请的任一实施例中，所述基于预设的相关性分析模型，对所述驾驶员的、选择的驾驶风格特征参数进行相关性分析，根据所述相关性分析的结果去除预先得到的所述驾驶员的驾驶行为数据样本中的冗余驾驶风格特征参数，包括：基于预设的相关性分析模型，对选择的所述驾驶风格特征参数进行相关性分析，得到所述驾驶风格特征参数之间的相关系数；根据所述相关系数和预设的相关系数阈值，去除预先得到的所述驾驶员的驾驶行为数据样本中的冗余驾驶风格特征参数。

可选地，在本申请的任一实施例中，所述基于预设的聚类算法模型，根据去除冗余驾驶风格特征参数的驾驶行为数据样本，得到所述驾驶行为数据样本的聚类结果，具体为：基于预设的聚类算法模型，对去除冗余驾驶风格特征参数的驾驶行为数据样本进行聚类分析，得到所述驾驶行为数据样本的聚类结果。

可选地，在本申请的任一实施例中，所述基于肘部法则，根据所述聚类结果确定所述驾驶员的驾驶风格类别数，具体为：基于K均值聚类算法模型，对所述聚类结果进行拟合，并根据拟合结果，基于肘部法则确定所述驾驶员的驾驶风格类别数。

可选地，在本申请的任一实施例中，所述基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型，包括：基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，生成Z个决策树，其中，Z为正整数，且Z大于2；基于多数投票，根据所述Z个决策树，构建所述驾驶员的驾驶风格辨识模型。

可选地，在本申请的任一实施例中，在所述基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型之后，还包括：按照预设比例，对所述驾驶行为数据样本进行划分，并根据所述驾驶行为数据样本的划分结果，基于十折交叉验证网格搜索，对所述驾驶风格辨识模型的参数进行优化，得到优化的驾驶风格辨识模型。

本申请实施例还提供一种基于机器学习的驾驶风格辨识模型构建装置，包括：驾驶风格分类单元，配置为根据预先得到的所述驾驶员的驾驶行为数据样本，对所述驾驶员的驾驶风格进行聚类分析，得到所述驾驶员的驾驶风格类别数；辨识模型构建单元，配置为基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型。

本申请实施例还提供一种计算机可读介质，其上存储有计算机程序，所述程序为如上任一实施例所述的基于机器学习的驾驶风格辨识模型构建方法。

本申请实施例还提供一种电子设备，包括：存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的程序，所述处理器执行所述程序时实现如上任一实施例所述的基于机器学习的驾驶风格辨识模型构建方法。

与最接近的现有技术相比，本申请实施例的技术方案具有如下有益效果：

本申请实施例提供的技术方案，用于对驾驶员的驾驶风格进行辨识，通过预先得到驾驶员的驾驶行为数据样本，对驾驶员的驾驶风格进行聚类分析，并根据得到驾驶风格类别数以及驾驶行为数据样本，基于随机森林算法，构建驾驶风格辨识模型，以对驾驶员的驾驶风格进行准确有效的辨识，实现对驾驶员的驾驶习惯进行针对性指导，提高矿用卡车的燃油经济性的目的。

附图说明

构成本申请的一部分的说明书附图用来提供对本申请的进一步理解，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。其中：

图1为根据本申请的一些实施例提供的基于机器学习的驾驶风格辨识模型构建方法的流程示意图；

图2为矿用卡车在重载作业状态和空载作业状态下的油门踏板行程图；

图3为矿用卡车在重载作业状态和空载作业状态下的行驶速度图；

图4为根据本申请的一些实施例提供的驾驶风格辨识模型构建方法中步骤S101的流程示意图；

图5为根据本申请的一些实施例提供的驾驶风格辨识模型构建方法中步骤S111的流程示意图；

图6为根据本申请的一些实施例提供的矿用卡车在重载作业状态下驾驶行为特征参数之间的相关系数热力图；

图7为根据本申请的一些实施例提供的矿用卡车在空载作业状态下驾驶行为特征参数之间的相关系数热力图；

图8为根据本申请的一些实施例提供的利用肘部法则确定矿用卡车在重载作业状态下驾驶风格的分类数量的示意图；

图9为根据本申请的一些实施例提供的利用肘部法则确定矿用卡车在空载作业状态下驾驶风格的分类数量的示意图；

图10为根据本申请的一些实施例提供的基于机器学习的驾驶风格辨识模型构建方法中步骤S102的流程示意图；

图11为根据本申请的一些实施例提供的基于机器学习的驾驶风格辨识模型构建装置的结构示意图；

图12为根据本申请的一些实施例提供的驾驶风格分类单元的结构示意图；

图13为根据本申请的一些实施例提供的冗余参数去除子单元的结构示意图；

图14为根据本申请的一些实施例提供的辨识模型构建单元的结构示意图；

图15为根据本申请的一些实施例提供的电子设备的结构示意图；

图16为根据本申请的一些实施例提供的电子设备的硬件结构图。

具体实施方式

下面将参考附图并结合实施例来详细说明本申请。各个示例通过本申请的解释的方式提供而非限制本申请。实际上，本领域的技术人员将清楚，在不脱离本申请的范围或精神的情况下，可在本申请中进行修改和变型。例如，示为或描述为一个实施例的一部分的特征可用于另一个实施例，以产生又一个实施例。因此，所期望的是，本申请包含归入所附权利要求及其等同物的范围内的此类修改和变型。

图1为根据本申请的一些实施例提供的基于机器学习的驾驶风格辨识模型构建方法的流程示意图；如图1所示，该方法用于对驾驶员的驾驶风格进行辨识，包括：

步骤S101、根据预先得到的所述驾驶员的驾驶行为数据样本，对所述驾驶员的驾驶风格进行聚类分析，得到所述驾驶员的驾驶风格类别数；

在本申请实施例中，主要是构建露天矿矿用卡车驾驶员的驾驶风格辨识模型，驾驶行为数据样本是对多名驾驶员驾驶矿用卡车时，分别对重载作业状态、空载作业状态进行数据采集得到，其中，矿用卡车每次在装载点运输剥离岩石至排土场卸载点过程中采集的数据为重载作业状态的驾驶行为数据样本，矿用卡车每次在排土场卸载点空载原路返回装载点过程中采集的数据为空载作业状态的驾驶行为数据样本。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，根据预先得到的驾驶行为数据样本，基于机器学习模型，对驾驶员的驾驶风格进行分类，得到驾驶员的驾驶风格类别数。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，露天矿矿用卡车在实际运输作业中，在驾驶员的驾驶风格未知的条件下，通过无监督聚类分析(unsupervised clustering analysis)将驾驶行为数据样本中的数据划分为不同簇，使得每个簇内的样本相似性大于其它簇内样本的相似性，然后将结果传递至回归或分类等有监督的机器学习模型，对驾驶员的驾驶风格进行分类，确定驾驶员的驾驶风格类别数。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，对矿用卡车进行数据采集的硬件部分主要包括1个ARM微控制器(型号STM32F103)、2个惯性导航传感器(型号WTGAHRS2)、1个SD存储卡、车载直流电源、保护外壳等。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，为了实时采集矿用卡车在重载作业状态以及空载作业状态下驾驶员的驾驶行为数据，在矿用卡车上安装惯性导航传感器和ARM(Advanced RISCMachines)微控制器，以2赫兹的数据采样频率，对驾驶员驾驶矿用卡车时的油门踏板行程、油门踏板的角速度、矿用卡车的速度、纵向加速度、矿用卡车的行驶面坡度、位置等数据进行采集并存储。表1为基于同一矿用卡车即实验道路，对11名驾驶员在实际运输作业中行驶里程约650公里的传感器采集参数表，如下所示：

表1

在本申请实施例中，由于存在GPS信号遮挡或其它电磁干扰等因素，传感器会输出错误、无效的数据，为避免驾驶行为数据样本对机器学习算法的学习结果的影响，在进行聚类分析前需对传感器采集的数据进行处理(比如，数据抽取、数据删除等)。籍此，提高机器学习的精度。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，惯性导航传感器有两个，定义一个为1号传感器，另一个为2号传感器。1号传感器主要对矿用卡车的油门踏板行程、油门踏板角速度进行数据采集，2号传感器主要对矿用卡车的速度、纵向加速度、位置以及行驶面坡度进行数据采集。惯性导航传感器为十轴惯性导航传感器，在十轴惯性导航传感器中集成有高精度的陀螺仪、加速度计、GPS等模块，形成GPS-IMU组合导航单元，具有高精度、低成本、低功耗、小尺寸的优点，可以精准的测量矿用卡车的纵向加速度、速度、GPS精度(即2号传感器对矿用卡车的位置进行数据采集时的位置精度)、油门踏板角速度等参数。

其中，十轴惯性导航传感器的性能参数如下表2所示：

表2

在本申请实施例中，1号传感器沿X轴方向牢固地安装在矿用卡车的油门踏板背面，2号传感器沿Y轴方向牢固地安装在驾驶室内水平位置(或近似水平位置)。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，在对传感器采集的数据进行数据抽取时，将1号传感器和2号传感器采集的数据分别单独存储于SD卡中，并以传感器的编号标识和时间为标记，基于Python语言开发传感器数据融合程序，实现同一时刻1号传感器和2号传感器所采集数据的拼接，以提供完成的驾驶行为数据样本。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，由于驾驶风格分类辨识是建立在矿用卡车动态运输作业过程中，因而在对传感器数据进行数据删除时，剔除传感器采集数据中速度为0的数据(速度为0代表矿用卡车处于静止状态)；考虑到矿用卡车行驶时，路面颠簸带来的误差，设置矿用卡车作业运行速度阈值，若矿用卡车的车速超过45km/h，则认为是异常数据，剔除传感器采集数据中速度大于45km/h的数据；由于矿用卡车的纵向加速度受到矿用卡车自重以及载重的限制，考虑到矿用卡车的自重以及载重综合约230吨，因而矿用卡车的加速度一般不超过0.55m/s

图2为矿用卡车在重载作业状态和空载作业状态下的油门踏板行程图；图3为矿用卡车在重载作业状态和空载作业状态下的行驶速度图；其中，load代表重载作业状态，noload代表空载作业状态。如图2、图3所示，矿用卡车在重载作业状态和空载作业状态下，油门踏板行程和速度存在较大差别，因而，将每次装载点运输剥离岩石至排土场卸载点过程中采集的数据为重载作业状态下的驾驶行为数据样本，以每次排土场卸载点空载原路返回装载点过程中采集的数据为空载作业状态下的驾驶行为数据样本。其中，将传感器采集的11名驾驶员的数据划分为111个重载作业状态下的驾驶行为数据和108个空载作业状态下的驾驶行为数据。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

图4为根据本申请的一些实施例提供的驾驶风格辨识模型构建方法中步骤S101的流程示意图；如图4所示，所述根据预先得到的所述驾驶员的驾驶行为数据样本，对所述驾驶员的驾驶风格进行聚类分析，得到所述驾驶员的驾驶风格类别数，包括：

步骤S111、基于预设的相关性分析模型，对所述驾驶员的、选择的驾驶风格特征参数进行相关性分析，根据所述相关性分析的结果去除预先得到的所述驾驶员的驾驶行为数据样本中的冗余驾驶风格特征参数；

在本申请实施例中，为了对露天矿矿用卡车驾驶员的驾驶风格进行分类辨识，首先应确定能够表征驾驶员的驾驶风格的特征参数。通常情况下，选择矿用卡车的油门踏板行程、油门踏板角速度、矿用卡车的速度、纵向加速度等的统计值(最大值、平均值、标准差)作为驾驶风格特征参数。如下表3所示，

表3

在本申请实施例中，当驾驶风格特征参数之间存在多重共线性(multicollinearity)时，相关的驾驶风格特征参数在欧式距离(euclidean distance)计算中所占权重较高，对驾驶风格分类的准确性影响较大。因而，需要对驾驶员的驾驶风格特征参数进行相关性分析(correlation analysis)。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

图5为根据本申请的一些实施例提供的驾驶风格辨识模型构建方法中步骤S111的流程示意图；如图5所示，所述基于预设的相关性分析模型，对所述驾驶员的、选择的驾驶风格特征参数进行相关性分析，根据所述相关性分析的结果去除预先得到的所述驾驶员的驾驶行为数据样本中的冗余驾驶风格特征参数，包括：

步骤S111A、基于预设的相关性分析模型，对选择的所述驾驶风格特征参数进行相关性分析，得到所述驾驶风格特征参数之间的相关系数；

在本申请实施例中，用相关系数来表征选取的驾驶风格特征参数之间的相关性大小，通过相关系数的计算明确不同驾驶风格特征参数之间是否存在冗余。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，相关性分析模型为皮尔森(Pearson)相关系数的计算模型，定义如下公式(1)所示；

其中，r表示相关系数，x、y分别表示两个不同的驾驶风格特征参数，x

图6为根据本申请的一些实施例提供的矿用卡车在重载作业状态下驾驶行为特征参数之间的相关系数热力图；图7为根据本申请的一些实施例提供的矿用卡车在空载作业状态下驾驶行为特征参数之间的相关系数热力图；如图6、图7所示，根据上述相关性分析模型计算得到的不同的驾驶风格特征参数之间的皮尔森(Pearson)相关系数，即可明确不同的驾驶风格特征参数之间的线性相关程度。皮尔森相关系数的范围为(-1，1)，皮尔森相关系数的绝对值越大，说明两个不同的驾驶风格特征参数之间的相关性越强；尔森相关系数的绝对值越接近0，说明两个不同的驾驶风格特征参数之间的相关性越弱。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

步骤S111B、根据所述相关系数和预设的相关系数阈值，去除预先得到的所述驾驶员的驾驶行为数据样本中的冗余驾驶风格特征参数。

在本申请实施例中，皮尔森相关系数位于范围(0.6，0.8]时，认为两个不同的驾驶风格特征参数之间强相关；皮尔森相关系数位于范围(0.8，1]时，认为两个不同的驾驶风格特征参数之间极强相关。比如，矿用卡车在重载作业状态下各驾驶风格特征参数的皮尔森相关系数均小于0.8，表明各驾驶风格特征参数的独立性很强；矿用卡车在空载作业状态下的角速度平均值(wx3_mean)与角速度标准差(wx3_std)的皮尔森相关系数为0.94，说明空载作业状态下的角速度平均值(wx3_mean)与角速度标准差(wx3_std)之间具有极强的正相关性。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在一些可选实施例中，所述根据所述相关系数和预设的相关系数阈值，去除预先得到的驾驶行为数据样本中的冗余驾驶风格特征参数，具体为：对所述相关系数与预设的相关系数阈值进行比对，根据比对结果，去除预先得到的驾驶行为数据样本中的冗余驾驶风格特征参数。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，通过将相关性分析模型计算得到的不同的驾驶风格特征参数之间的皮尔森相关系数，与预设的相关系数阈值进行比对，明确不同的驾驶风格特征参数之间的相关性程度，极强相关的两个驾驶风格特征参数之间表明该两个驾驶风格特征参数为冗余数据，需剔除其中一个。比如，矿用卡车在空载作业状态下的角速度平均值(wx3_mean)与角速度标准差(wx3_std)的皮尔森相关系数为0.94，说明空载作业状态下的角速度平均值(wx3_mean)与角速度标准差(wx3_std)之间具有极强的正相关性，可将驾驶行为数据样本中的角速度平均值(wx3_mean)剔除，而保留角速度标准差(wx3_std)。表4为根据图6、图7的相关系数热力图得到的矿用卡车在重载作业状态以及空载作业状态下去除冗余后的驾驶风格特征参数，表4如下所示：

表4

表5为矿用卡车在重载作业状态下，基于图6、图7的相关系数热力图去除冗余驾驶风格特征参数后的驾驶行为数据样本；表5如下所示：

表5

表6为矿用卡车在重载作业状态下，基于图6、图7的相关系数热力图，去除冗余驾驶风格特征参数后的驾驶行为数据样本；表6如下所示：

表6

步骤S121、基于预设的聚类算法模型，根据去除冗余驾驶风格特征参数的驾驶行为数据样本，得到所述驾驶行为数据样本的聚类结果；

在本申请实施例中，基于预设的聚类算法模型，根据去除冗余驾驶风格特征参数的驾驶行为数据样本，确定驾驶风格聚类中心，得到驾驶行为数据样本的聚类结果，对驾驶员的驾驶风格进行分类。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，驾驶行为数据样本用X

其中，聚类中心的计算模型如下公式(2)所示：

其中，j＝(1，k)，j为自然数；

n代表对矿用卡车进行数据采集的传感器的个数；

u代表每一类聚类中心的个数。

误差准则函数的计算模型如下公式(3)所示：

其中，J表示误差准则函数。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在一些可选实施例中，所述基于预设的聚类算法模型，根据去除冗余驾驶风格特征参数的驾驶行为数据样本，得到所述驾驶行为数据样本的聚类结果，具体为：基于预设的聚类算法模型，对去除冗余驾驶风格特征参数的驾驶行为数据样本进行聚类分析，得到所述驾驶行为数据样本的聚类结果。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，可以采用的聚类算法模型包括：基于距离聚类的K均值聚类算法模型、层次聚类算法模型、模糊聚类算法模型、基于密度的空间聚类算法模型(比如，具有噪声的基于密度的聚类方法(Density-Based Spatial Clustering of Applicationswith Noise，简称DBSCAN))。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，所述驾驶行为数据样本包括：重载作业状态下的驾驶行为数据样本，以及空载作业状态下的驾驶行为数据样本。在基于预设的聚类算法模型，对去除冗余驾驶风格特征参数的驾驶行为数据样本进行聚类分析，得到驾驶行为数据样本的聚类结果时，基于K均值聚类算法模型，分别对重载作业状态下的、去除冗余驾驶风格特征参数的驾驶行为数据样本，以及空载作业状态下的、去除冗余驾驶风格特征参数的驾驶行为数据样本进行拟合，得到驾驶行为数据样本的聚类结果。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，基于K均值(K-means)聚类算法模型，对驾驶行为数据样本进行拟合，可以有效的提高运行效率和驾驶风格的分类数量的准确率。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，K-means聚类算法以簇内误差平方和为目标函数进行聚类，同类驾驶风格的样本数据簇内误差平方和小，其相似程度较高而分配至同一簇，不同驾驶风格簇内误差平方和大，其相似程度低而分配至不同簇。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

步骤S131、基于肘部法则，根据所述聚类结果确定所述驾驶员的驾驶风格类别数；

在一些可选实施例中，所述基于肘部法则，根据所述聚类结果确定所述驾驶员的驾驶风格类别数时，基于K均值聚类算法模型，对所述聚类结果进行拟合，并根据拟合结果，基于肘部法则确定所述驾驶员的驾驶风格类别数。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，基于K-means聚类算法模型，分别对重载作业状态下、空载作业状态下的驾驶行为数据样本进行拟合后，利用肘部法则确定驾驶风格类别数。图8为根据本申请的一些实施例提供的利用肘部法则确定矿用卡车在重载作业状态下驾驶风格的分类数量的示意图；图9为根据本申请的一些实施例提供的利用肘部法则确定矿用卡车在空载作业状态下驾驶风格的分类数量的示意图；如图8、图9所示，矿用卡车在重载作业状态、以及空载作业状态下，聚类中心的个数为3时，簇内误差平方和下降速度发生明显改变且之后缓慢下降，因此，矿用卡车在重载作业状态、以及空载作业状态下驾驶风格的聚类中心数量均为3。即矿用卡车在重载作业状态下驾驶风格类别数为3，在空载作业状态下驾驶风格类别数为3。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，矿用卡车在重载作业状态、以及空载作业状态下，基于K-means聚类算法模型对驾驶员的驾驶风格进行聚类分析，通过设置聚类中心个数为3个、最大迭代次数为100等，分别对重载作业状态、以及空载作业状态下的驾驶行为数据进行无监督聚类分析，实现对驾驶员在重载作业状态下、以及空载作业状态下的驾驶风格进行分类。表7为矿用卡车在重载作业状态下的无监督聚类分析结果；表8为矿用卡车在重载作业状态下的无监督聚类分析结果；由表7可知，矿用卡车在空载载作业状态下，Cluster2中油门踏板行程、油门踏板角速度、矿用卡车速度等相关的驾驶风格特征参数的聚类中心最大，Cluster0中油门踏板行程、油门踏板角速度、矿用卡车速度等相关的特征参数的聚类中心最小，不同驾驶风格特征参数的分布符合规律，即符合激进型驾驶风格的油门踏板行程的中位数和上四分位数大于正常型及温和型，温和型驾驶风格的油分踏板行程更多的分布在低位。因此，可以将空载作业状态下，矿用卡车驾驶员的驾驶风格划分为三类：正常(Cluster0)、温和(Cluster1)、激进(Cluster2)。同样的道理，由表8可知，在矿用卡车重载作业状态下，油门踏板角速度以及矿用卡车速度相关的特征参数分布规律较为明显，依据与油门踏板角速度、矿用卡车的速度相关的驾驶风格特征参数(即油门踏板行程、油门踏板角速度、速度、纵向加速度等的统计值(最大值、平均值、标准差))，将重载作业状态下，矿用卡车驾驶员的驾驶风格划分为三类：正常(Cluster2)、温和(Cluster0)、激进(Cluster1)。

可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

表7

表8

步骤S102、基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型，

在本申请实施例中，矿用卡车在重载状态下、以及空载状态下的三种驾驶风格数量分布不均匀，属于非均衡数据集(imbalanced dataset)，采用随机森林算法构建的驾驶风格辨识模型不易产生过拟合，且具备更强的泛化能力。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

图10为根据本申请的一些实施例提供的基于机器学习的驾驶风格辨识模型构建方法中步骤S102的流程示意图；如图10所示，所述基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型，包括：

步骤S112、基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，生成Z个决策树，其中，Z为正整数，且Z大于2；

在本申请实施例中，采用重采样技术(比如，bootstrap抽样方法)，从训练集(对驾驶行为样本数据按照3:7的比例划分为测试集和训练集，训练集用于训练决策树，测试集用于对训练的决策树进行测试)中有放回(即抽样放回的采样策略)的随机选择r个样本，训练一棵决策树。根据该决策树，在其节点分裂的时候，从驾驶风格特征参数中随机选择p个特征，分别求出每个驾驶风格特征参数所有可能分裂方法的基尼(Gini)指数，以Gini指数为最小目标函数，选择Gini指数最小的驾驶风格特征参数对节点进行划分，即决策树通过基尼系数，选择基尼系数最小的节点进行分裂。其中，驾驶风格特征参数的Gini指数根据公式(4)计算。公式(4)如下所示：

其中，N为驾驶风格类别数，T为驾驶行为数据样本；C

在本申请实施例中，矿用卡车的驾驶风格类别有3类，即N＝3，分别为：正常、温和、激进。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，基于bootstrap抽样方法，训练Z个决策树，可以保证随机森林的Z个决策树都不相同。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

步骤S122、基于多数投票，根据所述Z个决策树，构建所述驾驶员的驾驶风格辨识模型。

在本申请实施例中，在得到Z个决策树后，基于多数投票构成用于矿用卡车驾驶员驾驶风格辨识的随机森林模型，即驾驶风格辨识模型。由于决策树容易过拟合的缺点，因而随机森林采用多个决策树的投票机制来改善决策树性能，以提高驾驶员风格便是模型的精度。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，通过预先得到驾驶员的驾驶行为数据样本，对驾驶员的驾驶风格进行聚类分析，并根据得到驾驶风格类别数以及驾驶行为数据样本，基于随机森林算法，构建驾驶风格辨识模型，以对驾驶员的驾驶风格进行准确有效的辨识，实现对驾驶员的驾驶习惯进行针对性指导，提高矿用卡车的燃油经济性的目的。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在一些可选实施例中，在所述基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型之后，还包括：按照预设比例，对所述驾驶行为数据样本进行划分，并根据所述驾驶行为数据样本的划分结果，基于十折交叉验证网格搜索，对所述驾驶风格辨识模型的参数进行优化，得到优化的驾驶风格辨识模型。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，对重载作业状态下的驾驶行为数据样本按照预设比例(比如，3:7)划分为重载测试集和重载训练集，其中，重载测试集和重载训练集的比例为3:7；对空载作业状态下的驾驶行为数据样本按照预设比例(比如，3:7)划分为空载测试集和空载训练集，其中，空载测试集和空载训练集的比例为3:7。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，根据驾驶行为数据样本的划分结果，采用十折交叉验证(10-fold cross-validation)网格搜索(grid-search)对驾驶行为辨识模型中的n-estimator、max_deph等参数进行暴力穷举搜索，获取n-estimator、max_deph等参数最优组合，实现对驾驶风格辨识模型的参数优化，得到优化的驾驶风格辨识模型，提高驾驶风格辨识模型的泛化能力(generalization ability)。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在本申请实施例中，驾驶风格辨识模型的网格搜索参数优化表如下表9所示：

表9

在本申请实施例中，通过对驾驶风格辨识模型的参数进行优化，提高了驾驶风格辨识模型的泛化能力及辨识精度，可有效的对矿用卡车驾驶员的驾驶风格进行辨识，对驾驶员的驾驶习惯进行针对性指导，提高矿用卡车的燃油经济性的目的。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

图11为根据本申请的一些实施例提供的基于机器学习的驾驶风格辨识模型构建装置的结构示意图；如图11所示，该装置用于对驾驶员的驾驶风格进行辨识，包括：驾驶风格分类单元1101，配置为根据预先得到的所述驾驶员的驾驶行为数据样本，对所述驾驶员的驾驶风格进行聚类分析，得到所述驾驶员的驾驶风格类别数；辨识模型构建单元1102，配置为基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

图12为根据本申请的一些实施例提供的驾驶风格分类单元的结构示意图；如图12所示，所述驾驶风格分类单元1101包括：冗余参数去除子单元1111，配置为基于预设的相关性分析模型，对所述驾驶员的、选择的驾驶风格特征参数进行相关性分析，并根据所述相关性分析的结果，去除预先得到的所述驾驶员的驾驶行为数据样本中的冗余驾驶风格特征参数；聚类分析子单元1121，配置为基于预设的聚类算法模型，根据去除冗余驾驶风格特征参数的驾驶行为数据样本，得到所述驾驶行为数据样本的聚类结果；驾驶风格分类子单元1131，配置为基于肘部法则，根据所述聚类结果确定所述驾驶员的驾驶风格类别数。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

图13为根据本申请的一些实施例提供的冗余参数去除子单元的结构示意图；如图13所示，所述冗余参数去除子单元1111包括：相关系数模块1111A，配置为基于预设的相关性分析模型，对选择的所述驾驶风格特征参数进行相关性分析，得到所述驾驶风格特征参数之间的相关系数；冗余参数模块1111B，配置为根据所述相关系数和预设的相关系数阈值，去除预先得到的所述驾驶员的驾驶行为数据样本中的冗余驾驶风格特征参数。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在一些可选实施例中，所述聚类分析子单元1121，进一步配置为基于预设的聚类算法模型，对去除冗余驾驶风格特征参数的驾驶行为数据样本进行聚类分析，得到所述驾驶行为数据样本的聚类结果。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在一些可选实施例中，所述驾驶风格分类子单元1131，进一步配置为基于K均值聚类算法模型，对所述聚类结果进行拟合，并根据拟合结果，基于肘部法则确定所述驾驶员的驾驶风格类别数。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

图14为根据本申请的一些实施例提供的辨识模型构建单元的结构示意图；如图14所示，所述辨识模型构建单元1102包括：决策树子单元1112，配置为基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，生成Z个决策树，其中，Z为正整数，且Z大于2；辨识模型子单元1122，配置为基于多数投票，根据所述Z个决策树，构建所述驾驶员的驾驶风格辨识模型。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

在一些可选实施例中，所述基于机器学习的驾驶风格辨识模型构建装置还包括：模型优化单元，配置为按照预设比例，对所述驾驶行为数据样本进行划分，并根据所述驾驶行为数据样本的划分结果，基于十折交叉验证网格搜索，对所述驾驶风格辨识模型的参数进行优化，得到优化的驾驶风格辨识模型。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

本申请实施例提供的基于机器学习的驾驶风格辨识模型构建装置能够实现上述基于机器学习的驾驶风格辨识模型构建方法中的各个过程，并达到相同的功能和效果，在此不再一一赘述。

图15为根据本申请的一些实施例提供的电子设备的结构示意图；如图15所示，该电子设备包括：

一个或多个处理器1501；

计算机可读介质，可以配置为存储一个或多个程序1502，所述一个或多个处理器执行一个或多个程序时，实现如下步骤：根据预先得到的所述驾驶员的驾驶行为数据样本，对所述驾驶员的驾驶风格进行聚类分析，得到所述驾驶员的驾驶风格类别数；基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

图16为根据本申请的一些实施例提供的电子设备的硬件结构图；如图16所示，该电子设备的硬件结构可以包括：处理器1601、通信接口1602、计算机可读介质1603和通信总线1604；

其中，处理器1601、通信接口1602、计算机可读介质1603通过通信总线1604完成相互间的通信；

可选地，通信接口1602可以为通信模块的接口，如GSM模块的接口；

其中，处理器1601具体可以配置为：根据预先得到的所述驾驶员的驾驶行为数据样本，对所述驾驶员的驾驶风格进行聚类分析，得到所述驾驶员的驾驶风格类别数；基于随机森林算法，根据所述驾驶风格类别数以及所述驾驶行为数据样本，构建所述驾驶员的驾驶风格辨识模型。可以理解的是，以上描述仅为示例性的，本申请实施例对此并不进行限定。

处理器1601可以是通用处理器，包括中央处理器(central processing unit，简称CPU)、网络处理器(Network Processor，简称NP)等，还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本申请实施例的电子设备以多种形式存在，包括但不限于：

(1)移动通信设备：这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括：智能手机(例如：IPhone)、多媒体手机、功能性手机，以及低端手机等。

(2)超移动个人计算机设备：这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括：PDA、MID和UMPC设备等，例如Ipad。

(3)便携式娱乐设备：这类设备可以显示和播放多媒体内容。该类设备包括：音频、视频播放器(例如：iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

(4)服务器：提供计算服务的设备，服务器的构成包括处理器、硬盘、内存、系统总线等，服务器和通用的计算机架构类似，但是由于需要提供高可靠的服务，因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

(5)其他具有数据交互功能的电子装置。

需要指出，根据实施的需要，可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤，也可以将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤，以实现本申请实施例的目的。

上述根据本申请实施例的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器存储介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，RAM、ROM、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的基于机器学习的驾驶风格辨识模型构建方法。此外，当通用计算机访问用于实现在此示出的方法的代码时，代码的执行将通用计算机转换为用于执行在此示出的方法的专用计算机。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及方法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和涉及约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请实施例的范围。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其它实施例的不同之处。尤其，对于设备及系统实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述得设备及系统实施例仅仅是示意性的，其中作为分离不见说明的单元可以使或者也可以不是物理上分开的，作为单元提示的不见可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

以上实施方式仅用于说明本申请实施例，而非对本申请实施例的限制，有关技术领域的普通技术人员，在不脱离本申请实施例的精神和范围的情况下，还可以做出各种变化和变型，因此所有等同的技术方案也属于本申请实施例的范畴，本申请实施例的专业保护范围应由权利要求限定。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于机器学习的驾驶风格辨识模型构建方法、装置、介质和设备 [P] . 中国专利： CN112686294A . 2021-04-20
2. 基于机器学习的驾驶风格辨识模型评估方法、装置、介质和设备 [P] . 中国专利： CN112651443A . 2021-04-13
3. MACHINE LEARNING MODEL CONSTRUCTION DEVICE, NUMERICAL CONTROL DEVICE, MACHINE LEARNING MODEL CONSTRUCTION METHOD, MACHINE LEARNING MODEL CONSTRUCTION PROGRAM, AND RECORDING MEDIUM [P] . 日本专利： JP2018014060A . 2018-01-25

机译：机器学习模型的构建设备，数控设备，机器学习模型的构建方法，机器学习模型的构建程序和记录介质
4. Machine learning model construction device, numerical control device, machine learning model construction method, machine learning model construction program, and recording medium [P] . 日本专利： JP6603182B2 . 2019-11-06

机译：机器学习模型构建装置，数控装置，机器学习模型构建方法，机器学习模型构建程序和记录介质
5. Machine learning model construction device, numerical control, machine learning model construction method, and non-transitory computer readable medium encoded with a machine learning model construction program [P] . 美国专利： US10649416B2 . 2020-05-12

机译：机器学习模型构建装置，数控，机器学习模型构建方法以及用机器学习模型构建程序编码的非暂时性计算机可读介质