首页> 中国专利> 一种用于强化学习探索训练的数据处理方法及装置

一种用于强化学习探索训练的数据处理方法及装置

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明公开了一种用于强化学习探索训练的数据处理方法及装置，该方法包括：获取模型参数信息和当前训练次数；模型参数信息包括第一权重参数、第二权重参数和最大训练轮次；判断当前训练次数是否等于最大轮训次数，得到第一次数判断结果；当第一次数判断结果为否时，对模型参数信息进行参数筛选处理，得到训练参数信息；利用预设的策略动作模型对训练参数信息和模型参数信息进行计算处理，得到策略动作信息；策略动作信息用于指示强化学习探索训练。可见，本发明有利于在训练前期减少探索随机概率，在训练后期提高随机探索概率，进而提高强化学习探索训练效率。

著录项

公开/公告号CN115329896A

专利类型发明专利
公开/公告日2022-11-11

原文格式PDF
申请/专利权人北京鼎成智造科技有限公司;
展开▼

申请/专利号CN202211118013.X
发明设计人陈敏杰;高世静;
展开▼

申请日2022-09-14
分类号G06K9/62;
代理机构北京丰浩知识产权代理事务所(普通合伙);
代理人王忠泽
地址 100193 北京市海淀区西北旺东路10号院东区15号楼2层01A201
入库时间 2023-06-19 17:35:25

法律信息

法律状态公告日

法律状态信息

法律状态
2022-11-11

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 一种用于CTC训练的数据处理方法、装置及系统 [P] . 中国专利： CN108460453B . 2022-05-17
2. 一种用于CTC训练的数据处理方法、装置及系统 [P] . 中国专利： CN108460453A . 2018-08-28
3. A method for Acoustic Model Training, which includes a forced alignment of Speech Training Data, process data and obtain the estimated Scattering matrices of Scattering matrices, skew the intermediate class and Internal diagonalize matrices and in Intermediate Class Terna and Estimating eigenvectors, to obtain new functions using discriminative vectorTrain a New Acoustic Model, to Save the Model, method and System for Acoustic Model Training [P] . CL2015000445A1 . 2015-06-19

机译：一种用于声学模型训练的方法，其中包括语音训练数据，过程数据的强制对齐以及获得估计的散射矩阵的散射矩阵，使中间类别和内部对角化矩阵倾斜以及在中间类别Terna和估计特征向量中倾斜，以获得新功能使用判别向量训练新的声学模型，以保存模型，方法和系统以进行声学模型训练
4. Image processing method, image processing device, image processing program, teacher data generation method, teacher data generation device, teacher data generation program, trained model generation method, trained model generation device, diagnostic support method, diagnostic support device, diagnostic support program , And a recording medium on which those programs are recorded. [P] . 日本专利： JP2021065293A . 2021-04-30

机译：图像处理方法，图像处理设备，图像处理程序，教师数据生成方法，教师数据生成装置，教师数据生成程序，训练模型生成方法，训练模型生成装置，诊断支持方法，诊断支持设备，诊断支持程序，以及记录这些程序的记录介质。
5. A data processing method for generating an error-correcting product code block, a data processing method for recording the data into a recording medium, and a data processing method for the data processing apparatus and a data processing apparatus using the data processing apparatus. 0002 MEDIUM, AND DATA PROCESSING DEVICE FOR DATA) [P] . 韩国专利： KR970706572A . 1997-11-03

机译：用于生成纠错乘积码块的数据处理方法，用于将数据记录到记录介质中的数据处理方法以及用于该数据处理设备和使用该数据处理设备的数据处理设备的数据处理方法。 [0002]介质和用于数据的数据处理装置）