首页> 外文OA文献 >Designing Regularizers and Architectures for Recurrent Neural Networks

【2h】

Designing Regularizers and Architectures for Recurrent Neural Networks

机译：为循环神经网络设计正则器和体系结构

页面导航

摘要
著录项
相似文献
相关主题

摘要

Cette thèse contribue a la recherche vers l'intelligence artificielle en utilisant des méthodes connexionnistes.Les réseaux de neurones récurrents sont un ensemble de modèles séquentiels de plus en plus populaires capable en principe d'apprendre des algorithmes arbitraires.Ces modèles effectuent un apprentissage en profondeur, un type d'apprentissage machine.Sa généralité et son succès empirique en font un sujet intéressant pour la recherche et un outil prometteur pour la création de l'intelligence artificielle plus générale.Le premier chapitre de cette thèse donne un bref aperçu des sujets de fonds:l'intelligence artificielle, l'apprentissage machine, l'apprentissage en profondeur et les réseaux de neurones récurrents.Les trois chapitres suivants couvrent ces sujets de manière de plus en plus spécifiques.Enfin, nous présentons quelques contributions apportées aux réseaux de neurones récurrents.Le chapitre ef{arxiv1} présente nos travaux de régularisation des réseaux de neurones récurrents.La régularisation vise à améliorer la capacité de généralisation du modèle, et joue un role clé dans la performance de plusieurs applications des réseaux de neurones récurrents, en particulier en reconnaissance vocale.Notre approche donne l'état de l'art sur TIMIT, un benchmark standard pour cette tâche.Le chapitre ef{cpgp} présente une seconde ligne de travail, toujours en cours, qui explore une nouvelle architecture pour les réseaux de neurones récurrents.Les réseaux de neurones récurrents maintiennent un état caché qui représente leurs observations antérieures.L'idée de ce travail est de coder certaines dynamiques abstraites dans l'état caché, donnant au réseau une manière naturelle d'encoder des tendances cohérentes de l'état de son environnement.Notre travail est fondé sur un modèle existant; nous décrivons ce travail et nos contributions avec notamment une expérience préliminaire.

机译：递归神经网络是一组越来越流行的顺序模型，能够学习任意算法，为深度学习提供了有力的支持。作为一种机器学习，它的普遍性和经验性成功使它成为一个有趣的研究主题，并成为创建更通用的人工智能的有希望的工具。背景：人工智能，机器学习，深度学习和递归神经网络。接下来的三章以越来越具体的方式涵盖了这些主题，最后，我们介绍了对神经网络的一些贡献 ref {arxiv1}一章介绍了我们对收到的神经网络的正则化的工作正则化旨在提高模型的泛化能力，并在递归神经网络的多种应用（尤其是语音识别）的性能中发挥关键作用，我们的方法给出了TIMIT的最新技术， ref {cpgp}一章提出了第二条工作，该工作仍在进行中，它探索了递归神经网络的新架构，递归神经网络保持了一个隐藏状态，代表着他们的观察结果。这项工作的思想是在隐藏状态下对某些抽象动态进行编码，从而为网络提供一种自然的方式来编码其环境状态的相关趋势。我们以特别的初步经验来描述这项工作和我们的贡献。

著录项

作者
Krueger David;
展开▼
作者单位

展开▼
年度 2016
总页数
原文格式 PDF
正文语种 en
中图分类

相似文献

外文文献
中文文献
专利

1. Designing optimal architecture of recurrent neural network (LSTM) with particle swarm optimization technique specifically for educational dataset [J] . Devika Chhachhiya, Amita Sharma, Manish Gupta International Journal of Information Technology . 2019,第1期

机译：利用粒子群优化技术为教育数据集设计递归神经网络（LSTM）的最佳架构
2. Designing optimal architecture of recurrent neural network (LSTM) with particle swarm optimization technique specifically for educational dataset [J] . Devika Chhachhiya, Amita Sharma, Manish Gupta International Journal of Information Technology . 2019,第1期

机译：专门针对教育数据集的粒子群优化技术设计经常性神经网络（LSTM）的最佳架构
3. Comparative effectiveness of convolutional neural network (CNN) and recurrent neural network (RNN) architectures for radiology text report classification [J] . Banerjee Imon, Ling Yuan, Chen Matthew C., Artificial intelligence in medicine . 2019,第JUNa期

机译：卷积神经网络（CNN）和递归神经网络（RNN）架构在放射学文本报告分类中的比较有效性
4. An energy-efficient deep learning processor with heterogeneous multi-core architecture for convolutional neural networks and recurrent neural networks [C] . Dongjoo Shin, Jinmook Lee, Jinsu Lee, IEEE Symposium on Low-Power and High-Speed Chips . 2017

机译：面向卷积神经网络和递归神经网络的具有异构多核架构的高能效深度学习处理器
5. Architecture optimization, training convergence and network estimation robustness of a fully connected recurrent neural network. [D] . Wang, Xiaoyu. 2010

机译：完全连接的递归神经网络的体系结构优化，训练收敛和网络估计的鲁棒性。
6. Comment on: Deep learning for pharmacovigilance: recurrent neural network architectures for labeling adverse drug reactions in Twitter posts [O] . Arjun Magge, Abeed Sarker, Azadeh Nikfarjam, 2019

机译：评论：用于药物警戒的深度学习：用于在Twitter帖子中标记药物不良反应的递归神经网络体系结构
7. Fuzzy adaptive recurrent counterpropagation neural networks: A neural network architecture for qualitative modeling and real-time simulation of dynamic processes. [O] . Pan YaDung. 1995

机译：模糊自适应递归反向传播神经网络：用于动态过程的定性建模和实时仿真的神经网络体系结构。
8. Hierarchical Neural Network (HNN) for Closed Loop Decision Making: Designing the Architecture of a Hierarchical Neural Network to Model Attention, Learning and Goal Oriented Behavior. [R] . Guez, A. 1990

机译：用于闭环决策的分层神经网络（HNN）：设计层次神经网络的体系结构以模拟注意，学习和目标导向行为。

Designing Regularizers and Architectures for Recurrent Neural Networks

摘要

著录项

相似文献

相关主题

期刊订阅