首页> 外文会议>Conference on Computational Linguistics and Speech Processing >基於聽覺感知模型之類神經網路及其在語者識別上之應用
【24h】

基於聽覺感知模型之類神經網路及其在語者識別上之應用

机译:基于听觉感知模型之类神经网路及其在语者识别上之应用

获取原文

摘要

根據神經生理學研究,耳朵會針對聲音的各個頻率進行分頻,並產生出聽覺頻譜,研究人 員根據專注聽覺現象和生物聽覺實驗,也發現了大腦聽覺皮質上神經作用的模式。於本論文中, 我們運用類神經網路,建構出一種模擬人類聽覺的類神經網路模型,並在語者識別這個應用上 進行討論,期望能成功連結神經生理學的知識與工程的技術。而我們所設計的模型,是利用兩層不同維度的卷積祌經網路(Convolutional Neural Network),分別模擬初期耳蝸階段及大腦皮質階段,透過設計卷積核初始值,即耳蝸階段多組一維分頻濾波器和大腦皮質階段同時解析時頻 資訊的二維濾波器,以使模型能夠快速地達到收斂狀態。而透過模型訓練,根據目的與環境變 因的不同,模型會自動調整其中參數,使輪入資料映射至目標的型態。同時我們也針對所提出 的模型架構,進行了多種形態的比較,進而發現在給定初始值的狀况下,即使訓練不夠充分, 也能產生不錯的結果。
机译:根据神经生理学研究,耳朵会针对声音的各个频率进行分频,并产生出听觉频谱,研究人 员根据专注听觉现象和生物听觉实验,也发现了大脑听觉皮质上神经作用的模式。于本论文中, 我们运用类神经网路,建构出一种模拟人类听觉的类神经网路模型,并在语者识别这个应用上 进行讨论,期望能成功连结神经生理学的知识与工程的技术。而我们所设计的模型,是利用两层不同维度的卷积祌经网路(Convolutional Neural Network),分别模拟初期耳蜗阶段及大脑皮质阶段,透过设计卷积核初始值,即耳蜗阶段多组一维分频滤波器和大脑皮质阶段同时解析时频 资讯的二维滤波器,以使模型能够快速地达到收敛状态。而透过模型训练,根据目的与环境变 因的不同,模型会自动调整其中参数,使轮入资料映射至目标的型态。同时我们也针对所提出 的模型架构,进行了多种形态的比较,进而发现在给定初始值的状况下,即使训练不够充分, 也能产生不错的结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号