首页> 外文会议>Conference on Computational Linguistics and Speech Processing >運用Python結合語音辨識及合成技術於自動化音文同步之實作
【24h】

運用Python結合語音辨識及合成技術於自動化音文同步之實作

机译:运用Python结合语音辨识及合成技术于自动化音文同步之实作

获取原文

摘要

本計一個方便處理有聲書音文同步的技術,利用雲端的文字轉語音(Text-tcvspeech)技術,結合語音辨識(Speech Recognition)技術,讓使用者能夠使用自行準備的文章來製作自己的『跟述練習』(Shadowing technique)的學習素材,製作達到詞層級(Word-level)的音文同步有聲書。此音文同步摘書是藉由『微寺間點啦字』(Timed-text)檔案所製作,而御寺間點敝字則是由者所提供的文章連同對應的語音聲波檔案,經由一套名為CGUAlign的音文同步技術之處理所產生的。CGUAlignPython將一有名術一HTK(Hidden Markov Model Toolkit)包裝,只要提供文字檔案及其朗讀的語音檔,其中語音檔是經由雲端語音合成技術而得來的,即能製作出音文同步的帶時間點的文字檔案,隨後,我們也建立一個簡易的以JavaScript製作的網站,能夠運用這個檔案做電腦輔助語言學習(Computer-assisted language learning, CALL)之用,此網站能夠閱讀音文同步有聲書,讓使用者能夠較輕鬆的做跟述練習,最後我們也提供即時翻譯的功能來逹到電腦輔助語言學習的目標。
机译:本计一个方便处理有声书音文同步的技术,利用云端的文字转语音(Text-tcvspeech)技术,结合语音辨识(Speech Recognition)技术,让使用者能够使用自行准备的文章来制作自己的『跟述练习』(Shadowing technique)的学习素材,制作达到词层级(Word-level)的音文同步有声书。此音文同步摘书是藉由『微寺间点啦字』(Timed-text)档案所制作,而御寺间点敝字则是由者所提供的文章连同对应的语音声波档案,经由一套名为CGUAlign的音文同步技术之处理所产生的。 CGUAlignPython将一有名术一HTK(Hidden Markov Model Toolkit)包装,只要提供文字档案及其朗读的语音档,其中语音档是经由云端语音合成技术而得来的,即能制作出音文同步的带时间点的文字档案,随后,我们也建立一个简易的以JavaScript制作的网站,能够运用这个档案做电脑辅助语言学习(Computer-assisted language learning, CALL)之用,此网站能够阅读音文同步有声书,让使用者能够较轻松的做跟述练习,最后我们也提供即时翻译的功能来逹到电脑辅助语言学习的目标。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号