首页> 外文会议>Conference on Computational Linguistics and Speech Processing >表示法學習技術於節錄式語音文件摘要之研究
【24h】

表示法學習技術於節錄式語音文件摘要之研究

机译:表示法学习技术于节录式语音文件摘要之研究

获取原文

摘要

隨著網路科技的蓬勃發展,大量含有語音資訊的多媒體内容(像是電視新聞、課程演講、會議錄音等)快速地傳遞並分享於全球各地,進而促使自動語音文件摘要成為一項重要的研究議題。其中,長久以來一直最為被廣泛地探究的是節錄式語音文件摘要(Extractive Spoken Document Summarization);其目標在於根據一定的摘要比例,從語音文件中選取重要語句並組合成摘要,以期能夠扼要的表示語音文件主要的主題或語意資訊。藉此,使用者能迅速地瀏覽大量多媒體內容並能充分理解原始語音文件的主題或語意資訊。另一方面,表示法學習(Representation Learning)是近期相當熱門的一個研究議題,多數的研究成果也證明了這項技術在許多自然語言處理(Natural Language Proceeding, NLP)的相關任務上,可以進一步地獲得優良的成效。有鑑於此,本論文首先探討使用不同的詞表示法(Word Representations)及語句表示法(Sentence Representations),包括了連續型詞袋模型(Continuous Bag-of-Words, CBOW)、跳躍式模型(Skip-Gram, SG)、分散式儲存模型(Distributed Memory Model of Paragraph Vector, PV-DM)以及分散式詞袋模型(Distributed Bag-of-Words of Paragraph Vector, PV-DB0W),於節錄式中文廣播新聞語音文件摘要之應用。其次,基於詞表示法及語句表示法,本論文提出使用三種簡單且有效的排序模型(Ranking Models)'包括了餘弦相似度(Cosine Similarity)、馬可夫隨機漫步(Markov Random Walk, MRW)以及文件相似度量值(Document Likelihood Measure, DLM),來選取重要語句以形成摘要。再者,除了使用文件中的文字資訊外,本論文更進一步地結合語音文件上的各式聲學特徵,諸如韻律特徵(Prosodic Features)等,以期望能獲得更好的摘要成效。在實驗設定上,本論文的語音文件摘要實驗語料是採用公視廣播新聞(Mandarin Chinese Broadcast News Corpus, MATBN); 一系列的實驗結果顯示,不論是在使用含有錯誤資訊的語音辨識轉寫(Speech Recognition Transcripts)或者是使用正確參考轉寫(Reference Transcripts)的情況下,相較於其它現有的摘要方法,我們所提出的新穎式摘要方法的確都能夠獲得供顯著的摘要效能增進。
机译:随着网路科技的蓬勃发展,大量含有语音资讯的多媒体内容(像是电视新闻、课程演讲、会议录音等)快速地传递并分享于全球各地,进而促使自动语音文件摘要成为一项重要的研究议题。其中,长久以来一直最为被广泛地探究的是节录式语音文件摘要(Extractive Spoken Document Summarization);其目标在于根据一定的摘要比例,从语音文件中选取重要语句并组合成摘要,以期能够扼要的表示语音文件主要的主题或语意资讯。借此,使用者能迅速地浏览大量多媒体内容并能充分理解原始语音文件的主题或语意资讯。另一方面,表示法学习(Representation Learning)是近期相当热门的一个研究议题,多数的研究成果也证明了这项技术在许多自然语言处理(Natural Language Proceeding, NLP)的相关任务上,可以进一步地获得优良的成效。有鉴于此,本论文首先探讨使用不同的词表示法(Word Representations)及语句表示法(Sentence Representations),包括了连续型词袋模型(Continuous Bag-of-Words, CBOW)、跳跃式模型(Skip -Gram, SG)、分散式储存模型(Distributed Memory Model of Paragraph Vector, PV-DM)以及分散式词袋模型(Distributed Bag-of-Words of Paragraph Vector, PV-DB0W),于节录式中文广播新闻语音文件摘要之应用。其次,基于词表示法及语句表示法,本论文提出使用三种简单且有效的排序模型(Ranking Models)'包括了余弦相似度(Cosine Similarity)、马可夫随机漫步(Markov Random Walk, MRW)以及文件相似度量值(Document Likelihood Measure, DLM),来选取重要语句以形成摘要。再者,除了使用文件中的文字资讯外,本论文更进一步地结合语音文件上的各式声学特征,诸如韵律特征(Prosodic Features)等,以期望能获得更好的摘要成效。在实验设定上,本论文的语音文件摘要实验语料是采用公视广播新闻(Mandarin Chinese Broadcast News Corpus, MATBN); 一系列的实验结果显示,不论是在使用含有错误资讯的语音辨识转写( Speech Recognition Transcripts)或者是使用正确参考转写(Reference Transcripts)的情况下,相较于其它现有的摘要方法,我们所提出的新颖式摘要方法的确都能够获得供显著的摘要效能增进。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号