形態素情報と単語内位置情報を用いた話し言葉音声認識のための音響モデル

五十川賢造; 篠田浩一; 嵯峨山茂樹; Kenzo Isogawa; Koichi Shinoda; Shigeki Sagayama

首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >形態素情報と単語内位置情報を用いた話し言葉音声認識のための音響モデル

【24h】

形態素情報と単語内位置情報を用いた話し言葉音声認識のための音響モデル

机译：基于形态学信息和词内位置信息的语音识别语音模型

获取原文

获取原文并翻译 | 示例

获取外文期刊封面封底 >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

話し言葉における発声変形をモデル化するため、文脈決定木を用いた状態クラスタリングにおいて、音素コンテキストの情報以外に品詞情報を利用する方法と音素の単語内位置情報を利用する方法とを提案する。品詞情報を利用する方法では、話し言葉の音声データから推定した単語継続時間長をもとに、品詞を2つのクラスタに分類する。各音素についてクラスタ別に初期モデルを構築し、音素コンテキストに関する質問に加えて所属クラスタに関する質問を用いた決定木による状態クラスタリングを行う。単語内位置情報を利用する方法では、各音素について語頭か語末かそれ以外かを考慮した初期モデルを構築し、音素コンテキストに関する質問に加えて語頭語末に関する質問を用いた決定木による状態クラスタリングを行う。 CSJ (Corpus of Spontaneous Japanese)コーパスを用いた連続音声認識実験を行った結果、品詞情報を利用した方法では単語正解精度がテスト話者7名の平均で最大で2.4ポイント向上し、単語内位置情報を用いたモデルでは単語正解精度が最大で6.1ポイント向上した。

机译：为了对口语中的语音转换进行建模，我们提出了一种使用除语音上下文信息之外的部分词信息的方法以及一种使用上下文确定树在状态聚类中使用语音单词中位置信息的方法。在使用分词信息的方法中，基于从口语单词的语音数据估计的单词持续时间，将分词分为两个聚类。为每个语音的每个群集构建一个初始模型，并使用决策树执行状态群集，该决策树使用有关电话所属群集的问题以及有关语音上下文的问题。在使用词内位置信息的方法中，会考虑一个初始模型，该模型考虑每个语音是否是开头，结尾或其他事物，然后使用决策树执行状态聚类，该决策树除了使用有关电话上下文的问题外，还使用有关单词开头和结尾的问题。 ..由于使用CSJ（自发日语的Corpus）语料库进行了连续的语音识别实验，因此七个测试讲话者的单词正确答案准确度平均提高了最多2.4点，并且通过使用部分歌词信息的方法提高了单词中的位置信息。在模型使用中，单词正确答案的准确性提高了6.1点。

著录项

来源
《電子情報通信学会技術研究報告. 音声. Speech》 |2002年第529期|共6页
作者
五十川賢造; 篠田浩一; 嵯峨山茂樹; Kenzo Isogawa; Koichi Shinoda; Shigeki Sagayama;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类电报、传真;
关键词
話し言葉; 音響モデル; 品詞; 決定木; Spontaneous speech; Acoustic model; Part of speech; Decision tree;

机译：口语;声学模型;词性;决策树;自发性言语;声学模型;词性;决策树;

相似文献

外文文献
中文文献
专利

1. 形態素情報と単語内位置情報を用いた話し言葉音声認識のための音響モデル [J] . 五十川賢造, 篠田浩一, 嵯峨山茂樹, 電子情報通信学会技術研究報告. 音声. Speech . 2002,第529期

机译：基于形态学信息和词内位置信息的语音识别语音模型
2. 形態素情報と単語内位置情報を用いた話し言葉音声認識のための音響モデル [J] . 五十川賢造, 篠田浩一, 嵯峨山茂樹, 電子情報通信学会技術研究報告. 音声. Speech . 2002,第529期

机译：语音语音识别的声学模型，使用语素信息和单词位置信息
3. 形態素情報と単語内位置情報を用いた話し言葉音声認識のための音響モデル [J] . 五十川賢造, 篠田浩一, 嵯峨山茂樹, 電子情報通信学会技術研究報告. 言語理解とコミュニケーション. Natural Language Understanding and Models of Communication . 2002,第527期

机译：语音语音识别的声学模型，使用语素信息和单词位置信息
4. Sequence-to-Sequence model を用いた話し言葉音声認識用言語モデルのための書き言葉から話し言葉へのテキスト変換 [C] . 小橋優矢, 西村良太, 北岡教英日本音響学会研究発表会 . 2019

机译：使用序列到序列模型的语言模型的语言模型的文本转换
5. 日本人の自然発話を対象とした音声感情認識 -感情音声の訓練サンプル数最適化を用いて- [D] . 市川朋輝 2020

机译：日本自然语音的语音情感识别-利用情感语音训练样本的优化-
6. アクセント情報を利用した雑音環境下での単語音声認識 [O] . 小野寺栄 2016

机译：使用重音信息在嘈杂环境中进行语音识别

形態素情報と単語内位置情報を用いた話し言葉音声認識のための音響モデル

摘要

著录项

相似文献

相关主题

期刊订阅