発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇

斉藤　剛史; 森下　和敏; 小西　亮介

首页> 外文期刊>電気学会論文誌 C:電子·情報·システム部門誌 >発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇

【24h】

発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇

机译：从发声场景检测关键帧并基于关键帧进行单词阅读

获取原文

获取原文并翻译 | 示例

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

In this paper, we propose the new keyframe-based lip reading method which does not need the advanced registration of an utterance scene. To extract keyframe, we apply the frame subtraction method and extract frame which the difference value is the local minimum as the keyframe. We compute thirteen shape features from the five lip regions of the extracted keyframe. Then we apply a discriminant analysis to mouth shape recognition. We generate a code sequence based on a mouth shape recognition result. Moreover, in accordance with several rules, we generate candidate code sequences. Finally, we apply DP matching using two kinds of code sequence of based on keyframe and candidate, and select the similar code sequence as the result word. We set Japanese 19 words as the target. We took four speakers' utterance scene. We carried out three experiments of the keyframe extraction, the mouth shape recognition, and the word recognition. As a result, we obtained average recognition rate of 53.9%. Although there was individual difference, one speaker obtained 72.1% of the highest recognition rate.%発話認識の分野において，高い認識率を誇る音声認識に関する研究は盛んに取り組まれている。しかし音声情報のみによる認識の場合，周囲雑音の影響を受けやすく，利用環境が制限される問題がある。近年，高騒音環境下や公共の場所で声を出せない場面での利用が可能なインタフェースの一つとして，読唇に関する研究が注目されている。

机译：在本文中，我们提出了一种新的基于关键帧的唇读方法，该方法不需要对发声场景进行高级配准。为了提取关键帧，我们应用帧减法并提取差值为局部最小值的帧作为关键帧。我们从提取的关键帧的五个嘴唇区域计算出十三个形状特征。然后，我们将判别分析应用于嘴形识别。我们基于嘴形识别结果生成一个代码序列。此外，根据几条规则，我们生成候选代码序列。最后，我们使用基于关键帧和候选的两种代码序列进行DP匹配，并选择相似的代码序列作为结果字。我们将日语19个单词作为目标。我们拍摄了四位演讲者的话语场景。我们进行了关键帧提取，嘴形识别和单词识别的三个实验。结果，我们获得了53.9％的平均识别率。尽管存在个体差异，但一位发言者获得了最高识别率的72.1％。近年，高騒音环境下や公共の场所で声を出せない场面での利用が可能なインタフェースの一つとして，読唇に关する研究が注目されている。

著录项

来源
《電気学会論文誌 C:電子·情報·システム部門誌》 |2011年第2期|p.418-42418|共8页
作者
斉藤　剛史; 森下　和敏; 小西　亮介;
展开▼
作者单位

九州工業大学大学院情報工学研究院　〒820－8502　飯塚市川津680－4;

鳥取大学大学院工学研究科　〒680-8552　鳥取市湖山町南4-101;

鳥取大学大学院工学研究科　〒680-8552　鳥取市湖山町南4-101;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
読唇; キーフレーム検出; 口形認識; 単語認識;

机译：唇读;关键帧检测;嘴形识别;单词识别;

相似文献

外文文献
中文文献
专利

1. キリンビバレッジ炭酸飲料「キリンの泡　芳醇グレープフルーツ＆ホップ」A委員「消費者のニーズをうまくとらえている。炭酸系飲料は幅広い世代に見直され需要が増えており、ノンアルコール飲料も成長著しい。シンプルで分かりやすいネーミングやデザイン、すっきりした味がぴったり合う。最初の『キリンの泡　芳醇アップル＆ホップ』に比べ、第2弾の『グレープフルーツ＆ホップ』は甘みも抑えてありよい。新たな炭酸飲料の提案だと思う」 [J] . 日経消費ウオツチャー Group 日経消費ウオツチャー . 2013,第51期

机译：麒麟饮料碳酸饮料“麒麟之阿瓦浓葡萄柚和蛇麻草”委员会A“我们非常了解消费者的需求。碳酸饮料已受到广泛的关注，并且需求在不断增长，非酒精饮料也在迅速增长。易于理解的命名，设计和令人耳目一新的口味完美匹配，与第一款“麒麟之阿瓦浓苹果酒和蛇麻草”相比，第二款“葡萄柚和蛇麻草”的甜度可能更低。我觉得”
2. キリンビバレッジ炭酸飲料「キリンの泡　芳醇グレープフルーツ＆ホップ」A委員「消費者のニーズをうまくとらえている。炭酸系飲料は幅広い世代に見直され需要が増えており、ノンアルコール飲料も成長著しい。シンプルで分かりやすいネーミングやデザイン、すっきりした味がぴったり合う。最初の『キリンの泡　芳醇アップル＆ホップ』に比べ、第2弾の『グレープフルーツ＆ホップ』は甘みも抑えてありよい。新たな炭酸飲料の提案だと思う」 [J] . 日経消費ウオツチャー Group 日経消費ウオツチャー . 2013,第51期

机译：Kirin饮料碳酸饮料“泡沫泡沫丰富的葡萄柚和跳”委员会“消费者的需求得到良好。碳酸饮料在广泛的几代人中进行了审查，需求增加，非酒精饮料也很重要。简单易于显着。了解命名，设计和干净的品味合适。第二个“葡萄柚和跳”，第二“葡萄柚和跳”，第一个“长颈鹿泡沫质量苹果和跳”，也可以抑制甜味。我认为新的碳酸饮料的提案那”
3. 三菱商事（77％）とメイジフローシステム（12％）が主な出資のフレキシテツク·ホールディング社、日本バイリーンの親会社（第2位）の独Freudenberg社から欧米の“自動車用ブレーキホース”製造の3社、Flexitech Europe SAS社（仏）、Flexitech RO SRL社（ルーマニア）、Flexitech Imc社（米）を買収 [J] . 不織布情報 . 2008,第3a401期

机译：三菱公司（77％）和Mage Flow System（12％）是Flexitech Holding Co.，Ltd.的主要投资者，日本Bileen（第二名）的母公司Freudenberg Co.，Ltd.在欧洲和美国生产“汽车制动软管”。收购了Flexitech Europe SAS（法国），Flexitech RO SRL（罗马尼亚），Flexitech Imc（美国）
4. サービス工学に基づくサービスCAD システムの構築（第36報）－サービス·マーケティング手法と場面遷移ネットに基づくサービスフロー·シミュレーション [C] . 佐藤友亮, 鈴木遼, 下村芳樹, 精密工学会大会学術講演会 . 2007

机译：基于服务工程服务CAD系统的构建（报告36） - 基于过渡网的营销方法和服务流模拟
5. 建築物におけるコージェネレーションシステムの適用に関する研究－エネルギー有効利用に基づくシステム評価－ [D] . 湯淺和博. 1990

机译：热电联产系统在建筑物中的应用研究-基于有效能耗的系统评估-
6. <論説>ワーク・ライフ・バランスのための非ジェンダー的法律が、いかにジェンダー的効果を生んだか : 20世紀最後の四半世紀におけるベルギーのタイムクレジット制度とキャリアブレイク制度、およびそれらが女性のライフスタイルに及ぼした影響について [O] . FREY Urszula 2014

机译：
工作与生活平衡的非性别法律如何产生性别影响：20世纪下半叶比利时的时间积分和职业中断制度及其对女性生活方式的影响关于影响

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

客服微信
服务号

発話シーンからのキーフレーム検出とキーフレームに基づく単語読唇

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅