无需脚本的动态字幕生成中的关键技术研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

全球超过六千六百万的人遭受听觉受损的折磨，这一缺陷严重影响了他们对视频内容的理解。字幕标注技术在一定程度上能够帮助他们在观看影视作品时，同步理解画面内容、人物身份、对白语意等。然而现存的大多数字幕标注技术远远不能满足听觉障碍者理解与欣赏视频的需求。本文介绍一种无需脚本的动态字幕生成技术，其中包含说话人分割与聚类、语音盲源分离、自动语音识别、人脸检测等关键技术。
　　本文描述的动态字幕生成方法，是将生成的字幕动态地显示在说话人人脸附近，与传统的静态字幕标注技术相比，并非简单地放置于特定的位置，如屏幕底部等区域。听觉障碍者能够较为迅速地分辨出说话人的身份信息，并获取有益于理解故事情节的语言台词，无需在画面与对白之间不断切换而导致注意力的分散，从而更好地欣赏视频作品。
　　本系统侧重脚本无关，拟在采用声音及视觉技术，将声音信息通过自动语音识别直接转化为文本信息，与已有的动态字幕标注技术相比，不再依赖字幕-脚本文件，从而可以广泛使用。
　　无需脚本的动态字幕生成技术主要包含三大模块:1、人脸与字幕的匹配;2、字幕标注的放置;3、设计界面与校正错误。本文着重介绍第一模块，它是后续工作的基础，也是整个系统的核心，其正确率影响系统的可行性，同时直接影响第三模块中人工校正错误的工作量。在该模块中，通过说话人分割与聚类系统实验的改进、语音盲源分离方法的优化，从理论上阐明人脸与对应语音成功匹配的可行性，再通过较为成熟的语音识别技术，得到人脸与字幕的对应关系。

著录项

作者
陈玥同;
展开▼
作者单位

合肥工业大学;

展开▼
授予单位合肥工业大学;
学科信号与信息处理
授予学位硕士
导师姓名汪萌;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类图像通信、多媒体通信;
关键词
动态字幕生成技术; 听觉障碍; 身份识别; 声音信息; 文本信息;
入库时间 2022-08-17 10:17:44

相似文献

中文文献
外文文献
专利

1. 基于地图制图脚本的交互式图例动态生成方法 [J] . 蔡苑彬 ,刘露 ,陈荦 . 地理空间信息 . 2014,第005期
2. 基于动态脚本自适应规则库的智能角色战术生成 [J] . 姜涛 . 福建电脑 . 2012,第008期
3. 2018版Premiere新字幕功能探索——After Effects创建的动态字幕模板在Premiere中的使用 [J] . 翁晴霄 . 影视制作 . 2019,第008期
4. 浅析字幕翻译中动态与静态的转换--《傲慢与偏见》字幕翻译的案例分析 [J] . 于丹 . 环球人文地理 . 2014,第012期
5. 动态网站自动生成器关键技术研究 [J] . 徐青 ,卿昕 ,李兴芳 . 电脑知识与技术 . 2010,第012期
6. 设计语境中基于脚本的形态生成教学初探 [C] . Sun Chengyu ,孙澄宇 . 2011全国建筑教育学术研讨会 . 2011
7. 自然语言脚本生成动画脚本的关键技术研究 [A] . 郭键 . 2008

无需脚本的动态字幕生成中的关键技术研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅