首页> 中文学位 >VoiceXML语音浏览器的实现与整合
【6h】

VoiceXML语音浏览器的实现与整合

代理获取

目录

文摘

英文文摘

论文说明:缩写符号表

声明

第一章绪论

1.1背景

1.2国内外研究现状

1.2.1 VoiceXML标准的发展状况

1.2.2国外研究状况

1.2.3国内研究状况

1.2.4待解决问题

1.3论文的主要研究内容

1.4论文的组织结构

第二章VoiceXML及关键技术介绍

2.1 VoiceXML介绍

2.1.1 VoiceXML简介

2.1.2 VoiceXML的体系结构

2.1.3 VoiceXML的特点

2.1.4 VoiceXML的基本概念

2.2语音识别技术

2.2.1语音识别技术简介

2.2.2语音识别技术在语音浏览平台中的应用

2.3语音合成技术

2.3.1语音合成技术简介

2.3.2语音合成技术在语音浏览平台中的应用

2.4文档解析

2.4.1对象树生成模块

2.4.2解释器模块

2.4.3 JavaScript集成

2.5 OpenVXI介绍

2.5.1 OpenVXI的组件

2.5.2 OpenVXI的系统框架

2.5.3 OpenVXI在语音浏览平台中的应用

2.6智能网技术介绍

2.6.1智能网的产生背景

2.6.2智能网的概念和目标

2.6.3智能网系统结构

2.7小结

第三章VoiceXML语音浏览平台的设计

3.1实现原理

3.2网络结构图

3.3平台模块结构

3.3.1协议接口

3.3.2功能模块描述

3.4小结

第四章VoiceXML语音浏览平台的整合

4.1实现思路

4.2呼叫控制原理

4.3 VoiceXML服务主程序

4.3.1处理流程

4.3.2初始化阶段

4.3.3处理阶段

4.3.4关闭阶段

4.4解析线程

4.4.1处理流程

4.4.2呼叫状态机

4.4.3主要消息处理概述

4.5电话接口的实现

4.5.1扩充OSBtelTransferBlind接口函数

4.5.2扩充OSBtelTransferBridge接口函数

4.6录音接口的实现

4.6.1扩充Record函数

4.6.2扩充OSBrecRecord接口函数

4.6.3录音状态迁移

4.7放音接口的实现

4.7.1数据结构扩充

4.7.2扩充OSBpromptQueue接口函数

4.7.3扩充OSBBpromptPlay接口函数

4.7.4扩充OSBpromptwait接口函数

4.7.5放音状态迁移

4.8识别接口的实现

4.8.1扩充OSBrecRecognize接口函数

4.9小结

第五章VoiceXML语音浏览器优化及自动测试工具介绍

5.1 VoiceXML语音浏览器的优化

5.1.1优化策略

5.1.2优化后的平台模块结构

5.1.3 VoiceAgent模块描述

5.1.4 VoiceXML语音浏览器的修改

5.2语音浏览器自动测试工具

5.2.1概述

5.2.2测试平台模块结构

5.2.3 VxmlEmul模块描述

5.2.4模拟消息交互

5.3小结

第六章VoiceXML语音浏览器的测试与分析

6.1测试环境

6.1.1硬件环境描述

6.1.2软件环境描述

6.1.3组网结构图

6.2测试配置

6.2.1 VxmlEuml的配置

6.2.2 VoiceXML浏览器的配置

6.3功能测试

6.3.1测试文档

6.3.2测试用例

6.3.3测试方法和结果

6.4性能测试

6.4.1测试文档

6.4.2测试用例

6.4.3测试方法和结果

6.5测试分析

6.6小结

第七章结论

7.1总结

7.2展望

致谢

参考文献

在学期间的研究成果

展开▼

摘要

人们可以使用电话或移动电话、PC、PDA和其它智能设备通过语音识别、语音合成的交互技术,以及语音浏览、智能信息处理技术等实现访问互联网,实现个人服务和商业服务的语音应用。其中,作为建立于网络与语音通讯之间的桥梁,语音浏览技术发挥着重要的作用。而作为语音浏览技术以及语音互联网的核心,VoiceXML突破性地实现了互联网与电话网的融合,为语音应用领域展现了一个更为广阔的未来。 本文在分析VoiceXML、语音识别、语音合成、文档解析等技术的基础上,完成了基于窄带智能网的VoiceXML语音浏览平台的原型系统设计并对系统结构、设计思想进行了详细介绍。本语音浏览平台以卡耐基梅隆大学的开源项目OpenVXI为核心,分为执行平台,VoiceXML语音浏览器和文档服务器三部分,本文重点介绍了VoiceXML语音浏览器的设计、实现、优化以及与执行平台的整合。 针对语音浏览器与执行平台高度耦合的局限,本语音浏览器采用标准的INAP/UIScript消息与执行平台进行交互,使其很容易、快速地部署到现有的窄带智能网平台中,并可以轻松地在不同设备制造商的智能网平台间迁移。 本语音浏览器的设计充分考虑了大规模商业应用的需要,通过采用多线程多通道的呼叫控制模型满足了商业应用环境下的大话务量并发呼叫请求。 由于OpenVXI没有对语音文件播放进行缓存,常常导致不必要的语音文件重复下载,严重地影响语音浏览平台的性能。因此本文提出了一种对语音浏览器的优化方案,通过引入VoiceAgent模块实现对语音文件的缓存,从而极大地提高了整个语音浏览平台的性能。 为了更方便快捷地测试语音本浏览器的功能和性能,本文提出了自主开发的自动测试工具Vxm1Emu1,该工具可以模拟窄带智能网的功能,在不需要SCP、SSP、媒体处理等智能网设备的参与下对语音浏览器进行测试。 文章的最后使用Vxm1Emu1完成了对语音浏览器的测试和性能分析,证实了其实际可行性. 本文的研究工作为进一步的产品化研究和商业应用奠定了一定的基础,并具有实际的参考价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号