公开/公告号CN103327181A
专利类型发明专利
公开/公告日2013-09-25
原文格式PDF
申请/专利权人 广东欧珀移动通信有限公司;
申请/专利号CN201310228274.1
发明设计人 吴欣欣;
申请日2013-06-08
分类号H04M1/725(20060101);G10L13/00(20060101);
代理机构44245 广州市华学知识产权代理有限公司;
代理人李盛洪
地址 523860 广东省东莞市长安镇乌沙海滨路18号
入库时间 2024-02-19 20:52:29
法律状态公告日
法律状态信息
法律状态
2020-01-24
专利权人的姓名或者名称、地址的变更 IPC(主分类):H04M1/725 变更前: 变更后: 申请日:20130608
专利权人的姓名或者名称、地址的变更
2014-12-10
授权
授权
2013-10-30
实质审查的生效 IPC(主分类):H04M1/725 申请日:20130608
实质审查的生效
2013-09-25
公开
公开
技术领域
本发明涉及一种语音聊天方法,尤其一种是可提高用户获知语音信息效率的语音聊天方法。属于移动通信技术领域。
背景技术
目前市面上手机、iPad等移动终端的主流语音聊天软件都存在一个问题,就是用户只能通过收听语音信息才能获知语音聊天内容,当用户在查看聊天记录等场景时,得逐句收听才能得知整个语音聊天的内容,更不能直接检索到用户想要查找的聊天记录,不仅耗时长,而且效率低。
中国专利申请号为20101050044.4的发明专利申请,公开了“一种移动终端在线聊天的方法、装置和系统”,其技术特点是将文字聊天记录进行解析,然后检索移动终端上储存的语音库找出相对应的语音数据,最后通过移动终端的扬声器播放出来,获得的有益效果是既可保存聊天记录,又可通过语音播放为不便查看聊天内容的用户(如工作时的用户)提供帮助。该专利申请虽然解决了语音聊天和视频聊天不方便检索聊天记录的问题,但其只是针对文字聊天方面的改进,并不能有效解决现有的语音聊天软件不能直接获知语音聊天内容的问题。
中国专利申请号为201210258936的发明专利申请,公开了“一种终端文字语音对等通话方法及其移动终端”,其技术特点是A端进行语音通话,通过语音识别技术转换为文字发送到B端,而B端查看到文字后,再输入新的文字,通过语音合成技术转换为语音发送到A端,同理可进行逆向操作,即一方采用语音输入则另一方就采用文字输入。但该专利申请的技术属于通话领域,主要是在不便接听电话、聋盲哑人间通话的场合使用,不存在解决现有语音聊天软件技术问题的启示。
发明内容
本发明的目的,是为了解决上述现有技术的缺陷,提供了一种可提高用户获知语音信息效率的语音聊天方法,使用户无需逐句收听即可直接获知所有语音聊天内容,不仅耗时短,而且效率高。
本发明的目的可以通过采取如下技术方案达到:
可提高用户获知语音信息效率的语音聊天方法,所述方法通过移动终端和服务器实现,包括以下步骤:
1)至少两个用户之间分别通过各自所在的移动终端建立语音聊天环境;
2)在语音聊天环境中的每个用户利用其所在的移动终端进行录音,将用户的声音转化为语音数据后上传至服务器;
3)服务器将接收到的语音数据进行解析,得到对应的文字内容;
4)服务器将语音数据及其对应的文字内容整合成聊天信息,并将聊天信息发送到语音聊天环境的每个移动终端;
5)每个移动终端将聊天信息显示给用户,该聊天信息含有直接呈现给用户的文字信息以及可进行播放的语音信息。
作为一种优选方案,所述移动终端包括:
录音模块,用于调用录音设备,将用户的声音转化为语音数据;
第一发送模块,用于将语音数据上传至服务器;
第一接收模块,用于接收服务器发送的聊天信息;
显示模块,用于将接收的聊天信息显示出来;
存储模块,用于对显示的聊天信息进行存储,生成聊天记录;
检索模块,用于调用文字输入单元,对聊天记录进行检索;
播放模块,用于调用播放设备,将聊天信息中的语音信息播放出来。
作为一种优选方案,所述录音模块设有屏幕触摸录音键,点击后将用户的声音录入;所述第一发送模块设有屏幕触摸发送键,点击后将语音数据上传;所述播放模块将聊天信息设为屏幕触摸播放键,点击后将语音播放出来;所述显示模块通过显示屏将聊天信息显示出来。
作为一种优选方案,所述服务器包括:
第二接收模块,用于接收移动终端上传的语音数据;
语音识别模块,用于将接收到的语音数据进行解析,得到对应的文字内容;
整合模块,用于将语音数据及其对应的文字内容整合成聊天信息;
第二发送模块,用于将整合的聊天信息发送到移动终端。
作为一种优选方案,所述语音识别模块通过调用google的语音转文字接口或科大讯飞的语音转文字接口对语音数据进行解析,得到对应的文字内容
本发明相对于现有技术具有如下的有益效果:
1、本发明的语音聊天方法在用户离开移动终端不小心错过语音聊天后,无需对语音信息进行逐句收听,即可直接在屏幕上获知所有语音聊天内容,大大提高了便利性,为用户节约了聊天时间。
2、本发明的语音聊天方法在服务器中通过语音识别模块可以将语音数据进行解析,得到对应的文字内容,并将语音数据和文字内容整合成聊天信息,由于聊天信息中含有文字信息,方便了用户进行聊天记录的检索。
3、本发明的语音聊天方法在出现以下几种情况时:a、用户所在的移动终端喇叭损坏或没有喇叭;b、用户由于开会等原因不方便播放语音;c、用户听力不好或耳聋,均可获知语音聊天的内容。
附图说明
图1为本发明的语音聊天方法的流程示意图。
图2为本发明的移动终端与服务器的连接关系示意图。
具体实施方式
实施例1:
如图1所示,本实施例在进行语音聊天前,移动终端的用户将用户资料信息以网页或短信的形式提交至服务器,服务器将用户资料进行保存,然后通过移动终端和服务器实现语音聊天,包括以下步骤:
1)至少两个用户之间分别通过各自所在的移动终端建立语音聊天环境;
2)在语音聊天环境中的每个用户利用其所在的移动终端进行录音,将用户的声音转化为语音数据后上传至服务器;
3)服务器将接收到的语音数据进行解析,得到对应的文字内容;
4)服务器将语音数据及其对应的文字内容整合成聊天信息,并将聊天信息发送到语音聊天环境的每个移动终端;
5)每个移动终端将聊天信息显示给用户,该聊天信息含有直接呈现给用户的文字信息以及可进行播放的语音信息。
实施例2:
如图2所示,本实施例的移动终端包括录音模块、第一发送模块、第一接收模块、显示模块、存储模块、检索模块以及播放模块,所述录音模块上设有屏幕触摸录音键,所述第一发送模块设有屏幕触摸发送键,所述播放模块将聊天信息设为屏幕触摸播放键;服务器包括第二接收模块,语音数据;语音识别模块、整合模块以及第二发送模块。
如图2所示,以多个用户采用微信软件的语音聊天为例,具体包括以下步骤:
1)多个用户之间分别通过各自所在的移动终端建立语音聊天环境;
2)在语音聊天环境中的每个用户点击其所在移动终端的屏幕触摸录音键进行录音,通过录音模块调用录音设备将用户的声音转化为语音数据后,点击屏幕触摸发送键由第一发送模块上传至服务器;
3)服务器通过第二接收模块接收到语音数据,采用语音识别模块对语音数据进行解析,得到对应的文字内容;
4)服务器通过整合模块将语音数据及其对应的文字内容整合成聊天信息,并由第二发送模块将聊天信息发送到移动终端;
5)移动终端通过第一接收模块接收聊天信息,并由显示模块通过显示屏将聊天信息显示给用户,通过存储模块将聊天信息进行保存,生成聊天记录。
上述步骤5)中,所述聊天信息中含有文字信息和语音信息,用户在屏幕可以直接看到显示与语音信息相对应的文字,点击聊天信息可将语音播放出来进行收听;当用户想查找过往的聊天记录时,通过检索模块调用文字输入单元,即可检索到符合要求的聊天记录。
上述语音识别模块通过调用google的语音转文字接口对语音数据进行解析,得到对应的文字内容,如下:
以IOS系统为例,以下为调用google公共API识别位于/Users/adminadmin/Desktop/hello.flac语音文件的代码:
服务器将返回类似结果:
本发明的语音聊天方法可以应用在现有的各种语音聊天软件中,对现有的语音聊天软件进行改进,可提高用户获知语音信息的效率。
实施例3:
本实施例的主要特点是:所述语音识别模块通过调用科大讯飞的语音转文字接口对语音数据进行解析,得到对应的文字内容。其余同实施例2。
以上所述,仅为本发明优选的实施例,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明所公开的范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都属于本发明的保护范围。
机译: MUG(多用户图形用户)之间的语音聊天系统,通过使用来自MUG网络的PSTN独立消息和使用语音聊天系统的语音聊天方法,特别是与在服务方面进行完整的MUG网络互连完全相关从物理角度来看
机译: 处理在虚拟空间中参与语音聊天的用户角色的动作的方法,使每个用户都能够通过输入文本共同体来直接操作角色
机译: 信息处理设备,语音聊天控制方法和语音聊天控制程序