公开/公告号CN114970469A
专利类型发明专利
公开/公告日2022-08-30
原文格式PDF
申请/专利权人 北京中电慧声科技有限公司;中国电子科技集团公司第三研究所;
申请/专利号CN202210822871.6
申请日2022-07-14
分类号G06F40/166(2020.01);G06F16/16(2019.01);G06F16/178(2019.01);G10L15/26(2006.01);H04L67/06(2022.01);
代理机构工业和信息化部电子专利中心 11010;
代理人华枫
地址 100015 北京市朝阳区酒仙桥北路乙七号
入库时间 2023-06-19 16:34:57
法律状态公告日
法律状态信息
法律状态
2022-11-18
授权
发明专利权授予
2022-09-16
实质审查的生效 IPC(主分类):G06F40/166 专利申请号:2022108228716 申请日:20220714
实质审查的生效
技术领域
本发明涉及语音转写技术领域,尤其涉及一种基于声文同步离线编辑的会议纪要处理方法及系统。
背景技术
语音转写系统支持将用户说话的内容转化成文字,通常使用在会议场景中。主要利用自然语言理解和语音识别的相关技术实现。并且为便于用户进行会议纪要的整理,系统支持会议音频、文本文件的下载。用户边听边整理的时间约为会议时长的3-5倍。
相关技术中,会议记录的处理流程如下:
下载音频文件-下载文本文件-文件拷贝-听取音频-整理文本-反复定位音频位置-整理文本-保存会议纪要。
发明内容
本发明要解决的技术问题是如何提高会议纪要的处理效率,本发明提出一种基于声文同步离线编辑的会议纪要处理方法及系统。
根据本发明实施例的基于声文同步离线编辑的会议纪要处理方法,包括:
搭载语音转写系统的第一设备在会议语音转写时,对音频内容和对应文本内容通过时间戳进行声文同步,并保存为离线编辑文件;
下载所述离线编辑文件,在第二设备进行解压,获得音频内容和文本内容对应的声文同步文件,以实现会议纪要的声文同步离线处理。
根据本发明实施例的基于声文同步离线编辑的会议纪要处理方法,语音转写系统在会议语音转写时,可以将音频内容和文本内容进行声文同步,并存储为离线编辑文件,通过下载离线编辑文件可以在任意其他设备中解压并对会议纪要进行声文同步离线处理,提高了会议纪要处理的便利性和处理效率。并且实现脱离系统使用声文同步功能,解决用户异地快速整理会议纪要的问题。
根据本发明的一些实施例,在所述第二设备解压获得所述声文同步文件后,在同一界面显示文本内容和音频内容对应的播放条,当前播放的音频内容对应的文本内容高亮显示。
在本发明的一些实施例中,当选中所述文本内容的部分内容时,所述播放条自动定位至对应位置。
根据本发明的一些实施例,所述语音转写系统采用静态页面排列的方式进行会议语音转写。
在本发明的一些实施例中,解压所述离线编辑文件后获得的文件包括:html格式的会议记录、wav格式的会议音频及文件夹。
根据本发明实施例的语音转写系统,语音转写系统在会议语音转写时,对音频内容和对应文本内容通过时间戳进行声文同步,并保存为离线编辑文件;
所述语音转写系统提供所述离线编辑文件下载接口,通过所述下载接口下载的所述离线编辑文件解压后,获得音频内容和文本内容对应的声文同步文件,以实现会议纪要的声文同步离线处理。
根据本发明的一些实施例,所述语音转写系统采用静态页面排列的方式进行会议语音转写。
在本发明的一些实施例中,所述语音转写系统还提供有音频文件下载接口、文本文件下载接口及音频和文本共同下载接口。
根据本发明的一些实施例,解压所述离线编辑文件后获得的文件包括:html格式的会议记录、wav格式的会议音频及文件夹。
根据本发明实施例的电子设备,所述电子设备搭载有如上所述语音转写系统。
根据本发明的一些实施例,所述电子设备为台式计算机、笔记本或平板电脑。
附图说明
图1为根据本发明实施例的基于声文同步离线编辑的会议纪要处理方法流程图;
图2为根据本发明实施例的基于声文同步离线编辑的会议纪要处理方法流程图;
图3为根据本发明实施例的语音转写系统的会议准备页面截图;
图4为根据本发明实施例的语音转写系统的会议转写页面截图;
图5为根据本发明实施例的语音转写系统的会议转写结束页面截图;
图6为根据本发明实施例的语音转写系统的会议记录页面截图;
图7为根据本发明实施例的语音转写系统的下载离线编辑功能页面截图;
图8为根据本发明实施例的离线编辑压缩文件解压页面截图;
图9为根据本发明实施例的利用声文同步的离线编辑功能截图。
具体实施方式
为更进一步阐述本发明为达成预定目的所采取的技术手段及功效,以下结合附图及较佳实施例,对本发明进行详细说明如后。
本发明中说明书中对方法流程的描述及本发明说明书附图中流程图的步骤并非必须按步骤标号严格执行,方法步骤是可以改变执行顺序的。而且,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
现有转写系统仅是支持单独音频和文本文件的下载,用户在边听边整理会议纪要的时候需要根据音频播放的内容进行文本整理,但是限于人工打字的速度远不及音频播放的速度,所以用户会经常需要切换刚播放的音频进行再整理和内容确认。如此反复才能将完整的会议内容进行整理。通常用户边听边整理的时间约为会议时长的3-5倍。也就是说1个小时的会议,如果要完全复制会议内容,人工整理的时间是3-5个小时。时间成本巨大。
为了提高会议记录处理效率,本发明提出一种基于声文同步离线编辑的会议纪要处理方法及语音转写系统。
如图1所示,根据本发明实施例的基于声文同步离线编辑的会议纪要处理方法,包括:
S100,搭载语音转写系统的第一设备在会议语音转写时,对音频内容和对应文本内容通过时间戳进行声文同步,并保存为离线编辑文件;
本发明中,在会议语音转写过程中,语音转写系统通过时间戳对音频内容和文本内容进行声文同步存储,并保存为离线编辑文件。
S200,下载离线编辑文件,在第二设备进行解压,获得音频内容和文本内容对应的声文同步文件,以实现会议纪要的声文同步离线处理。
需要说明的是,第二设备与第一设备可以为不同的设备,且第二设备中可以不搭载语音转写系统,这里的“搭载”可以理解为“安装”。也就是说,本发明中,从语音转写系统中下载的离线编辑文件,可以在任意其他设备中解压获得声文同步文件,通过声文同步文件便可以实现会议纪要的声文同步离线处理,不需要安装和登录语音转写系统。
根据本发明实施例的基于声文同步离线编辑的会议纪要处理方法,语音转写系统在会议语音转写时,可以将音频内容和文本内容进行声文同步,并存储为离线编辑文件,通过下载离线编辑文件可以在任意其他设备中解压并对会议纪要进行声文同步离线处理,提高了会议纪要处理的便利性和处理效率。并且实现脱离系统使用声文同步功能,解决用户异地快速整理会议纪要的问题。
根据本发明的一些实施例,如图9所示,在第二设备解压获得声文同步文件后,在同一界面显示文本内容和音频内容对应的播放条,当前播放的音频内容对应的文本内容高亮显示。由此,可以直观清楚地展示音频内容播放所对应的文本内容,便于对文本内容和音频内容进行定位和对应。
如图9所示,文本内容中“各位同事,大家好”被高亮显示,说明此时,音频内容正读到对应内容位置处。
在本发明的一些实施例中,当选中文本内容的部分内容时,播放条自动定位至对应位置。由此,便于对音频内容和文本内容的对应定位,当需要回听对应的内容时,可以选中对应的文本内容,进度条便可以自动定位至对应音频内容的位置处。当然,在点击音频进度条不同位置时,也会自动将该音频对照的文本高亮展示,以便于会议纪要的整理。
根据本发明的一些实施例,语音转写系统采用静态页面排列的方式进行会议语音转写。静态页面为HTML格式,代码都在页面中,无需经过服务器的编译,可以直接加载到客户浏览器上显示出来的网页。
在本发明的一些实施例中,如图8所示,解压离线编辑文件后获得的文件包括:html格式的会议记录、wav格式的会议音频及文件夹。通过点击heml格式的会议记录,可以进入图9中所示的声文同步离线编辑页面对会议纪要进行处理。
根据本发明实施例的语音转写系统,语音转写系统在会议语音转写时,对音频内容和对应文本内容通过时间戳进行声文同步,并保存为离线编辑文件;
语音转写系统提供离线编辑文件下载接口,通过下载接口下载的离线编辑文件解压后,获得音频内容和文本内容对应的声文同步文件,以实现会议纪要的声文同步离线处理。
根据本发明实施例的语音转写系统,语音转写系统在会议语音转写时,可以将音频内容和文本内容进行声文同步,并存储为离线编辑文件,通过下载离线编辑文件可以在任意其他设备中解压并对会议纪要进行声文同步离线处理,提高了会议纪要处理的便利性和处理效率。
根据本发明的一些实施例,语音转写系统采用静态页面排列的方式进行会议语音转写。
在本发明的一些实施例中,语音转写系统还提供有音频文件下载接口、文本文件下载接口及音频和文本共同下载接口。如图6和图7所示,语音转系系统存储的会议记录文件具有“下载”选项,当用户选择“下载”选项时,弹出图7中所示的选择窗口,用户可以选择“离线编辑”、“音频”、“文本”、“音频+文本”等对应选项选择对应的下载内容。
根据本发明的一些实施例,解压离线编辑文件后获得的文件包括:html格式的会议记录、wav格式的会议音频及文件夹。
根据本发明实施例的电子设备,电子设备搭载有如上语音转写系统。例如,电子设备可以为台式计算机、笔记本或平板电脑。
目前音频单独播放,同步整理文本内容的方式,需要用户反复回听,并且回听音频位置不准确,造成人工成本巨大。本发明的声文同步功能能够将音频和文本同一界面展示,并且实现音频文件与文本内容的时间戳对照,点击文本内容就能自动定位到该内容对应的音频处同步播放,节省用户回听定位不准确的问题。
由于语音转写软件多数都部署在单位或公司,声文同步功能无法脱离系统使用,用户无法异地整理会议纪要。所以本发明通过用户认可的解压缩文件方式,实现脱离系统使用声文同步功能,解决用户异地快速整理会议纪要的问题。
下面参照附图以一个具体的实施例详细描述根据本发明的基于声文同步离线编辑的会议纪要处理方法及系统。值得理解的是,下述描述仅是示例性描述,而不应理解为对本发明的具体限制。
本发明实现基于声文同步的离线编辑功能。声文同步功能,具体指每一句文本会有相应的音频与之对照,在系统中将音频和文本同一界面展示,点击对应文本内容会自动跳转到该文本对照音频的位置同步播放,点击音频会自动将该音频对照的文本高亮展示,便于用户在系统使用中总结整理会议纪要。
基于声文同步的离线编辑功能,解决了声文同步功能只在系统中使用的限制,即将声文同步功能脱离系统使用,用户只要下载会议记录对应的离线编辑压缩包,在任意电脑中进行解压,即可使用声文同步功能整理会议纪要。并且提供通常用户利用系统声文同步功能完成会议纪要整理是单独下载音频、文本,边听边整理效率的3-5倍。
此功能是在语音转写软件开发,采用静态页面排列文本的方式,完成文本时间戳与音频时间的对照,并且依靠脚本插件实现音频预加载解析。流程图如下。
登录语音转写系统成功后,如图3和图4所示,点击【开始】按钮开始会议转写。采用静态页面排列文本的方式进行转写文本转写,分别完成文本和音频按照句标记的时间戳,实现文本时间戳与音频时间戳的对照。
如图5所示,点击【结束】按钮结束会议转写。同步生成该会议的转写记录,会议记录页面截图如图6所示。
下载离线编辑功能页面截图如图7所示,下载该会议记录的离线编辑文件并解压。
如图8所示,为离线编辑压缩文件解压页面截图。解压文件后,双击html文件打开附带声文同步的离线编辑功能。
利用声文同步的离线编辑功能截图如图9所示。
综上所述,本发明实现音频文件与文本内容的时间戳对照,实现音频和文本内容便捷准确的定位。实现声文同步的脱离系统使用,采用用户接受的方式,解压缩文件实现声文同步,便于用户异地整理会议内容。
本发明具有如下有益效果:
目前音频单独播放,同步整理文本内容的方式,需要用户反复回听,并且回听音频位置不准确,造成人工成本巨大。本发明的声文同步功能能够将音频和文本同一界面展示,并且实现音频文件与文本内容的时间戳对照,点击文本内容就能自动定位到该内容对应的音频处同步播放,节省用户回听定位不准确的问题。
由于语音转写软件多数都部署在单位或公司,声文同步功能无法脱离系统使用,用户无法异地整理会议纪要。所以本发明通过用户认可的解压缩文件方式,实现脱离系统使用声文同步功能,解决用户异地快速整理会议纪要的问题。
通过具体实施方式的说明,应当可对本发明为达成预定目的所采取的技术手段及功效得以更加深入且具体的了解,然而所附图示仅是提供参考与说明之用,并非用来对本发明加以限制。
机译: 基于两通道认证方案的离线支付处理系统,基于基于主认证操作的刷卡模式,基于两通道认证方案的离线支付处理方法及其装置
机译: 离线付款处理系统,使用两步签入的离线付款处理方法以及使用相同步骤的设备
机译: 离线支付处理系统,基于签出的离线支付处理方法以及使用该方法的装置