首页> 中国专利> 一种扫描笔根据语音划出重点的系统及方法

一种扫描笔根据语音划出重点的系统及方法

摘要

本发明公开了一种扫描笔根据语音划出重点的系统及方法,系统包括语音采集模块、声纹设置模块、扫描参数设置模块、图片帧标记模块、语音指令处理模块、识别处理模块。利用本发明,用户可以通过方便快捷的方式,在扫描的同时对重点内容划重点,不需要再对输出的文本内容进行二次编辑,有助于提升用户体验。

著录项

  • 公开/公告号CN113096655A

    专利类型发明专利

  • 公开/公告日2021-07-09

    原文格式PDF

  • 申请/专利权人 读书郎教育科技有限公司;

    申请/专利号CN202110336269.7

  • 发明设计人 陈家峰;秦曙光;

    申请日2021-03-29

  • 分类号G10L15/22(20060101);G10L15/26(20060101);

  • 代理机构44436 广州德伟专利代理事务所(普通合伙);

  • 代理人黄浩威

  • 地址 528400 广东省中山市五桂山镇长命水工业园

  • 入库时间 2023-06-19 11:45:49

说明书

技术领域

本发明涉及扫描笔技术领域,具体涉及一种扫描笔根据语音划出重点的系统及方法。

背景技术

扫描笔是一种手持式的电子设备,用户可以通过握持扫描笔实现文字或者图像的扫描录入,通过内置的光学字符识别(OCR)模块,能够对文字进行识别、存储和编辑等操作,被广泛应用于学生学习、旅游翻译等场景。

当前扫描笔可以非常有效地辅助人们进行英语翻译学习、法学条例学习,但是在使用过程中,还没有较好的办法对扫描出的文档进行划重点的方法,往往需要用户扫描完后需要进行二次编辑,影响用户的学习效率。

发明内容

针对现有技术的不足,本发明旨在提供一种扫描笔根据语音划出重点的系统及方法。

为了实现上述目的,本发明采用如下技术方案:

一种扫描笔根据语音划出重点的系统,包括:

语音采集模块:用于采集用户的语音;

扫描参数设置模块:用于供用户设置扫描参数,扫描参数包括普通扫描参数和划重点扫描参数,所述普通扫描参数包括字体大小和字体颜色,所述划重点扫描参数包括文本突出显示颜色、字体颜色、字体大小、是否画出下划线、是否画出波浪线;

图片帧标记模块:用于在未触发划重点扫描时将扫描笔扫描得到的图片帧标记为普通帧,在触发划重点扫描后将扫描笔扫描得到的图片帧标记为重点帧;

语音指令处理模块:用于在用户触发扫描事件后对语音采集模块采集得到的语音指令进行处理:识别语音指令的内容,当识别得到的语音指令的内容为设定的触发划重点扫描的内容时,触发划重点扫描,如果识别得到的语音指令的内容为设定的停止划重点扫描的内容时,停止划重点扫描,如果都不是,不进行任何操作并向用户发出提示;

识别处理模块:用于对扫描笔扫描得到的图片帧按顺序进行拼接后进行文本识别,对从普通帧识别得到的文本内容按照普通扫描参数进行设置,对从重点帧识别得到的文本内容按照划重点扫描参数进行设置,最后将最终得到的全部文本内容输出至扫描笔的显示屏中显示。

进一步地,上述系统还包括有音源定位模块,所述扫描参数还包括有是否开启音源定位;当用户开启了音源定位,音源定位模块用于对语音采集模块采集得到的语音指令进行音源定位;语音指令处理模块对音源定位的结果进行判断,并且仅对来自设定范围内的语音指令进行处理。

进一步地,上述系统还包括有声纹设置模块,用于在用户触发录入声纹信息事件后,对语音采集模块采集到的语音进行声纹提取,获取其中的声纹信息并保存;所述扫描参数还包括有是否开启声纹识别;如果用户开启了声纹识别,语音指令处理模块首先提取语音指令的声纹信息,并与声纹设置模块保存的声纹信息进行匹配,如果匹配成功再识别语音指令的内容,匹配失败则不识别语音指令的内容。

本发明还提供一种利用上述系统的扫描笔根据语音划出重点的方法,具体过程如下:

S1、用户在扫描参数设置模块中预先设置扫描参数,扫描参数包括普通扫描参数和划重点扫描参数,所述普通扫描参数包括字体大小和字体颜色,所述划重点扫描参数包括文本突出显示颜色、字体颜色、字体大小、是否画出下划线、是否画出波浪线;

S2、用户触发扫描事件后开始扫描,此时图片帧标记模块将扫描笔扫描得到的图片帧均标记为普通帧;

当扫描到需要划重点的内容时,用户说出触发划重点扫描的语音指令,语音采集模块对语音指令进行采集,语音指令处理模块对语音指令进行处理:识别语音指令的内容,当识别得到的语音指令的内容为设定的触发划重点扫描的内容时,触发划重点扫描,图片帧标记模块对此后扫描得到的图片帧标记为重点帧;

如果用户需要停止划重点扫描,说出停止划重点扫描的语音指令,语音指令采集模块采集得到语音指令,语音指令处理模块对语音指令进行处理:识别语音指令的内容,当识别出语音指令的内容为设定的停止划重点扫描的内容后停止划重点扫描,图片帧标记模块对此后扫描得到的图片帧标记为普通帧;

S3、扫描完成后,识别处理模块对扫描得到的所有图片帧按顺序拼接,然后进行文本识别,并对从普通帧识别得到的文本内容按普通扫描参数进行设置,对从重点帧识别得到的文本内容按照划重点扫描参数进行设置,最后将最终得到的所有文本内容输出至扫描笔的显示屏中显示。

进一步地,上述方法的步骤S1中,还包括:用户触发录入声纹信息事件,声纹设置模块和语音采集模块开启,用户发出语音,语音采集模块采集得到用户的语音,声纹设置模块对用户语音进行声纹提取,获取其中的声纹信息并保存;所述扫描参数还包括有是否开启声纹识别;

步骤S2中,如果用户开启了声纹识别,语音指令处理模块首先提取语音指令的声纹信息,并与声纹设置模块保存的声纹信息进行匹配,如果匹配成功再识别语音指令的内容,匹配失败则不识别语音指令的内容;如果用户没有开启声纹识别,语音指令处理模块不对语音指令进行声纹提取和匹配,直接识别语音指令的内容。

进一步地,上述方法的步骤S1中,扫描参数还包括有是否开启音源定位;步骤S2中,如果用户开启了音源定位,语音采集模块采集到语音指令后,音源定位模块对语音指令进行音源定位;语音指令处理模块对音源定位的结果进行判断,并且仅对来自设定范围内的语音指令进行处理。

更进一步地,如果录入多个不同的声纹信息,声纹设置模块设置第一个录入的声纹信息为管理员的声纹信息。

本发明的有益效果在于:利用本发明,用户可以通过方便快捷的方式,在扫描的同时对重点内容划重点,不需要再对输出的文本内容进行二次编辑,有助于提升用户体验。

具体实施方式

以下将对本发明作进一步的描述,需要说明的是,本实施例以本技术方案为前提,给出了详细的实施方式和具体的操作过程,但本发明的保护范围并不限于本实施例。

实施例1

本实施例提供一种扫描笔根据语音划出重点的系统,包括:

语音采集模块:用于采集用户的语音;

声纹设置模块:用于在用户触发录入声纹信息事件后,对语音采集模块采集到的语音进行声纹提取,获取其中的声纹信息并保存;

扫描参数设置模块:用于供用户设置扫描参数,扫描参数包括普通扫描参数、划重点扫描参数、是否开启声纹识别,所述普通扫描参数包括字体大小和字体颜色,所述划重点扫描参数包括文本突出显示颜色、字体颜色、字体大小、是否画出下划线、是否画出波浪线;

图片帧标记模块:用于在未触发划重点扫描时将扫描笔扫描得到的图片帧标记为普通帧,在触发划重点扫描后将扫描笔扫描得到的图片帧标记为重点帧;

语音指令处理模块:用于在用户触发扫描事件后对语音采集模块采集得到的语音指令进行处理:如果用户开启了声纹识别,首先提取语音指令的声纹信息,并与声纹设置模块保存的声纹信息进行匹配,如果匹配成功,再识别语音指令的内容,匹配失败则不识别语音指令的内容;当识别得到的语音指令的内容为设定的触发划重点扫描的内容时,触发划重点扫描,如果识别得到的语音指令的内容为设定的停止划重点扫描的内容时,停止划重点扫描,如果都不是,不进行任何操作并向用户发出提示;

识别处理模块:用于对扫描笔扫描得到的图片帧按顺序进行拼接后进行文本识别,对从普通帧识别得到的文本内容按照普通扫描参数进行设置,对从重点帧识别得到的文本内容按照划重点扫描参数进行设置,最后将最终得到的全部文本内容输出至扫描笔的显示屏中显示。

在本实施例中,上述系统还包括有音源定位模块,所述扫描参数还包括有是否开启音源定位;当用户开启了音源定位,音源定位模块用于对语音采集模块采集得到的语音指令进行音源定位;语音指令处理模块对音源定位的结果进行判断,并且仅对来自设定范围内的语音指令进行处理。

实施例2

本实施例提供一种扫描笔根据语音划出重点的方法,具体过程如下:

S1、用户触发录入声纹信息事件(可以通过点击相应的功能菜单触发,也可以采用其他如语音、手势等方式触发),声纹设置模块和语音采集模块开启,用户发出语音,语音采集模块采集得到用户的语音,声纹设置模块对用户语音进行声纹提取,获取其中的声纹信息并保存;

用户在扫描参数设置模块中预先设置扫描参数,扫描参数包括普通扫描参数、划重点扫描参数、是否开启声纹识别,所述普通扫描参数包括字体大小和字体颜色,所述划重点扫描参数包括文本突出显示颜色、字体颜色、字体大小、是否画出下划线、是否画出波浪线;

S2、用户触发扫描事件后(可以采用常规的按压扫描笔笔头的方式触发)开始扫描,此时图片帧标记模块将扫描笔扫描得到的图片帧均标记为普通帧;

当扫描到需要划重点的内容时,用户说出触发划重点扫描的语音指令,语音采集模块对语音指令进行采集,语音指令处理模块对语音指令进行处理:如果用户开启了声纹识别,首先提取语音指令的声纹信息,并与声纹设置模块保存的声纹信息进行匹配,如果匹配成功再识别语音指令的内容,匹配失败则不识别语音指令的内容;当识别得到的语音指令的内容为设定的触发划重点扫描的内容时,触发划重点扫描,图片帧标记模块对此后扫描得到的图片帧标记为重点帧;

如果用户需要停止划重点扫描,说出停止划重点扫描的语音指令,语音指令采集模块采集得到语音指令,语音指令处理模块对语音指令进行处理:如果用户开启了声纹识别,首先提取语音指令的声纹信息,并与声纹设置模块保存的声纹信息进行匹配,如果匹配成功再识别语音指令的内容,匹配失败则不识别语音指令的内容;当识别出语音指令的内容为设定的停止划重点扫描的内容后停止划重点扫描,图片帧标记模块对此后扫描得到的图片帧标记为普通帧;

S3、扫描完成后,识别处理模块对扫描得到的所有图片帧按顺序拼接,然后进行文本识别,并对从普通帧识别得到的文本内容按普通扫描参数进行设置,对从重点帧识别得到的文本内容按照划重点扫描参数进行设置,最后将最终得到的所有文本内容输出至扫描笔的显示屏中显示。

需要说明的是,步骤S2中,如果用户没有开启声纹识别,语音指令处理模块不对语音指令进行声纹提取和匹配,直接识别语音指令的内容。即表示所有用户都可以进行划重点扫描。

需要说明的是,开启声纹识别后,语音指令处理模块仅对声纹信息匹配成功的语音指令进行处理和响应,可以有效排除其他的语音干扰,保证扫描的准确、流畅。

进一步地,上述方法的步骤S1中,扫描参数还包括有是否开启音源定位;步骤S2中,如果用户开启了音源定位,语音采集模块采集到语音指令后,音源定位模块对语音指令进行音源定位;语音指令处理模块对音源定位的结果进行判断,并且仅对来自设定范围内的语音指令进行处理。如此可以有效屏蔽误操作指令或其他音源干扰指令。

进一步地,上述方法的步骤S1中,如果录入多个不同的声纹信息,声纹设置模块设置第一个录入的声纹信息为管理员的声纹信息。

对于本领域的技术人员来说,可以根据以上的技术方案和构思,给出各种相应的改变和变形,而所有的这些改变和变形,都应该包括在本发明权利要求的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号