首页> 中国专利> 一种通过坐标注册语音所见即可说的方法及装置

一种通过坐标注册语音所见即可说的方法及装置

摘要

本申请公开了一种通过坐标注册语音所见即可说的方法及装置。所述通过坐标注册语音所见即可说的方法包括:获取内容变化的子view的坐标信息;根据所述子view的坐标信息更新子view的所见即可说信息。本申请所提供的通过坐标注册语音所见即可说的方法当页面有变化时,由系统提供接口,告知语音SDK发生变化的View坐标点,语音通过坐标点,获取到view,只上报数据有变化的控件的所见即可说,从而解决了现有技术中的需要遍历的问题以及业务对接复杂的问题。

著录项

  • 公开/公告号CN115985325A

    专利类型发明专利

  • 公开/公告日2023-04-18

    原文格式PDF

  • 申请/专利权人 中国第一汽车股份有限公司;

    申请/专利号CN202211533984.0

  • 发明设计人 魏玉玲;

    申请日2022-12-01

  • 分类号G10L15/26(2006.01);G10L15/30(2013.01);G10L15/22(2006.01);

  • 代理机构北京翔宇专利代理事务所(普通合伙) 11960;

  • 代理人田昱川

  • 地址 130011 吉林省长春市汽车经济技术开发区新红旗大街1号

  • 入库时间 2023-06-19 19:21:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-06-23

    实质审查的生效 IPC(主分类):G10L15/26 专利申请号:2022115339840 申请日:20221201

    实质审查的生效

  • 2023-04-18

    公开

    发明专利申请公布

说明书

技术领域

本申请涉及车辆交互技术领域,尤其涉及一种通过坐标注册语音所见即可说的方法、一种通过坐标注册语音所见即可说的装置、车辆语音交互方法以及车辆语音交互系统。

背景技术

当前语音实现所见即可说的方案有三种:1.应用主动上报页面信息变化给语音客户端,语音客户端管理所见即可说上下文;2.语音监听系统页面变化,抓取当前页面信息,内部整合,管理所见即可说上下文;3.以上两种方案的结合体:简单控件通过语音抓取,复杂控件业务自己上报。以上三种方案,只要页面有变化,都会触发所见即可说内容的上报,然而上述三个方案具有如下缺点:

方案1需要业务端自己去上报,这样所见即可功能有变化时,需要每个业务来对接;

方案2语音实现SDK,由业务端接入,语音SDK监听当前activity,activity页面有变化时,遍历所有的view,上报所见即可说,此方案涉及到遍历,无法精准定位到到底是哪个view变化了。

因此,希望有一种技术方案来解决或至少减轻现有技术的上述不足。

发明内容

本发明的目的在于提供一种通过坐标注册语音所见即可说的方法来至少解决上述的一个技术问题。

名词解释:

View:页面上的子控件,比如一个按钮、一个选择框等;

Activity:Android基本控件,对应具体的某一个页面;

SDK:提供给其他应用来使用,内部包含实现一些具体的功能实现。

所见即可说,指页面上能看到的所有内容(所见),都可以通过语音来控制(所说)。

本发明提供了下述方案:

根据本发明的一个方面,提供一种通过坐标注册语音所见即可说的方法,所述通过坐标注册语音所见即可说的方法包括:

获取内容变化的子view的坐标信息;

根据所述子view的坐标信息更新子view的所见即可说信息。

可选地,在车端获取内容变化的子view的坐标信息之前,所述通过坐标注册语音所见即可说的方法进一步包括:

对根View注册监听,从而来监听根view是否有变化,若是,则

通过根view获取具有内容变化的子view的坐标信息。

可选地,所述通过根view获取具有内容变化的子view包括:

当所述根view具有变化时,根view会收到监听回调,根view通过坐标点获取到子view的坐标信息。

可选地,在所述对根View注册监听,从而来监听根view是否有变化之前,所述通过坐标注册语音所见即可说的方法进一步包括:

判断当前activity是否处于resume生命周期,若是,则

遍历当前activity的页面并注册所见即可说并同时对根View注册监听。

可选地,所述通过坐标注册语音所见即可说的方法进一步包括:

获取语音信息;

将所述语音信息发送给云端;

根据云端所反馈的语音结果判断是否需要进行操作,若是,则

语音SDK模拟命中的点击事件,执行点击操作。

本申请还提供了一种通过坐标注册语音所见即可说的装置,所述通过坐标注册语音所见即可说的装置包括:

坐标信息获取模块,所述坐标信息获取模块用于获取内容变化的子view的坐标信息;

更新模块,所述更新模块用于根据所述子view的坐标信息更新子view的所见即可说信息。

本申请还提供了一种车辆语音交互方法,所述车辆语音交互方法包括:

车端获取当前activity的生命周期;

车端采用如权利要求1至5中任意一项所述的通过坐标注册语音所见即可说的方法实时更新所述当前activity的各个子view。

可选地,所述车辆语音交互方法进一步包括:

车端获取使用者的语音信息;

车端将使用者的语音信息发送给云端;

云端对所述语音信息进行解析,判断所述语音信息是否命中车端注册的可见即可说信息,若是,则云端将命中结果传递给车端。

可选地,所述车辆语音交互方法进一步包括:

车端的语音SDK根据所述命中结果模拟命中的点击事件,执行点击操作。

本申请还提供了一种车辆语音交互系统,所述车辆语音交互系统包括云端以及车端,所述云端以及车端配合实现如上所述的车辆语音交互方法。

本申请所提供的通过坐标注册语音所见即可说的方法当页面有变化时,由系统提供接口,告知语音SDK发生变化的View坐标点,语音通过坐标点,获取到view,只上报数据有变化的控件的所见即可说,从而解决了现有技术中的需要遍历的问题以及业务对接复杂的问题。

附图说明

图1是本发明一个或多个实施例提供的通过坐标注册语音所见即可说的方法的流程图。

图2是本发明一个或多个实施例提供的通过坐标注册语音所见即可说的方法的一种电子设备结构框图。

图3是本申请另一个实施例的通过坐标注册语音所见即可说的方法的流程示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1是本发明一个或多个实施例提供的通过坐标注册语音所见即可说的方法的流程图。

如图1所示的通过坐标注册语音所见即可说的方法包括:

步骤1:获取内容变化的子view的坐标信息;

步骤2:根据所述子view的坐标信息更新子view的所见即可说信息。

本申请所提供的通过坐标注册语音所见即可说的方法当页面有变化时,由系统提供接口,告知语音SDK发生变化的View坐标点,语音通过坐标点,获取到view,只上报数据有变化的控件的所见即可说,从而解决了现有技术中的需要遍历的问题以及业务对接复杂的问题。

在本实施例中,在车端获取内容变化的子view的坐标信息之前,所述通过坐标注册语音所见即可说的方法进一步包括:

对根View注册监听,从而来监听根view是否有变化,若是,则

通过根view获取具有内容变化的子view的坐标信息。

在本实施例中,系统会提供具体的具有内容变化的子view的坐标信息,举例来说,系统对呈现在屏幕上的内容,有自己的管理栈,管理栈以坐标形式管理,一旦有某个view变化,系统会第一时间知道变化的view的坐标。

在本实施例中,本申请设置有view数据库,view数据库包括至少一个预设view以及每个预设view对应的预设坐标信息,获取变化的view的坐标相同的预设坐标信息所对应的预设view即可。

在本实施例中,所述通过根view获取具有内容变化的子view包括:

当所述根view具有变化时,根view会收到监听回调,根view通过坐标点获取到子view的坐标信息。

在本实施例中,在所述对根View注册监听,从而来监听根view是否有变化之前,所述通过坐标注册语音所见即可说的方法进一步包括:

判断当前activity是否处于resume生命周期,若是,则

遍历当前activity的页面并注册所见即可说并同时对根View注册监听。

在本实施例中,所述通过坐标注册语音所见即可说的方法进一步包括:

获取语音信息;

将所述语音信息发送给云端;

根据云端所反馈的语音结果判断是否需要进行操作,若是,则

语音SDK模拟命中的点击事件,执行点击操作。

参见图3,本方案的核心点在于只需要上报发生内容变化的view的所见即可说,节省遍历view的时间,也能节省和云端交互的流量。

1、语音提供SDK供业务端应用继承,在BaseApplication中通过监听当前activity的生命周期,当activity处于resume生命周期时,遍历页面注册所见即可说,同时对根View注册监听,来监听view是否有变化(未对根view下的每个子view注册监听是因为SDK不确定哪些view会发生变化)

2、步骤1已对根View注册了监听,当页面的某一个子view有变化时,根view会收到监听回调,同时系统开放发生变化的view对应的坐标点,根view通过坐标点获取到子view,只更新子view对应的所见即可说信息;

3、每次有view发生变化,只上报发生变化的view对应的所见即可说;

4、语音提供基础能力sdk,业务端应用的application需要继承SDK中提供的application,这样SDK可以获取到业务端页面的view信息,整合以后注册所见即可说,同时命中所见即可说以后,SDK也可以模拟点击事件。

下面以举例的方式对本申请进行进一步详细阐述,可以理解的是,该举例并不构成对本申请的任何限制。

以音乐场景为例,在线音乐的Application继承了语音提供的SDK,SDK在activity的onResume生命周期内对页面的根view注册变化监听,同时遍历根view,整合页面所有view信息,注册所见即可说;

在线音乐的某一个控件view发生了变化(主要是内容变化),根view收到了内容变化的监听回调,此时,系统开发接口,告知sdk发生内容变化的具体view的坐标点,根view通过坐标点获取到具体的view,sdk不用通过遍历精准定位到变化的view,此时只需要上报发生变化的view的所见即可说;

业务端将语音SDK收集到的所见即可说信息,发送给语音,语音传输信息给语音云端;

通过语音交互,云端命中所见即可,语音将结果反馈给业务端,语音SDK模拟命中的点击事件,执行点击操作。

举例来说,在线音乐的界面具有多个可交互的控件view,例如,在线音乐的界面上有热门这一控件view,如果点击热门这一控件view,会跳转到下一界面,又例如,在线音乐的界面上有歌词内容这一控件view,该歌词内容可以通过上滑屏幕或者下滑屏幕而滚动。

在本实施例中,需要监听当前的在线音乐的界面有哪些控件view,例如,有上述的热门这一控件view以及歌词内容控件view,假设在某一时刻,歌词内容控件view发生了变化,此时,通过对根View注册了监听,当页面的某一个子view有变化时,根view会收到监听回调,同时系统开放发生变化的view对应的坐标点,根view通过坐标点获取到子view,只更新子view对应的所见即可说信息,例如,该处的歌词内容控件view突然变成了视频控件view,此时,重新注册控件view对应的所见即可说信息即可。

当使用者对视频控件view进行交互时,可以根据刚刚注册的所见即可说信息进行交互即可。

本申请还提供了一种通过坐标注册语音所见即可说的装置,所述通过坐标注册语音所见即可说的装置包括坐标信息获取模块以及更新模块,所述坐标信息获取模块用于获取内容变化的子view的坐标信息;所述更新模块用于根据所述子view的坐标信息更新子view的所见即可说信息。

本申请还提供了一种车辆语音交互方法,所述车辆语音交互方法包括:

车端获取当前activity的生命周期;

车端采用如上所述的通过坐标注册语音所见即可说的方法实时更新所述当前activity的各个子view。

在本实施例中,车辆语音交互方法进一步包括:

车端获取使用者的语音信息;

车端将使用者的语音信息发送给云端;

云端对所述语音信息进行解析,判断所述语音信息是否命中车端注册的可见即可说信息,若是,则云端将命中结果传递给车端。

在本实施例中,所述车辆语音交互方法进一步包括:

车端的语音SDK根据所述命中结果模拟命中的点击事件,执行点击操作。

本申请还提供了一种车辆语音交互系统,所述车辆语音交互系统包括云端以及车端,所述云端以及车端配合实现如上所述的车辆语音交互方法。

图2是本发明一个或多个实施例提供的一种电子设备结构框图。

如图2所示,本申请还公开了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器中存储有计算机程序,当计算机程序被处理器执行时,使得处理器执行通过坐标注册语音所见即可说的方法的步骤。

本申请还提供了一种计算机可读存储介质,其存储有可由电子设备执行的计算机程序,当计算机程序在电子设备上运行时,使得电子设备执行通过坐标注册语音所见即可说的方法的步骤。

上述电子设备提到的通信总线可以是外设部件互连标准(PeripheralComponentInterconnect,PCI)总线或扩展工业标准结构(ExtendedIndustryStandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

电子设备包括硬件层,运行在硬件层之上的操作系统层,以及运行在操作系统上的应用层。该硬件层包括中央处理器(CPU,CentralProcessingUnit)、内存管理单元(MMU,MemoryManagementUnit)和内存等硬件。该操作系统可以是任意一种或多种通过进程(Process)实现电子设备控制的计算机操作系统,例如,Linux操作系统、Unix操作系统、Android操作系统、iOS操作系统或windows操作系统等。并且在本发明实施例中该电子设备可以是智能手机、平板电脑等手持设备,也可以是桌面计算机、便携式计算机等电子设备,本发明实施例中并未特别限定。

本发明实施例中的电子设备控制的执行主体可以是电子设备,或者是电子设备中能够调用程序并执行程序的功能模块。电子设备可以获取到存储介质对应的固件,存储介质对应的固件由供应商提供,不同存储介质对应的固件可以相同可以不同,在此不做限定。电子设备获取到存储介质对应的固件后,可以将该存储介质对应的固件写入存储介质中,具体地是往该存储介质中烧入该存储介质对应固件。将固件烧入存储介质的过程可以采用现有技术实现,在本发明实施例中不做赘述。

电子设备还可以获取到存储介质对应的重置命令,存储介质对应的重置命令由供应商提供,不同存储介质对应的重置命令可以相同可以不同,在此不做限定。

此时电子设备的存储介质为写入了对应的固件的存储介质,电子设备可以在写入了对应的固件的存储介质中响应该存储介质对应的重置命令,从而电子设备根据存储介质对应的重置命令,对该写入对应的固件的存储介质进行重置。根据重置命令对存储介质进行重置的过程可以现有技术实现,在本发明实施例中不做赘述。

为了描述的方便,描述以上装置时以功能分为各种单元、模块分别描述。当然在实施本申请时可以把各单元、模块的功能在同一个或多个软件和/或硬件中实现。

本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。

对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器或者网络设备等)执行本申请各个实施方式或者实施方式的某些部分所述的方法。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号