公开/公告号CN104049753A
专利类型发明专利
公开/公告日2014-09-17
原文格式PDF
申请/专利权人 百度在线网络技术(北京)有限公司;
申请/专利号CN201410253678.0
发明设计人 陈龙;
申请日2014-06-09
分类号
代理机构北京清亦华知识产权代理事务所(普通合伙);
代理人宋合成
地址 100085 北京市海淀区上地十街10号百度大厦三层
入库时间 2023-12-17 01:10:06
法律状态公告日
法律状态信息
法律状态
2017-06-20
授权
授权
2014-10-22
实质审查的生效 IPC(主分类):G06F3/01 申请日:20140609
实质审查的生效
2014-09-17
公开
公开
技术领域
本发明涉及人工智能识别技术领域,尤其涉及一种实现手语信息和文本信息相互转换 的方法、装置和穿戴式设备。
背景技术
手语是用手势比量动作,根据手势的变化模拟形象或者音节以构成的一定意思或词语, 它是聋哑人主要的交际工具。目前,对手语的识别,根据输入方式,可分为基于穿戴式设 备和基于传统视觉。基于穿戴式设备的识别方式,主要是通过穿戴式设备上的传感器等测 量手的各关节角度信息和手在空间运动的轨迹以及时序信息等来进行手语识别。基于传统 视觉的识别方式,主要是通过摄像头采集手势的视频信息或者图像信息来进行识别。
但是,在实现本发明的过程中发明人发现现有技术至少存在以下问题:基于传统视觉 的识别方式需要借助于摄像头等设备,容易受到环境影响,且识别的成功率低;基于穿戴 式设备的识别方式,需要通过各种传感器获取大量的手指关节信息,再对这些手指关节信 息进行处理,对软硬件设备要求高,信息处理效率低,实现复杂。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的一个 目的在于提出一种实现手语信息和文本信息相互转换的方法。该方法能够提高信息处理效 率,提高转换效率,降低对软硬件设备的要求,且不需要借助其他设备,实现简单,适用 性强。
本发明的第二个目的在于提出另一种实现手语信息和文本信息相互转换的方法。
本发明的第三个目的在于提出一种实现手语信息和文本信息相互转换的装置。
本发明的第四个目的在于提出一种穿戴式设备。
为了实现上述目的,本发明第一方面实施例的实现手语信息和文本信息相互转换的方 法,包括:转换装置接收穿戴式设备发送的手语信息,所述手语信息包括手掌与所述转换 装置之间的距离、手掌的高度信息以及手指之间的相对距离;所述转换装置对所述手语信 息进行处理获得对应的位置信息,根据所述位置信息获得对应的文本信息;以及所述转换 装置输出所述文本信息。
本发明实施例的实现手语信息和文本信息相互转换的方法,通过穿戴式设备的距离传 感器获得手掌与转换装置之间的距离与手指之间的相对距离,高度传感器获得手掌的高度 信息,大大减少了转换过程中需要的信息数量,提高了信息处理效率,提高了转换效率, 并且降低了对软硬件设备的要求,且不需要借助其他设备,实现简单,适用性强。
为了实现上述目的,本发明第二方面实施例的实现手语信息和文本信息相互转换的方 法,包括:穿戴式设备获得手语信息,其中,所述手语信息包括手掌与所述转换装置之间 的距离、手掌的高度信息以及手指之间的相对距离;以及所述穿戴式设备对所述手语信息 进行处理,并向转换装置发送处理后的手语信息,以使所述转换装置根据所述处理后的手 语信息输出对应的文本信息。
本发明实施例的实现手语信息和文本信息相互转换的方法,通过距离传感器获得手掌 与转换装置之间的距离与手指之间的相对距离,高度传感器获得手掌的高度信息,大大减 少了转换过程中需要的信息数量,提高了信息处理效率,提高了转换效率,并且降低了对 软硬件设备的要求,且不需要借助其他设备,实现简单,适用性强。
为了实现上述目的,本发明第三方面实施例的实现手语信息和文本信息相互转换的装 置,包括:接收模块,用于接收穿戴式设备发送的手语信息,所述手语信息包括手掌与所 述装置之间的距离、手掌的高度信息以及手指之间的相对距离;获得模块,用于对所述手 语信息进行处理获得对应的位置信息,根据所述位置信息获得对应的文本信息;以及输出 模块,用于输出所述文本信息。
本发明实施例的实现手语信息和文本信息相互转换的装置,通过距离传感器获得手掌 与转换装置之间的距离与手指之间的相对距离,高度传感器获得手掌的高度信息,大大减 少了转换过程中需要的信息数量,提高了信息处理效率,提高了转换效率,并且降低了对 软硬件设备的要求,且不需要借助其他设备,实现简单,适用性强。
为了实现上述目的,本发明第四方面实施例的穿戴式设备,包括:获得模块,用于获 得手语信息,其中,所述手语信息包括手掌与转换装置之间的距离、手掌的高度信息以及 手指之间的相对距离;以及处理模块,用于对所述手语信息进行处理,并向转换装置发送 处理后的手语信息,以使所述转换装置根据所述处理后的手语信息输出对应的文本信息。
本发明实施例的穿戴式设备,通过距离传感器获得手掌与转换装置之间的距离与手指 之间的相对距离,高度传感器获得手掌的高度信息,大大减少了转换过程中需要的信息数 量,提高了信息处理效率,提高了转换效率,并且降低了对软硬件设备的要求,且不需要 借助其他设备,实现简单,适用性强。
附图说明
图1是根据本发明一个实施例的实现手语信息和文本信息相互转换的方法的流程图。
图2是根据本发明一个实施例的手语信息示例图。
图3是根据本发明另一个实施例的实现手语信息和文本信息相互转换的方法的流程 图。
图4是根据本发明一个实施例的实现手语信息和文本信息相互转换的装置的结构示意 图。
图5是根据本发明一个实施例的穿戴式设备的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同 或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描 述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
下面参考附图描述本发明实施例的实现手语信息和文本信息相互转换的方法、装置和 穿戴式设备。
图1是根据本发明一个实施例的实现手语信息和文本信息相互转换的方法的流程图, 该实施例从穿戴式设备进行描述。
如图1所示,实现手语信息和文本信息相互转换的方法包括以下步骤:
S101,穿戴式设备获得手语信息,其中,手语信息包括手掌与转换装置之间的距离、 手掌的高度信息以及手指之间的相对距离。
在本发明的实施例中,穿戴式设备可通过各种传感器获得用户做出的手势对应的手语 信息。具体地,穿戴式设备可通过距离传感器获得左右手掌与转换装置之间的距离与十个 手指之间的相对距离,可通过高度传感器获得左右手掌的高度信息。
更具体地,可用L表示左手掌与转换装置的距离,R表示右手掌与转换装置的距离,LH 表示左手掌的高度信息(即左手5个手指的平均高度),RH表示右手掌的高度信息(即右 手5个手指的平均高度)。L1表示左手拇指,L2表示左手食指,L3表示左手中指,L4表 示左手无名指,L5表示左手小拇指,R1表示右手拇指,R2表示右手食指,R3表示右手中 指,R4表示右手无名指,R5表示右手小拇指。10个手指之间的距离可用10*10或者5*5 的矩阵向量进行表示。采用矩阵向量的方式表示数据,方便后续操作。
S102,穿戴式设备对手语信息进行处理,并向转换装置发送处理后的手语信息,以使 转换装置根据处理后的手语信息输出对应的文本信息。
在本发明的实施例中,穿戴式设备可对获得的手语信息进行放大,然后进行编码及压 缩,然后进行存储等处理。在对手语信息进行处理后,穿戴式设备可通过NFC(近场通信)、 WIFI(无线保真)、红外线、声波等方式与转换装置进行通信,并向转换装置发送处理后的 手语信息,以使转换装置根据处理后的手语信息输出对应的文本信息。
本发明实施例的实现手语信息和文本信息相互转换的方法,通过距离传感器获得手掌 与转换装置之间的距离与手指之间的相对距离,高度传感器获得手掌的高度信息,大大减 少了转换过程中需要的信息数量,提高了信息处理效率,提高了转换效率,并且降低了对 软硬件设备的要求,且不需要借助其他设备,实现简单,适用性强。
图2是根据本发明另一个实施例的实现手语信息和文本信息相互转换的方法的流程 图,该实施例从转换装置侧进行描述。
如图2所示,实现手语信息和文本信息相互转换的方法包括以下步骤:
S201,转换装置接收穿戴式设备发送的手语信息,手语信息包括手掌与转换装置之间 的距离、手掌的高度信息以及手指之间的相对距离。
在本发明的实施例中,转换装置可通过NFC(近场通信)、WIFI(无线保真)、红外线、 声波等方式与穿戴式设备进行通信。转换装置可接收穿戴式设备发送的手语信息,其中, 手语信息可包括手掌与转换装置之间的距离、手掌的高度信息以及手指之间的相对距离。 具体地,穿戴式设备可通过距离传感器获得手掌与转换装置之间的距离与手指之间的相对 距离,可通过高度传感器获得手掌的高度信息。
S202,转换装置对手语信息进行处理获得对应的位置信息,根据位置信息获得对应的 文本信息。
在本发明的实施例中,由于用户的手臂长度、手指长度、身高等并不一定相同,因此 需要收集多个用户的信息,然后从中提取特征作为样本信息,以此建立转换表。其中,转 换表可包含文本信息及其手语信息转换的位置信息。该位置信息可为用户做出的手势对应 的坐标信息。在转换装置接收穿戴式设备发送的手语信息后,转换装置可对手语信息进行 处理获得对应的坐标信息,然后查询并获得转换表中该坐标信息对应的文本信息。
例如:假设手掌与转换装置之间的距离为50厘米,用户做出的手势相对应的数据可表 示为L,R,LH,RH=(50,45,80,130)以及10个手指的距离矩阵包含的数据如表1 所示。
表1距离矩阵包含的数据
根据以上坐标信息,可查询转换表与其对应的文本信息,最终可获得文本信息“我”, 如图3所示。同样地,采用上述方式可根据另两个手势对应的坐标信息获得文本信息“爱” 和“你”。需要说明的是,以上数值及单位仅为示例。
S203,转换装置输出文本信息。
在本发明的实施例中,转换装置可包括显示屏,可通过显示屏输出文本信息或语音输 出文本信息。
由此可见,在本实施例中采用的手语信息仅包括手掌与转换装置之间的距离、手掌的 高度信息以及手指之间的相对距离这三类,相对于其他转换方式,本实施例中所采用的转 换方式所采用的数据量较小,因此,数据的处理效率高,信息间的转换效率较高,尤其适 用于实时性要求较高的场景,例如聋哑人发生紧急意外的情况。
在本发明的实施例中,转换装置还可以将用户输入的文本信息转换为对应的手语信息。 具体地,转换装置可获得用户输入的待转换文本,然后根据转换表获得与待转换文本对应 的位置信息,再根据该位置信息,通过显示屏输出与待转换文本对应的手语信息。例如: 当电视台的电视节目媒体需要将直播节目加上手语表达环节的时候,可通过将主持人的需 要口述的材料(待转换文本)输入到转换装置中,然后根据转换表获得对应的位置信息,再 根据位置信息,通过显示屏输出虚拟人物的动作信息,从而让不识字的聋哑人能够看懂媒 体发布的信息,节省了人工翻译成手语的时间成本,使聋哑人能够像普通人一样及时获取 实时信息。
本发明实施例的实现手语信息和文本信息相互转换的方法,通过穿戴式设备的距离传 感器获得手掌与转换装置之间的距离与手指之间的相对距离,高度传感器获得手掌的高度 信息,大大减少了转换过程中需要的信息数量,提高了信息处理效率,提高了转换效率, 并且降低了对软硬件设备的要求,且不需要借助其他设备,实现简单,适用性强。
上述实施例还可以应用于具体的信息搜索场景。举例来说,当一名聋哑人用户想上网 查询资料,但不会传统的输入法时,此时,他只需在电脑屏幕上选中文字输入的位置即搜 索框内,穿戴上穿戴式设备进行手语操作,将手语信息发送至电脑,此处的电脑即为转换 装置。电脑通过查询预先存储的转换表,获得对应的文本信息,在搜索框即可显示用户想 输入的文本。聋哑人用户可通过此方法进行搜索词的输入,并搜索所需的资料。
为了实现上述实施例,本发明还提出一种实现手语信息和文本信息相互转换的装置。
如图4所示,实现手语信息和文本信息相互转换的装置包括:接收模块110、获得模 块120和输出模块130。
接收模块110用于接收穿戴式设备发送的手语信息,手语信息包括手掌与装置之间的 距离、手掌的高度信息以及手指之间的相对距离。
在本发明的实施例中,转换装置可通过NFC(近场通信)、WIFI(无线保真)、红外线、 声波等方式与穿戴式设备进行通信。接收模块110可接收穿戴式设备发送的手语信息,其 中,手语信息可包括手掌与转换装置之间的距离、手掌的高度信息以及手指之间的相对距 离。具体地,穿戴式设备可通过距离传感器获得手掌与转换装置之间的距离与手指之间的 相对距离,可通过高度传感器获得手掌的高度信息。
获得模块120用于对手语信息进行处理获得对应的位置信息,根据位置信息获得对应 的文本信息。
在本发明的实施例中,由于用户的手臂长度、手指长度、身高等并不一定相同,因此 需要收集多个用户的信息,然后从中提取特征作为样本信息,以使建立模块140基于样本 信息建立转换表。其中,转换表可包含文本信息及其手语信息转换的位置信息。该位置信 息可为用户做出的手势对应的坐标信息。在接收模块110接收穿戴式设备发送的手语信息 后,获得模块120可对手语信息进行处理获得对应的坐标信息,然后查询并获得转换表中 该坐标信息对应的文本信息。例如:假设手掌与转换装置之间的距离为50厘米,用户做出 的手势相对应的数据可表示为L,R,LH,RH=(50,45,80,130)以及10个手指的距 离矩阵包含的数据如表1所示。
表1距离矩阵包含的数据
根据以上坐标信息,可查询转换表与其对应的文本信息,最终可获得文本信息“我”, 如图2所示。同样地,采用上述方式可根据另两个手势对应的坐标信息获得文本信息“爱” 和“你”。需要说明的是,以上数值及单位仅为示例。
输出模块130用于输出文本信息。
在本发明的实施例中,转换装置可包括显示屏,输出模块130可通过显示屏输出文本 信息或语音输出文本信息。
由此可见,在本实施例中采用的手语信息仅包括手掌与转换装置之间的距离、手掌的 高度信息以及手指之间的相对距离这三类,相对于其他转换方式,本实施例中所采用的转 换方式所采用的数据量较小,因此,数据的处理效率高,信息间的转换效率较高,尤其适 用于实时性要求较高的场景,例如聋哑人发生紧急意外的情况。
另外,实现手语信息和文本信息相互转换的装置还可包括建立模块140。
建立模块140用于在获得模块120根据位置信息获得对应的文本信息之前,基于样本 信息建立转换表,转换表中包含文本信息及其手语信息转换的位置信息。
在本发明的实施例中,转换装置还可以将用户输入的文本信息转换为对应的手语信息。 具体地,获得模块120可获得用户输入的待转换文本,然后根据转换表获得与待转换文本 对应的位置信息,再根据该位置信息,输出模块130通过显示屏输出与待转换文本对应的 手语信息。例如:当电视台的电视节目媒体需要将直播节目加上手语表达环节的时候,可 通过将主持人的需要口述的材料(待转换文本)输入到转换装置中,然后根据转换表获得对 应的位置信息,再根据位置信息,通过显示屏输出虚拟人物的动作信息,从而让不识字的 聋哑人能够看懂媒体发布的信息,实时性强,节省了人工翻译成手语的时间成本,使聋哑 人能够像普通人一样及时获取实时信息。
本发明实施例的实现手语信息和文本信息相互转换的装置,通过穿戴式设备的距离传 感器获得手掌与转换装置之间的距离与手指之间的相对距离,高度传感器获得手掌的高度 信息,大大减少了转换过程中需要的信息数量,提高了信息处理效率,提高了转换效率, 并且降低了对软硬件设备的要求,且不需要借助其他设备,实现简单,适用性强。
为了实现上述实施例,本发明还提出一种穿戴式设备。如图5所示,穿戴式设备包括: 获得模块210和处理模块220。
获得模块210用于获得手语信息,其中,手语信息包括手掌与转换装置之间的距离、 手掌的高度信息以及手指之间的相对距离。
在本发明的实施例中,获得模块210可通过各种传感器获得用户做出的手势对应的手 语信息。具体地,获得模块210可通过距离传感器获得左右手掌与转换装置之间的距离与 十个手指之间的相对距离,可通过高度传感器获得左右手掌的高度信息。
更具体地,可用L表示左手掌与转换装置的距离,R表示右手掌与转换装置的距离,LH 表示左手掌的高度信息(即左手5个手指的平均高度),RH表示右手掌的高度信息(即右 手5个手指的平均高度)。L1表示左手拇指,L2表示左手食指,L3表示左手中指,L4表 示左手无名指,L5表示左手小拇指,R1表示右手拇指,R2表示右手食指,R3表示右手中 指,R4表示右手无名指,R5表示右手小拇指。10个手指之间的距离可用10*10或者5*5 的矩阵向量进行表示。采用矩阵向量的方式表示数据,方便后续操作。
处理模块220用于对手语信息进行处理,并向转换装置发送处理后的手语信息,以使 转换装置根据处理后的手语信息输出对应的文本信息。
在本发明的实施例中,处理模块220可对获得的手语信息进行放大,然后进行编码及 压缩,然后进行存储等处理。在对手语信息进行处理后,处理模块220可通过NFC(近场 通信)、WIFI(无线保真)、红外线、声波等方式与转换装置进行通信,并向转换装置发送 处理后的手语信息,以使转换装置根据处理后的手语信息输出对应的文本信息。
本发明实施例的穿戴式设备,通过距离传感器获得手掌与转换装置之间的距离与手指 之间的相对距离,高度传感器获得手掌的高度信息,大大减少了转换过程中需要的信息数 量,提高了信息处理效率,提高了转换效率,并且降低了对软硬件设备的要求,且不需要 借助其他设备,实现简单,适用性强。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、 或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包 含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须 针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一 个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技 术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合 和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或 者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者 隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个, 三个等,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个 或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分, 并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序, 包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的 实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实 现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令 执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行 系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设 备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播 或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用 的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布 线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只 读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及 便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述 程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行 编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储 在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实 施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或 固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下 列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路 的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现 场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可 以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中, 该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各 个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既 可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以 软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读 取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了 本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制, 本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
机译: 在符号语言信息和文本信息之间实现相互转换的方法和装置
机译: 文本信息处理设备,文本信息处理方法和文本信息处理程序
机译: 用于监视文本信息的词典创建设备,用于监视文本信息的词典创建方法以及用于监视文本信息的词典创建程序