首页> 中国专利> 一种基于人工智能的手机APP语音收纳管理系统

一种基于人工智能的手机APP语音收纳管理系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种基于人工智能的手机APP语音收纳管理系统，通信连接的APP客户端、服务器以及管理客户端，APP客户端接收输入的语音数据、图片数据以及文字数据，将语音数据处理后转化成文字数据，所述语音数据、图片数据以及文字数据形成收纳数据，并将收纳数据发送至服务器存储；服务器对接收的语音数据进行特征提取后分类，生成语音特征分类模型，还对文字数据或图片进行特征提取后分类，生成语义分类集，并基于手机客户端的请求，推送与请求最贴切的语音特征分类或语义分类到APP客户端；管理客户端实现对服务器中各用户的信息管理，对语音特征分类模型和语义分类集的更新，以及发布一些公共通知。

著录项

公开/公告号CN108111491A

专利类型发明专利
公开/公告日2018-06-01

原文格式PDF
申请/专利权人浙江大学;
展开▼

申请/专利号CN201711288501.4
发明设计人徐翊焜;
展开▼

申请日2017-12-07
分类号
代理机构杭州天勤知识产权代理有限公司;
代理人胡红娟
地址 310013 浙江省杭州市西湖区余杭塘路866号
入库时间 2023-06-19 05:31:18

法律信息

法律状态公告日

法律状态信息

法律状态
2020-06-19

授权

授权
2018-06-26

实质审查的生效 IPC(主分类):H04L29/06 申请日:20171207

实质审查的生效
2018-06-01

公开

公开

说明书

技术领域

本发明属于通信领域，具体涉及一种基于人工智能的手机APP语音收纳管理系统。

背景技术

随着社会进步，赴国内外的流动人口频次大大增多，普通家庭特别是经常出差的商务人士，迫切需要一个基于个人的智能收纳管理系统，帮助其管理、快速需找、防遗失重要物品，提高学习、办公和生活效率，方便其出行、家庭生活、商务需要。

目前市场上，基于个人(含家庭)的收纳管理系统很少，大型超市里面收货售货设备无法适应普通家庭需求，且价格昂贵。少数有收纳管理功能的手机APP功能非常有限，很难帮助商务白领、普通家庭提高效率。

究其原因，是因为个人(含家庭)收纳管理有数据量大、物品位置变动频繁、使用人多的特点。传统收纳管理之所以难以满足现代人和商务人士的需要，主要是物品信息录入工作量大、不方便快速修改物品位置信息功能、无法多平台同步、缺少共享功能以及缺少人工智能机器学习技术。

发明内容

本发明的目的是提供一种基于人工智能的手机APP语音收纳管理系统，以实现对生活物品的管理和查找。

为实现上述目的，本发明提供以下技术方案：

一种基于人工智能的手机APP语音收纳管理系统，包括APP客户端、与所述APP客户端通信连接的服务器、与所述服务器通信连接的管理客户端，

所述APP客户端接收输入的语音数据、图片数据以及文字数据，将所述语音数据处理后转化成文字数据，所述语音数据、图片数据以及文字数据形成收纳数据，并将所述收纳数据发送至服务器存储；

所述服务器对接收的语音数据进行特征提取后分类，生成语音特征分类模型，还对接收的文字数据或图片数据进行特征提取后分类，生成语义分类信息集，并基于手机客户端的请求，推送与所述请求最贴切的语音特征分类模型或语义分类信息到所述APP客户端；

所述管理客户端实现对服务器中各用户的信息管理、用户权限管理和安全管理，对语音特征分类模型和语义分类集的更新，以及发布一些公共通知。

在本技术方案中，用户通过APP客户端输入语音数据、文字数据或图片数据，将语音数据转化为文字数据，上述语音数据、文字数据或图片数据组成收纳数据，组成收纳数据的文字数据既包括直接输入的文字数据，也包括由语音数据转化的文字数据，该些收纳数据包含收纳物品的相关信息，该相关信息至少包括收纳物品的类型、名称以及位置。该些收纳数据会被同步到服务器的个人账户内。服务器会对以上语音数据进行训练，提炼语音特征，生成语音分类模型集，每个语音分类模型对应一个地域的人们语言特征，该语音分类模型被推送到APP客户端，能够将语音数据转化为正确的文字数据，实现快速地输入收纳数据。服务器还会对以上文字数据或图片数据进行训练，提取文字或图片表达的内容，生成语义分类信息集，每一个语义分类对应一个主题，当接收到APP客户端发送的请求时，服务器会自动将与请求包括的主题对应的语义分类推送到APP客户端，实现对用户的推荐作用。

作为优选，所述的APP客户端包括：

注册模块，用于在线填写用户的注册信息，所述用户注册信息包括用户昵称、姓名、手机号、邮箱以及密码；

接收模块，用于接收用户输入的收纳数据，还用于接收基于发送的语音数据请求返回的收纳数据、语义分类信息、语音特征分类模型；

训练模块，用于对用户的语音数据进行训练，获得用户的个人语音识别数据集；

转化模块，用于基于用户的个人语音识别数据集和所述服务器推送的语音特征分类模型，将用户的语音数据转化为文字数据；

发送模块，用于发送所述收纳数据至所述服务器以存储；

显示模块，用于解析并显示所述收纳数据以及语义分类信息；

同步模块，用于同步获取所述服务器上更新的信息；

帮助模块，用于用户对遇到问题的反馈、数据的备份以及获取APP的更新。

作为优选，所述服务器包括：

接收模块，用于接收所述APP客户端发送的收纳数据；

个人账户模块，用于存储个人用户的注册信息、收纳数据、用户的个人语音识别数据集；

公共账户模块，用于存储基于不同类型用户的语音分类模型集、所述文字语义分类集；

用户意见反馈模块，用于存储个人反馈信息；

用户备份数据，用于备份个体账户的收纳数据；

语音数据训练模块，用于对接收的各用户的语音数据进行训练，提取语音特征，并按照语音特征分类，形成语音特征分类集，且形成与语音特征分类集对应的基于不同类型用户的语音分类模型集，并将所述语音分类模型集存储到公共账户模块内；

文字或图片数据训练模块，用于对接收的各用户的文字数据或图片数据进行训练，提取文字或图片的语义，并基于文字或图片语义分类，形成语义分类信息集，并将所述语义分类信息集存储到公共账户模块内；

文字处理模块，用于基于接收的文字数据，提取所述文字数据语义，调取并推送与所述语义相关的语义分类信息至所述APP客户端；

语音处理模块，用于基于接收的语音数据，分析所述语音数据语义，调取并反馈与所述语音数据语义对应的收纳数据至所述APP客户端，还用于基于接收的语音数据，分析语音特征，并调取与所述语音特征相应的语音特征分类模型至所述APP客户端。

作为优选，所述管理客户端包括：

信息管理模块，用于实现对用户的信息查询、管理、统计分析；

用户权限管理模块，用于实现对用户的权限管理；

安全管理模块，用于实现对用户数据的安全管理；

更新模块，用于实现对语音特征分类模型和语义分类集的更新；

通知模块，用于发布一些公共通知。

本发明与现有技术相比，具有的有益效果为：

(1)本收纳管理系统中的APP客户端由于设定了转化模块可以随时准确地通过语音进行收纳输入、修改、查看等管理，操作简单，便捷，且能适应不能口音的人群应用，普适性强。

(2)APP客户端与服务器通信连接，能够实现收纳数据的同步，可以随时随地地查看、更新、跟踪个人物品的收纳信息。

(3)服务器设有机器学习功能，能够基于同步的各用户的语音数据训练得到符合不同个人(或不同地域)口音的语音特征模型，这样能够准确地将语音数据转化为文字数据，实现对收纳物品的管理，还能够基于同步的用户的语音数据训练得到符合某一主题的语义分类，能够在根据用户的请求，推送给用户实现对用户的推荐。

附图说明

图1是实施例提供的基于人工智能的手机APP语音收纳管理系统的结构示意图；

图2是实施例提供的APP客户端的结构示意图；

图3是实施例提供的服务器的结构示意图；

图4是实施例提供的管理客户端的结构示意图。

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例本发明进行进一步的详细说明。应当理解，此处所描述的具体实施方式仅仅用以解释本发明，并不限定本发明的保护范围。

图1是实施例提供的基于人工智能的手机APP语音收纳管理系统的结构示意图。参见图1，本实施例提供的收纳管理系统包括：APP客户端101、与所述APP客户端101通信连接的服务器102、与所述服务器102通信连接的管理客户端103。

所述APP客户端101接收输入的语音数据、图片数据以及文字数据，将所述语音数据处理后转化成文字数据，所述语音数据、图片数据以及文字数据形成收纳数据，并将所述收纳数据发送至服务器102存储；

所述服务器102对接收的语音数据进行特征提取后分类，生成语音特征分类模型，还对接收的文字数据或图片数据进行特征提取后分类，生成语义分类信息集，并基于手机客户端的请求，推送与所述请求最贴切的语音特征分类模型或语义分类信息到所述APP客户端101；

所述管理客户端103实现对服务器中各用户的信息管理、用户权限管理和安全管理，对语音特征分类模型和语义分类集的更新，以及发布一些公共通知。

图2是实施例提供的APP客户端的结构示意图。参见图2，本实施例提供的APP客户端包括：

注册模块201，用于在线填写用户的注册信息，所述用户注册信息包括用户昵称、姓名、手机号、邮箱以及密码；

接收模块202，用于接收用户输入的收纳数据，还用于接收基于发送的语音数据请求返回的收纳数据、语义分类信息、语音特征分类模型；

训练模块203，用于对用户的语音数据进行训练，获得用户的个人语音识别数据集；

转化模块204，用于基于用户的个人语音识别数据集和所述服务器推送的语音特征分类模型，将用户的语音数据转化为文字数据；

发送模块205，用于发送所述收纳数据至所述服务器以存储；

显示模块206，用于解析并显示所述收纳数据以及语义分类信息；

同步模块207，用于同步获取所述服务器102上更新的信息；

帮助模块208，用于用户对遇到问题的反馈、数据的备份以及获取APP的更新。

用户在使用的时候，首先通过注册模块201注册用户的相关信息，这样，在服务器102中会形成该用户的一个存储地址，用于存储该用户同步上传的收纳数据。

接收模块202的设置，为客户提供收纳数据的输入接口，输入的收纳数据可以是语音、图片、文字等任何形式，当该些数据输入后，针对语音数据，会对其进行训练，目的就是获得该用户的声纹数据，得到该用户的语音数据集，该语音数据集记载了用户的语音特性，这样当用户下次再输入语音数据时，能够将该用户的不标准的普通话转化为正确的文字信息，提升输入收纳数据的及时性和准确性以及方便性。

该APP客户端还设有转化模块204，该转化模块204既能根据自己的个性化的语音识别数据集将语音数据转化为文字，也能根据服务器102推送的语音特征分类模型，将语音数据转化为文字，这样，老用户可以基于自己的个性化语音识别数据集实现语音到文字的转化，新用户可以基于推荐的语音特征分类模型实现语音到文字的转化，提高了输入收纳数据的准确定和稳定性。

APP客户端101还设有显示模块206，基于服务器102能够获得自己请求的推荐内容，例如，用户输入语音“去美国需要的行李”，服务器102会推荐一些关于行李主题的语义分类，该语义分类包含了一些需要的行李物品，便于用户参考，该些语义分类信息会通过显示模块显示出来。

APP客户端101还设有帮助模块208，用户通过该模块可以实现对问题的反馈，收纳数据的备份、APP的更新等功能。

图3是实施例提供的服务器的结构示意图。参见图3，本实施例提供的服务器102包括：

接收模块301，用于接收APP客户端101发送的收纳数据；

个人账户模块302，用于存储个人用户注册信息、收纳数据、用户的个人语音识别数据集；

公共账户模块303，用于存储基于不同类型用户的语音分类模型集、所述文字语义分类集；

用户意见反馈模块304，用于存储个人反馈信息；

用户备份数据305，用于备份个体账户的收纳数据；

语音数据训练模块306，用于对接收的各用户的语音数据进行训练，提取语音特征，并按照语音特征分类，形成语音特征分类集，且形成与语音特征分类集对应的基于不同类型用户的语音分类模型集，并将所述语音分类模型集存储到公共账户模块内；

文字或图片数据训练模块307，用于对接收的各用户的文字数据或图片数据进行训练，提取文字或图片的语义，并基于文字或图片语义分类，形成语义分类信息集，并将所述语义分类信息集存储到公共账户模块内；

文字处理模块308，用于基于接收的文字数据，提取所述文字数据语义，调取并推送与所述语义相关的语义分类至所述APP客户端101；

语音处理模块309，用于基于接收的语音数据，分析所述语音数据语义，调取并反馈与所述语音数据语义对应的收纳数据至所述APP客户端101，还用于基于接收的语音数据，分析语音特征，并调取与所述语音特征相应的语音特征分类模型至所述APP客户端101。

该服务器102既能试下对个人账户的管理，还能实现对公共数据的处理，具体地，语音数据训练模块306主要是对收集的大量语音数据进行训练，形成符合各地域语音特征的语音分类模型。具体地，采用神经网络对语音数据进行训练，以带有地域发音特性的语音数据作为输入数据，以该语音数据对应的正确文字数据作为真值标签，对该语音数据进行训练，得到能够描述该发音特性的语音分类模型。这样，当用户输入一段语音数据时，可以基于该语音分类模型，准确地将该语音数据表达的内容转发为文字。

文字或图片数据训练模块307的设立主要是为用户推荐信息用，具体地，对接收的各用户的文字数据或图片进行训练，提取文字或图片的语义，并基于文字或图片语义分类，形成语义分类集，并将语义分类集存储到所述存储模块公共账户对应的地址内。这样，能够基于用户请求，将与请求包含的语义对应的语义分类推送给用户。

图4是实施例提供的管理客户端的结构示意图。参见图4，本实施例提供的管理客户端包括：

信息管理模块401，用于实现对用户的信息查询、管理、统计分析；

用户权限管理模块402，用于实现对用户的权限管理；

安全管理模块403，用于实现对用户数据的安全管理；

更新模块404，用于实现对语音特征分类模型和语义分类集的更新；

通知模块405，用于发布一些公共通知。

本实施例提供的收纳系统可以随时准确地通过语音进行收纳输入、修改、查看等管理，操作简单，便捷，且能适应不能口音的人群应用，普适性强，同时能够实现收纳数据的同步，可以随时随地地查看、更新、跟踪个人物品的收纳信息。

系统操作简单，可随时利用手机APP1拍摄、文字或声音输入收纳物品信息；多平台同步更新后台数据；还可接收来自家人朋友的共享信息的提醒；语音输入，简化用户操作提升了用户体验，节约了用户时间成本；机器学习，进行个性化定制；人工智能，大数据统计用户偏好，为用户提供更多更好的服务。

以上所述的具体实施方式对本发明的技术方案和有益效果进行了详细说明，应理解的是以上所述仅为本发明的最优选实施例，并不用于限制本发明，凡在本发明的原则范围内所做的任何修改、补充和等同替换等，均应包含在本发明的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于人工智能的手机APP语音收纳管理系统 [P] . 中国专利： CN108111491B . 2020.06.19
2. 一种基于人工智能的手机APP语音收纳管理系统 [P] . 中国专利： CN108111491A . 2018-06-01
3. Pointer-oriented object acquisition method for tangible treatment of information of the computer system which is based on one natural language and in which a received signal reaction of this computer system of artificial intelligence of a cyborg or an android, a corresponding association of this computer system of artificial intelligence of a cyborg or an android, a corresponding thought of this computer system of artificial intelligence of a cyborg or an android are substantiated [P] . 美国专利： US2009265298A1 . 2009-10-22

机译：一种基于指针的对象获取方法，用于对计算机系统的信息进行有形处理，该方法基于一种自然语言，并且该机器人或机器人的人工智能系统对该计算机系统的接收信号作出反应，该计算机系统具有相应的关联机器人或机器人的人工智能，该机器人或机器人的人工智能计算机系统的相应思想得到证实
4. NECK STRESS RELIEF DEVICE FOR VEHICLE BASED ON ARTIFICIAL INTELLIGENCE AND NECK STRESS MANAGEMENT SYSTEM BASED ON ARTIFICIAL INTELLIGENCE [P] . 韩国专利： KR20200035540A . 2020-04-06

机译：基于人工智能的汽车颈应力缓解装置及基于人工智能的颈应力管理系统
5. ARTIFICIAL INTELLIGENT VOICE TERMINAL DEVICE AND VOICE SERVICE SYSTEM PROVIDING SERVICE BASED ON CONTINUOUS VOICE COMMAND [P] . 韩国专利： KR20200047853A . 2020-05-08

机译：基于连续语音命令的人工智能语音终端设备和语音服务系统