法律状态公告日
法律状态信息
法律状态
2022-09-06
实质审查的生效 IPC(主分类):G06Q30/02 专利申请号:2022105654092 申请日:20220523
实质审查的生效
技术领域
本发明涉及数据分析领域,具体来说,涉及基于用户数据的用户需求分析方法,更具体地说,涉及一种用于产品改进策略制定的用户需求数据分析方法及系统。
背景技术
随着电子商务的发展,产品迭代加快和竞争加剧使得企业了解客户需求的即时性加强。基于用户生成的大数据的分析方法,逐渐取代传统的调查方法。利用传统数据分析模型对用户生成内容进行分析,逐渐成为产品改进前的必要步骤。但是,现有的数据分析模型在对客户需求进行处理时维度单一,忽视了用户在购买的不同阶段的偏好差异,造成数据分析结果不够全面,对企业产品改进策略制定的支撑性不足。
发明内容
为解决现有技术中存在的上述缺陷,本发明的目的在于提供一种用于产品改进策略的数据分析框架,以提高用户需求分析的全面性和有效性
本发明的目的是通过以下技术方案来实现的。
本发明一方面,提供了一种用于产品改进策略的用户需求数据分析方法,综合了用户在线评论和购买记录两种数据,借助联合分析(Conjoint analysis)、马尔科夫链蒙特卡罗(Markov Chain Monte Carlo)技术等方法,构建一种双权重模型,实现系统分析用户需求以支持产品改进策略制定的功能。
本发明提供的用于产品改进策略制定的用户需求数据分析方法,包括:
获取目标产品类别的评论数据,构建产品要素词典以及通过联合分析获得产品要素基于满意度的权重;
获取用户购买记录及产品工艺参数,利用两阶段效用模型获得影响系数,利用构建的产品要素词典获得产品要素基于用户购买倾向的权重;
基于双权重模型,利用获得的产品要素基于满意度的权重和产品要素基于购买倾向的权重结果对产品要素进行分类,得到针对性的产品改进策略。
优选的,产品要素基于满意度的权重的计算,包括:
P11、将获得的目标产品类别评论中的文本结构化;
P12、通过联合分析模型对文本结构化后的评论进行评分,计算得到产品要素基于满意度的权重。
优选的,所述步骤P11中,通过如下方法完成目标产品类别评论中的文本的结构化:
P111、通过一种循环方法构建产品要素词典,将所有评论进行分组和分词,从第一组中提取产品功能相关词,将高频词加入词库,从余下组中删去已经加入词库中多余的词,循环直至所有组处理完毕,得到含有产品功能相关词的词库;
基于word2vec对词库中每两个词之间的相似性进行计算,基于相似性进行聚类,得到产品要素词典,获得的词典的结构为:产品要素-评论中获得的词;
P112、基于产品要素词典对所有评论进行反向搜索,根据评论中是否包含要素词典中对应词,生成评论-要素关系矩阵;
P113、对所述评论-要素关系矩阵,利用词性标注和隐含狄利克雷分配构建情感词典,将评论所包含要素情感转化为评论是否包含积极或消极特征的0-1矩阵,得到结构化后的评论文本。
优选的,对于目标产品的用户购买记录及产品工艺参数,通过如下方式完成基于用户购买倾向的权重的计算:
P21、利用两阶段效用模型获得产品工艺参数对用户购买倾向的影响系数;
P22、利用相关关系矩阵,将工艺参数对用户购买倾向的影响系数转换为产品要素对用户购买倾向的影响权重。
优选的,所述步骤P22,包括以下步骤:
P221、进行要素-工艺参数间相关关系的模糊评价,评价包括五级量表变量:非常弱,弱,中等,强和非常强;
P222、计算产品要素对用户购买倾向的影响权重。
优选的,利用获得的产品要素基于满意度的权重和产品要素基于购买倾向的权重结果对产品要素进行分类,采用图形化的分类方法:双权重模型对产品要素进行分类,该模型横纵轴分别对应基于用户满意度、购买倾向的影响权重,按照用户满意度、购买倾向的相似程度和高低水平分为四类:类别Ⅰ、类别Ⅱ、类别Ⅲ和类别Ⅳ。
产品要素进行分类为:
类别Ⅰ:该类要素对用户购买倾向和满意度影响大,需要通过改进产品功能并谨慎考虑创新,提高用户的购买效用和使用后的满意度;
类别Ⅱ:该类要素对用户购买倾向比对满意度影响更大,不成功的产品功能创新不会降低用户满意度;
类别Ⅲ:该类要素对购买倾向和满意度均不重要,应减少对功能的投资,寻求成本优化的替代方案;
类别Ⅳ:该类要素对满意度比对购买意向影响更大,应提高产品功能的整体质量,以保持和提高用户满意度。
通过上述分析框架,将用户的评论数据经文本挖掘和情感分析进行结构化,经联合分析法计算得到产品要素基于用户满意度的影响权重;将用户的购买记录及产品工艺参数经两阶段效用模型建模,经马尔可夫蒙特卡洛方法进行计算,得到产品要素基于用户购买倾向的影响权重;经双权重模型整合产品要素分别对于满意度和购买倾向的权重,将产品要素分为四类,根据对应类别特征制定相应的产品改进策略。
本发明另一方面,提供了一种用于产品改进策略制定的用户需求数据分析系统,包括:
网上数据采集装置,用以采集产品在线评论数据及产品工艺参数;
评论文本挖掘装置,用以对采集的评论数据进行文本分析处理,得到产品要素数据库和结构化的评论;
要素满意度分析装置,用以对结构化的评论实施联合分析,得到要素满意度测度数据库;
用户购买行为采集装置,用以采集用户购买记录;
购买行为分析装置,结合产品要素数据库基于两阶段效用模型进行分析,得到要素基于购买倾向测度数据库;
双要素分析装置,综合要素满意度测度数据库和要素基于购买倾向测度数据库,基于双权重模型对要素进行分类分析,得到产品改善策略数据库,为产品制造商提供进行针对性产品的改进策略。
为实现发明目的,本发明使用购买记录来衡量产品要素对购买倾向的影响。本发明通过购买后的在线评论来分析产品对整体满意度的影响。本发明提供了一个双权重模型,模型综合了用户评论和购买两个维度,将产品特征分为四类。根据不同的类别,为产品设计者提供了相应的产品设计建议。因此,我们提供了一个全面的分析框架,从用户行为和用户言语、使用前和使用后、购买动机和满意度因素多维度地研究的需求。本项目首次将用户评论和用户购买记录进行结合,引入到用户需求分析框架中,得到了更为全面的分析结果。方法具有很好的鲁棒性,可以在很多产品领域予以实现。
本发明的其他特征和优点将在随后的具体实施方式部分予以详细说明。
本发明由于采取以上技术方案,其具有以下有益效果:
1)用户需求的全面化。本方法拓展了用户需求分析的维度,考虑了用户在不同阶段需求的差异性。
2)降低产品制造商产品改进中的创新风险。本方法利用一个双权重模型将用户不同阶段的需求分成四个类别,其中第二类要素的特点是在购买倾向所占的权重高,但整体满意度的权重较低。因此,使用这些功能实施更改和创新被认为是低风险的。
3)具有很强的类别拓展性。本方法所使用的数据可获得性强,并且分析方法已包含了对于非结构化数据的处理,本方法可应用于具有产品改进需求的企业和个人在各种产品类别上进行需求分析。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的不当限定,在附图中:
图1是根据本发明实施例的一种用于产品改进策略制定的用户需求的系统结构示意图;
图2是根据本发明实施例的一种用于产品改进策略制定的用户需求分析流程图;
图3为根据本发明实施例的两阶段效用模型的示例图;
图4为根据本发明实施例的双权重模型分类示例图;
图5为根据本发明实施例对应的产品要素基于双权重模型的分类结果。
具体实施方式
下面将结合附图以及具体实施例来详细说明本发明,在此本发明的示意性实施例以及说明用来解释本发明,但并不作为对本发明的限定。
图1是本发明实施例的一种用于产品改进策略制定的用户需求的系统结构示意图。如图1所示的本发明的一种用于产品改进策略制定的用户需求数据分析系统,包括:网上数据采集装置10,用以采集产品在线评论数据及产品工艺参数;评论文本挖掘装置11,用以对采集的评论数据进行文本分析处理,得到产品要素数据库12和结构化的评论;要素满意度分析装置13,用以对结构化的评论实施联合分析,得到要素满意度测度数据库14;用户购买行为采集装置20,用以采集用户购买记录;购买行为分析装置21,结合产品要素数据库12基于两阶段效用模型进行分析,得到要素基于购买倾向测度数据库22;双要素分析装置30,综合要素满意度测度数据库14和要素基于购买倾向测度数据库22,基于双权重模型对要素进行分类分析,得到产品改善策略数据库31,通过输出32为产品制造商提供进行针对性产品的改进策略。
如图2所示,根据本发明实施例的一种用于产品改进策略制定的用户需求分析流程图,本发明是一种综合性的分析框架,参考成熟的数据获取技术和计算方法,考虑用户不同阶段的需求差异,提供一种二维的用户需求分析方法,方法的分析框架包含三个部分:第一部分,基于用户满意度的需求挖掘,用以分析产品要素对于用户满意度的权重,包括:获取目标产品类别的评论数据,结构化评论,建立联合分析模型以计算产品要素对整体满意度的影响权重;第二部分,基于用户购买倾向的需求挖掘,用以分析产品要素对于用户购买倾向的权重,包括:获取用户购买记录及产品工艺参数,利用两阶段效用模型获得影响系数,利用产品要素词典获得要素基于购买倾向的权重;第三部分,产品改进策略分析,用以将要素的两类权重汇总至双权重模型,基于两类权重的水平和相似度,对要素进行分类,并制定相应的产品改进策略。
本发明用于产品改进策略制定的用户需求数据分析方法,步骤如下:
P1、获取目标产品类别的评论数据,构建产品要素词典以及通过联合分析获得产品要素基于满意度的权重。
基于满意度的要素权重分析,其主要分析数据为目标产品类别的评论数据,其中主要有用户标识(如用户ID)、评论星级和评论文本内容,其主要包括的处理过程有获取公开电商平台上的目标产品类别的评论数据,包括用户ID,评价星级和评论文本内容,计算要素基于满意度的权重。
要素基于满意度的权重的计算,包括:
P11、将获得的目标产品类别的评论中的文本结构化。
通过如下方法完成目标产品类别评论文本的结构化:
P111、通过一种循环方法构建产品要素词典,具体方法为具体而言,首先将所有评论进行分组和分词,从第一组中提取产品功能相关的词,将高频词加入词库,并将已经加入词库中的词从后面的所有组中删去,循环直至所有组处理完毕,得到含有产品功能相关词的词库;基于word2vec对词库中每两个词之间的相似性进行计算,基于相似性进行聚类,并根据产品相关知识进行调整,得到产品要素词典。所获得的词典的结构为:产品要素-评论中获得的词;进一步,遍历所有评论,基于产品要素词典判断每条评论中提及的要素,得到评论和要素的关系矩阵X
P112、基于上述产品要素词典对所有评论进行反向搜索,根据评论中是否包含要素词典中对应词,生成评论-要素关系矩阵;
P113、对所述评论-要素关系矩阵,利用词性标注(Part-of-Speech Tagging)和隐含狄利克雷分配(Latent Dirichlet Allocation,LDA)构建情感词典,基于要素进行情感分析,将评论所包含要素情感转化为评论是否包含积极或消极特征的0-1矩阵,得到结构化后的评论文本。
对评论-要素关系矩阵X
P12、将联合分析(Conjoint Analysis)模型应用于结构化后的评论与对应评论评分,通过如下步骤计算产品要素基于满意度的权重:
P121、所述联合分析模型为:
其中,y
P122、将上述联合分析模型计算得到的系数结果代入公式:
P2、获取用户购买记录及产品工艺参数,利用两阶段效用模型获得影响系数,利用构建的产品要素词典获得产品要素基于购买倾向的权重。用户的购买记录应包括用户基本个人信息(年龄、性别等)和购买的产品。
基于用户购买倾向的要素权重分析,其主要分析数据包括用户购买记录及产品工艺参数,其主要包括的处理过程有获取目标产品的用户购买记录及产品工艺参数,计算要素基于购买倾向的权重。
对于目标产品的用户购买记录及产品工艺参数,通过如下方式完成第二步中要素基于用户购买倾向的权重的计算。
P21、利用两阶段效用模型获得产品工艺参数对用户购买倾向的影响系数,对用户决定更换产品并购买某个新产品的过程进行建模。
模型第一阶段,用户对于旧产品的潜在效用由如下公式建模:
其中,
上述效用小于零时,用户做出更换产品的决策,用向量形式表示的概率质量函数为:
其中,Replace
利用一个多项Probit模型(Multinomial Probit Model)对用户第二阶段的选择进行建模。用户基于效用最大化准则进行产品选择,具体的,用户i将选择使其效用u
模型第二阶段,定义用户第二阶段效用和一个从选择集中随机选择的效用基准ui
为了便于计算u
其中,ε
用户的选择则表示为:
其中,Choice
对应的概率质量函数为:
其中,
利用两阶段效用方程共同估计
P22、利用一个相关关系矩阵将工艺参数对用户购买倾向的影响系数,转换为产品要素对用户购买倾向的影响权重。
包含的具体步骤为:
P221、进行要素-工艺参数间相关关系的模糊评价,评价由五级量表变量(非常弱,弱,中等,强,非常强)构成。五级量表变量由如下隶属函数定义:
其中,(l,m,u)分别对应(0,0,0.3),(0,0.25,0.5),(0.3,0.5,0.7),(0.5,0.75,1)和(0.7,1,1)。
P222、利用如下公式计算产品要素对用户购买倾向的影响权重:
其中,Weight
对于R
其中,R
P3、基于双权重模型,利用获得的产品要素基于满意度的权重和产品要素基于购买倾向的权重结果对产品要素进行分类,得到针对性的产品改进策略。
基于双权重模型的产品改进策略分析,具体含义为将第一、二步获得的两类权重结果汇总至双权重模型,对产品要素进行双维度下的分类,得到针对性的产品改进策略。
采用图形化的分类方法:双权重模型对产品要素进行分类,该模型横纵轴分别对应要素基于用户满意度、购买倾向的影响权重,按照二者的相似程度和高低水平分为四类,具体的分类基准计算公式为:
其中,X为横轴坐标,对应要素基于用户满意度的影响权重;Y为纵轴坐标,对应要素基于用户购买倾向的影响权重;α为相似度水平,是一个可调参数,产品制造商可以根据实际产品的改进需要对这个参数进行调整。
具体的分类特征及对应的产品改进策略分别为:
类别I:该类要素对于用户购买倾向和满意度都非常重要,是产品的核心功能。它们的性能影响着产品的口碑,差异化程度决定了产品的市场竞争力。通过改进产品功能,公司可以提高用户的购买效用和使用后的满意度。但是,如果功能没有得到适当的改进,则会大幅降低用户的购买意愿和满意度。因此,改变这些功能存在很高的风险,提高这些功能的性能比追求创新更安全。
类别II:该类要素对购买倾向比对满意度影响更大。用户希望购买与竞争产品在这些要素上存在差异的产品。而在产品使用后的整体评价中,这些特点在一定程度上被忽略。反之,不成功的产品功能创新则不会降低用户满意度。我们认为基于这些功能的创新是低风险的,这与类别I有很大不同。因此,公司可以在这些要素上创新,以扩大与竞争产品的差距,并吸引用户进行购买。在这些要素上的创新具有有利的风险收益比。
类别III:该类与类别I的特征完全相反,类别III的要素对购买意向和满意度均不重要。为了更好地控制整体成本并获得更好的收益,公司可以减少对这些功能的投资,甚至寻求成本优化的替代方案。
类别IV:该类要素对满意度比对购买意向影响更大。用户在购买时无法感知或不关心这些要素上的差异,而只关心在使用产品时的实际表现。如果表现不能达到他们的预期,从长远来看,将影响产品的声誉,进而影响品牌的未来发展。公司应该投资提高这些功能的整体质量,以保持和提高用户满意度,而不是着力于创新。
下面根据本发明的用于产品改进策略制定的用户需求分析流程,给出以手机市场为分析对象的实施例。
所使用的在线评论和用户购买记录分别来自某大型电商平台各手机品牌旗舰店和某主要通信运营商。第一部分提取的产品要素词典,包含22类产品要素,如下表(1)所示。
表(1)手机产品要素词典
根据产品要素词典,对实施例中的28,198条评论进行结构化,得到的结构化的在线评论如表(2)所示。
表(2)结构化的在线评论
将结构化后的评论和对应评论评分,代入联合分析模型
表(3)要素及对用户满意度的影响权重
第二部分中实施例所获得的数据如下表(4)所示。
表(4)用户及产品属性数据的统计值
图3是根据本发明实施例的两阶段效用模型的示例图。如图3所示,用户更换手机的决策分为两个阶段,第一阶段是对于已拥有旧手机的效用判断,如果当前手机已经无法提供一个正的效用,则用户将更换手机;第二阶段代表了用户在市场中进行的选择,在市场提供的竞争产品中,选择效用最大的购买。根据用户的购买记录,用户两阶段的决策、用户的属性和手机的各项属性为已知项,代入两阶段效用模型,并利用马尔可夫蒙特卡洛(MCMC)方法,求解得到工艺参数对购买倾向的影响系数,如表(5)所示。
表(5)工艺参数对购买倾向的影响系数
进一步,利用
表(6)要素及对用户购买倾向的影响权重
图4为根据本发明实施例的双权重模型分类示例图。如图4所示,双权重模型将所有产品要素分为四类,代表对用户满意度和购买倾向影响程度不一的四类需求。将实施例中计算得到的表(3)和表(6)的结果代入模型,得到图5的结果。
图5为根据本发明实施例对应的产品要素基于双权重模型的分类结果。如图所示,本实施例中手机产品对应的22类产品要素被按照对应对满意度和购买倾向的影响权重分到四类。企业可以按照此分类结果,全面且具体地制定对应的产品改进策略。
本发明所构建全部的数据分析流程,用伪代码的形式展示,如表(7)所示。
表(7)数据分析流程伪代码
本发明方法解决了用户在购买的不同阶段的偏好差异,数据分析结果全面,通过综合用户的在线评论和购买记录的用户需求分析为产品制造商提供产品改进指导,通过综合的数据使用和系统的数据分析,对企业产品改进策略制定提供了支撑,为一种可行的产品改进策略的用户需求数据分析方法。
本发明并不局限于上述实施例,在本发明公开的技术方案的基础上,本领域的技术人员根据所公开的技术内容,不需要创造性的劳动就可以对其中的一些技术特征作出一些替换和变形,这些替换和变形均在本发明的保护范围内。
机译: 基于义务积分项目分类代码的产品需求/供应连接网络服务方法以及一种能够基于用户需求的物品供应系统来提供需求/供应连接网络的系统
机译: 在计算机中实现的用于识别井的设施中的地面区域的方法,用于分析至井的设施的多维数据的方法,用于获取侧壁的缓冲区的样本的方法以及计算机程序产品,系统用于在井的安装中识别地面区域的Ma数据处理。数据处理系统,计算机程序产品和用于对井的安装进行多维数据分析的数据处理系统
机译: 将一种或多种成分施用于多种种子的方法,种子处理操作期间的湿度和温度控制方法,种子处理产品的开发方法,具有一种或多种种子处理产品的生产工厂中的种子处理方法,环境受控种子处理系统,以在生产场所或测试场所处理种子,在种子生产设施中用于将处理过的种子输送到种子的方法,该方法用于将种子处理产品应用于生产工厂中的多种玉米种子的方法,作物产量增强方法,种子生产设施中用于处理生产者的种子的环境控制种子处理系统以及在预定环境条件下评估处理产品种子性能的方法