首页> 中国专利> 一种主题公园感知价值评估方法

一种主题公园感知价值评估方法

摘要

本发明属于资源价值评估技术领域,涉及一种主题公园感知价值评估方法,包括步骤1:构建主题公园感知价值评估指标体系;步骤2:获得有效评论数据;步骤3:获得特征词表;步骤4:特征句提取,确定评估指标的权重赋值;步骤5:将特征句作为训练集数据训练LSTM模型;步骤6:针对测试主题公园,根据步骤2‑步骤5,获得特征句;将特征句作为测试集数据输入LSTM模型,获得评估指标均值;步骤7:通过灰色关联分析,对各项指标的灰色关联度值进行排序,判别影响主题公园感知价值的指标因素。本发明优化了以往传统评价模型中评估指标过于主观、不容易量化等缺点,适用于研究网络平台环境下评论数据规模繁多等问题。

著录项

  • 公开/公告号CN113298367A

    专利类型发明专利

  • 公开/公告日2021-08-24

    原文格式PDF

  • 申请/专利权人 北京信息科技大学;

    申请/专利号CN202110515761.0

  • 申请日2021-05-12

  • 分类号G06Q10/06(20120101);G06Q30/02(20120101);G06Q50/14(20120101);G06F40/216(20200101);G06F40/289(20200101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11392 北京卫平智业专利代理事务所(普通合伙);

  • 代理人闫萍

  • 地址 100192 北京市海淀区清河小营东路12号

  • 入库时间 2023-06-19 12:19:35

说明书

技术领域

本发明属于资源价值评估技术领域,涉及一种主题公园感知价值评估方法,尤其涉及一种基于LSTM(长短期记忆人工神经网络)细粒度情感分析-灰色关联分析的主题公园感知价值评估方法。

背景技术

主题公园是依据一个类似的或一系列的主题设计,融合了景观、环境、游乐设施、表演和展览等内容的综合性休闲娱乐场所,是人为创造的一类具有创意性游园线索和策划性活动方式的旅游资源,体现了人们对于休闲和娱乐偏好的重视程度。这对落实国家旅游发展战略、提升人民生活质量起到积极作用。主题公园在发展过程中也出现了许多问题:主题公园在运营周期内存在着过度竞争、盲目投资和重游率低等现实问题,要使主题公园持续发展,需要准确了解市场动态、突出科技和文化主题和树立良好的品牌形象。故主题公园的价值评估问题是当下研究的热点问题,也是衡量主题公园发展水平的重要参考标准。主题公园是体验模式下的服务产品,研究其价值的基础即是游客的具体体验感受,如何客观精准地衡量评估主题公园的服务价值,是当今主题公园走向转型发展的必要途径,更是第三方机构进行质量监管和促进旅游市场良性竞争的重要参考指标。

随着情感分析问题的深入研究,人们逐渐从机器学习的方法过渡到深度学习上,基于朴素贝叶斯和支持向量机等浅层学习算法的实现相对较简单,无法表达复杂的函数。而计算机技术的飞速发展使得深度学习方法不断被应用在情感分析领域,并且在处理中文文本信息时有着很好的效果。但由于学习层数的增加会导致梯度消失、爆炸和过拟合等现象,利用LSTM模型的语义分析能力和学习能力能够有效地解决这个问题。以往主题公园价值评估的研究模型多为粗粒度级别的情感分析,鉴于此,本申请提出基于细粒度情感分析模型评估主题公园的感知价值,采用方特东方神画主题公园作为实证对象,以游客评论作为数据支撑,使用灰色关联法对模型结果进行验证,可对主题公园整体系统的规划、景区管理以及树立良好的品牌形象等方面有着指导意义。

发明内容

针对现有技术中存在的缺陷,本发明的目的在于提供一种基于LSTM细粒度情感分析的主题公园感知价值评估方法,构建了基于LSTM细粒度情感分析的主题公园感知价值评估的内容资源价值评估模型。

为达到以上目的,本发明采取的技术方案如下:

一种主题公园感知价值评估方法,所述主题公园感知价值评估方法基于LSTM细粒度情感分析,包括以下步骤:

步骤1:构建基于LSTM细粒度情感分析的主题公园感知价值评估指标体系;

步骤2:抓取游客评论数据,并进行数据清洗与筛选,获得有效评论数据;

步骤3:对有效评论数据进行分词;提取关键词;得到候选特征词;获得主题公园感知价值特征词表;

步骤4:提取特征句,确定主题公园感知价值评估指标的权重赋值;

步骤5:利用特征句数据训练LSTM模型;

步骤6:针对测试主题公园,根据步骤2-步骤5,获得隐式特征句;将获得的隐式特征句数据输入训练后的LSTM模型,获得主题公园感知价值评估指标值;

所述主题公园感知价值为:各主题公园感知价值评估指标值的加权求和;

所述加权的权重为:相应的主题公园感知价值评估指标的权重赋值;

步骤7:通过灰色关联分析,对主题公园感知价值评估指标体系中各项指标的灰色关联度值进行排序,以此判别主题公园感知价值评估的关键影响因素。

在上述技术方案的基础上,所述步骤1的具体步骤为:以感知综合观为研究基础,结合情感、认知和行为等多重视角,依据主题公园的现实场景对游客的整体体验感受,从游客的感知价值构成由感知属性决定出发,进而延伸出新的价值构成;

所述感知属性包括:社会参与性、娱乐性、安全性和个性化;

所述新的价值构成包括:精神价值、品牌价值和文化价值;

从游客的情感视角,将主题公园的感知价值的实现分为三个层面,即所述主题公园感知价值评估指标体系包括:精神契合价值、品牌契合价值和文化契合价值;

所述精神契合价值、品牌契合价值和文化契合价值属于一级指标;

所述精神契合价值从游客自身真实体验感受角度出发,包括以下二级指标:项目感受性与服务意识性;

所述品牌契合价值是主题公园提供给游客的基本出游保障,在游客形成品牌认可的过程中起到了至关重要的作用,包括以下二级指标:设施完善性、景观规划性与附加消费力;

所述文化契合价值是对主题公园的综合评判,是对继承及创新内容和方式的高度要求,包括以下二级指标:主题契合性与文化传播性。

在上述技术方案的基础上,所述项目感受性是指:游客对游乐、演艺项目的真实体验感受;

所述服务意识性是指:主题公园内部员工的服务意识、态度及水平;

所述设施完善性是指:主题公园的外部交通、内部配套设施是否便捷和人性化;

所述景观规划性是指:主题公园的景观建筑和环境绿化是否有特色;

所述附加消费力是指:游客在主题公园内的餐饮消费和评价、以及文化衍生品消费等;

所述主题契合性是指:主题公园的整体特色的契合度;

所述文化传播性是指:游客在游玩过程中对传统文化历史的理解学习和收获以及传播方式、范围的广泛性。

在上述技术方案的基础上,所述步骤2的具体步骤为:以权威旅游出行app上的消费者评价为基础,通过网络爬虫技术抓取游客的身份ID(身份标识号)、游客评论、评分等级以及评价时间等数据,并对获取到的游客评论进行如下辨别和筛选:如果存在“此用户没有填写评论”、“评价方未及时做出评价,系统默认好评”等的平台默认的评论信息,则将上述游客评论数据当做评论冗余值删除;如果存在重复数据,则删除多余评论,只留下一条有效评论数据。

在上述技术方案的基础上,所述权威旅游出行app包括:携程和去哪儿网等。

在上述技术方案的基础上,所述步骤3的具体步骤为:

首先使用jieba(结巴)工具对有效评论数据进行分词,获得所有有效评论数据的词条;

然后利用TF-IDF(词频-逆文档频率)算法提取关键词,具体是:利用公式(1)、(2)和(3)进行计算,

其中,TF

其中,IDF为逆向文件频率;若包含某词条的有效评论数据的数量越少,则表明其IDF越大,说明该词条具有很好的类别区分能力;

TFIDF=TF

其中,TFIDF为:词频-逆文档频率;筛选TFIDF的数值高的词条作为关键词(例如筛选TFIDF的数值大于20的词条作为关键词);上述筛选倾向于过滤掉常见的词语,保留相对重要的词语;

再用Counter库对关键词进行词频统计,得到候选特征词(即特征词候选词);

所述Counter库是python中的一个库,属于字典的子类,元素被存储为字典的关键字,而关键字出现的次数被存储为相应的数值;

最后,根据主题公园感知价值评估指标体系,经过人工筛选辨别,对候选特征词进行分级分类后,得到主题公园感知价值特征词表。

在上述技术方案的基础上,所述二级指标设施完善性的特征词包括:优惠、服务、管理、设备、交通、电动车、人性化、插队、基础设施、排起长队、等待时间、节省时间、方便、优惠、卫生和规划;

所述二级指标景观规划性的特征词包括:环境、还好、木质、风景、景色、环境优美、建筑风格、细节、一流、时尚、用心、风俗、值得一看、很漂亮和景观设计;

所述二级指标附加消费力的特征词包括:失望、划算、购买、性价比、超值、味道、实惠、好评、套餐、口味、欠佳、饭菜、胃口、死咸、食材、美食街、真棒、推荐、便宜、还好、尽兴、挺不错、不贵、合理和性价比高;

所述二级指标项目感受性的特征词包括:排队、好玩、适合、刺激、开心、梦幻、值得、喜欢、震撼、好看、穿越、科技、满意、逼真、故事、还好、技术、盛宴、精彩、设计、很漂亮、挑战、过瘾、现代科技、享受、超赞、期待、垃圾、生动、穿梭、害怕、吓人、解压、科技含量、画面感、科幻、冲击、超爽、视觉效果、参与感、奇幻、童话世界、艺术、遨游、科技进步、人太多、挺好玩、遗憾、高科技、惊魂、身临其境、愉快、仙境、舞台效果、新体验和激动人心;

所述二级指标服务意识性的特征词包括:服务好、态度、热情、服务到位、超好、员工素质、人员素质、态度恶劣和棒棒;

所述二级指标主题契合性的特征词包括:中国、神话、神韵、传统、华夏、元素、古色古香、文化底蕴、民族、风格、古典、民族特色、文化氛围、主题鲜明、主题、经典和灵魂;

所述二级指标文化传播性的特征词包括:文化、游乐、特色、结合、历史、意义、教育、知识、熏陶、激励、回忆、纪念、寓教于乐、学知识、小朋友、孩子、老人、大人、游客、家人、情侣、男朋友、女朋友、亲子、小姐姐、圣诞节、朋友、同学、老婆、对象、妹妹、哥哥、室友、老公、女儿、女票、盆友、闺女、闺蜜和全家;

由于在线评论的主观性较强,所述特征词表示的含义不太确定,所以某些特征词可能会同时归在多个指标分类中。

在上述技术方案的基础上,所述特征句包括:显示特征句和隐式特征句;

步骤4的具体步骤为:

第一步,显式特征句提取;

所述显式特征句提取是指:将所有有效评论的词条进行逐词遍历,并与主题公园感知价值特征词表进行比对,将匹配到的特征词作为该词条所在有效评论的特征属性,同时将具有特征属性的有效评论提取出来,作为显式特征句;

再利用StandfordCore NLP平台对提取到的显式特证句进行依存句式分析,提取所述显式特征句的修饰词;

提取所述显式特征句的修饰词具体步骤是:对显式特征句的词条进行逐词遍历,并与HowNet情感字典的修饰词进行比对,将匹配到的修饰词作为该词条所在显式特征句的修饰词;

所述HowNet情感字典包括:形容词、名词、动词、副词及它们的组合;

针对匹配到修饰词的显式特征句,进行以下处理:

将所述显示特征句的特征词作为主导词,显示特征句的修饰词作为情感词,构建“属性特征-情感词”对,进而得到“属性特征-情感词-属性情感词对权重”;

所述属性特征为:主导词;

将所述属性情感词对权重记为:SQ,按照公式(4)计算,

第二步:隐式特征句提取;

针对没有匹配到特征词的特征句,对其词条进行逐词遍历,并与HowNet情感字典的修饰词进行比对;

当所述没有匹配到特征词的特征句没有匹配到修饰词时,将此条特征句删除;

当所述没有匹配到特征词的特征句匹配到修饰词时,将匹配到的修饰词作为该词条所在特征句的修饰词,将修饰词作为情感词;

然后,根据前述公式(4)计算的“属性特征-情感词-属性情感词对权重”,以没有匹配到特征词的特征句中的情感词为依据,选取属性情感词对权重最大的属性特征作为没有匹配到特征词的特征句的特征词;

将上述获得特征词的没有匹配到特征词的特征句作为隐式特征句;

Standford NLP平台是一个自然语言处理工具包,其集成了很多非常实用的功能,包括分词、词性标注和句法分析等;Standford NLP平台不是一个深度学习框架,而是一个已经训练好的模型,可以类比为一个软件;stanford NLP平台用Java语言编写,有python接口;

所述一条评论句为:一条有效的游客评论;

针对有效评论数据,确定指标权重,具体方法如下所述:

主题公园感知价值评估指标的权重赋值包括:一级指标权重赋值和二级指标权重赋值;

所述一级指标权重赋值按公式(5)计算,

其中,YC1为:一级指标特征词在有效评论数据中的出现次数,ZC为:所有特征词在有效评论数据中的出现次数;

所述二级指标权重赋值按公式(6)计算,

其中,EC为:二级指标特征词在有效评论数据中的出现次数,YC2为:二级指标所属的一级指标特征词在有效评论数据中的出现次数。

在上述技术方案的基础上,所述步骤5的具体步骤为:

步骤51:针对上一步提取到的特征句,人工对每一个特征句进行情感极性标注;

所述情感极性标注为:正向情感记为1,负向情感记为-1,中性情感记为0;

步骤52:利用word2vec将特征句转化为词向量;

将所述词向量、特征句对应的特征词、特征句对应特征词所属二级指标、特征句对应特征词所属一级指标和特征句对应的情感极性标注作为:特征句数据;

步骤53:将所述特征句数据分为训练集数据和测试集数据;

步骤54:将训练集数据和测试集数据的数量比例设置为4:1,利用训练集数据经过多次实验测试后,确定LSTM模型的超参数,以便于后续LSTM模型进行情感识别训练;利用测试集数据测试LSTM模型;

所述LSTM模型输出所述感知价值评估指标体系中各二级指标项的情感值。

在上述技术方案的基础上,所述LSTM模型的超参数设置如下:激活函数为tanh函数;词向量维度值设为100;数据批处理量为32,即每次选用32个样本作为输入;窗口大小为7;训练周期为4;迭代次数为1;神经元丢弃率为0.5,即神经元暂时从网络中丢弃以减弱神经元节点间的联合适应性的概率为0.5。

在上述技术方案的基础上,在训练好LSTM模型后,对于检测实验结果的评价指标采用精确率、召回率和F1值表示,

所述精确率是指:针对预测结果而言,模型分类的准确性;

所述召回率则是指:针对原样本而言,正确分类所占的比例;

所述F1值为:对精确率和召回率进行的综合评价。

在上述技术方案的基础上,所述步骤7的具体步骤为:

采用灰色关联分析分别计算各项二级指标子序列与母序列的灰色关联度;

假设通过百度指数数据分析平台获取m个主题公园的百度搜索指数;

所述评分母序列为:m个主题公园的百度搜索指数;

每个二级指标的m个主题公园的情感值形成一个二级指标子序列;

所述各二级指标子序列为:m个主题公园形成的7个二级指标的情感值序列,

运用“均值化法”对所述各二级指标子序列与评分母序列做无量纲化操作,具体是按照式(7)计算,

其中,x'(k)为:各二级指标子序列或评分母序列中第k个元素的原始值;x(k)为:各二级指标子序列或评分母序列中第k个元素经均值化后的值;然后,按照公式(8)和(9)分别计算出每个二级指标子序列与评分母序列的灰色关联系数ξ

其中,|x

灰色关联系数的具体计算步骤为:首先固定评分母序列中的第j个元素,然后利用二级指标子序列中的所有元素与上述第j个元素,按照公式(8)计算一个灰色关联系数;以此类推,更换评分母序列中的元素,计算出m个灰色关联系数;按照公式(9)计算所述m个灰色关联系数的平均值,作为相应二级指标与评分母序列的灰色关联度;

通过灰色关联分析,对灰色关联度的大小进行排序,以此判别主题公园感知价值评估的关键影响因素。

本发明的有益技术效果如下:

1、本申请基于游客视角,构建了包括3个一级指标和7个二级指标的主题公园感知价值评估指标体系,充分考虑感知价值对游客精神契合价值、主题公园品牌契合价值以及社会文化契合价值的意义。另外,指标体系具有更好的系统性及层次性,体现了感知价值研究对于文旅融合发展的意义;

2、针对主题公园及其服务的高情感和高传播的特征,采用LSTM细粒度情感分析的感知价值评估模型。优化了以往传统评价模型中评估指标过于主观和不容易量化等缺点,适用于研究网络平台环境下评论数据规模繁多等问题;

3、论证了本文所述的主题公园感知价值的影响因素,针对模型构建的感知质量评估指标体系较以往研究更有系统性,对之后感知质量的详细探索提供一定价值参考;

4、对主题公园日常运营具有一定的指导意义,日后可根据实际需要扩展应用场景,参考优秀主题公园运营管理中的成功经验,进一步优化系统,在提升公园管理水平背后提供更有效的理论支撑。

附图说明

本发明有如下附图:

图1本发明所述主题公园感知价值评估方法的流程示意图。

图2本发明所述实施例的基于LSTM细粒度情感分析的主题公园感知价值评估流程示意图。

具体实施方式

以下结合附图对本发明做进一步详细说明。

如图1-2所示,本发明所述的基于LSTM细粒度情感分析的主题公园感知价值评估方法,包括以下步骤:

步骤1:以感知综合观为基础,分析主题公园感知价值的影响因素,构建基于LSTM细粒度情感分析的主题公园感知价值评估指标体系,即如图1所示的:基于游客情感视角构建指标体系;

步骤2:抓取游客评论数据,并进行数据清洗与筛选,获得有效评论数据,即如图1所示的:抓取游客评论数据并进行清洗;

步骤3:对有效评论数据进行分词;提取关键词;得到候选特征词;获得主题公园感知价值特征词表,即如图1所示的:利用jieba、TF-IDF算法得到特征词表,后续有详细描述;

步骤4:提取特征句,确定主题公园感知价值评估指标的权重赋值,即如图1所示的:确定指标权重;

步骤5:利用特征句训练LSTM模型,即如图1所示的:使用LSTM模型进行情感分析训练;

步骤6:针对测试主题公园,根据步骤2-步骤5,获得隐式特征句;将获得的隐式特征句数据输入训练后的LSTM模型,获得主题公园感知价值评估指标值;

所述主题公园感知价值为:各主题公园感知价值评估指标均值的加权求和;

所述加权的权重为:相应的主题公园感知价值评估指标的权重赋值的;

步骤7:通过灰色关联分析,对主题公园感知价值评估指标体系中各项指标的灰色关联度值进行排序,以此判别主题公园感知价值评估的关键影响因素。

所述步骤1的具体步骤为:感知价值内涵自身所存在的共性特点为本研究提供了前提,以感知综合观为研究基础,结合情感、认知和行为等多重视角,依据主题公园这一现实场景对游客的整体体验感受,此时游客的感知价值构成由感知属性(包括:社会参与性、娱乐性、安全性和个性化)决定,进而延伸出新的价值构成(包括:精神价值、品牌价值和文化价值)。

鉴于此,本文以主题公园为对象,从游客的情感视角,将主题公园的感知价值的实现分为三个层面:精神契合价值、品牌契合价值和文化契合价值。

然后对于这三个维度构建包括3个一级指标和7个二级指标的主题公园感知价值评估指标体系。

所述步骤2的具体步骤为:考虑到当今互联网平台的使用规模和信息技术数字化的趋势,携程、去哪儿网的用户数量庞大,是当下使用率最高的线上旅游平台,并且平台开放性高,用户可以随时随地发表评价,传达自己的经历和情感。所以,以权威旅游出行app上的消费者评价为基础,通过网络爬虫技术收集携程、去哪儿网提供的芜湖、宁波、济南、长沙以及厦门五处的“方特东方神画主题公园”中游客的身份ID(身份标识号)、游客评论、评分等级以及评价时间等数据。并对获取到的游客评论进行辨别和筛选:如果存在“此用户没有填写评论”、“评价方未及时做出评价,系统默认好评”等的平台默认的评论信息,则将上述游客评论数据当做评论冗余值删除;如果存在重复数据,则删除多余评论,只留下一条有效数据,经过筛选清洗后共剩余13210条有效数据,最终的数据抓取情况如表1所示。

表1游客评论数据爬取情况

上述步骤即如图2所示的数据清洗与筛选:对游客评论数据进行数据清洗和文本去重,获得有效评论数据。

所述步骤3的具体步骤为:

首先使用jieba(结巴)工具对有效评论数据进行分词,获得所有有效评论数据的词条;

然后利用TF-IDF(词频-逆文档频率)算法提取关键词,具体是:利用公式(1)、(2)和(3)进行计算,

其中,TF

其中,IDF为逆向文件频率;若包含某词条的有效评论数据的数量越少,则表明其IDF越大,说明该词条具有很好的类别区分能力;

TFIDF=TF

其中,TFIDF为:词频-逆文档频率;筛选TFIDF的数值高的词条作为关键词(例如筛选TFIDF的数值大于20的词条作为关键词);上述筛选倾向于过滤掉常见的词语,保留相对重要的词语。

再用Counter库对关键词进行词频统计,从而得到候选特征词(即特征词候选词)。

所述Counter库是python中的一个库,属于字典的子类,元素被存储为字典的关键字,而关键字出现的次数被存储为相应的数值。

最后,根据主题公园感知价值评估指标体系,经过人工筛选辨别,对候选特征词进行分级分类后,得到主题公园感知价值特征词表,如表2所示。

表2主题公园感知价值特征词表

由于在线评论的主观性较强,所述特征词表示的含义不太确定,所以某些特征词可能会同时归在多个指标分类中。

所述特征句包括:显示特征句和隐式特征句;

所述步骤4的具体步骤为:

第一步,显式特征句提取;

所述显式特征句提取是指:将所有有效评论的词条进行逐词遍历,并与主题公园感知价值特征词表进行比对,将匹配到的特征词作为该词条所在有效评论的特征属性,同时将具有特征属性的有效评论提取出来,作为显式特征句;

再利用StandfordCore NLP平台对提取到的显式特证句进行依存句式分析,提取所述显式特征句的修饰词;

提取所述显式特征句的修饰词具体步骤是:对显式特征句的词条进行逐词遍历,并与HowNet情感字典的修饰词进行比对,将匹配到的修饰词作为该词条所在显式特征句的修饰词;

所述HowNet情感字典包括:形容词、名词、动词、副词及它们的组合;

针对匹配到修饰词的显式特征句,进行以下处理:

将所述显示特征句的特征词作为主导词,显示特征句的修饰词作为情感词,构建“属性特征-情感词”对,进而得到“属性特征-情感词-属性情感词对权重”,简称特征-情感词汇-权重赋值,如图2所示;

所述属性特征为:主导词;

将所述属性情感词对权重记为:SQ,按照公式(4)计算,

第二步:隐式特征句提取;

针对没有匹配到特征词的特征句,对其词条进行逐词遍历,并与HowNet情感字典的修饰词进行比对;

当所述没有匹配到特征词的特征句没有匹配到修饰词时,将此条特征句删除;

当所述没有匹配到特征词的特征句匹配到修饰词时,将匹配到的修饰词作为该词条所在特征句的修饰词,将修饰词作为情感词;

然后,根据前述公式(4)计算的“属性特征-情感词-属性情感词对权重”,以没有匹配到特征词的特征句中的情感词为依据,选取属性情感词对权重最大的属性特征作为没有匹配到特征词的特征句的特征词,即图2所示的识别隐式特征;

将上述获得特征词的没有匹配到特征词的特征句作为隐式特征句;

Standford NLP平台是一个自然语言处理工具包,其集成了很多非常实用的功能,包括分词、词性标注和句法分析等;Standford NLP平台不是一个深度学习框架,而是一个已经训练好的模型,可以类比为一个软件;stanford NLP平台用Java语言编写,有python接口;

所述一条评论句为:一条有效的游客评论;

针对有效评论数据,确定指标权重,具体方法如下所述:

主题公园感知价值评估指标的权重赋值包括:一级指标权重赋值和二级指标权重赋值;

所述一级指标权重赋值按公式(5)计算,

其中,YC1为:一级指标特征词在有效评论数据中的出现次数,ZC为:所有特征词在有效评论数据中的出现次数;

所述二级指标权重赋值按公式(6)计算,

其中,EC为:二级指标特征词在有效评论数据中的出现次数,YC2为:二级指标所属的一级指标特征词在有效评论数据中的出现次数。

具体权重赋值计算结果如表3所示,

表3权重赋值计算结果

所述步骤5的具体步骤为:

步骤51:针对上一步提取到的特征句,人工对每一个特征句进行情感极性标注;

所述情感极性标注为:正向情感记为1,负向情感记为-1,中性情感记为0;

步骤52:利用word2vec将特征句转化为词向量;

将所述词向量、特征句对应的特征词、特征句对应特征词所属二级指标权重赋值、特征句对应特征词所属一级指标权重赋值和特征句对应的情感极性标注作为:特征句数据;

步骤53:将所述特征句数据分为训练集数据和测试集数据;

步骤54:将训练集数据和测试集数据的数量比例设置为4:1,利用训练集数据经过多次实验测试后,确定LSTM模型的超参数,以便于后续LSTM模型进行情感识别训练;利用测试集数据测试LSTM模型,即图2所示利用实证数据测试LSTM模型;

所述LSTM模型输出所述感知价值评估指标体系中各二级指标项的情感值;训练好的LSTM模型也称为情感分析模型。

所述LSTM模型利用keras库进行情感识别训练;

所述keras库是一个由Python编写的开源人工神经网络库,可以作为Tensorflow、Microsoft-CNTK和Theano的高阶应用程序接口,进行深度学习模型的设计、调试、评估、应用和可视化。

所述LSTM模型的超参数设置如下:激活函数为tanh函数;词向量维度值设为100;数据批处理量为32,即每次选用32个样本作为输入;窗口大小为7;训练周期为4;迭代次数为1;神经元丢弃率为0.5,即神经元暂时从网络中丢弃以减弱神经元节点间的联合适应性的概率为0.5。

在训练好LSTM模型后,对于检测实验结果的评价指标采用精确率、召回率和F1值表示,

所述精确率是指:针对预测结果而言,模型分类的准确性;

所述召回率则是指:针对原本样本而言正确分类所占的比例;

所述F1为:对精确率和召回率进行的综合评价;

精确率、召回率和F1的值分别是:89.70%、85.83%和87.23%。

针对步骤6,将五所城市方特东方神画主题公园的评论数据处理后,输入到已训练好的LSTM模型中,得到各个指标项的情感值均值(即每个感知价值评估指标体系中二级指标项的情感值)如表4所示。

表4样本主题公园的评价指标情感值

依据指标权重计算出每个所在地方特公园的感知价值(加权总分值)=0.584*(0.786*“项目感受性”+0.214*“服务意识性”)+0.240*(0.695*“设施完善性”+0.115*“景观规划性”+0.190*“附加消费力”)+0.176*(0.395*“主题契合性”+0.605*“文化传播性”),其结果(为保证数据可观性及权威性,保留小数点后三位有效数字)如表5所示,表5样本主题公园感知价值的加权总分值

百度是全球最大的中文搜索引擎,经过多年发展,基于海量网民的搜索行为数据,推出了百度指数数据分析平台,在平台里可以进行趋势分析、需求图谱和人群画像等操作,进而清晰地了解时事热点、网民的兴趣需求以及用户特征背后的深层原因。

所以,取厦门、宁波、芜湖与济南四处方特主题公园的2019年搜索指数为母序列,指标体系中的各指标情感值(即各项二级指标项的均值)为子序列,进行灰色关联分析,得到的指标灰色关联度结果进行排序:附加消费力(0.727)>设施完善性(0.722)>主题契合性(0.712)>景观规划性(0.711)>文化传播性(0.709)>项目感受性(0.692)>服务意识性(0.444)。

综上可知各因素对主题公园感知价值的关联程度大小排序为附加消费力>设施完善性>主题契合性>景观规划性>文化传播性>项目感受性>服务意识性。对感知价值关联程度最大者为附加消费力,可见景区内部带动消费的能力很强,最小为服务意识性,关联度仅为0.444,说明主题公园感知价值评估的过程中,游客对于园区服务意识的要求占比相对于其他指标来说较低。

以上所述仅为本发明的优选实施例,并不用以限制本发明,凡在本发明的形式和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

本说明书中未做详细描述的内容属于本领域专业技术人员公知的现有技术。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号