基于Apriori算法的大学生选择旅游景点的研究分析
Research and Analysis of College Students’ Selection of Tourist Attractions Based on Apriori Algorithm
DOI: 10.12677/MM.2024.142033, PDF, HTML, XML, 下载: 30  浏览: 72  科研立项经费支持
作者: 曹青青, 胡贵育, 霍奥莉, 刘思雨, 汤佳婧:河南科技大学商学院,河南 洛阳
关键词: Apriori算法旅游景点因子分析法层次分析法Apriori Algorithm Tourist Attractions Factor Analysis Hierarchical Analysis
摘要: 大学生作为旅游行业消费群体的主力军,其对旅游景点的选择极大地影响着旅游业的发展。本文基于Apriori算法,对近几年大学生对旅游景点特征组合选择的关键因素进行了研究。文章首先使用因子分析法提取了五个主要因素,其次将处理后的数据通过Apriori算法提取关联特征,然后使用层次分析法寻找权重占比较高的因素。根据实验得出的重要因素,最终找到影响大学生选择旅游景点的三个主要因素为民俗、物价和曝光度。
Abstract: As the main force of consumer groups in the tourism industry, college students’ choice of tourist attractions greatly affects the development of tourism. Based on Apriori algorithm, this paper researches the key factors of college students’ choice of feature combinations for tourist attractions in recent years. The article firstly extracted five main factors using factor analysis, secondly extracted the associated features from the processed data by Apriori algorithm, and then used hierarchical analysis to find the factors with higher weight share. According to the important factors derived from the experiment, the three main factors affecting college students’ choice of tourist attractions were finally found to be folklore, price and exposure.
文章引用:曹青青, 胡贵育, 霍奥莉, 刘思雨, 汤佳婧. 基于Apriori算法的大学生选择旅游景点的研究分析[J]. 现代管理, 2024, 14(2): 253-259. https://doi.org/10.12677/MM.2024.142033

1. 引言

据统计报告显示,2023年旅游市场消费持续增长明显,国内旅客数量呈现大幅度增长,国内128万家A级旅游景点逐渐对游客开放,占国内A级景区总数80%以上。据《2023年上半年国内旅游数据情况》显示,2023年上半年,旅游总人数高达23.84亿,国内旅游总人次同比增幅分别为63.9%,其中第一季度,国内旅游人数共12.16亿,第二季度国内旅游人数共11.68亿。在五一旅游高峰期,国内旅游人数合计274亿人,同比增长70.83%,是2019年同期的119.09% [1] 。

大学生正处于培养个人爱好、选择释放压力、提升自我阅历与价值的关键时期,在经过疫情三年封控后,高校大学生的社交与娱乐需求呈现出显著增长 [2] 。据文献调查显示,河南省72.25%的大学生表示需要进行外出旅游,对旅游抱有一定的期待 [3] 。在旅游业消费群体中,相比社会人员,大学生具有基数大、空闲时间长等特点,因此大学生消费群体已逐渐成为旅游业的重点关注对象,其对旅游景点的选择极大地影响着旅游行业的发展。在疫情期间,大学生旅游受到限制,某些学生甚至没有探索过学校所在城市周边的旅游景区,对外界有着强大好奇心的大学生极易受此影响,当旅游的好奇心被抑制时,其旅游需求得到不断的强化,从而驱使大学生参与到旅游发展中 [4] 。

2. 方法介绍

2.1. 层次分析法

层次分析法是由来自美国的运筹学家萨蒂(20世纪70年代初)提出的一种层次权重决策分析方法。该方法主要用于解决一个复杂的多因素系统决策问题,其首先将问题及解决方案分为目标层、准则层和方案层,其次通过定性的方法将问题分解为多指标的多个层次,形成一个多层次分析结构模型,最后通过定量的方法计算各方案的权重,利用权重排序,得出各方案的优劣次序 [5] 。

2.2. 因子分析法

因子分析法是由查尔斯–斯皮曼(1904年)提出的一种在多变量中提取综合因子的统计方法,在日常生活中,变量之间是不可能做到毫无关系的,当变量之间有一定的相关关系时,它将具有相关关系的变量利用正交变换综合为少数且独立的几个因子。以表现原有变量与因子之间的相互关系,讨论多个可直接获取数据的变量是受几个内在的独立因子影响,根据研究需要从中可以取出几个较少的综合因子尽可能地减少原始变量信息的丢失 [6] 。

2.3. Apriori算法

Apriori算法是由阿格拉沃尔等学者(1993年)提出的挖掘出布尔关联规则频繁项集的算法。Apriori算法利用频繁项集的先验知识,通过逐层搜索的迭代方法扫描数据集中的关系,最终形成大于最小支持度阈值的关联规则,其过程由连接和剪枝组成 [7] 。

3. 方案实施

3.1. 关键特征提取

通过在河南科技大学校内发放调查问卷,一定时间后我们收回了257份有效问卷,部分数据展示如表1所示,然后利用SPSS软件运用因子分析法,从影响大学生对旅游地点选择的因素:文化底蕴、曝光度、自然景观、口碑、交通出行、物价、服务与设施完善度、政策支持、地域标识、安全保障、民风民俗和休闲娱乐12个特征值中提取出了5个关键特征,通过将问卷选项与价值尺度评价表相对应,消除各数据之间的量纲,并通过正交旋转最大方差,使得这12个特征值有高负载的变量数目达到最小。结果显示,KMO值为0.885,可知特征值之间的相关性较强,适合做因子分析。

Table 1. Feature selection value table

表1. 特征选择价值表

Table 2. Component matrix after rotation

表2. 旋转后的成份矩阵

表2可知,根据相关系数矩阵计算累计方差贡献率和方差贡献率,第一个成分因子占所有因子方差的20.416%,前五个因子累计的方差贡献率为70.684%,能够反映出原始问卷中的大部分信息,故问卷信息失真较少,因子分析效果较为理想,具有实际研究意义,因此可以将提取出的5个关键特征作为本次研究的关键影响因素。其中,政策支持度、服务与设施完善度、安全保障、地域标识、曝光度位于第一个因子成分上,其主要表现为政策支持度、服务与设施完善度、安全保障,这些都是城市建设方面的内容,故取名为城市建设因子;自然景观、口碑、交通出行位于第二个因子成分上,主要为自然景观与口碑,因此取名为景观评价因子;物价、民风民俗位于第三个因子成分上,解释为物价与民风因子;交通出行、休闲娱乐位于第四个因子成分上,解释为出行与娱乐因子;文化底蕴位于第五个因子成分上,故解释为文化底蕴因子。综上所述,通过因子分析能够将这12个特征指标归类为以上5种关键因子。

3.2. 提取关键特征组合

围绕城市建设、景观评价、物价与民风、出行与娱乐、文化底蕴5个关键因子设计问卷,并在河南科技大学校内以及校外发放问卷,共收回了804份有效问卷,以此作为数据来源,对采集的数据进行预处理、筛选,将问卷选择结果以二分类数据进行转换,使用SPSS软件对数据进行Apriori算法,挖掘关联组合,部分数据如表3所示。

Table 3. Secondary classification data table

表3. 二分类数据表

注:若该项被选择则标记为T,反之标记为F。

Table 4. Correlation combination extraction results

表4. 关联组合提取结果

根据关联组合提取结果,设置最小支持度为20%,最小置信度为70%。见表4,以第1行为列,前项为文化底蕴、城市建设,后项为物价与民风的支持度为20.373%,置信度为78.659%,说明在804份数据中,有164份数据表明该规则同时发生,在文化底蕴、城市建设为前项的出现条件下,物价与民风出现的概率为78.659%。其中,第一列的支持度和置信度最高,说明文化底蕴、城市建设、物价与民风关键特征是大学生在选择旅游景点时较为关注的具有相互关联关系的关键特征组合。

3.3. 主要因素的确定

3.3.1. 建立AHP层次模型

Figure 1. Hierarchical structure model

图1. 层次结构模型

根据上文中的数据处理过程,将最初提出的影响大学生对旅游地点选择的12个因素进行关联组合,通过关键特征值的提取与因子分析结果,建立如图1的层次模型,下一步运用层次分析法得出旅游业应该着重从哪几个方面去提高自身,从而提升对大学生的吸引力。

3.3.2. 构建判断矩阵及计算

根据整理的第二次问卷数据,将影响因素进行两两比较并进行赋值,从而构造判断矩阵,对判断矩阵的数据使用归一化处理并进行一致性检验。

Table 5. Weights of indicators

表5. 各指标权重

注:C.I. < 0.1、C.R. < 0.1均通过一致性检验。

最终,得到各影响因素的指标权重,见表5,如表所示,通过计算各指标的权重值,其中民风民俗、物价、曝光度的权重分别为0.380、0.190、0.132,排名为前三,且权重占比均大于0.1,则表格结果可以说明在影响大学生对旅游景点选择的12个主要因素中民风民俗、物价和曝光度占据重要方面,因此可以说明在大学生选择旅游景点时的主要影响因素有民风民俗、物价和曝光度,故文旅行业可以从以上三个角度着重下手提出相应的改革政策,以提高旅游景点对大学生的吸引力。

4. 结论与建议

为找出影响大学生在选择旅游景点时的关键因素,本研究通过问卷调查得到研究数据,并通过关键特征组合的提取,成功构建层次结构模型,最终得出影响大学生选择旅游景点的三大因素分别为民风民俗、物价和曝光度。可知,大学生在旅游时会主要考虑景点的这三个方面是否达到他们的预期。

综上,通过对本项目的研究,能为一些正处于发展瓶颈的旅游相关行业带来一定的指导。旅游行业若想得到长远的发展,可以考虑从基数大的大学生群体入手,参考本项目研究得出的三大影响因素,从而对旅游景点的宣传和发展进行提高与完善。对此,旅游景点应正确处理好文化创新与民风民俗之间的关系,同时确保景区物价合理规范,加强景区运行的数字化营销,借文化兴起之势,在提高本地文化底蕴的同时,吸引更多高校学生走进景区。

4.1. 民俗方面的改进

互联网宣传能够从多方面提升旅游景点的市场竞争力,利用互联网优势提高旅游景点的曝光度。通过知名画家、博主等群体在社交媒体、旅游网站等平台打造独特的城市形象。以多方位、多方式的角度展示和吸引大学生眼球,明确城市定位,挖掘城市独特的文化内涵和个性。运用新媒体与传统媒体的同时,发动本地居民的力量,激发他们的认同感和自豪感,引导他们宣传城市代表性标签,在内容创作上进行创新,避免同质化宣传内容,如旅游景点推广策略、宣传用语等过于相似 [8] 。

4.2. 物价方面的改进

大学生外出旅游必然会考虑其经济情况以及当地物价,定价过高的景点周边及景区对于学生的吸引力不高。执行各种价格优惠政策是提高当地景区对大学生吸引力的有效措施之一,有利于直接提高景区周边的收益,促进景区发展 [9] 。同时,景区需要控制当地商品的品质,按照旅游商品市场发展制定合理的商品价格,景区管理者需要全面了解商品的进产销,明确商品的成本,制定适宜的价格战略 [10] 。

4.3. 曝光度方面的改进

针对曝光度的提升,景点首先要找到自身特殊性,比如特殊的地理位置、风俗习惯、景色和美食等等,然后挖掘自身文化底蕴,明确城市定位,丰富城市独特的文化内涵,打造一个独特的城市形象。其次要进行自我营销、合理利用互联网,要想通过网络提升曝光度,可以将传统内容年轻化、将严肃内容趣味化、将纪实内容戏剧化;媒体和文旅相互融合 [11] 。一个城市或景点是否能够“长红”,还要看能否持续曝光,首要任务就是发展经济。若想取得长期发展,我们必须首先审视自身。经济实力、人才储备、创新精神和丰富的文化底蕴,这些都是取得成功的基石 [12] 。

5. 结语

本研究通过问卷调查对大学生选择旅游景点的关键因素进行了分析,综合考虑了物价、文化、城市等多方面的影响因素,深入探讨了这些因素对大学生选择旅游景点的影响程度。综合分析的方法可以帮助我们全面地看待问题,不遗漏潜在的影响因素,从而有利于为行业提出具有针对性的建议。同时,通过因子分析和Apriori算法提取出这些因素中的主要因素,最后通过层次分析法抓取到关键因素,能够提出更有针对性的对策建议。这些研究使得本项目不仅为旅游行业提供了新的见解和证据,同时也为实践者提供了有价值的参考。

基金项目

河南省大学生创新创业训练计划创新重点项目《基于Apriori算法的疫情开放后大学生对旅游景点选择的研究分析》(项目编号:202310464072)。

参考文献

[1] 魏彪. 上半年国内旅游数据情况出炉旅游人次和收入实现大幅增长[N]. 中国旅游报, 2023-07-14(001).
[2] 索冰洁, 宋贞迪, 石晓雪, 等. “深度旅游 + 社交”模式影响因素以及发展路径解析[J]. 中国市场, 2023(9): 1-4.
[3] 梁留科, 钱宏胜, 陈德广. 河南高校大学生旅游市场初探[J]. 西北农林科技大学学报(社会科学版), 2007, 7(2): 77-80.
[4] 程思, 罗希. 大学生旅游: 既爱“走马打卡”也爱“沉浸体验” [N]. 中国青年报, 2023-04-28(006).
[5] 汪应洛, 主编. 系统工程[M]. 北京: 机械工业出版社, 2008: 122-131.
[6] 张文彤, 主编, 董伟, 副主编. SPSS统计分析高级教程[M]. 北京: 高等教育出版社, 2004: 245.
[7] 孟海东, 宋宇辰, 著. 大数据挖掘技术与应用[M]. 北京: 冶金工业出版社, 2014: 64.
[8] 高华. 互联网宣传对区域旅游市场竞争力的影响及对策研究[J]. 西部旅游, 2023(8): 94-96.
[9] 孙萃. 旅游饭店执行淡季优惠的探讨[J]. 科技视界, 2012(13): 59-60.
[10] 付英娟, 宋丹瑛. 旅游景区商品高物价对旅游业的发展影响分析[J]. 中国市场, 2020(11): 34-35+42.
[11] 李浩然. 如何利用媒体融合助力城市文旅宣传——以重庆广电为例[J]. 西部广播电视, 2020(12): 51-53.
[12] 张蕊, 周添舒. 多媒体视阈下的“网红城市”——以重庆为例[J]. 今传媒(学术版), 2021, 29(3): 51-53.