“统计软件”课程论文
题 目
学 院 专业名称 班 级 学 号 姓 名
国内旅游业发展及其预测
理学院 数学与应用数学
北京林业大学20 15--20 16 学年第 一 学期论文考试要求
课程名称: 统计软件 课程所在学院: 理学院 考试班级: 数学13-1,2 命题人: 杨晓霞
论文要求:
1、 论文题目(范围) 依据个人兴趣, 在世界银行网站,国家统计局等网站下载相关数据,运用所学的统计知识和统计软件进行分析 ;
2、 论文要求手写□ 打印√,字数范围为 不少于 1500 字; 3、 论文上交时间: 2015年10月20号 ; 4、 写作要求(请任课教师详细说明本次论文考试的内容要求)
严禁剽窃、抄袭等作弊行为!
1) 确立题目后,首先进行相关文献阅读,至少阅读三篇文献 2)论文标明数据来源
3)给出数据处理方法和相关结果,解读运算结果的含义 4)结合问题对结果进行分析,总结。 5)注明参考文献
鼓励同学自学新的统计方法,鼓励创新! 论文上交电子版和纸质版.
教研室主任意见:
签字: 年 月 日
学院负责人意见:
签字: 年 月 日
注:此表一式两份,一份于考前交到考试中心,一份随学生论文装订成册
国内旅游业发展分析及其预测
【摘要】
随着经济的发展,人们的生活水平也日渐提高。生活富足之后,人们就更加倾向于将收入用于享受型消费,因此旅游业的发展也日益蓬勃。在这里,我们提取了近十年内国内游客、国内旅游总花费以及国内旅游人均花费的具体数据,在r语言的环境下对数据进行粗略的分析来具体阐明旅游业的发展趋势,并对未来的走向加以分析预测。
【关键词】
游客人数、旅游总花费、城镇、农村、线性回归、百分比。
庞大的市场需求催生了旅游地产的几年得到了迅猛的发展,2015年开始进入一个全面的资源整合的阶段,这个阶段中复合型旅游地产的发展越来越迅速,目前国内旅游地产市场开始变得理性和成熟,未来三到五年,中国旅游市场将会迎来一个黄金的发展期,而颁布的系列,也积极推动着中国旅游地产的发展。不仅是城市人口乐于在假期选择境内出游,农村人口的出游人数近几年也实现了跨越式的增长。
一、 国内游客及国内旅游总花费的数据分析 1.1数值变化
指标 国内游客(百万人次) 国内旅游总花费(亿元) 数据来源:国家统计局
2014年 3611 30311.9 2013年 3262 26276.1 2012年 2957 22706.2 2011年 21 19305.4 2010年 2103 12579.8 指标 国内游客(百万人次) 国内旅游总花费(亿元) 2009年 1902 10183.7 2008年 1712 8749.3 表1-1
2007年 1610 7770.6 2006年 1394 6229.7 2005年 1212 5285.9
根据表1-1中数据,利用r软件的绘图功能绘制散点图。其中tourist代表游客数量,单位为百万人次;consume代表国内旅游总花费,单位为亿元。
图1-1
图1-2
从图中可以看出,从04至今,游客数量和旅游总花费总体都呈一个上升的趋势,并大致符合某种线性规律。这从有一个侧面说明了国民经济的不断发展以及旅游业的蓬勃兴旺。
1.2线性拟合
由于花费和人数的增长符合某种线性关系,我们根据表1-1中的数据,利用R语言作线性拟合,得到如下线性关系。
图1-3
图1-4
其中,游客人数的回归方程为:
Y=269*X-538376.0
回归系数的α值为3.75e-07,常数的α值为3.63e-07。
总花费的回归方程为:
Y=2874.6*X-5761473.8
回归系数的α值为6.00e-06,常数的α值为5.e-06。
总的来看,游客以及花费都呈现线性增长关系。散点大多在直线附近并且偏差不大,说明拟合得较为成功。
二、 城镇和农村比例
近年来,旅游业的推动发展不仅仅是城镇人民的贡献,农村居民也一定程度上拉动了旅游业向前发展。在这里,我们试着用r语言来分析和比较农村和城市在旅游方面的的贡献程度。
2.1国内游客
指标 城镇居内游客(百万人次) 农村居内游客(百万人次) 数据来源:国家统计局
2014年 2483 1128 2013年 2186 1076 2012年 1933 1024 2011年 1687 954 2010年 1065 1038 指标 城镇居内游客(百万人次) 农村居内游客(百万人次)
2009年 903 999 2008年 703 1009 2007年 612 998 2006年 576 818 2005年 496 716 表2-1
根据表2-1中的数据,利用r语言软件绘图得到年份和游客数量关于陈镇居民和农村居民的散点图,如下所示。
图2-1
图2-2
由图2-1,可知城市居内游客人数逐年增长,10年前大致呈指数增长模式,10年之后呈线性增长;由图2-2,可知农村居内游客人数也呈增长趋势,在11年曾出现下降。
根据表2-1绘制箱线图进行比对,如下图所示。其中1为城镇,2为农村。
图2-3
通过对比可看出二者的均值相近,但城镇的最高值高于农村。
图2-4
计算出均值并绘出饼状图,如图2-4所示。通过分析可得在国内旅游人数方面,城镇的贡献大于农村。
2.2国内旅游总花费
指标 2014年 2013年 2012年 2011年 2010年 17678 5028.2 城镇居内旅游总花费(亿元) 24219.8 20692.6 农村居内旅游总花费(亿元) 6092.1 数据来源:国家统计局
14808.6 9403.8 4496.8 5583.5 3176 指标 2009年 2008年 2007年 2006年 2005年 5971.8 2777.6 5550.4 2220.2 4414.7 1815 3656.1 1629.7 城镇居内旅游总花费(亿元) 7233.8 农村居内旅游总花费(亿元) 2949.9 表2-2
根据表2-2中的数据,利用r语言软件绘图得到年份和旅游总花费关于陈镇居民和农村居民的散点图,如下所示。
图2-5
图2-6
由图2-5和图2-6可知,农村和城镇的旅游总花费均呈上升趋势。
根据表2-1绘制箱线图进行具体比对,如下图所示。其中1为城镇,2为农村。
图2-7
由图2-7可得城镇的旅游总消费均值和最高值都远远大于农村。
具体计算出均值并绘出饼状图,如图2-4所示。通过分析可得在国内旅游人数方面,城镇的贡献大于农村。如图2-8所示。
图2-8
通过分析可得在国内旅游总花费方面,城镇的贡献远远大于农村。
综上所述,随着我国经济的发展,旅游业也是日益兴旺,国内游客人数和国内旅游总花费都呈现一个较好的增长趋势。其中,城镇游客对旅游业发展的贡献度要高于农村游客,这也是因为城镇的经济发展水平较高所导致的。
【参考文献】:
[1]汤银才,R语言与统计分析[M],北京:高等教育出版社,2008.5 [2] R语言----绘图学习笔记之Scatter plots,2012-1-12
[3]机器学习(一) 从一个R语言案例学线性回归,2015-3-27,Jason Guo [4]中国国家统计局网,http://www.stats.gov.cn/tjsj/,年度数据
附录:
#一 #1.1
tourist<-c(1212,1394,1610,1712,1902,2103,21,2957,3262,3611)
consume<-c(5285.9,6229.7,7770.6,8749.3,10183.7,12579.8,19305.4,22706.2,26276.1,30311.9) year<-c(2005:2014) plot(year,tourist) plot(year,consume) #1.2
tourist<-c(1212,1394,1610,1712,1902,2103,21,2957,3262,3611)
consume<-c(5285.9,6229.7,7770.6,8749.3,10183.7,12579.8,19305.4,22706.2,26276.1,30311.9)
lm.reg <- lm(tourist~year) summary(lm.reg) abline(lm.reg)
lm.reg <- lm(consume~year) summary(lm.reg) abline(lm.reg)
#二 #2.1
tourist<-c(1212,1394,1610,1712,1902,2103,21,2957,3262,3611)
consume<-c(5285.9,6229.7,7770.6,8749.3,10183.7,12579.8,19305.4,22706.2,26276.1,30311.9)
mean(consume) mean(tourist)
urban<-c(496,576,612,703,903,1065,1687,1933,2186,2483) rural<-c(716,818,998,1009,999,1038,954,1024,1076,1128)
a1=mean(urban) a2=mean(rural)
x<-c(a1,a2)
names(x) <- c(\"urban\ pie(x,col=c(\"white\ #2.2
tourist<-c(1212,1394,1610,1712,1902,2103,21,2957,3262,3611)
consume<-c(5285.9,6229.7,7770.6,8749.3,10183.7,12579.8,19305.4,22706.2,26276.1,30311.9)
mean(consume) mean(tourist)
rural<-c(1629.7,1815,2220.2,2777.6,2949.9,3176,4496.8,5028.2,5583.5,6092.1)
urban<-c(3656.1,4414.7,5550.4,5971.8,7233.8,9403.8,14808.6,17678,20692.6,24219.8)
a1=mean(urban) a2=mean(rural)
x<-c(a1,a2)
names(x) <- c(\"urban\ pie(x,col=c(\"white\
#箱线图
urban<-c(496,576,612,703,903,1065,1687,1933,2186,2483) rural<-c(716,818,998,1009,999,1038,954,1024,1076,1128) boxplot(urban,rural) #
rural<-c(1629.7,1815,2220.2,2777.6,2949.9,3176,4496.8,5028.2,5583.5,6092.1)
urban<-c(3656.1,4414.7,5550.4,5971.8,7233.8,9403.8,14808.6,17678,20692.6,24219.8) boxplot(t1,t2)
boxplot(urban,rural) year<-c(2005:2014) plot(year,urban) plot(year,rural)