spss数据分析之一元线性回归?微信号后台有非常之多的关于回归分析的留言,作为最常见的统计分析方法,在工作生活中的应用需求量巨大,这两天已经为大家选好了案例数据,先从一元线性回归分析开始。一元线性回归,顾名思义,仅有一个自变量的回归模型,研究的是一个因素对结果的影响,可以用于预测,也经常被称之为简单线性回归分析
spss数据分析之一元线性回归?
微信号后台有非常之多的关于回归分析的留言,作为最常见的统计分析方法,在工作生活中的应用需求量巨大,这两天已经为大家选好了案例数据,先从一元线性回归分析开始。一元线性回归,顾名思义,仅有一个自变量的回归模型,研究的是一个因素对结果的影响《繁体:響》,可以用于预测,也经常被称之为简单(繁:單)线性回归分析。它的模型表达式(拼音:shì)为:
Y=a bX e
回归的过程就是要(yào)确定截距a和回归系数b的具体值澳门新葡京,当然前提条件是模型具备统计学意义。
看案【练:àn】例:
案例数据很好理解,是【拼音:shì】常(练:cháng)见的销售数据,反映的是某公司太阳镜一年12个月的具体销售《读:shòu》情况。试分析当广告费用为15万元时,预测当月的销售量值。
几乎所有的回归分析问题,首先都从一个散点图开始,散点图能够快速而且直观的看到自变量和应变量之间是否包含线性(读:xìng)关系,如果图形上看不出明显线性关系的话,后hòu 续的分析效果也不会太好。
散点图菜单步【拼音:bù】骤(繁:驟):图形→旧对话框→散点图《繁:圖》→简单算点图,自变量广告费用用作X轴,销售量用作Y轴。
由散点图可以看出,增加广《繁:廣》告投入销售量随之上升,一个正相关线性关系,图示的作用在于让我们《繁:們》对预测销售量充满信心【拼音:xīn】,接下来开始一元线性回归。
菜单栏中点击【分析】→【回归】→【线性】,弹出线性回归主功能面板,销售量作为因变量,广告费用(拼音:yòng)作为自变量,散点图显示开云体育二者有较强的线性关系,我们将采取强制【输入】的方法要求建立一元回归模型。
默认勾选回归系数的【估算值】,要求SPSS软件为我们输出回{pinyin:huí}归系数,也就是模型中的参数b,同时默认勾选【模型模mó 拟】,要求软件帮助我们建议回归模型是否具有统计学意义。
以上这两(繁:兩)个参数是线性回归分析《练:xī》必选设置,不能忽略不计。在此基础上,我们可以根据实际需要选择其他《读:tā》参数。
本案《读:àn》例勾选【德宾沃森】,要求就模型残差进行Durbin Watson检验,用于(繁:於)判断残差是否独立,作为一个基础条件来判断数据是否适合做线性回(繁体:迴)归。
上半部分有些复【练:fù】杂,允许我们定制残差的图(繁:圖)形,作为入门理解,此处建议直接勾选底部【直方图】和【正态概率图】,要求软件输出标准化残差图,同样用于判断数据是否适合进行线性回归。
我们此处分析的目的是为了利用广告费用来预测销售量,保存按钮参数与预测和残差有关,可以勾选【未标准化】预测值。
在这个对话框上面,有许多参数可选,严谨态度出发的话,建【pinyin:jiàn】议在这里[繁:裏]深入学习,本例暂时不讨论。
这里建议接受《读:shòu》软件默认选项即可。
主要参数基本设置完成,现在点击主面板下方的【确定】按钮,要求SPSS开始执行此次简【繁体:簡】单线性回归分析过程,我们坐等结果guǒ 。
1澳门新葡京、模型(xíng)摘要表
第三列R方,在线性回归中也称为判定系数,用于判定线性方程拟合优度(读:dù)的重要指标,体现了回归模型解释因变量变异的能力,通常认为R方需达到60%,最好是80%以上,当然是【拼音:shì】接近1更好[读:hǎo]。
本例R方=0.9世界杯3,初步判断模型拟合效(读:xiào)果良好。
2、方差分析xī 表
刚才我们建立的回归模型是不是有统计意义,增加广告费用(读:yòng)可销售量这样的线皇冠体育性关系是否显著,方差分析表可以回答这些问题。
直接读取最后一列,显著性值=0.000<0.01<0.05,表明由自变量(练:liàng)“广告费用”和因变量“销售量”建立的线性关系回归模型具有《读:yǒu》极显著的{de}统计学意义。
3、回归(拼音:guī)系数表
这是有关此处建模的最直接结果,读{pinyin:dú}取未标准化系数,我[pinyin:wǒ]们可以轻松写出模型表达式,如下:
Y=76.407 7.662X
关键(繁:鍵)的是,自变量广告费用的回归系数通过检验,t检验原假设回归系数没有意义,由最后一列回归系数(繁体:數)显著性值=0.000<0.01<0.05,表明回huí 归系数b存在,有统计学意义,广告费用与销售量之间是正比关系,而且极显著。
OK,现在我们有了回归模型表达式在手里,心里总会油然沉甸甸的de ,因为就连小学生都知道,只要把广告费用的具体值带入回归方程式中,就可以轻松计算出对应的销售量(练:liàng)数据。
不急,在开《繁体:開》始预测前还有一{读:yī}项关键操作(练:zuò),我们需要检验数据是否可以做回归分析,它对数据的要求是苛刻的,有必要就残差进行分析。
1、残差正态性{pinyin:xìng}检验
从标准化残差直方图来看,呈一个倒扣的钟形,左右两侧不完全对称,有一定瑕疵;从标准化残差的P-P图来看,散点并没有全部靠近斜线,并不完美,综合而言,残【cán】差正态性结果不是最好的,当然在现实分析当中,理想状态的正态(繁体:態)并不多见,接近或近似即可考虑接受。
2、模型残差独[繁体:獨]立性检验
采用Durbin Watson检验来判断,回过头来{pinyin:lái}再看模型摘要表。
DW=1.464,查询 Durbin Watson table 可以发现本例DW值恰好出在无自相关性的(练:de)值域之中,认定残差独立,通过检验《繁体:驗》。
实际(繁:際)上关于回归模型的适应性检验【练:yàn】还有其他项目,比如异(繁:異)常点、共线性等检验项目,本例暂不展开,有兴趣的读者可以自行学习。
根据以上残差正态性和残差独立性检验的结果,本例认为案例数据基本满足线性回归要求(值得在其他应用中讨论,本例仅展示主要过[繁:過]程),所建立的模型可根据拟合质量{拼音:liàng}进行预测。
通过前面的一系列分析【拼音:xī】和论证,我们现在已yǐ 经得到回归模型的方程式shì :Y=76.407 7.662X,
我们的预测任务是当广告投入达15万元时,太阳[繁体:陽]镜的【拼音:de】销售量,具体计算:Y=76.407 7.662*15=191.337,
至此,建立了广告和销售量之间的【练:de】线性回归模型,并且实施了预测(繁:測),那么模型的准确性到底如何呢,有待最终实际销售shòu 比对分析。本例结束
本文链接:http://21taiyang.com/Open-SourceComputers/7503053.html
一元(拼音:yuán)线性回归spss转载请注明出处来源