{{'Please rotate your device to landscape mode' | trans: locale}}

视频 介绍

回归分析的基本思想及其初步应用

本节课主要介绍了分类变量和列联表,独立性检验

小松 徐

教师 合肥六中中学一级教师,省优质课一等奖。

{{trans['order Lesson']}}
00:00:00

大家好,这里是婉欣十分钟学校,我是数学徐老师。

00:00:13

今天我们来学习第三章统计案例31,回归分析的基本思想及其初步应用,我们来看一下例一,关于两个变量,X和Y的七组数据如下表所示,是判断Y与X是否线性相关,在这里我们先简单的介绍一下线性相关,我们说线性相关第一是有关系,第二又不是确定的函数关系,所以要特别要注意区分线性相关和确定的,一次函数的这样的关系的区别。

00:00:55

好,我们来计算,首先按照我们的书课本上所提供的公式,我们分别计算出X的平均Y的平均XA的平方,的求和XIAYA的求和以及YA的平方求和,分别计算出如下数据,这样我们就可以计算出所谓的相关系数,在我们统计学当中,我们实际上我们的统计学家已经把很多的数据,都已经统计好了,我们只要做出相应的计算,然后对照给定的一些标准数,这样我们就可以达到判断的目的。

00:01:37

在这里面我们通过这些计算,算出R的值是约,等于08375,由于它大于075,而我在统计学当中只要是大于075,我们就认为X与Y是具有线性相关关系,这里面的我们一般称之为叫相关系数,而且相关系数越大,说明它们的线性相关越强,在这里面我们有必要对这样的符号做一个解释,我们在很多同学在课本上发现这个公式和课本,上可能不太一样,实际上是一样的,我们来看一下,西格玛在这里为了书写的方便,我就在后面我会省略掉A等于1,到N对于XI减去X,平均乘以Y减去Y平均,公式,实际上,它就是等于西格玛XIY再减去N倍的,X平均Y平均,也就是说这两个式计算的结果是完全一样的,但是在具体的计算过程当中,有的时候用这个很方便,有的时候用这个很方便,所以我们要因题而异,但是在考试当中,我们的试卷上一般来说,所给你的是这两个当中,的一个所以有必要你要学会之间的转化,我们如何能够很自如地,在这两个求和当中去,转化,我想我们只需要掌握两点内容,你就应该很方便的去应对了,第一我们要掌握,XA加减YA从一到N,它就是,等于西格玛XI加减西格玛YI,在这里由于西,格玛是一个连加号,SA加减YI很简单,实际上也就是说,它借助了我们的交换律结合律,就可以得到这样的式子,但用它就可以很方便地进行化简。

00:04:22

好,第二个,第二个一般来说,西格玛C乘以XI这个C是什么,是与我们变量A无关的一个量,它可以是一个数字,也可以是一个字母,所以它就可以利用我们的分配律,把它提到我们的连加号的外面。

00:04:48

好,有一些显而易见的结论,我们得知道,比方说西格马A,没有写出AI而写出的是A,什么意思呢,也就是说它是A加A1直总共是N个,所以很自然是,NA还有一些显而易见的结论,比方说N分之一,西格玛,XI实际上它是等于,X平均。

00:05:34

好,利用这些结论,我想你们同应该说,是很容易能够做这两者之间,的转换,同学们你们可以试试看。

00:05:44

好,我们看第二,下表提供了某厂节能降耗技术改造后生产甲,产品过程中记录的产量与相应的生产能耗的几,组对照数据,为了能够计算的方便,这也是一道曾经考过一道高考题,所以为了计算的方便,他给的数据都是比较简单,能够可以手动计算的,一请画出上表数据的散点图,二请根据上表提供的数据,用最小二乘法求出Y关于X的回归直线方程,Y估计等于B估计X加上A估计,三,已知该厂技改前一百吨甲产品的生产能耗为,90吨标准煤,是根据二所求出的回归直线方程,预测生产一百吨甲产品的生产能耗比技改前,降低多少吨标准煤,耗,这里面为了能够计算方便,他给了你参考数值,是这样。

00:07:02

好,我们看第一个散点图的画法很简单,对应的四个点就可以了,关键是我们如何根据这样所提供的数据,来用最小二乘法求出Y关于X的回归直线方程。

00:07:20

好,这是三点图,我们看一下,在这里我们要特别注意,我们三点图的你看,如果是我要想连接这样的线,记住一定是用虚线,而且点与点之间,不能够用虚线把它连起来,你就维持这样的点,它是散点图也是顾名思义它是散的。

00:07:44

好,第二个,我们计算数据根据公式,我们只要对照公式,一个一个把相应的数据把它计算出来就可以了,你看第一个,计算出XA的平方的求和,X平均计算出Y,平均计算出XAYA的球和,665已经给过我们这样的数据了,那样由最小二乘法,所确定的回归方程的系数低,B估计我们很容易求解,在这里我们的X平均,Y平均,实际上是我们样本,的中心点,既然是中心点,它自然满足我们的线性回归方程,所以当我们求出了B估计之后,我们借助X平均Y平均,来求出我们的A股既,有了A估计和B估计之后,我们的所求的回归直线方程Y估计就非常简单,是07,X加上035。

00:08:50

好,第三,由二的回归方程及技改前生产,一百吨甲产品的生产能耗得降低多少,直接带入计算就可以了。

00:09:04

好,是196吨标准煤,我们看一下例三,假设关于某设备的使用年限X和所支出的维修,费用外,有如下表的统计资料,2345对应分23456,分别对应的是二点二三点八五点六六点五和7,0,现在我们由资料知Y与X成线性相关关系,第一我们求回归方程当中的,B估计和A估计,也就是要求我们求出线性回归方程,这在刚刚的例二中我们已经做到了,这一点我们同学们也应该非常熟悉,关键是在这里面,第二个,是求残差的平方和求相关指数R平方,估计使用年限为十年时,维修费用是多少。

00:10:03

好,我们看一看,在这里面由于统计学家,已经做了非常详细的,一个处理,也就是说,我们只需要按照他所要求的代入公式,进行计算就可以了。

00:10:17

好,用线性相关的公式分别计算,首先制表,这里面需要知道相应的这些这么多数据。

00:10:29

好,然后算出B估计,B估计算出的结果是123,我刚说了,我们的X平均Y平均是样本中心,也就是说满足我们的线性回归方程,所以把X平均Y平均以及刚刚所计算出的B,估计带入到线性回归方程当中,就可以计算出A股系,由此,我们就得到我们的线性回归方程,也就是说我已经知道了,A估计和B估计,第二个我们是要计算出残差的平方和,我们来看一看,残差的平方和,首先,我们根据刚刚所计算出的线性回归方程,计算出Y1估计Y2不计外三股系Y4部集合,Y5估计,而Y1到Y5个数据我们都是有的,但是我们发现计算的结果和他是有误差的,而这就是我们随机误差随机误差一一估计是,等于22254,也就是表格当中所给出的Y的外衣的数据减去,Y1估计,同理算出一二,估计一三,估计意思估计和一五估计,我们把所有的这五个随机误差的平方,然后再求和,就得出了残差的平方和061,也就直接带入公式计算就可以了。

00:12:14

好,第三个,计算相关指数,同样直接利用我们的公式,把刚刚所计算出的数据直接代入,算出结果是09587。

00:12:31

号,第四个是利用我们所计算出的回归直线的方程,然后来估计使用十年十的维修费用,很简单,我们刚刚计算出回归直线的方程是Y估计等于,123X加上008,那么当X等于10,也就是十年的时候,我们把X等于10替换为十代入计算即可得到,Y估计是1238万元。

00:13:06

好,今天的课到这里,欢迎同学们继续收看晚歆十分钟学校其他课程,的视频,谢谢。

相关视频