数学:第三章《统计案例》教案(1)(新人教A版选修2-3).doc
2023-04-28,文件大小:972.00K,下载:0
下载
下载地址加载中.... 下载教程 (新手必看)
提示: 此文件暂无参考内容, 请自行判断再确认下载!!
作者很懒没有写任何内容
,2,xy) ,…, (2nnxy),1
第三章 统计案例3.1回归分析的基本思想及其初步应用(共计4课时)授课类型:新授课一、教学内容与教学对象分析学生将在必修课程学习统计的基础上,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用。二、学习目标1、知识与技能通过本节的学习,了解回归分析的基本思想,会对两个变量进行回归分析,明确建立回归模型的基本步骤,并对具体问题进行回归分析,解决实际应用问题。2、过程与方法本节的学习,应该让学生通过实际问题去理解回归分析的必要性,明确回归分析的基本思想,从散点图中点的分布上我们发现直接求回归直线方程存在明显的不足,从中引导学生去发现解决问题的新思路—进行回归分析,进而介绍残差分析的方法和利用R的平方来表示解释变量对于预报变量变化的贡献率,从中选择较为合理的回归方程,最后是建立回归模型基本步骤。3、情感、态度与价值观通过本节课的学习,首先让显示了解回归分析的必要性和回归分析的基本思想,明确回归分析的基本方法和基本步骤,培养我们利用整体的观点和互相联系的观点,来分析问题,进一步加强数学的应用意识,培养学生学好数学、用好数学的信心。加强与现实生活的联系,以科学的态度评价两个变量的相关系。教学中适当地增加学生合作与交流的机会,多从实际生活中找出例子,使学生在学习的同时。体会与他人合作的重要性,理解处理问题的方法与结论的联系,形成实事求是的严谨的治学态度和锲而不舍的求学精神。培养学生运用所学知识,解决实际问题的能力。三、教学重点、难点教学重点:熟练掌握回归分析的步骤;各相关指数、建立回归模型的步骤;通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型,了解在解决实际问题的过程中寻找更好的模型的方法。教学难点:求回归系数 a , b ;相关指数的计算、残差分析;了解常用函数的图象特点,选择不同的模型建模,并通过比较相关指数对不同的模型进行比较。四、教学策略:教学方法:诱思探究教学法 学习方法:自主探究、观察发现、合作交流、归纳总结。教学手段:多媒体辅助教学五、教学过程:(一)、复习引入:回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。(二)、新课:探究:对于一组具有线性相关关系的数据:(11,xy) , (


斜率的最小二乘估计公式分别为:
$aybx=-$ (1) 121()()()niiiniixxyybxx==--=-��$ (2)其中1111,nniiiixxyynn====��,(,xy)成为
样本点的中心.注:回归直线过
样本中心.你
能推导出这两个计算公式吗? 从我们
$a和
已经学过的知识知道,截距斜率b$分别1 2是使(,)()niiiQybxa
ab==--�取到
最小值时,的值ba. 由
于 21
xxyxyQy)]n(iii)([),(=bbbbaa=---+--

n
22
=--+----�--+--[(]]})([])([2])([){yyxyxyxyxyxxbbababbb
�iiii
i=1
nn
22
=---+---�--+--)([)(])([2])(][xyxyxyxyxyxynbababbbb
注��iiii
ii==11
意到
n
()]()[xyxyxy-----abbb
�ii
i=1
n
----=-])[()(yxyxyxbabb
�ii
i=1
nn
----=-])[()(xyxyynxbabb
��ii
ii==11
2----=.=-])([)0(xyxnynxnybabb
我们知道其回归方程的截距和


n
22
xnxyxyQy(])([),)(abbbba=---+--

ii
i=1
nnn
2222
+--=---+--babb)()(()(2))(xynyyyxxxxy
���
iiii
iii===111
nn
2
()()[()()]xxyyxxyy----
��iiii
nn
2222
ii==11
-+----+-=-xxxyyny[)()(])(bab
��ii
nn
22
ii==11
()()xxxx--
��在上
ii
ii==11
ab无
式中,后两项和,而关,前两项为非负数,此因得使Q取要最小当,值且仅当前两
项的值均0为,即i1221n有iiniixynxyyxxnx
bab==�-�==--��,.这正
是我们所要推导的公式.下面
我们从另一个角度来推导的公式.人教A版
选修2-2P37习题1.4A组第4题:用
测量工具测量某物体的长度,由于工具的精度以及测量技术的原因,测得n个数据
12,,,aanaL .证
明:用这个数据的平均i11ni值xan==� 表示
这个物体的长度,能使(n个数据的方差211()这)niifxxan==-
�最
小.思
考:这个结果说明了什么?通过这个问题,你能说明最小二乘法的基本原理吗?证
明:由211()()n于iifxxan==-
�,所以'12()()niifxxan==-�,令
'()0fx=, 得11niixan==�。3


得到11, niixan=�是函数()fx=的极小值点,也是最小这值点.
个结果说,用明n个数据的平均示11nii值n=�表a这个物体的长度是合,理的这就是最小
二乘法的基本原理.由
最小二乘法的基本原理即得 定
xxx+++L,则
12n
理 Rx设�,x=
n
11
2222222
)()()()][([()()]sxxxxxxxxxxxx=+-++-�-+-++--LL (*)当
1212nn
nn
且仅时12nxxxxxn++当==L+取等号. (*)式说
xxx+++L是
12n
明, x=任何个一实数x与均数中最
12,,,xxxnL的差的平方的平
n
小的数.从而说明了方差具有最小也即定义性,标准差的合理性.下面借
助(*)式22求22211)()()(abxyabxabxyQnn的最y小值.1122
n)()()n(ybxybxybx-+-++-L1212nn
n
yyyxxx++++++LL,由(*)式
�=-�=-bybx
nn
知,
222
xyabxyaQybabx=---++-+--)([[])([])(]]2221122[()()L[()()][()()]nnybxybxybxybxybxybx�-�--+-�--++-�--L
1122nn
222
--+-----=++--([()]])()([)()()[]yyyxxyybxxbxxbyL122112
1122nn
=---+--()nnn)iiiiii()(2)i(=yy==byxxbxxy
���222211221111()()[()()]()[]()()()nniiiinniiiinniiiiiixxyyxxyyxxbyyxxxx======----=--+----������222211221111()()[()()]()[]()()()nniiiinniiiinniiiiiixxyyxxyyxxbyyxxxx======----=--+----������4
可以


��
且仅,aybx=-�当且1122211()()()nniiiiiinnii-iixxyyxynxybxxxnx====---==-最小22211112值
��时, Q达到
()()[()()]yxyyxxyx-----
���
i)nnniiiiiiini(xx====-
�.由此得到,.,xbyaxnxyxnyxxxyyxxbniiniiiniiniii2121121)())((其中b是回归直线的
斜是,a率截距.借
rrrrrr和
助配方法,我们给出了人教A版必修3的第二章统计第三节变量
||||||||||||bbabaa-�+�+
间回ybxa=+的一个合理的解释1、的相关关系中回归直线方程归分析的基本步骤:(1) 画
出两个变量的散点图. (2) 求回归直线方程.(3) 用回归直线方程进行预报.下面
我们通过案例,进一步学习回归分析的基本思想及其应用2、
举:例例1. 从
某大学中随机选取 8 名女大学生,其身高和体重数据如7编号12345678身高/cm16516515表 170175165155170体重/kg4857505464614359求
根据女大学生的身高预报体重的回归方程,并预报一名身高的172为 cm 女大学生的体重.解:
由于问题中要求根据身高预报体重,因此选取身高,体重为为自变量 x因变量 y .5
221211[()()]()()niiniiniiixxyyyyxx===--�---���22211121()()[()()]()nnniiiiiiiniixxyyxxyyxx====-----=-����当


看出,样本点呈条状分布,身高和体重有比较好的线性相关关系,因此
可以用线性回归方程来近似刻画它们之间的关系根
据探究中的公式)和(1(2 ) ,可以ˆˆ得到0.849,85.712ba==-. 于是
得到回归方程
$
yx=-.因此084985.712
,对于m172 c身高 的女大学生,由回归方程可以预报其体重为
$084917285.71260.316y=�-= ( kg ) . ˆ0.849b=是
斜率的估值计,说明身高每 x 增加1个位单时,体重y就0加增.849 位,这
表明体重与身高具有正的线性相关关系.如何描述它们之间线性相关关系的强3在必修 弱? 中,我们介绍了用相关系数;来
衡量两个变量之间关性相线关系的方法本相关系数的具体计算
公式为
12211()()niiinniiiixxyyrxxyy当r>0时,表明两个变量
正关;当reQanb2)(),(

nn--22ini
$a和b$由公式$a ,b$)
估计量, 其中)1) (2(给出,Q(称残差平方和为(residual sum of squares ).可以用
s的
�2�2
量回归方程的预报精度.通常,,预报精度
s衡s越小
越高.在
研究两个变量间要关系的,首先时根据散点来图粗略判断它们是否性线相关,是否可以用线性回归模型来
拟合数据然后,可以通过残差
���
12,,,neeeL来
判断模型拟合的效果,判断始原数据中是否存在可疑数据.这方面的分析工作称分残差为析.表3一 2 列
出了女大学生身高和体重的原始编号123456数据以及相应的残差数据。78身高/cm165165157170175165155170体重/kg4857505464614359残差e$-6.3732.6272.419-4.6181.1376.627 -2.8830.382我们可以利用图形来分析残差特性作图时
纵坐标为残差,横坐为可标选以样本编号,或身高
数据,或体重的估计值等,这样形作的图出称.残差图.为 3 是 1 一 3 图以样本编号为横坐
标的残差图。8



看出,第 1 个样本点和第 6 个样本点的残差比较大,需要确认在采集这
两个样本点的过程中是否的有为人错误.如果数据采集有错误,就予以纠正,然后再重新利型线性回归模用
拟合数据;如果数据采集没有错误,需则要寻找其他的原因.另外,残差点比较
均匀地落在水平的带状区域中,说这样明选用的模型比较合适.的带状区域的宽度越窄
,说明模型拟合精度越高,回归方程的预报精度高越.另外,我们还相以用可关指数2R来
刻画回归的效果,其计算公式是:
�22121()1()niiiniiyyRyy==-=--��显
然,2R取值越大,意味着和差残方平越小,也就是说模型的拟合效果越好.在线性回归模型中,2R表示解释变量对于预报变量变化的贡献率. 2R越
接近于1,表示回归的效果越
好(因为2R越接近,表示解释变量和预报变量的线��
内容系创作者发布,涉及安全和抄袭问题属于创作者个人行为,不代表夹子盘观点,可联系客服删除。
夹子盘