You are on page 1of 21

答疑时间: 1月4号12:30~14:30, 1月7号15:40~16:40;

地点: 彰武路校区北大楼3楼教师休息室.
2018-12-29

1. 作业讲解
2. 试卷分析(17-18A)
3. 课程总结
1. 作业讲解——4.9(1)(2)、4.13(3) 、4.14、5.7、5.8
n n
4.8 定义离差平方和 Q( 1 )  i  i 1i
 2

i 1
 ( y   x )
i 1
2

最小二乘估计的准则是寻找估计量 ˆ1 使得离差平方和

Q( 1 ) 达到最小. 即
n
Q( ˆ1 )  min Q( 1 )  min  ( yi  1 xi ) 2
1 1
i 1
对 Q( 1 ) 在 ˆ1 处关于 1 求偏导并令其等于零

Q n
得: 1 =ˆ1
 2 ( yi  ˆ1 xi ) xi  0
1 i 1
整理并解出方程: n

n n x y i i
()
( xi2 ) ˆ1   xi yi  0  ˆ1  i 1
n
i 1 i 1
i
x 2

i 1

即为回归系数 1 的最小二乘估计值,
1 n 1 n n n
定义 x   xi , y   yi , J xx   xi 2 , J xy   xi yi ,
n i 1 n i 1 i 1 i 1

ˆ J xY
则 1 的最小二乘估计量为 1 
J xx
4.9(1)(2) 先证明估计量 ˆ1 具有线性性、无偏性和正态性

①线性性
xi xi
记 ki  n
 , i  1, 2, , n. 则
x 2 J xx
i
i 1
n n

xY xY i i i i n
xi n
ˆ1  i 1
n
 i 1
 Yi   kiYi ;
x 2 J xx i 1 J xx i 1
i
i 1

这表明估计量 ˆ1 是样本 Y1 , , Yn 的线性组合. 即证.


②无偏性 Yi  1 xi   i ,  i ~ N (0,  2 )
n
xi  xi n
注意到  ki xi   1 ,
i 1 i 1 J xx
n n n
故 E ( ˆ1 )  E (  k Y )   k E (Y )   k   x  
i 1
i i
i 1
i i
i 1
i 1 i 1

进一步可计算出估计量的方差

n n
x 2
 2
 2 n
D( 1 )  D( kiYi )   ki D(Yi )    i2 
ˆ 2 2
 n .
i 1 J xx
i
i 1 i 1 J xx 2
x
i 1
③正态性
由①即知, ˆ1 是正态随机变量 Yi , i  1, 2, , n. 的线性组合,

2
故 ˆ1 服从正态分布, 即 ˆ1 ~ N ( 1 , n
). 此即4.9(1)
x
i 1
2
i
4.9(2)的证明 Yi  1 xi   i ,  i ~ N (0,  2 )
Yi  1 xi i
①令 U i   , i  1, , n , 则 U1 , ,U n 相互独立
 
且都服从标准正态分布. 作正交变换如下:
Zi  ci1U1  ci 2U 2   cinU n , i  1, 2, , n  1,
n
x1 x2 xn xi
Zn  U1  U2   Un   Ui .
J xx J xx J xx i 1 J xx
n n

 i  i .
i .i .d
则 Z1 , Z 2 , , Z n ~ N (0,1) , 且 Z 2
 U 2

i 1 i 1
n n

ˆ1  1 1 xY i i
1  x ( x   )
i 1 i i
②  [ i 1  1 ]  [ i 1  1 ]
  J xx  J xx
n

1 x i i
1 n i 1 n


 i 1

J xx
  xi 
J xx i 1  J xx
 xU
i 1
i i

n
1 xi 1

J xx

i 1 J xx
Ui 
J xx
Zn
n n
1 1
2  i 2  i
③ (Y  ˆ x )2 
 [Y   x   x  ˆ x ]2

 1 i
i 1  i 1
1 i 1 i 1 i

1 n
 x ( ˆ  ) 2
 n
 2  [ i  xi ( ˆ1  1 )]  [ i  i 1 1 ]
2

 i 1 i 1  
n
Z n 2 n 2 n 2 Z n2 n Zn
 [U i  xi ]  U i   xi    2U i xi
i 1 J xx i 1 i 1 J xx i 1 J xx
n n n 1
xi
  Zi2  Z n2  2Z n  U i   Zi2 ~  2 (n  1)
i 1 i 1 J xx i 1

ˆ1  1 1 n
xi n n
 Zn , Zn   Ui ,  i  i.
Z 2
 U 2

 J xx i 1 J xx i 1 i 1
4.13(3) 0  1 x0 的一个估计是 ˆ0  ˆ1 x0 , 且
E (ˆ0  ˆ1 x0 )  0  1 x0 , D(ˆ0  ˆ1 x0 )  D(ˆ0 )  D(ˆ1 ) x02

ˆ ˆ 2 1 1
2 x0 cov( 0 , 1 )   [  ( x0  x ) 2 ] . 由正态性知
n lxx

ˆ ˆ 2 1 1
0  1 x0 ~ N (0  1 x0 ,  [  ( x0  x )2 ]).
n lxx
(n  2)ˆ 2
又  (n  2) , 且这两项相互独立, 因此
2

 2
ˆ0  ˆ1 x0  (  0  1 x0 )
1 1
 [  ( x0  x ) 2 ]
2

n lxx ˆ0  ˆ1 x0  (  0  1 x0 )


 ~ t (n  2)
(n  2)ˆ 2 1 ( x0  x ) 2
ˆ  
 2 (n  2) n lxx

由此即得 0  1 x0 的双侧 1   置信区间的上下限分别为

1 ( x0  x )2
( ˆ0  ˆ1 x0 )  t  ( n  2)  ˆ 
 .
1 n lxx
2
4.14 假设检验问题 H 0 : 1  1 ( H1 : 1  1)
2 (n  2)ˆ *2
由定理4.2知 ˆ1 ~ N ( 1 , ), ~  2 (n  2), 且
2
lxx
ˆ1  1
相互独立, 故构造检验统计量 T lxx ~ t (n  2),
ˆ *

ˆ1  1
并记 T1 lxx , 则在原假设 H 0 成立时,
ˆ *

ˆ1  1  1  1 1  1
T lxx  T1    T1 , 其中   * lxx  0.
ˆ *
ˆ
于是由 P T  t (n  2)    可推得 T  T1    T1

P T1  t (n  2)   P T    t (n  2) 

 P T  t (n  2)     P T  t (n  2)   

ˆ1  1
由此构造检验的拒绝域, 当 T1  lxx  t (n  2) 时
ˆ *

拒绝原假设. (计算略)
(5.7) 为了寻求适应某地区的水稻品种, 选取4个不同品种
的种子进行实验, 每一品种都在4块试验田上试种. 假定这
16块试验田的面积和其它条件均基本相同, 试验结束观测
到各块试验田的水稻产量(公斤)如下 ( F0.95 (3,12)  3.49)
种子品种 A 各试验田水稻产量 ( t0.975 ( 12)  2.18 )
A1 67 67 55 43
A2 68 96 90 66
A3 79 66 81 70
A4 90 79 79 88
(1)列出方差分析表; (2)问种子的品种对水稻高产有无显著
影响? 哪一个品种比较有优势? 取显著性水平  0.05 .
解 (1)计算并列出方差分析表如下:
方差来源 平方和 自由度 均方和 F-值
因子A SS A  1568 3 MS A  522.67 4.653
误差 SSe  1348 12 MSe  112.33
总和 SS  2916 15
且 x1  58, x2  80, x3  74, x4  84 .
(2)原假设: 水稻品种之间在产量上没有显著差异
因为 4.653  3.49  F0.95 (3,12) , 所以拒绝原假设. 即可以
认为水稻品种之间有显著差异.
进一步, 通过比较 xi 的大小可知水平 A2 与 A4下的产量较高,
于是进一步检验 H 0 : 2  4 (即品种2与4的产量没有差异)
2
由假设条件知 X i ~N ( i , ), i  1, 2, ,a
m
2 2
即 X 2 ~N ( 2 , ), X 4 ~N ( 4 , ) 且相互独立. 故
m m
2 2
故 X 2  X 4 ~N ( 2  4 , )
m
( X 2  X 4 )  ( 2  4 )
 m ~ N (0,1),
2
1
又 SSe ~  2 (n  a), 且样本均值和样本方差相互独立,
2
( X 2  X 4 )  ( 2  4 )
m
因此 T24
2
SSe
 2 (n  a)

m ( X 2  X 4 )  ( 2  4 )
 ~ t (n  a )
2 SSe
na
m X 2  X 4
在原假设成立时, T24  ~ t (n  a) . 因此给定
2 SSe
na
显著性水平  , 当 T24  t  (n  a) 时拒绝原假设.
1
2

80  84
计算可知 T24  24   0.5337,
1348
因为 0.5337  2.18  t0.975 (12) , 故不能拒绝原假设. 即2号

种子和4号种子在产量上没有显著差异, 都具有一定优势.

You might also like