方差分析和正交试验设计

第6章方差分析和正交试验设计

§6.1 单因子方差分析

在实际问题中，某个指标的取值，往往可能与多个因素有关。例如，农作物的产量，可能与作物的品种有关，可能与施肥量有关，可能与土壤有关，等等。又例如，化工产品的收得率，可能与原料配方有关，可能与催化剂的用量有关，可能与反应温度有关，还可能与反应容器中的压力有关，等等。

由于因素很多，自然就会产生这样的问题：这些因素，对于指标的取值，是否都有显著的作用？如果不是所有的因素都有显著的作用，那么，哪些因素的作用显著？哪些因素的作用不显著？还有，这些因素的作用，是简单地叠加在一起的呢，还是以更复杂的形式交错在一起的？

以上这些问题，都需要我们从试验数据出发，来加以判断、分析，做出结论。方差分析（Analysis of Variance，简称ANOVA）就是一种能够解决这类问题的有效的统计方法。

在方差分析中，将可能与某个指标的取值有关的因素，称为因子（Factor），通常用 A,B,? 来表示。因子所取的各种不同的状态，称为水平（Level），用 A1,A2,?，B1,B2,? 来表示。

如果问题中只考虑一个因子，这样的方差分析称为单因子方差分析。如果问题中要考虑两个因子，这样的方差分析就称为双因子方差分析。当然，还可以有三因子、四因子、更多因子的方差分析。

我们先来看单因子方差分析。

问题设某个指标的取值可能与一个因子 A 有关，因子 A 有 r 个水平：A1,A2,?,Ar。在这 r 个水平下的指标值，可以看作是 r个相互独立、方差相等的正态总体

?i～N(?i,?2)，i?1,2,?,r 。

在每一个水平 Ai 下，对指标作 t （t?1）次重复观测，设观测结果为

Xi1,Xi2,?,Xit ，

它们可以看作是总体 ?i 的样本。即有

问：因子 A 对指标的作用是否显著？

１３７

检验方法

检验因子 A 的`作用是否显著，相当于要检验这样一个假设

H0：?1??2?r 。

为了作检验，先给出一批定义。称

n?rt 为总观测次数，

i??Xij 为水平Ai的均值， tj?1

SSi??(Xij?i)2 为水平Ai的平方和，

j?1t

1rt1r

Xij??i 为总均值， ni?1j?1ri?1

SST(Xij?)2 为总平方和，

i?1j?1rt

SSe(Xij?i)??SSi 为误差平方和， 2

i?1j?1i?1rtr

SSA?t?(i?)2 为因子A的平方和。

i?1r

这些统计量之间的相互关系，可以用下列图表的形式表示出来：

水平观测值 Ai 的平方和 Ai 的均值

r?? 总均值 A1? Ar

X11?X1t←─SS1─→ ?? ? ←─SSr─→ X1?Xrt?r←────→ │←── 误差平方和SSe──→│←─A的平方和SSA──→│ │←───────── 总平方和SST─────────→│

SSi??(Xij?i)2 反映了在各水平 Ai 的内部指标取值的差异程度，这种差异

j?1

完全是由于误差引起的，而 SSe 是所有这样的 SSi 的总和，所以称为误差平方和。

SSA?t?(i?)2 反映了各水平之间指标取值的差异程度，如果因子A 的作用i?1r

不显著，各水平之间差异很小，1,2,?,r近似相等，与X差异很小，SSA 的值也比１３８

较小，如果因子A 的作用显著，各水平之间差异很大，1,2,?,r与X的差异也很大，

所以称为因子A 的平方和。 SSA 的值就会偏大。SSA 的大小反映了因子 A 的作用大小，

总平方和 SST 、误差平方和 SSe 、因子A 的平方和 SSA 之间，有下列平方和分解关系：

SST?SSe?SSA 。

这是因为

SST(Xij?)2 i?1j?1

rtrt

i?1j?1

rtij?i?i?)2 ?i)?2??(Xij?i)(i?)(i?)2 2

i?1j?1i?1j?1

trtrt (Xi?1j?1ij

?SSe?2?(?X

i?1j?1rij?ti)(i?)?t?(i?)2 i?1r

?SSe?0?SSA?SSe?SSA 。

由 SSA 、SSe 可以算出统计量 MSA?SSA(r?1) 和 MSe?SSe(n?r) 。MSA 称为因子A 的均方，MSe 称为误差均方。由 MSA 、MSe 可以算出统计量

FA?MSASSA(r?1) 。 ?MSeSSe(n?r)

下面证明一个关于 FA 的分布的定理。

定理 6.1 若 H0：?1??2?r 为真，则有

FA?MSASSA(r?1)～F(r?1,n?r) 。 ?MSeSSe(n?r)

2 证设?1??2?r??，这时有 ?i～N(?,?)，i?1,2,?,r 。

因为 Xi1,Xi2,?,Xit 是 ?i的样本，所以 Xij～N(?,?)2Xij??

?～N(0,1)，

i?1,2,?,r，j?1,2,?,t，相互独立。１３９

?Xiji?1j?1??

??(X

i?1j?1

?)2

??(X

i?1j?1

ij2

2??(Xij?)(??)?

i?1j?1

??(??)

i?1j?1

SST

?0?

SSA

SSe

n(??)2

?2?2

n?Q1?Q2?Q3 。

其中，Q1?

SSA

t?(i?)2

i?1

是r项的平方和，但这r项又满足1个线性关系式：

?(i?1

?)??i?r?0，所以，Q1的自由度 f1?r?1。

i?1

Q2?

SSe

??(X

i?1j?1

?i)2

是 n?rt 项的平方和，但这 n 项又满足 r个线性

关系式：

?(X

j?1

?i)??Xij?ti?0，i?1,2,?,r，所以，Q2的自由度

j?1

f2?n?r。

?nQ3是1项的平方和，所以，Q3的自由度 f3?1。

因为 f1?f2?f3?(r?1)?(n?r)?1?n，所以由定理2.7（Cochran 定理）可知：

Q1?

SSA

～?(r?1)，Q2?

SSe

?22

?n～?(n?r)，Q3～?(1)，

而且Q1?

SSA

，Q2?

SSe

?n，Q3相互独立。

因此，由F分布的定义可知

１４０

2SSA(r?1)FA??

SSe(n?r)SSe

SSA

r?1)

～F(r?1,n?r) 。

n?r)

由定理6.1可知，若H0：?1??2?r 为真，则FA～F(r?1,n?r) ；若 H0：?1??2?r 不真，则SSA的值会偏大，FA的值也会偏大，统计量FA 的分布，相对于 F(r?1,n?r) 分布来说，峰值的位置会有一个向右的偏移。

因此，可得到检验方法如下：

从样本求出 FA 的值。对于给定的显著水平?，自由度(r?1,n?r)，查F分布的分位数表,可得分位数F1??(r?1,n?r)，使得 P{FA?F1??(r?1,n?r)}?? ，当

FA?F1??(r?1,n?r) 时，拒绝H0：?1??2?r ，这时，可以认为因子 A 的

作用显著，否则，接受 H0：?1??2?r，这时，可以认为因子 A 的作用不显著。单因子方差分析的计算步骤

方差分析的计算比较复杂，用带统计功能的计算器计算时，最好按照下列步骤进行，并把计算结果填写在下列形式的表格中：

（1）从Xi1,Xi2,?,Xiti求出 i??Xij 和 SSi??(Xij?i)2,i?1,2,?,r 。

tj?1j?1

把Xi1,Xi2,?,Xiti看作样本，i??Xij 就是样本均值，SSi??(Xij?i)2

tj?1j?1

1t2

就是样本方差 S??(Xij?i) 再乘以样本观测次数 t （或修正样本方差

tj?1

。所以，在计算器上计算时，只要像计算样本统S*?(Xij?i)2再乘以t?1）?t?1j?1

１４１

学者谷

方差分析和正交试验设计

《三亚落日》教学设计

设计作文6篇[经典]

[经典]我的设计作文8篇

未来设计作文600字(精华)

相关文章