谁知道?正交试验中,因素把各列占满后,残差自由度为零了,怎么对正交试验进行方差分析?

哪位知道?

正交试验设计是获得最佳搭配的方法之一.它是通过三个步骤完成的:1,利用正交表来安排试验;2,对试验的结果进行综合比较;3,获得最佳搭配方案.4,分析影响结果的因素的主次。

正交试验设计表的设计原则是均衡分散搭配,分析试验结果,其原则为综合比较,即在同因素中将相同水平的结果相加,找出每个因素中的最好水平,得到最佳搭配。

分析影响结果的因素的主次.将同因素中的两个水平的结果做差,一般来说差的大小是不同的,差的大小实际上反应了该因素的变化对产量的影响的大小.差大说明该因素水平的变化对试验的结果影响大,差小说明该因素的变化对试验结果没太多影响.因此,可以通过差的大小来确定因素对试验结果影响的主次,找出影响试验的主要因素.

在对一个因子试验所建立的线性模型中,独立参数(总均值,主效应,交互效应等)的个数k与试验次数n之间有下面的关系:当n>k时,有足够的自由度k来估计参数,同时还有剩余自由度来估计误差的方差(n-k>0);当n=k时,有足够的自由度来估计参数,但是没有剩余自由度来估计误差的方差n-k=0;当nk).在双因子有重复试验中,试验次数大于交互效应模型中独立参数的总数,因此有剩余的自由度来估计误差方差;而在双因子无重复试验中,试验次数等于交互效应模型中独立参数的总数,因此没有剩余自由度来估计误差方差.此时,要估计误差就只能用可加效应模型.

根据上述的思路,只要试验总次数$N$大于独立参数的个数$M$就可以有足够的自由度来估计参数,同时还有剩余的自由度来估计误差方差,进而作假设检验.这是因子试验设计中要考虑的第一件事.第二件事是要使参数估计和检验统计量有好的性质和形式,关键是要使各组效应的参数估计之间相互独立,同时使相应的平方和之间相互独立.但是,在一个线性模型中,参数(主效应及各种交互效应)的数目是由实际问题本身决定的,而不是由人主观决定的.在大量的因子试验的实践中,人们发现:在很多情况下,因子之间只有主效应,至多存在某些一阶交互效应(即两因子的交互效应).高阶交互效应在很多情况下是不存在的.在这种情况下,多因子试验的模型中包含的参数实际上并不多,可能远远少于全模型的参数.比如有6个二水平因子,如果考虑所有可能的交互作用就有26=64个独立参数(包括总均值),但是如果只考虑主效应则只有6+1=7个独立参数.因此对6个二水平因子的可加效应模型,理论上只需作8次试验就可以有多余的自由度来估计误差方差.

如何使得上述的两个想法很好地实现 从双因子无重复试验的可加模型的分析中可以得到如何安排试验的启示.在这个模型中,由于两个因子的所有水平组合都作了相同次试验(一次),因此两组因子主效应的参数估计不仅有简单的形式,而且还是相互独立的,因而平方和之间也是相互独立的.因此,对于多因子试验的无交互效应模型(只考虑主效应),如果我们能如此安排试验,使得对任何一对因子,它们的所有水平组合都作了相同次试验,则对任何一对因子,两组因子主效应的参数估计和平方和也应具有上述性质.进而,如果试验的总次数n超过参数的总个数k,则还有多余的自由度来估计误差,进行方差分析.实际上,这就是"正交因子设计"原理的基本思路.

假定因子对响应变量的影响无交互效应(许多实际情况正是这样),正交试验的优点是在很少的试验次数(与全面试验相比)中,所得数据可以简便而有效地对因子效应进行参数估计和方差分析.其方法可一般地归纳如下:
1) 总均值的估计=试验数据的总平均值,
2) 某因子的某个主效应的估计=该因子的该主效应所出现的试验数据的平均值-总平均值,
3) 总平方和=(试验数据-总平均值)的平方和, 自由度=n-1,
4) 某因子的主效应平方和=重复数×参数估计的平方和, 自由度=水平数-1,
5) 残差平方和=总平方和-(因子效应平方和的和), 自由度=总平方和-(因子效应自由度的和).

另外,你可以用“正交试验 搭配方案”做关键词搜一下,有一些PPT实例可以参照看一看
温馨提示:答案为网友推荐,仅供参考
第1个回答  2007-01-27
我们知道如果有很多的因素变化制约着一个事件的变化,那么为了弄明白哪些因素重要,哪些不重要,什么样的因素搭配会产生极值,必须通过做实验验证(仿真也可以说是试验,只不过试验设备是计算机),如果因素很多,而且每种因素又有多种变化(专业称法是:水平),那么试验量会非常的大,显然是不可能每一个试验都做的。那我们这个试验来讲,影响主轴温升的因素很多,比如转速、预紧力、油气压力、喷油间隙时间、油品等等;每种因素的水平也很多,比如转速从8Krpm到20Krpm,等等,坤哥算了一下,所有因素都做,大概一共要900次试验,按一天3次试验计,要不停歇的做10个月,显然是不可能的。

能够大幅度减少试验次数而且并不会降低试验可行度的方法就是使用正交试验法。首先需要选择一张和你的试验因素水平相对应的正交表,已经有数学家制好了很多相应的表,你只需找到对应你需要的就可以了。所谓正交表,也就是一套经过周密计算得出的现成的试验方案,他告诉你每次试验时,用那几个水平互相匹配进行试验,这套方案的总试验次数是远小于每种情况都考虑后的试验次数的。比如3水平4因素表就只有9行,远小于遍历试验的81%B
第2个回答  2007-01-28
<< 返回正交 试验 进行 方差 分析的搜索结果页
以下是http://faculty.math.tsinghua.edu.cn/faculty/~xlu/pdf/c3.pdf的页面缓存,是搜索引擎自动从网站上抓取的快照。关键词标引如下 正交 试验 进行 方差 分析
网页自身有可能已经改变,你可以点击查看:当前页面
雅虎与网页的所有内容没有任何关系并且不对当前内容负责
CH3. 多因子方差分析与正交试验设计原理3.1多因子方差分析在前两章中我们讨论了单因子方差分析模型和完全平衡的(包括有、无重复)双因子方差分析模型。在这两种模型中,试验数据的统计分析有以下两大优点:1) 因子水平(或水平组合)参数的估计有简单的表达形式;
2) 因子效应(包括主效应和交互效应)和随机误差效应可以用平方和分解的方法进行分离,进而用F 统计量进行检验。在此我们要指出两种模型的一个重要区别:对单因子方差分析模型,我们不要求在每个水平上的试验次数相同;而对双因子方差分析模型,在每对因子水平组合
上,试验的平衡性(即等重复性)是一个重要条件,不然的话,平方和分解公式就
不成立,这样在方差分析时就会产生一定的困难。在多因子试验中也有同样的问
题。因此,我们只考虑平衡的多因子试验。双因子试验的方差分析模型中所包含的统计思想和方法可以一般地推广到多因子试验的场合。以三因子模型为例,设有三个因子对响应变量有影响,分别记为
A、B、C,它们的水平数分别为 I、J、K。全面地考虑,这三个因子对响应变量的
影响可以分成以下三种:1) 各因子的主效应,即单个因子的不同水平对响应变量产生的影响;
2) 一阶交互效应(双因子交互效应),即在扣除主效应的影响之后,任意两个因子的不同水平组合(AB、AC、BC)对响应变量产生的联合影响;3) 二阶交互效应(三因子交互效应),即在扣除主效应和一阶交互效应的影响之后,三个因子的不同水平组合(ABC)对响应变量产生的联合影响。与双因子的情况类似,如果在三个因子的每个水平组合上作相同的L 次试验,则当L>1(有重复)时,可以用全模型(即包含全部上述三种效应的模型)进行方差分析;而当L=1(无重复)时,二阶交互效应无法分析,而只能分析主效应和一阶交互效应。读者可以仿照上一节中的作法,对这两种情况下三个因子方差分析的
全部过程列出结果(模型、平方和分解、自由度、F 统计量,等等)。进而可以考虑四因子、五因子、乃至一般m 个因子的情况。无论有多少个因子,如果在所有因子的每个水平组合上都作至少一次试验,则试验是完全的。为便于进行方差分
析,试验应该是等重复的。为能够分析最高阶(m-1 阶)交互效应,试验应该是有重复的(重复数大于1)。3.2 正交试验设计原理虽然我们在理论上可以容易地将双因子方差分析的模型和方法推广到多因子方差分析的情况,但是,在实践中,作多个因子的完全试验会有实际的困难,因为完全试验所要求的试验次数太多,乃至无法实现。例如,假定要考虑五个三水平因
子,则完全试验(重复数为1)要求作 35=243 次试验;假如再加一个四水平因子,则完全试验(同样重复数为1)要作 972 次试验。如果要能够分析全部交互效应,同时还能够作平方和分解,则试验次数还需加倍!显然,如此大的试验次数在
实际中几乎是无法实施的。如何解决这个困难呢?我们先提出如下的思路供思考。在对一个因子试验所建立的线性模型中,独立参数(总均值、主效应、交互效应等)的个数k 与试验次数 n 之间有下面的关系:当 n>k 时,有足够的自由度 k 来估计参数,同时还有剩余自由度来估计误差的方差(n-k>0);当 n=k 时,有足够的自由度来估计参数,但是没有剩余自由度来估计误差的方差n-k=0;当 n<k 时,没有足够的自由度来估计参数,同时也没有自由度来估计误差的方差。在因子试验
中,除非可以事先确定数据中的随机误差很小,以至可以简单地忽略,否则误差的
估计是必要的,它是进行F 检验的前提。因此,如果不能简单忽略随机误差,就应该给误差的估计留下适当的自由度(n>k)。对这样一个思路,我们不想在此作理论上的论证,读者可以结合双因子试验中有重复和无重复的两种情况来领会。在
双因子有重复试验中,试验次数大于交互效应模型中独立参数的总数,因此有剩余
的自由度来估计误差方差;而在双因子无重复试验中,试验次数等于交互效应模型
中独立参数的总数,因此没有剩余自由度来估计误差方差。此时,要估计误差就只
能用可加效应模型。根据上述的思路,只要试验总次数$N$大于独立参数的个数$M$就可以有足够的自由度来估计参数,同时还有剩余的自由度来估计误差方差,进而作假设检验。
这是因子试验设计中要考虑的第一件事。第二件事是要使参数估计和检验统计量有好的性质和形式,关键是要使各组效应的参数估计之间相互独立,同时使相应的平方和之间相互独立。但是,在一个线
性模型中,参数(主效应及各种交互效应)的数目是由实际问题本身决定的,而不
是由人主观决定的。在大量的因子试验的实践中,人们发现:在很多情况下,因子
之间只有主效应,至多存在某些一阶交互效应(即两因子的交互效应)。高阶交互
效应在很多情况下是不存在的。在这种情况下,多因子试验的模型中包含的参数实
际上并不多,可能远远少于全模型的参数。比如有6 个二水平因子,如果考虑所有可能的交互作用就有26=64 个独立参数(包括总均值),但是如果只考虑主效应则只有6+1=7 个独立参数。因此对 6 个二水平因子的可加效应模型,理论上只需作 8次试验就可以有多余的自由度来估计误差方差。如何安排试验,使得上述的两个想法很好地实现呢?从双因子无重复试验的可加模型的分析中得到启示。在这个模型中,由于两个因子的所有水平组合都作了相
同次试验(一次),因此两组因子主效应的参数估计不仅有简单的形式,而且还是
相互独立的,因而平方和之间也是相互独立的。因此,对于多因子试验的无交互效
应模型(只考虑主效应),如果我们能如此安排试验,使得对任何一对因子,它
们的所有水平组合都作了相同次试验,则对任何一对因子,两组因子主效应的参
数估计和平方和也应具有上述性质。进而,如果试验的总次数n 超过参数的总个数k,则还有多余的自由度来估计误差,进行方差分析。实际上,这就是“正交因子
设计”原理的基本思路。下面我们先来研究一个实例。
例3.2.1假定在一个农业试验中要考察三个小麦品种、三种不同的肥料和三种播种方式对小麦产量的影响,并假定有九个地力基本相同的试验小区。在这个问题中有三个
可能影响小麦产量的因子:品种、肥料和播种方式,每个因子有三个水平。如果要
作完全试验就需要3×3×3=27 个小区。而实际上总共只有 9 个小区。显然,完全试验在当前的情况下行不通。因此我们退一步考虑,按照上述的想法,要求品种、肥料和播种方式中的任意两个(品种与肥料、品种与播种方式、肥料与播种方式)
的不同水平的搭配都出现一次。这样的试验设计存在吗?对此,答案是肯定的。表
4.3.1 就是这样一个试验的设计表。表3.2.1 三个三水平因子 9 次试验的正交试验设计表试验序号品种肥料播种方式1
2
34
5
67
8
91
1
12
2
23
3
31
2
31
2
31
2
31
2
32
3
13
1
2按照这张表来安排试验的方法如下:表的每一行代表一次试验,第一列为试验的编号,后三列每一列代表一个因子。表中的元素1、2、3 分别表示相应因子的第一、二、三水平。按照这个规定,容易安排试验。例如,表的第1 行为(1,1,1),相应地,在序号 1 的试验中每个因子都取1 水平。又例如,表的第 5 行为(2,2,3),相应在序号 5 的试验中安排第一因子的2 水平,第二因子的 2 水平,第三因子的 3 水平,等等。仔细观察表3.2.1 的结构,不难看出按照这个表来安排试验就满足我们前面提到的要求。具体
地说,表中任意两列的1、2、3 的 9 种不同组合出现相同次数(各 1 次)。满足这种性质的试验就是“正交试验”。假定因子对小麦单产的影响满足可加效应模型(只有主效应,而没有一阶和二阶交互效应),对上述的试验安排我们建
立如下的模型。记yi为第i 次试验中小麦单产(公斤/亩),并记jα为品种因子的第j 水平对小麦单产的影响,jβ为肥料因子的第j 水平对小麦单产的影响,jγ为播种方式因子的j 水平对小麦单产的影响,j =1,2,3。根据表 3.2.1 容易写出这个模型如下:y1=µ+α1 +β1 +γ1 + e1y2=µ+α1 +β2 +γ2 + e2y3=µ+α1 +β3 +γ3 + e3y4=µ+α2 +β1 +γ2 + e4y5=µ+α2 +β2 +γ3 + e5y6=µ+α2 +β3 +γ1 + e6y7=µ+α3 +β1 +γ3 + e7y8=µ+α3 +β2 +γ1 + e8y9=µ+α3 +β3 +γ2+ e9其中ei, i=1,… ,9 为独立、),0(2σN分布的随机误差;µ为总均值。如同在全面试验的方差分析模型中的作法一样,假定模型中的参数满足下面的约束条件:α1 +α2 +α3 =0,β1 +β2 +β3 =0,γ1 +γ2 + γ3 =0.在上述模型和约束条件下,我们来分析各组效应。先考虑参数估计。总均值µ的估计为样本均值:µˆ=•y =∑=9191iiy这是µ的无偏估计,因为在总共9 次试验值的期望中都有µ,且所有主效应参数各出现3 次,根据上面的约束条件可以验证 E(µˆ)=µ。再考虑因子主效应的估计,以β1 ,β2 ,β3的估计为例。在表3.2.1 中的第 2 列上,元素 1,4,7 为 1,元素2,5,8 为 2,元素 3,6,9 为 3。据此可以得到β1 ,β2 ,β3的估计为βˆ1=•−++yyyy)(31741βˆ2=•−++yyyy)(31852βˆ3=•−++yyyy)(31963根据上面的约束条件可以验证E(βˆj)= βj, j=1,2,3. 因此是无偏估计。不难看出,这个结果得益于设计的“正交性”。上述估计方法可以概括如下:某个因子第 j 水平的参数估计是该因子第 j 水平所对应的 yi的算术平均减去总平均•y 。容易根据此方法构造其它参数的估计。可以证明:对于这样的设计,三组主效应的参数估计之间是相互独立的。得到参数估计之后,为检验因子效应的显著性,还要进行方差分析。总平方和为SST=∑=•−912)(iiyy,SST 的自由度为 fSST=9-1=8。因子效应的平方和分别为SSA=3∑=312ˆjjα,SSB=3∑=312ˆjjβ,SSC=3∑=312ˆjjγ,它们的自由度分别为3-1=2(水平数减 1)。残差平方和
SSE=SST-SSA-SSB-SSC,
其自由度为8-3-3-3=2(SST 的自由度减去所有因子效应的自由度)。不难看出:因子效应平方和=重复数×(参数估计)2残差平方和=总平方和-(因子效应平方和的和)根据平方和与自由度的分解结果我们可以计算均方,进而构造F 统计量,对三个因子的主效应是否显著进行检验。上面我们用一个例子来说明了正交试验设计的基本特点和分析方法。下面给出一般性的陈述。考虑设计一个试验,安排m 个因子,作 n 次试验,若它满足下面两个条件,则这个试验称为正交试验:1)每一因子的不同水平在试验中出现相同次数(均衡性);2)任意两因子的不同水平组合在试验中出现相同次数(正交性).就定义来说,等重复的完全试验显然满足(4.3.4)中的条件,因此当然是正交试验。但是,如果因子的水平数分别为t1, t2, … , tm, 则完全试验至少要作 N= t1,t2,…tm次试验,由于要求的试验次数太多,实际上很难实施。我们通常所说的正交试验设
计是指既满足上述两条件,同时试验次数n 又远远小于 N 的设计。正交试验设计的方案可以用一张表来表示, 这张表就称为正交设计表. 表 3.2.1就是一张正交设计表. 一般, 正交设计表第一行为表头, 标明每列所代表的因子, 最左一列标明试验的序号(并不表示试验的时间先后顺序, 先后顺序要按照随机化原则来安排), 由 1 到 n. 表中每列中的数字代表相应因子的水平序号; 每行的数字代表在相应试验中各因子的水平序号. 在正交设计表中,1)每列中不同数字出现的次数相同(试验的均衡性);2)每两列中不同的数字组合出现的次数相同(试验的正交性).这两条性质符合正交试验设计的定义.假定因子对响应变量的影响无交互效应(许多实际情况正是这样),正交试验的优点是在很少的试验次数(与全面试验相比)中,所得数据可以简便而有效地对
因子效应进行参数估计和方差分析。其方法可一般地归纳如下:1)总均值的估计=试验数据的总平均值,2)某因子的某个主效应的估计=该因子的该主效应所出现的试验数据的平均值-总平均值,3)总平方和=(试验数据-总平均值)的平方和, 自由度=n</i><b>-</b>1,4)某因子的主效应平方和=重复数×参数估计的平方和, 自由度=水平数-1,5) 残差平方和=总平方和-(因子效应平方和的和), 自由度=总平方和-(因子效应自由度的和).
第3个回答  2007-01-27
上面的人兄都说的差不多了
第4个回答  2007-01-27
说老实话!你比我厉害!我......~~~~~~~!!
相似回答