怎么利用SPSS进行正交试验分析?

我想利用SPSS进行一个五因素,四水平的正交试验分析,怎么建立数据,导入数据,分析得出结果?

2.最长距离法是把类与类之间的距离定义为两类中离得最远的两个案例之间的距离.最长距离法克服了最短距离法链接聚合的缺点,两类合并后与其他类的距离是原来两个类中的距离最大者,加大了合并后的类与其他类的距离.
3.平均联结法,最短最长距离法都只用两个案例之间的距离来确定两类之间的距离,没有充分利用所有案例的信息,平均联结法把两类之间的距离定义为两类中所有案例之间距离的平均值,不再依赖于特殊点之间的距离,有把方差小的类聚到一起的趋势,效果较好,应用较广泛.
4.重心法,把两类之间的距离定义为两类重心之间的距离,每一类的重心是该类中所有案例在各个变量的均值所代表的点.与上面三种不同的是,每合并一次都要重新计算重心.重心法也较少受到特殊点的影响.重心法要求用欧氏距离,其主要缺点是在聚类过程中,不能保证合并的类之间的距离呈单调增加的趋势,也即本次合并的两类之间的距离可能小于上一次合并的两类之间的距离.
5.离差平方和法,也称沃尔德法.思想是同一类内案例的离差平方和应该较小,不同类之间案例的离差平方和应该较大.求解过程是首先使每个案例自成一类,每一步使离差平方和增加最小的两类合并为一类,直到所有的案例都归为一类为止.采用欧氏距离,它倾向于把案例数少的类聚到一起,发现规模和形状大致相同的类.此方法效果较好,分析原理<pre说判定有些严格,其实就是观察一下各个指标的相关程度。一般来说相关性越是高,做主成分分析就越是成功。主成分分析是通过降低空间维度来体现所有变量的特征使得样本点分散程度极大,说得直观一点就是寻找多个变量的一个加权平均来反映所有变量的一个整体性特征。
评价相关性的方法就是相关系数,由于是多变量的判定,则引出相关系数矩阵。
评价主成分分析的关键不在于相关系数的情况,而在于贡献率,也就是根据主成分分析的原理,计算相关系数矩阵的特征值和特征向量。
相关系数越是高,计算出来的特征值差距就越大,贡献率等于前n个大的特征值除以全部特征值之和,贡献率越是大说明主成分分析的效果越好。反之,变量之间相关性越差。
举个例子来说,在二维平面内,我们的目的就是把它映射(加权)到一条直线上并使得他们分散的最开(方差最大)达到降低维度的目的,如果所有样本点都在一条直线上(也就是相关系数等于1或者-1),这样的效果是最好的。再假设样本点呈现两条垂直的形状(相关系数等于零),你要找到一条直线来做映射就很难了。
一般来说前三个主成分的贡献率在90%以上,第一个主成分的贡献率在70%效果就已经很好了
one-way ANOVA方差分析项的post Hoc test分别有二选项: 1.假设方差齐时有一系列的分析方法可选。2.假设方差不齐时又有一系列的分析方法可选。
再者,为保证统计准确,如果方差不齐,可以进行对数,倒数或函数的转换,选择适当的转换形式,直到齐性检验变为不显著。
如果还不行就只能用非参数的单因素分析。如果非要进行方差分析则需要把means±SD范围外的数据剔除。
实际操作中对方差齐性等适用条件的把握:
1.单因素方差分析:根据BOX的研究结果,在单因素方差分析中,如果各组的例数相同(即均衡),或总体呈正态分布,则方差分析模型对方差略微不齐有一定的耐受力,只要最大与最小方差之比小于3,分析结果都是稳定的
2. 单元格内无重复数据的方差分析分析:以配伍设计的方差分析最为典型,此时不需要考虑正态性和方差齐性问题,原因在于正态性和方差齐性的考察是以单元格为基本单位的,此时每个格子中只有一个元素,当然没法分析了.除配伍设计的方差分析外,交叉设计,正交设计等也可以出现无重复数据的情况.但必须指出,这里只是因条件不足,无法考察适用条件,而不是说可以完全忽视这两个问题.如果根据专业知识认为可能在不同单元格内正态性,方差齐性有问题,则应当避免使用这种无重复数据的设计方案.
3.有重复数据的多因素方差分析:由于正态性,方差齐性的考察以单元格为基本单位,此时单元格数目往往很多,平均每个单元格内的样本粒数实际上比较少。此时实际上很难检验出差别;另一方面,也可能只是因为极个别单元格方差不齐而单质检验不能通过。根据实际经验,实际在多因素方差分析中,极端值的影响远远大于方差齐性等问题的影响,因此实际分析中可以直接考察因变量的分布情况,如果数据分布不是明显偏态,不存在极端值,而一般而言方差齐性和正态齐性不会有太大问题,而且也可以基本保证单元格内无极端值.因此在多因素方差分析中,方差齐性往往只限于理论讨论,但对于较重要的研究,则建模后的残差分析是非常重要的。
正交试验设计是获得最佳搭配的方法之一.它是通过三个步骤完成的:1,利用正交表来安排试验;2,对试验的结果进行综合比较;3,获得最佳搭配方案.4,分析影响结果的因素的主次。正交试验设计表的设计原则是均衡分散搭配,分析试验结果,其原则为综合比较,即在同因素中将相同水平的结果相加,找出每个因素中的最好水平,得到最佳搭配。分析影响结果的因素的主次.将同因素中的两个水平的结果做差,一般来说差的大小是不同的,差的大小实际上反应了该因素的变化对产量的影响的大小.差大说明该因素水平的变化对试验的结果影响大,差小说明该因素的变化对试验结果没太多影响.因此,可以通过差的大小来确定因素对试验结果影响的主次,找出影响试验的主要因素.在对一个因子试验所建立的线性模型中,独立参数(总均值,主效应,交互效应等)的个数k与试验次数n之间有下面的关系:当 n>k时,有足够的自由度k来估计参数,同时还有剩余自由度来估计误差的方差(n-k>0);当n=k时,有足够的自由度来估计参数,但是没有剩余自由度来估计误差的方差n-k=0;当nk).在双因子有重复试验中,试验次数大于交互效应模型中独立参数的总数,因此有剩余的自由度来估计误差方差;而在双因子无重复试验中,试验次数等于交互效应模型中独立参数的总数,因此没有剩余自由度来估计误差方差.此时,要估计误差就只能用可加效应模型.根据上述的思路,只要试验总次数$N$大于独立参数的个数$M$就可以有足够的自由度来估计参数,同时还有剩余的自由度来估计误差方差, 进而作假设检验.这是因子试验设计中要考虑的第一件事.第二件事是要使参数估计和检验统计量有好的性质和形式,关键是要使各组效应的参数估计之间相互独立,同时使相应的平方和之间相互独立.但是,在一个线性模型中,参数(主效应及各种交互效应)的数目是由实际问题本身决定的,而不是由人主观决定的
温馨提示:答案为网友推荐,仅供参考
第1个回答  2012-05-24
先设计正交表然后做实验,分析
相似回答