扫二维码与项目经理沟通
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流
正交实验设计
发展壮大离不开广大客户长期以来的信赖与支持,我们将始终秉承“诚信为本、服务至上”的服务理念,坚持“二合一”的优良服务模式,真诚服务每家企业,认真做好每个细节,不断完善自我,成就企业,实现共赢。行业涉及围栏护栏等,在网站建设、成都全网营销推广、WAP手机网站、VI设计、软件开发等项目上具有丰富的设计经验。
当析因设计要求的实验次数太多时,一个非常自然的想法就是从析因设计的水平组合中,选择一部分有代表性水平组合进行试验。因此就出现了分式析因设计(fractional factorial designs),但是对于试验设计知识较少的实际工作者来说,选择适当的分式析因设计还是比较困难的。
正交试验设计(Orthogonal experimental design)是研究多因素多水平的又一种设计方法,它是根据正交性从全面试验中挑选出部分有代表性的点进行试验,这些有代表性的点具备了“均匀分散,齐整可比”的特点,正交试验设计是分式析因设计的主要方法。是一种高效率、快速、经济的实验设计方法。日本著名的统计学家田口玄一将正交试验选择的水平组合列成表格,称为正交表。例如作一个三因素三水平的实验,按全面实验要求,须进行33=27种组合的实验,且尚未考虑每一组合的重复数。若按L9(3)3正交表按排实验,只需作9次,按L18(3)7正交表进行18次实验,显然大大减少了工作量。因而正交实验设计在很多领域的研究中已经得到广泛应用。
1.正交表
正交表是一整套规则的设计表格,用 。L为正交表的代号,n为试验的次数,t为水平数,c为列数,也就是可能安排最多的因素个数。例如L9(34), (表11),它表示需作9次实验,最多可观察4个因素,每个因素均为3水平。一个正交表中也可以各列的水平数不相等,我们称它为混合型正交表,如L8(4×24) (表12),此表的5列中,有1列为4水平,4列为2水平。根据正交表的数据结构看出,正交表是一个n行c列的表,其中第j列由数码1,2,… Sj 组成,这些数码均各出现N/S 次,例如表11中,第二列的数码个数为3,S=3 ,即由1、2、3组成,各数码均出现 次。
正交表具有以下两项性质:
(1)每一列中,不同的数字出现的次数相等。例如在两水平正交表中,任何一列都有数码“1”与“2”,且任何一列中它们出现的次数是相等的;如在三水平正交表中,任何一列都有“1”、“2”、“3”,且在任一列的出现数均相等。
(2)任意两列中数字的排列方式齐全而且均衡。例如在两水平正交表中,任何两列(同一横行内)有序对子共有4种:(1,1)、(1,2)、(2,1)、(2,2)。每种对数出现次数相等。在三水平情况下,任何两列(同一横行内)有序对共有9种,1.1、1.2、1.3、2.1、2.2、2.3、3.1、3.2、3.3,且每对出现数也均相等。
以上两点充分的体现了正交表的两大优越性,即“均匀分散性,整齐可比”。通俗的说,每个因素的每个水平与另一个因素各水平各碰一次,这就是正交性。
2. 交互作用表 每一张正交表后都附有相应的交互作用表,它是专门用来安排交互作用试验。表14就是L8(27)表的交互作用表。
安排交互作用的试验时,是将两个因素的交互作用当作一个新的因素,占用一列,为交互作用列,从表14中可查出L8(27)正交表中的任何两列的交互作用列。表中带( )的为主因素的列号,它与另一主因素的交互列为第一个列号从左向右,第二个列号顺次由下向上,二者相交的号为二者的交互作用列。例如将A因素排为第(1)列,B因素排为第(2)列,两数字相交为3,则第3列为A×B交互作用列。又如可以看到第4列与第6列的交互列是第2列,等等。
3.正交实验的表头设计 表头设计是正交设计的关键,它承担着将各因素及交互作用合理安排到正交表的各列中的重要任务,因此一个表头设计就是一个设计方案。
表头设计的主要步骤如下:
(1)确定列数 根据试验目的,选择处理因素与不可忽略的交互作用,明确其共有多少个数,如果对研究中的某些问题尚不太了解,列可多一些,但一般不宜过多。当每个试验号无重复,只有1个试验数据时,可设2个或多个空白列,作为计算误差项之用。
(2)确定各因素的水平数 根据研究目的,一般二水平(有、无)可作因素筛选用;也可适用于试验次数少、分批进行的研究。三水平可观察变化趋势,选择最佳搭配;多水平能以一次满足试验要求。
(3)选定正交表 根据确定的列数©与水平数(t)选择相应的正交表。例如观察5个因素8个一级交互作用,留两个空白列,且每个因素取2水平,则适宜选L16(215)表。由于同水平的正交表有多个,如L8(27)、L12(211)、L16(215),一般只要表中列数比考虑需要观察的个数稍多一点即可,这样省工省时。
(4)表头安排 应优先考虑交互作用不可忽略的处理因素,按照不可混杂的原则,将它们及交互作用首先在表头排妥,而后再将剩余各因素任意安排在各列上。例如某项目考察4个因素A、B、C、D及A×B交互作用,各因素均为2水平,现选取L8(27)表,由于AB两因素需要观察其交互作用,故将二者优先安排在第1、2列,根据交互作用表查得A×B应排在第3列,于是C排在第4列,由于A×C交互在第5列,B×C交互作用在第6列,虽然未考查A×C与B×C,为避免混杂之嫌,D就排在第7列。
(5)组织实施方案 根据选定正交表中各因素占有列的水平数列,构成实施方案表,按实验号依次进行,共作n次实验,每次实验按表中横行的各水平组合进行。例如L9(34)表,若安排四个因素,第一次实验A、B、C、D四因素均取1水平,第二次实验A因素1水平,B、C、D取2水平,……第九次实验A、B因素取3水平,C因素取2水平,D因素取1水平。实验结果数据记录在该行的末尾。因此整个设计过程我们可用一句话归纳为:“因素顺序上列、水平对号入座,实验横着作”。
4.二水平有交互作用的正交实验设计与方差分析
例8 某研究室研究影响某试剂回收率的三个因素,包括温度、反应时间、原料配比,每个因素都为二水平,各因素及其水平见表16。选用L8(27)正交表进行实验,实验结果见表17。
首先计算Ij 与IIj ,Ij为第j列第1水平各试验结果取值之和,IIj为第j列第2水平各试验结果取值之和。然后进行方差分析。过程为:
求:总离差平方和
各列离差平方和 SSj=
本例各列离均差平方和见表10最底部一行。即各空列SSj之和。即误差平方和
自由度v为各列水平数减1,交互作用项的自由度为相交因素自由度的乘积。
分析结果见表18。
从表18看出,在α=0.05水准上,只有C因素与A×B交互作用有统计学意义,其余各因素均无统计学意义,A因素影响最小,考虑到交互作用A×B的影响较大,且它们的二水平为优。在C2的情况下, 有B1A2和B1,A1两种组合状况下的回收率最高。考虑到B因素影响较A因素影响大些,而B中选B1为好,故选A2B1。这样最后决定最佳配方为A2B1C2,即80℃,反应时间2.5h,原料配比为1.2:1。
如果使用计算机进行统计分析,在数据是只需要输入试验因素和实验结果的内容,交互作用界的内容不用输入,然后按照表头定义要分析的模型进行方差分析。
我的实验是三因素三水平,做正交的话就是9次实验(我做一次实验得出一组数据就是一个月啊)。
我看不少论文上都是分两大步骤:
一、正交设计
1、进行正交设计,设计出后续的实验方案。
2、根据正交设计的实验方案进行试验(不写出过程,不做图表,因为各单因素的搭配是随机的,没法画曲线图分析),只给出结果。
3、根据实验结果,进行正交分析,得出各单因素的影响大小。
(在正交设计这部分,我就得做九个实验啊)
二、单因素实验
对正交设计的分析结果进行验证所补充的实验,这次所做的实验具有可比性,可以对单个因素影响效果做曲线图分析。
如此一来,那我的实验岂不是就做了两遍(虽然这两遍实验的控制因素水平可能不一样)。
做这么多实验就啥时候毕业呀。
我的问题是:
有人说先单因素方便确定正交设计的因素水平。
2 ,我不想做正交设计。想直接用简单比较法得出最优实验方案算了,不过这样做出的论文不够炫,感觉没有技术含量,和人家做正交设计的相比就差了一大截。
很是头疼,定不下来方案。
希望各位走过路过的朋友帮帮忙,
对质量因素,应选入的水平通常是早就定下来的,如要比较的品种有3种,该因素(即品种)的水平数只能取3;对数量因素,选取水平数的灵活性就大了,如温度、反应时间等,通常取2或3水平,只是在有特殊要求的场合,才考虑取4以上的水平。
数量因素的水迄度取得过窄,结果可能得不到任何有用的信息;过宽,结果会出现危险或试验无法进行下去。最好结合专业知识或通过预试验,对数量因素的水平变动范围有一个初步了解,只要认为在技术上是可行的,一开始就应尽可能取得宽一些.随着试验反复进行和技术情报的积累,再把水平的幅度逐渐缩小。 重复试验(各此试验的样品不完全相同)和重复取样(各此试验的样品完全相同)在概念上和数据处理时都是有区别的,使用时须慎重。除了上面提到的场合下要进行重复试验(或取样)外,当用动物作为受试对象时,也应考虑进行重复试验,这是由于动物的个体差异很大,通过重复试验,可使误差的估计更精确,使试验结果更可靠。
误差的离均差平和及自由度的计算方法:若属重复试验,当表中有空白列时,则由全部空白列和重复试验2部分组成;当表中无空白列时,则仅由重复试验一部分组成;若属重复取样,当表中有空白列时,则须用由重复取样产生的究偏差均方作分母,用由空白列产生的整体试验偏差作分子构造F统计量,进行F检验,差别不显著时,可将2部分偏差的离差平和及自由度分别合并求得误差均方的估计值;若差别显著,则不能合并,只用空白列产生的偏差作为误差的估计值;当表中无空白列时,只能用由重复取样产生的偏差作为误差的近似估计值。如果检验的结果有一半左右的因素或交互作用不显著,可认为这种检验还是合理的,因它能区分矛盾的主次。
正交实验设计方法是研究与处理多因素实验的一种科学方法。它最早产生于 20 世纪20 年代英国罗隆姆斯特农业实验站 ( 侯化国等,1985) ,后来由日本田口玄一博士在 50年代编制出正交实验表,60 年代初从日本传入中国。它依据 Galois 理论导出的正交表,从大量实验条件中挑选出适量、有代表性的条件来合理地安排实验,被称为国际标准型正交实验法。
正交表是运用组合数学理论构造的一种规格化的表格,通常有两种表达形式,一种是非交互性的正交表,另一种是交互性的正交表。下面只简单介绍第一种正交表,其通用符号可以表示为:
Ln( ji)
式中: L———正交表符号;
n———正交表的行数 ( 实验次数或实验方案数) ;
j———正交表中的数码 ( 因素的水平数或称位级数) ;
i———正交表的列数 ( 实验因素的个数) 。
举例来说,某工厂想提高某种产品的质量或产量,对工艺中 3 个主要因素各按 3 个水平进行实验 ( 表 5. 1) ,以寻求最适宜的操作条件。
表 5. 1 3 因素与 3 水平的选择
那么,很容易想到的是全面搭配法方案,如图 5. 1 所示。此方案数据点分布的均匀性极好,因素和水平的搭配十分全面,唯一的缺点是实验次数多达 33= 27 次 ( 指数 3 代表3 个因素,底数 3 代表每个因素有 3 个水平) 。因素、水平数愈多,则实验次数愈多。例如,做一个 6 因素 3 水平的实验,就需 36= 729 次实验,显然在人力、物力和时间上都难以做到,而且付出的经济代价也高得多。因此,需要寻找一种合适的实验设计方法。
图 5. 1 全面搭配法方案
如果采用简单比较法方案,即先固定 p1和 T1,只改变 t,观察因素 t 不同水平的影响,做了如图 5. 2 ( 1) 所示的 3 次实验,发现 t = t2时的实验效果最好 ( 好的用 □ 表示) ,所得产品的产量最高,因此认为在后面的实验中因素 t 应取 t2水平。然后固定 p1和t2,改变 T 的 3 次实验,如图 5. 2 ( 2) 所示,发现 T = T3时的实验效果最好,因此认为因素 T 应取 T3水平。最后固定 T3和 t2,改变 p 的 3 次实验,如图 5. 2 ( 3) 所示,发现因素p 宜取 p2水平。
图 5. 2 简单比较法方案
因此可以得出结论: 为提高所得产品的产量,最适宜的操作条件为 p2、T3、t2。与全面搭配法方案相比,简单比较法方案的优点是实验次数减少,只需做 9 次实验。但必须指出,简单比较法方案的实验结果是不可靠的。因为: ①在改变 t 值 ( 或 T 值,或 p 值) 的3 次实验中,说 t2( 或 T3或 p2) 水平最好是有条件的,在 p≠p1,T≠T1时,t2水平不是最好的可能性是存在的; ②在改变 t 的 3 次实验中,固定p = p2,T = T3,应该说也是可以的,是随意的,故在此方案中数据点分布的均匀性是毫无保障的; ③用这种方法比较条件好坏时,只是对单个的实验数据进行数值上的简单比较,不能排除必然存在的实验数据误差的干扰。
运用正交实验设计方法,不仅兼有上述两个方案的优点,而且实验次数少,数据点分布均匀 ( 图 5. 3) ,结果的可靠性也好。正交实验设计方法是用正交表来安排实验的,对于上述实例适用的正交表是 L9( 34) ,其实验安排见表 5. 2。
图 5. 3 正交实验法方案
表 5. 2 L9( 34) 正交实验安排
选择 L9( 34) 正交表是因为在 3 水平的正交表中,常用的有 L9( 34) 和 L27( 313)等,由于3 水平正交表中不存在3 因素3 水平的正交表,即不能完全 “对号入座”。所以,只有选用 L9( 34) 才能放下 3 因素。虽然空闲一列,但该表较之其他各表实验次数最少。我们选择此正交表共进行 9 次试验,它是从可能进行搭配的 34= 81 次实验中一次挑出来的,只要条件许可,还可以同时进行实验。
所有的正交表与 L9( 34) 正交表一样,都具有以下两个特点:
1) 在每一列中,各个不同数字出现的次数相等,即具有整齐可比性。在表 L9( 34)中,每一列有 3 个水平,水平 1、2、3 都是各出现 3 次。
2) 表中任意两列间横向组合的数字对搭配次数也是相等的,即具有均匀分散性。在表 L9( 34) 中,任意两列间横向组合在一起形成的数字对共有 9 个: ( 1,1) , ( 1,2) ,( 1,3) ,( 2,1) ,( 2,2) ,( 2,3) ,( 3,1) ,( 3,2) ,( 3,3) ,每一个数字对各出现一次。
这两个特点称为正交性。正是由于正交表具有上述特点,保证了用正交表安排的实验方案中因素水平是均衡搭配的,数据点的分布是均匀的。因素、水平数越多,运用正交实验设计方法,越能显示出它的优越性,如上述提到的 6 因素 3 水平实验,用全面搭配方案需 729 次,若用正交表 L27( 313) 来安排,则只需做 27 次实验。
在工农业生产中,因素之间常有交互作用。当上述的因素 p 的数值和水平发生变化时,实验指标随因素 T 变化的规律也发生变化; 或反过来,因素 T 的数值和水平发生变化时,实验指标随因素 p 变化的规律也发生变化。这种情况称为因素 p、T 间有交互作用,记为 p × T,那么就要选取交互性正交表,这方面的内容此处不再赘述,需要时可以查阅相关参考书。
正交表设计时遵循以下步骤:
1) 明确实验目的,确定考核指标。
2) 挑因素,选水平,确定因素水平表。
3) 选择适宜的正交表; 原则上被选用正交表的因子数与水平数等于或大于要进行实验考察的因子数与水平数,并且使实验次数最少。
4) 因素水平上正交表,确定实验方案,并按实验方案进行实验。
5) 实验结果分析。
我们在微信上24小时期待你的声音
解答本文疑问/技术咨询/运营咨询/技术建议/互联网交流