原理微积分研究了变量间的函数关系:y=f(x);这是一种确定性的关系,即自变量x的值确定以后,因变量y的值也就随之而定了。许多实际问题中,需要研究变量间的另一类关系,这时的变量为随机变量。它们之间明显地存在有某种联系,但又不能用一个函数表达式确切地表示出来。例如:钢产量和电耗的关系,产量越高,电耗自然就要增加,但决不可能由电耗来确定钢产量。再比如:采用电炉吹氧技术时,吹氧量和吹氧时间对钢水的含碳量就有影响,但也不是完全确定的关系。这一类的关系,我们称为相关关系。回归分析就是研究处理相关关系的有力工具。
当自变量和因变量都是一个时,称为1-1回归,如果自变量为多个而因变量为一个时,称为多回归,实际工作中我们遇到的问题大多是多个自变量的问题。
建立回归方程已知的资料是:(y1;x11,…,x1p),(y2;x21,…,x2p),…,(yn;xn1,…,xnp)即因变量y与p个自变量x1,…,xp的n组观测值,第i组的值是(yi;xi1;…,xip)。此时仍然假定它们还有线性关系式:yi=b0+b1xi1+…+bpxip+Eii=1,…,n(1.1)现在的问题是如何从这n组资料去估计b0,b1,…,bp的值。
检验从正规方程组式中,解出回归系数和回归常数时回归平方和的自由度fU=p=自变量的个数,残差平方和的自由度fQ=n-p-1=资料的组数-(1+自变量的个数)3实际应用舞钢炼钢厂2号泵站水处理系统共分为5个分系统,即电炉净循环水系统、连铸净循环水系统、连铸浊循环水系统、泥浆处理系统、安全供水系统。在对2号泵站水处理系统进行系统分析后,初步得到如下结论:2号泵站电耗主要决定于2号电炉的钢产量、连铸机的钢坯产量和工厂所在地的月平均温度。从2000年3月到2001年2月,经过1年的运行得到一组数据。
数据分析2000年3月份数据因前半月处于停产检修状态,其数据不能作为统计分析用,其它月份生产正常,其数据均可作为统计分析用。直观显示每个月数据的分布状况,通过可以直观看出2号泵站电耗同2号电炉的钢产量、连铸机的钢坯产量和工厂所在地的月平均温度线性相关。
公式拟和根据公式(2)建立n=11,p=3矩阵,采用高斯?约旦消元法,利用Basic语言编程求解得:y⌒=7.47x1+5.40x2+0.412x3+12.03其中:y⌒??2号泵站月电耗期望值,万度;x1??2号电炉月钢产量,万t;x2??连铸坯月产量,万t;x3??月平均温度,度。检验回归方程检验计算。自由度n1=3,n2=7,可得临界值为4.35,可见F=8.508>4.35,表明此回归方程是有意义的。
结论通过回归的方程式可知,目前的生产情况下,生产一吨钢2号泵站动力设备耗电7.47度,生产一吨铸坯耗电5.4度,温度每升高一度,多耗电0.412度。此回归方程可为2002年泵站电耗指标的制定提供依据。