• 沒有找到結果。

多元线性回归模型

在文檔中 导 论 (頁 124-127)

∑实例

5.4 多元线性回归模型

包含两个或多个自变量的函数关系叫做多元线性回归模型。在(完全)一般性多元线性回 归模型中,假设自变量 Y是m个自变量X1,X2,…,Xm的函数,具有的形式为:

Y= + 1X1+ 2X2+…+ mXm+ (5 - 3 0)

在舍温-威廉斯公司例子中,假设油漆销售量( Y)是三个变量的函数:促销支出( A),

价格(P)和家庭可支配收入( M)[见(式5 - 1)]:

Y= + 1A+ 2P+ 3M+

构成多元线性回归模型的假设

除了要满足与简单线性回归模型(本章前面讨论过)相同的 4个假设条件(或要求)以外,

在多元线性回归模型中应用最小平方估计程序时还要求有另外两个假设。

假设5

观察值数量( n)必须超过要估计的参数数量( m+ 1)。

假设6

任何自变量之间都不存在准确的线性关系,一种定义关系或共识(比如账簿中的现金等于 初始现金加上收据)是不能估计的,除非数据中存在某些随机因素的来源。例如,当值的职员 会承认调整时出现偶然的误差。

F=4 4 9 1.506 4 1 5 8.5/ 8 =8.641

5.4.1 应用电脑程序

使用矩阵代数方法,采用与说明简单线性回归模型相似的程序,可以计算式( 5 - 3 0)中的 估计回归参数( a,b),检验每个自变量的统计显著性和回归方程的整体解释能力。 [ 2 6 ] 在大多数 多元回归分析的实际应用中都采用通用计算机程序来完成对一系列给定数据的估计程序。

虽然在进行多元回归分析时有多种不同的程序,但这些程序的结果都是相当标准化的。正 常的结果包括估计回归参数,每个系数的 t统计值, R2,方差分析和整体显著性的 F检验。这里 提供的程序是 M Y S TAT。[ 2 7 ]

把表5 - 1中舍温-威廉斯公司的数据以及适当的控制说明输入 M Y S TAT程序,产生的结果如 图5 - 8所示。

图5-8 计算机输出结果:舍温-威廉斯公司

5.4.2 总体回归系数的估算

根据计算机的结果(系数栏),可得到下列回归的方程:

Y= 3 1 0 . 2 4 5 + 0 . 0 0 8A-1 2 . 2 0 2P+ 2 . 6 7 7M (5 - 3 1)

变量P的系数 (-1 2 . 2 0 2 )表明,所有其他条件不变,价格提高 1美元,某一给定销售地区内 的预期销售量将减少- 1 2 . 2 0 2×1 000或12 202加仑。

5.4.3 利用回归模型进行预测

如同简单的线性回归模型一样,多元线性回归模型也可用来进行点预测或区间预测。把自 变量的特定值代入估计回归方程中就可进行点预测。

在舍温-威廉斯公司例子中,假设我们有兴趣估计某一销售地区的销售量,这个地区的 促销支出为 185 000 美元(即 A= 1 8 5),销售价格为 1 5 . 0 0美元( P),每个家庭的可支配收入为 19 500美元(即 M= 1 9 . 5),把这些数值代入式( 5 - 3 1),产生:

y'= 3 1 0 . 2 4 5 + 0 . 0 0 8×( 1 8 5 )-1 2 . 2 0 2×( 1 5 . 0 0 ) + 2 . 6 7 7×( 1 9 . 5 ) = 1 8 0 . 8 9 7

[26] See Lardaro, Appiled Econometrics, (New York: HarperCollins, 1993), chap.6, for a discussion of the multiple linear regression model.

[27] See MYSTAT (Evanston, Ill.: Systat, Inc., 1989). MYSTAT is a product of Systat, Inc., Evanston, Ill.

或180 897加仑。在预测Y' 的过程中,是包括 1个、2个还是全部3个自变量取决于这个及随后样本 预测中的均值预测误差(如这里是 185 000-180 897=4 103)。

图5 - 8中产量估计值的标准误差( Se)可用来构建Y的预测区间。大约 9 5%的预测区间等于:

y'±2se

对于一个带有前面提到特点的一个销售地区(即, A= 1 8 5,P= 1 5 . 0 0,M= 1 9 . 5)来说,大约 9 5%的油漆销售预测区间等于:

1 8 0 . 8 9 7±2 ( 1 7 . 4 1 7 ) 或从146 063到215 731加仑。

5.4.4 总体回归系数的推断

在文檔中 导 论 (頁 124-127)