伍德里奇-计量经济学(第4版)答案
计量经济学答案
第二章
2.4 (1)在实验的准备过程中,我们要随机安排小时数,这样小时数(hours)可以于其它影响SAT成绩的因素。然后,我们收集实验中每个学生SAT成绩的相关信息,产生一个数据集
(sati,hoursi):i1,2,...n,n
是实验中学生的数量。从式
i(2.7)中,我们应尽量获得较多可行的hours变量。 (2)因素:与生俱来的能力(天赋)、家庭收入、考试当天的健康状况
①如果我们认为天赋高的学生不需要准备SAT考试,那天赋(ability)与小时数(hours)之间是负相关。②家庭收入与小时数之间可能是正相关,因为收入水平高的家庭更容易支付起备考课程的费用。③排除慢性健康问题,考试当天的健康问题与SAT备考课程上的小时数(hours)大致不相关。
(3)如果备考课程有效,应该是正的:其他
1因素不变情况下,增加备考课程时间会提高SAT成绩。
(4)在这个例子中有一个很有用的解释:因
0为E(u)=0,是那些在备考课程上花费小时数
0
为0的学生的SAT平均成绩。
2.7(1)是的。如果住房离垃圾焚化炉很近会压低房屋的价格,如果住房离垃圾焚化炉距离远则房屋的价格会高。
(2)如果城市选择将垃圾焚化炉放置在距离昂贵的街区较远的地方,那么log(dist)与房屋价格就是正相关的。也就是说方程中u包含的因素(例如焚化炉的地理位置等)和距离(dist)相关,则E(u︱log(dist))≠0。这就违背SLR4(零条件均值假设),而且最小二乘法估计可能有偏。 (3)房屋面积,浴室的数量,地段大小,屋龄,社区的质量(包括学校的质量)等因素,正如第(2)问所提到的,这些因素都与距离焚化炉的远近(dist,log(dist))相关
2.11(1)当cigs(孕妇每天抽烟根数)=0时,预计婴儿出生体重=110.77盎司;当cigs(孕妇每天抽烟根数)=20时,预计婴儿出生体重(bwght)=109.49盎司。
(110.77-109.49)/110.77=8.6%,抽烟数从0到20,预计儿童出生体重下降了约8.6%。 (2)并不能。还有其他因素可以影响婴儿出生体重,尤其是母亲的整体健康状况和产前保健的
质量。这些因素还都可能与母亲怀孕期间的抽烟习惯有关。其它因素,比如咖啡因的摄入量也会影响婴儿出生体重,而且可能与母亲怀孕期间的抽烟习惯有关。
(3)如果预测出生体重为125盎司,则cigs=(125 – 119.77)/( –0.524) –10.18 ,约为-10支,这是不可能的。当然,这只是告诉我们,对于预测婴儿出生体重这样复杂的因变量,如果只有一个解释变量,将会发生什么。预计婴儿出生体重的最大值是119.77盎司,然而样本中确有超过700个新生婴儿的体重超过了119.77盎司,这就说明模型建立不恰当
(4)85%的妇女怀孕期间不抽烟,即1388个样本中有大约1180个妇女不抽烟。因为我们只用cigs一个变量解释婴儿出生体重,所以当cigs=0时,我们只有一个相对应的出生体重数。在cigs=0时,预计的出生体重数大致位于观测的出生体重数的中间。因此,我们可能会低估较高的出生体重数。
第三章
3.3(1)法学院的排名(rank值)越大,说明学
校威望越低:这会降低起薪。例如:rank=100说明有99所学校排在其前面。
(2)>0,>0;LSAT和GPA都是测量进入法学
23院的学生的整体素质,不论优秀的学生在哪里进入法学院,我们预期他们会赚得更多。平均来讲,
3和4>0,法学院图书馆的藏书量及法学院每年
的费用都能衡量学校的好坏(相对于藏书量,法学院每年的费用对起薪的正的效应并不那么明显,但它应反映教职工、基础设备等相关资源质量的好坏)。
(3)在其他条件不变的情况下,预计GPA中位数相差一分会导致薪水有24.8%的差别。(恰好等于GPA的相关系数)
(4)Log(libvol)的系数表明:法学院藏书量每增加1%,则学生起薪会提高0.095%。 (5)很明显,进入排名较靠前(数字较小)的法学院更好。如果法学院A的排名比B靠前20位,则A法学院的起薪要高大约6.6%(0.0033*20*100%)
3.4(1)如果成年人为工作而放弃睡眠,工作多意味着睡眠会减少。所以>0.
1(2)一般说来,和的的符号并不确定。虽然有
23
人认为受过较高教育的人想要得到更完美的生活,所以他们的睡觉时间很少(<0)。睡眠时
2间与年龄之间的关系要比模型中给的复杂多,经济学家也并未对此作出更好的解释。
(3)因为工作时间以分钟为单位,我们把5小时化为分钟,则总工作时间为300分钟。睡眠时间预计会减少0.148*300=44.4分钟。从一周来看,少睡45分钟并不算是很大的舍弃。
(4)较多的教育意味着较少的睡眠时间,但教育对睡眠时间的影响是较小的。如果我们假设大学与高中的差别是4年,那么大学毕业生平均每年要少睡大约45(11.13*4)分钟。
(5)很明显,这3个解释变量只解释了睡眠时间11.3%的变异(R=0.113)。其他可能影响花在睡
2眠上时间的因素包括:健康状况、婚姻状况以及是否有孩子。一般来讲,这3个变量都与工作时间有关。(比如:身体状况较差的人工作时间较少) 第四章
4.3(1)尽管hrsemp(平均每个雇员每年接受培训的小时数)的标准误差没有改变,但系数增
加了大约一半(-0.029到-0.042),t统计量从-1.26到-2.21(-0.042/0.019),显著性水平为5%的临界值小于零。(当自由度为40时,显著性水平为5%的临界值约为-1.684;显著性水平为1%的临界值为-2.423,;p值在0.01---0.05之间)。
(2)log(scrap)=+hrsemp+log(sales)+log(employ)+ u
0123 = + hrsemp + [log(sales) – log(employ)]
0122
3 + log(employ)] + u
0[
2log(employ)
1+ +
=log(sales/employ)
2 + hrsemp
2 + ( + )log(employ) + u,
233我们令+=,则原式可写成:log(scrap)=+hrsemp+log(sales/employ)+log(employ)+ u
30123假设H:=0,意味着0332,当其他条件不变时,
销售额增加1%与企业雇员人数减少1%对废品率的影响是相同的。
(3)不是。我们对log(employ)的系数感兴趣,其t统计量为0.2(很小),因此我们可以得到:一旦我们控制了工人培训和销售—雇员比之后(以对数形式表示),以员工数量为测量标准的企业规模与废品率在统计上的显著性并不重要。 (4)零假设检验:H:= –1. T统计量=[–0.951–
02(–1)]/0.37= (1– 0.951)/0.370 .132; 这个数字很小,我们不能拒绝单侧或双侧假设。即sales/employ提高1%将伴随以废品率下降1%。
4.8(1)式中自由度df=706-4=702,自由度为702的双侧检验的5%的临界值是1.96。这样, teduc= 11.13/5.88 1., 所以|teduc|= 1.< 1.96,在显著性水平为5%的时候,我们不能拒绝假设H0:
educ = 0。同理:tage=2.20/1.451.52<1.96。因此,
对于双侧对立假设,educ与age在5%的水平上都不是个别显著的。 (2)
F(q,dfur)2(RurRr2)/qF2(1Rur)/dfur.1130.103)/23.96:;查表可知=(0(10.113)/702=F(2,702)=3.00。3.96>3.00,所以在5%
的显著性水平上,educ与age在原式中是联合显著的。
(3)几乎不影响。虽然educ与age在原式中是联合显著的,但在考虑它们之后,原式totwrk(总工作时间)的系数从-0.151变到了-0.148,这个影响是很小的。
(4)因为T检验与F检验是建立在同方差假定与其他线性模型假定基础上的,所以如果睡眠方程中含有异方差性,就意味着我们对方程的检验是无效的。
4.11(1)假定profmarg不变,当sales变化10%时,
rdinters=(0.321/100)*10=0.0321,j即rdintens
变化大约3%。相对于sales的变化,rdintens的变化是个较小的影响。 (2)H0::=0
1H1
:>0 其中是log(sales)
11321.486;自由度为的系数。进行T检验:t=00..216df=32-3=29的单侧检验显著性水平为5%的临界值为1.699,因而在5%的显著性水平上我们不能拒绝原假设。自由度为df=32-3=29的单侧检验显著性水平为10%的临界值为1.311,因而在10%的显著性水平上我们拒绝原假设而接受
1>0。
(3)Profmarg的系数表示:profmarg变化1%,rdintens变化0.05%,这在经济上影响并不显著。 (4)对profmarg的显著性进行T检验:
.051.087<1.311,因为它在统计上并不显著。 t=00.046第五章
5.3风险承受能力越强,越愿意投资于股票市场,因此
假设funds 和 risktol正相关,我们
因此具有高度不
使用等式
一致(渐进有偏),这表明如果我们在回归方程中省略risktol,并且它和funds高度相关,funds 的估计效应取决于risktol的效应。(省略risktol,回归方程倾向于高估funds的影响) 第六章
6.3(1)当其他要素固定时,我们有等式两边同除以
得到结果,是不显著的,
尽管大于0,如果来我们考虑一个孩子多得一年教育,孩子的父母会有更高的学历。 (2)我们选择pareduc的两个具体值来解释交叉项系数,比如父母双方都受过大学教育时pareduc=32
或父母都是高中毕业时
pareduc=24,educ的估计回报差额是0.00078(32-24)=0.0062,或者说0.62%。
(3)如果在方程中加入paredc作为一个变量引入,交叉项系数是负的。Educ*pareduc的t统计量大约是-1.33.在10%的显著性水平上,在双侧对立假设上,t统计量是不显著的。注意到,pareduc的系数在5%的显著性水平上,在双侧对立假设下是显著的。这表明省略一个效应水平会如何导致交互效应的有偏估计。 6.5 (1)当转折点是
ˆ1/(2|
ˆ2|),
or .0003/(.000000014) 21,428.57时开始为负的(以百万美元为计量单位)(对方程式求导,然后等式让等于0,即得到21,428.57)
(2)会,它的t统计量大约为-1.,这个在5%显著性水平上违背了单侧对立假设H0: 实际上,P值是0.036。
(3)因为销售获取除以 1 000,得到 salesbil,相应的系数乘以 1000 : (1,000)(0.00030) =0.30。标准错误乘以相同的因子。提示,salesbil2 = 销售额/1,000,000,所以对二次系数
获
取
乘
以
100
万
:
1 < 0
(co –1.70 with df = 29),即它是统计显著的,
(1,000,000)(.0000000070) =.0070 ;它的标准误差也获取乘以 100 万。截距 或R(因为 rdintens 不其重新缩放)不会发生变化:
rdintens2
=
2.613 +0.30 salesbil – 0.0070 (0.429)
(0.14)
salesbil2
(0.0037)
n = 32, R2 = 0.1484.
(4)第三小题的方程更容易阅读,因为它右侧包含更少的0,两个方程的解释是相同的,只是记账尺度不同。 第7章
7.1(1)男性系数是87.75,所有估计一男子差不多一周比女人多睡一个半小时,此外,tmale =87.75/34.33 2.56,这个数接近对于双侧对立假设的1%水平的临界值(2.58),因此, 性别差异的证据是相当强烈的。
(2)totwrk的 t 统计是 −0.163/0.018 ≈ −9.06,这是统计性水平是很显著的。这个系数意味着多工作一个小时(60 分钟)就会少睡0.163(60) ≈ 9.8分钟。
(3)为了获得R的值, R-squared来自约束回归
2r
方程,我们需要估计没有age 和age^2的模型,当age和 age2 都在模型中时,只有这两个参数均为零时才有没有影响。 7.2 (i) 如果 cigs = 10 那么 婴儿出生体重下降 4.4% 。
(2)在第一个方程中,保持其他因素不变,预计一个白人孩子比一个非白人孩子的出生体重高5.5%。而且twhite 4.23,这个比普通的临界值高,因此,白人孩子和非白人孩子的差异也是统计显著性的。
(3)如果孩子的母亲的教育水平多一年,孩子出生体重预计会高0.3%,这不是一个太大的影响,t统计量等于-1,因此其统计显著性不明显。 (4)这两个回归方程使用的是不同的观测值,第二个回归方程用的是较小的观测值因为在某些观测值中母亲或父亲的值消失了,我们需要使用估计的观测值来重新估计第一个方程(获得R-squared的值)。
7.3(1)hsize2 的t统计量的绝对值大于4,有很强的证据表明是统计显著的,我们是通过找到转折点来获得的。在其他条件不变的情况下hsize
log(bwght) =
0.0044(10) = 0.044, 意味着每天多抽十根烟,
ˆ的值:19.3/(22.19) 4.41.因为hsize是扩大了sat以百人计学生规模,毕业生的最优规模大约是
441.
(2)这个是由female的系数给出的(当black = 0时):非黑人女性比非黑人男性的SAT分数低45分,t统计量大约是-10.51.因此这个估计差异的统计显著性非常大。
(3)由于female = 0, black的系数表明一个黑人男性的SAT分数比同类非黑人男性低170分。T统计量的绝对值高0.13,因此,我们很容易就可以拒绝分数没有差异的虚拟假设。(t=-13.36,故拒绝原假设,即他们的分数存在差异) (4)我们为black females 插入black = 1, female = 1值,为nonblack females插入black = 0 and female = 1值,因此差异为–169.81 + 62.31 = 107.50.因为这个估计结果取决于两个系数,我们不能从给定的信息中构造出t统计量,最简便的方法是为三或四个种族或性别类定义虚拟变量,选择nonblack females 作为基础变量,因此,当black female的系数也是虚拟变量时我们就能获得所要的T统计量 第八章
4(1)这些系数有预期的估计效应。如果一个学生选修的课程平均成绩很高-通过较高的crsgpa反映出来-则他的成绩就会很高。学生在过去表现越是良好-通过cumgpa衡量-则学生在此学期平均成绩就会越好。最后,tothrs是对经验的衡量,这个系数表示报酬递增。
对于crsgpa,t统计量很大,使用普通标准误其值大于5(这是这两个中最大的).对cumgpa使用稳健的标准误,它的t统计量大约是2.61,在5%的显著性水平上是统计显著的。对于tothrs,使用任意标准误其t统计量仅约为1.17,因此在5%的水平上不是统计显著的。 (2)很容易发现在模型中没有解释变量。如果crsgpa是仅有的解释变量,H0:crsgpa= 1 意味着在
没有任何信息的情况下,对学生长期GDP最好的预测是学生课程的平均GDP,它可以通过定义获得(截距在这种情况下将是0).加入更多的解释变量,crsgpa= 1不一定正确,因为crsgpa与学
生的品质相关(例如,学生选修的课程可能是受考试成绩衡量的能力和过去的在校表现影响的)。但是,对检验这一假说很有意思。 使用普通标准误得到的t统计量是t =
(0.900 – 1)/0.175 0.57;使用异方差稳健标准误得出t 0.60。在这两种情况下,在任何合理的显著性水平上我们都不能拒绝H0:
crsgpa= 1,当然也包括5%。
(3)在旺季效应的系数上赛季,这意味着,当运动员的运动存在竞争时,他的GDP最低大约是0.16点。使用普通标准误其t统计量大约是-1.6,然而使用稳健标准误其t统计量大约是-1.96.
对于双侧对立假设,使用稳健标准误得出的t统计量在5%水平上是显著的(标准正常临界值是1.96),而使用普通标准误其t统计量在10%水平上不是显著的(临界值是1.65)。因此,在这种情况下使用不同的标准误有不同的结果。这个例子有点不寻常,因为稳健标准误往往是这两个中较大的那个。
6(1)所提出的检验是对帕甘检验和怀特检验的结合。有k+1个回归量,原始解释变量和拟合值的平方。因此,检验的数是K+1,这是分子的自由度,分母的自由度是n (k + 2) = n
k 2
(2)对于帕甘检验,这很容易:混合检验有一
ˆ, 因此对于混合检验而言,个额外的回归量y2R-平方不会小于帕甘检验下的R-平方。对于怀特检验特殊形式,这个参数更加微妙。在回归中(8.20), 拟合值是回归量的线性函数(当然,在线性函数中这个系数是OLS的估计值)。因此,我们正对原始解释变量如何在回归中出现作出。这意味着,怀特检验特殊形式下的R-平方不会大于混合检验下的R-平方。
(3)不是,对这些回归量进行联合显著性检验
其F统计量取决于R/(1R),它是真实的且这个比
22垐u2u2率随着R增加而增加。但F统计量也取决于自由
2ˆ2u度,且这个自由度在这三个检验中都是不同的:帕甘检验是怀特检验和混合检验的特例。所以,我们不知道哪个检验会产生最小的p值。 (4)如在(2)中所讨论的那样,OLS拟合值是原来回归量的线性组合。因为这些回归量出现在混合检验中,增加OLS拟合值是多余的,会导致完全共线性。 第九章
1.如果β6≠0或β7≠0,在添加人口参数分别是ceoten2 and comten2后,存在函数形式误设。
因此,我们使用R2形式的F检验对这些变量进行联合显著性检验:F = [(.375 − .353)/(1 − .375)][(177 –8)/2] ≈ 2.97。(2 ∞)时,10%的临界值是2.30,而5%的临界值是3.00。因此,p-值是略高于0.05,这是函数形式误设的合理证据。(当然,对于不同程度解释变量的估计偏效应是否有实际影响是另一回事) 3.(1)联邦资助的学校午餐计划的申请资格是与经济上处于不利地位紧密相连的。因此,享受午餐计划的学生比例与处于贫困中的学生比例非常相近。
(2)从回归方程中忽略重要变量时,我们可以使用常用的推理。log(expend)变量和lnchprg是呈负相关的:平均而言,有贫困儿童的校区花的更少。另外,β3<0。从表3.2可知,从回归模型中忽略lnchprg(贫困的代理)会产生一个向上的偏估计β1 [在模型中忽略了log(enroll)的存在]。因此,当我们控制贫困比率时,支出的影响会下降。
(3)一旦,我们控制了lnchprg,log(enroll)的系数会变为负的且其t统计量大约为-2.17.在5%的水平上双侧对立是显著的。这个系数意味
着点。
因此,入
学人数增加10%会导致math10下降0.126个百分(4)math10 和 lnchprg是百分数,因此,lnchprg增加10个百分点会导致math10下降约3.23个百分点,这是一个相当大的影响。 (5)列(1)中所有的变量只解释了对math10影响的很小部分:不足3%。列(2),我们解释了近19%(这样仍有许多变量没有解释)。显然,math10的大部分变量是通过lnchprg的变量得到解释。在学校行为研究中这是个很普通的发现:家庭收入(或相关因素,如生活在贫困中)在解释学生行为方面比花在每个学生身上的支出或学校其他特点方面更重要。 第十章
1.不同意。大部分的时间序列过程随时间推移是相关的,且很多都有很强的相关性。这意味着他们不是的横截面观测,而是代表了不同的时间段。即使是大致不相关的序列- 如股票收益率 - 似乎并不是分布,如你将在第12章中看到的动态形式下的异方差性。
2.同意。这句话可以从定理10.1中得到。特别是,我们不需要同方差和无序列相关的假设。 3.不同意。趋势变量在回归模型中常常被用作因变量。我们在解释结果时必须要谨慎,因为我们可能在Yt和趋势解释变量中只是找到一个虚假的关系。在回归中包含有趋势的因变量或自变量是合理的。正如第10.5节中讨论的那样,因变量有趋势时,通常r^2可能会产生误导。 4.同意。使用年度数据时,每一个时间段代表一年,与任何季节性变化都没有联系。 第十一章
证明:由于协方差平稳,= Var()不依赖于t,因此sd()=第十二章
12.1从方程12.4中可以找出原因:通常OLS标准误差是对
的估计量。当因变量和自变量,对于任何的h>=0.根据定义,
是水平in level(或对数)形式时,AR(1)的参数,ρ,在时间序列回归模型中往往是正的。此外,回归模型中不同时期的自变量往往是正相关的,因此,
-
当{}的样本均值不是0时,它通常出现在(12.4)方程中—对于多数时期t和t+j来说,往往是正的。有多个解释变量的公式更为复杂,但也有类似的特征。
如果ρ < 0或{}是负自相关的,(12.4)方程中最后一行的第二项可能是负的,在这种情况下,真正的标准偏差实际上会小于
这是个分析1981到2001年国内生产总值(GDP)与消费水平(XF)之间的相关关系的例子。 因变量:GDP
方法:最小二乘法
时间:11年6月3日13点19分 样本:1981年——2001年的数据 由表格可以建立GDP跟XF的方程: GDP=-134.93+1.66XF
Variable 变量 Coefficient 系数 Std.Error标准差 t-Statistic t统计量 Prob. 概率 其中:t-Statistic= Coefficient 系数/ Std.Error标准差
R-squared ——是剩余平方和与总平方和的比值,即R^2=SSE/SST 详见课本76页 Ajusted R-squared ——调整的R^2 一般Ajusted R-squared比R-squared要小, 调整后的可决系数剔除了解释变量个数对解释能力的影响。
S.E.of regression ——回归标准误 Sum squared resid——残差平方和
Durbin-Watson stat——DW统计量,检验模型是否含有一阶自相关,其值越接近2越好 Mean dependent var——因变量均值 S.D.dependent var——因变量标准差 F-Statistic——F统计量
Prob(F-Statistic)——F统计量的概率
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- 7swz.com 版权所有 赣ICP备2024042798号-8
违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务