这个作业是完成人口出生率、死亡率以及国民生产总值的计量经济问题统计

ECON603 Introduction to Econometrics

Assignment, Semester 2, 2020

问题1(24分)
使用“作业2”中题为“问题1”的工作表_数据.xlsx“为了这个问题。它包含64个国家的儿童死亡率(CM)、女性识字率(FLR)、人均国民生产总值(PGNP)和总生育率(TFR)的数据,进行以下回归分析并给出您的产出:
Y_i=β1+β2 X_2i+u_i
Y_i=β∗1+β∗2i+β∗3 X_3i+u_i
Y_i=β1+β2 X_2i+β3 X_3i+β4 X_4i+u_i
Y_i=儿童死亡率(CM),婴儿和5岁以下儿童的死亡(每1000个活产)。
X_2i=女性识字率(FLR),15岁及以上能够读写的成年女性的百分比。
X_3i=人均国民生产总值(PGNP)。
X_4i=总生育率(TFR),即妇女在其一生中所生或可能生的子女总数,如果妇女受人口中按年龄分列的生育率的影响。
首先,CM和其他变量之间的预期关系是什么?
(4分)
鉴于回归结果,你会选择哪种模型?为什么?写下估计的样本回归线。
(5分)
解释估计的回归系数,并测试您在(b)中选择的模型的每个估计偏斜率系数的统计显著性。
(5分)
解释决定系数R2并检验其统计意义。
(5分)
解释R^2和调整后的R̅2之间的差异。
(5分)
问题2(18分)
使用“作业2”中题为“问题2”的工作表_数据.xlsx“为了这个问题。它包含了来自世界银行发展指标的两个变量的176个国家的数据。出生率表示2011年每1000人中活产的数量。人均国内生产总值是2011年人均国内生产总值,以目前的美元计算。
在进行任何实证分析之前,请简要讨论一下您对两个变量之间关系的预期:出生率和人均GDP。(提示:你可以尝试用生育的微观经济学来预测这种关系)
(2分)
创建出生率和人均国内生产总值的散点图。你如何描述这两个变量之间的关系?另外,通过计算相关比率来评估这种关系,并解释结果。
(4分)
生成一个新的变量ln⁡(人均GDP)。建立出生率与ln⁡(人均GDP)的散点图,并计算它们之间的相关系数。这些结果是否会影响潜在回归规范的选择?
(4分)
通过进行以下二元回归分析,评估人均GDP对出生率的影响,然后解释您的结果,记住解释哪个模型是首选的,以及为什么。
i) Y_i=α+βX_i+u u i
ii)Y_i=α+βln⁡(X_i)+u_i
式中,Y逯i=2011年每1000人的粗出生率,X逯i=2011年人均GDP(美元)
(8分)
问题3(20分)
使用“作业2”中题为“问题3”的工作表_数据.xlsx“为了这个问题。它包含数字无线通信设计和制造商高通公司(Qualcomm,Inc.)1995年至2000年期间的每周股票价格数据。
创建一个股价随时间变化的散点图。什么样的模式在情节中很明显?
(5分)
估计一个基于时间的线性模型来预测收盘价。写下要估计的总体回归函数(PRF)和样本回归函数(SRF)。根据回归结果,这个模型是否与数据拟合得很好?
(5分)
现在使用时间和时间平方来估计平方模型(写下PRF和SRF)。这比(b)部分更合适吗?
(5分)
现在尝试用三次或三次多项式拟合数据(写下PRF和SRF)。哪一个模型似乎是股票价格的最佳估计?
(5分)

QUESTION 4 (20 Marks)
Use the data in the worksheet entitled “Question 4” in “Assignment 2_data.xlsx” for this question. The data contains the following information collected for 680 university students in the United States:
stndfnl = the standardized final exam score
atndrte = the percentage of lectures attended
fresh = 1 if in 1st year of university; and 0 otherwise
second = 1 if in 2nd year of university; and 0 otherwise
priGPA = prior cumulative GPA (grade point average)
ACT= State high school graduation achievement test score

To determine the effects of attending lectures on final exam performance, first estimate a model relating the standardized final exam score (stndfnl) to the percentage of lectures attended (atndrte). Include the binary variables fresh and second as explanatory variables. Interpret the estimated coefficients and discuss their statistical significance:
(10 marks)

As proxy variables for student ability, add to the regression priGPA and ACT. Now, what is the effect of atndrte? Discuss why and how the effects differ from that in (a).
(5 marks)

To test for a nonlinear effect of atndrte, add its squared term to the regression equation in (b). What do you conclude?
(5 marks)

QUESTION 5 (18 Marks)
Use the data in the worksheet entitled “Question 5” in “Assignment 2_data.xlsx” for this question. The data contains the following information collected for 654 youths on the following variables:
fev = stands for forced expiratory volume, the volume of air (in litres) that can be forced out after taking a deep breath, an important measure of pulmonary function. The objective of this exercise is to find out the impact of age, height, weight and smoking habits on fev.
smoke = smoker coded as 1; non-smoker coded as 0
age = in years
ht = height in inches
sex = coded 1 for male and 0 for female

Develop a suitable regression model for the exercise, i.e. find out the impact of age, height, gender and smoking habits on fev.
(5 marks)

What is the expected effect of each explanatory variable on fev? Do the regression results support your expectation?
(5 marks)

Which of the explanatory variables, or regressors, are individually statistically significant, say, at the 5% level? What are the estimated p values?
(5 marks)

Would you reject the hypothesis that the slope coefficients of all the regressors are statistically insignificant? How would you interpret the R^2 value?
(3 marks)