这个作业是完成统计当中的随机变量、回归估计等问题

Problem List – SS9878/CS9878 Winter Term 2021

1.假设随机变量Y具有概率密度或质量函数
f(y; p,β1,β2)= pf1(y;β1)+(1- p)f2(y;β2),
其中p是(0,1)中的参数取值,f1(y)和f2(y)是两个给定的概率
参数未知的β1和β2的密度或质量函数。
假设{Y1,。 。 。 ,Yn}是从分布f(y; p)中选择的随机样本。让
θ=(p,βT
1个
,βT
2

Ť

(一种)。找到似然函数以推论θ。
(b)。查找所需的信息功能。
(C)。假设f1(y;β1)和f2(y;β2)是N(β1,1)和的概率密度函数
N(β2,1)。制定θ的估计程序。
(d)。假设f1(y;β1)和f2(y;β2)是EXP(β1)的概率密度函数
和EXP(β2)。那是,
当y≥0时,fj(y;βj)=βjexp(-βjy)
其中j = 1,2。计算出θ的估计程序。
2.假设样本包含{{(Yi
,Xi}:i = 1 ,。 。 。 ,n},其中Xi =(Xi1,…,Xip)
Ť
是p×1维向量
协变量令Y =(Y1,…,Yn)
T和X = [1n X; 1 X; 2。 。 。 X; p]表示协变量的n×(p +1)矩阵,其中X; j =(X1j,…,Xnj)
Ť
对于j = 1,,。 。 。 ,第考虑线性回归
模型
Y =Xβ+,(1)
其中β=(β0,β1,…,βp)
Ť
是回归系数的向量,并且=(1,,。。,n)
Ť
是一个
均值为零且i.d.的随机向量元素。
令bβLS表示β的最小二乘估计,令DLS =(bβLS-β)
TbβLS-β)表示
bβLS到β的距离。
(a)证明
E(DLS)=σ
2T r {(XTX)
-1
}。
2
(b)假设〜N(0,σ2
In),其中In是n×n单位矩阵,并且σ
2
是积极的
持续的。显示
var(DLS)=2σ
4T r {(XTX)
−2
}。
(c)设ξ1,。 。 。 ,ξp是XTX的特征值,则
E(DLS)=σ
2倍
p
j = 1
1个
ξj
和var(DLS)=2σ
4倍
p
j = 1
1个
ξ
2
Ĵ

3.对于上述问题中的模型,令bβridge=(XTX +λIp)
-1XTY是β的岭回归估计量,其中λ是调整参数。令Dridge(λ)=(bβridge-β)
Tbβridge-β)
表示从bβ脊到β的距离,其中对λ的依赖性在表示法中被抑制
bβridge,但用Dridge(λ)明确表示。设ξ1,。 。 。 ,ξp是XTX的特征值。
(一种)。显示
E {Dridge(λ)} =σ
2倍
p
j = 1
ξj
(ξj+λ)
2


Ť
(XTX +λIp)
−2β;
(b)。证明总是存在一个使得
E {Dridge(λ)}≤E {Dridge(0)}。
4.假设Y1,…。 。 。 ,Yn是独立的,并且均服从正态分布
分布N(β,1)。令Y = n
-1 Pn
i = 1 Yi,让符号z +代表​​max(z,0)。为了
在以下情况下,使用λ作为调整参数来推导惩罚似然估计量。
(一种)。将惩罚函数设置为λ|β|。证明套索估计是由bβlasso=
符号(Y¯)(|Y¯| −λ)+。
(b)。将惩罚函数设置为nλ2
|β| / |
bβLS|其中βLS是最小二乘估计
β。证明自适应拉索估计是由bβadapt-lasso= Y(1 −λ
2 / Y 2
)+。
(C)。将惩罚函数设置为2n {λ
2
(|β|-λ)I(|β| <λ)} ||其中I(·)表示指标
功能。证明估计量由Y I(| Y | |>λ)给出。
(d)。将惩罚函数设置为SCAD惩罚函数,然后得出结果
估算器。
5.易(2017)书中的问题2.10。
3
6.易(2017)书中的问题2.11。
7.易(2017)书中的问题2.12。
8.易(2017)书中的问题3.11。
9.易(2017)书中的问题3.12。
10.易(2017)书中的问题4.15。
11.易(2017)书中的问题5.6。
12. Yi(2017)书中的问题7.4。
13.易(2017)书中的问题7.11。 (注意:此问题被视为两个问题)。
14. Problem 7.13 in the book of Yi (2017).
15. Problem 7.14 in the book of Yi (2017).
16. Problem 8.3 in the book of Yi (2017).
17. Problem 8.7 in the book of Yi (2017).
18. Problem 8.11 in the book of Yi (2017).
19. Problem 8.12 in the book of Yi (2017).
20. Suppose that for i = 1, . . . , n, the bivariate response vector Yi = (Yi1, Yi2)
T
is subject to
4
missingness. Let Ri be the categorical variable indicating the missingness status with
Ri =



1, if both Yi1 and Yi2 are observed
2, if Yi1 is observed and Yi2 is missing
3, if Yi1 is missing and Yi2 is observed.
Suppose that the distribution of Yi varies among different missingness patterns:
Yi
|(Ri = r) ∼ N(µr, σ2
r
)
for r = 1, 2, 3, where the parameters satisfy −∞ < µr < ∞ and σr > 0 for r = 1, 2, 3. Suppose
that the distribution of Ri
is given by
P(Ri = r) = πr for r = 1, 2, 3,
where the parameters πr are between 0 and 1 and π1 + π2 + π3 = 1. Let β = (µ1, µ2, σ2
1
, σ2
2
)
T
and π = (π1, π2, π3)
T
. Let θ = (β
T
, πT
)
T
.
(a). Discuss the inference procedure for the maximum likelihood estimator of θ.
(b). If the missingness probabilities are determined by design, i.e., the value of π is given,
discuss the inference procedure for the maximum likelihood estimator of β.
(c). Compare the estimators of β obtained from (a) and (b) in terms of the efficiency.


EasyDue™ 支持PayPal, AliPay, WechatPay, Taobao等各种付款方式!

E-mail: easydue@outlook.com  微信:easydue


EasyDue™是一个服务全球中国留学生的专业代写公司
专注提供稳定可靠的北美、澳洲、英国代写服务
专注提供CS、统计、金融、经济、数学等覆盖100+专业的作业代写服务