admin管理员组

文章数量:1130349

causal

Stratification Randomized Experiments (SRE)

Definition: We conduct K K K independent CREs within the K strata of a discrete covariate X X X.

【分层标准:离散协变量 X X X】

提出SRE的原因

CRE wtih 离散协变量 X ∈ { 1 , … , K } X\in\{1,\ldots,K\} X∈{1,…,K},定义

  • n [ k ] 1 = # { i : X i = k , D i = 1 } n_{[k]1} = \#\{i : X_i = k, D_i = 1 \} n[k]1​=#{i:Xi​=k,Di​=1}: X i = k X_i = k Xi​=k的个体里接受治疗的
  • n [ k ] 0 = # { i : X i = k , D i = 0 } n_{[k]0} = \#\{i : X_i = k, D_i = 0 \} n[k]0​=#{i:Xi​=k,Di​=0}: X i = k X_i = k Xi​=k的个体里对照组的

【问题在于:对于不同的 k k k而言,可以 k k k组内的所有个体都没治疗或者治疗了,这样covariate就不balance了,会导致
n [ k ] 1 n 1 − n [ k ] 0 n 0 \frac{n_{[k]1} }{n_1} -\frac{n_{[k]0} }{n_0} n1​n[k]1​​−n0​n[k]0​​差的特别大,因为有的 n [ k ] 1 n_{[k]1} n[k]1​或者 n [ k ] 0 n_{[k]0} n[k]0​可以为0.】
???为啥要算这个?因为要在每个层内算 E { Y ( 1 ) − Y ( 0 ) } E\{Y(1)-Y(0)\} E{Y(1)−Y(0)},所以要✖️在这个层里的 D = 1 D=1 D=1 or 0 0 0的概率??

那咋整,那就提前固定 n [ k ] 1 n_{[k]1} n[k]1​或者 n [ k ] 0 n_{[k]0} n[k]0​,让它不是0就行了

定义within stratum k, the proportion of units receiving the treatment is 治疗比例
e [ k ] = n [ k ] 1 n [ k ] e_{[k]} = \frac{n_{[k]1}}{n_{[k]}} e[k]​=n[k]​n[k]1​​
也叫倾向得分(propensity score)

于是,SRE和CRE的区别就是:SRE的 e [ k ] e_{[k]} e[k]​提前固定,但CRE的 e [ k ] e_{[k]} e[k]​是随机的。

分层ACE

For stratum k k k, we have stratum-specific average causal effect
τ [ k ] = n [ k ] − 1 ∑ i : X i = k τ i \tau_{[k]} = n_{[k]}^{-1}\sum_{i:X_i = k}\tau_i τ[k]​=n[k]−1​i:Xi​=k∑​τi​

故ACE为
τ = n − 1 ∑ i = 1 n τ i = n − 1 ∑ k = 1 K ∑ i : X i = k τ i = n − 1 ∑ k = 1 K n [ k ] τ [ k ] = ∑ k = 1 K n [ k ] n τ [ k ] : = ∑ k = 1 K π [ k ] τ [ k ] \tau = n^{-1}\sum_{i=1}^{n}\tau_i = n^{-1} \sum_{k=1}^{K} \sum_{i: X_i = k} \tau_i \\= n^{-1} \sum_{k=1}^{K} n_{[k]}\tau_{[k]} = \sum_{k=1}^{K} \frac{n_{[k]}}{n}\tau_{[k]}\\ := \sum_{k=1}^{K} \pi_{[k]}\tau_{[k]} τ=n−1i=1∑n​τi​=n−1k=1∑K​i:Xi​=k∑​τi​=n−1k=1∑K​n[k]​τ[k]​=k=1∑K​nn[k]​​τ[k]​:=k=1∑K​π[k]​τ[k]​

π [ k ] = n [ k ] n \pi_{[k]} = \frac{n_{[k]}}{n} π[k]​=nn[k]​​: proportion of units in stratum k k k
e [ k ] = n [ k ] 1 n [ k ] e_{[k]} = \frac{n_{[k]1}}{n_{[k]}} e[k]​=n[k]​n[k]1​​: propensity score in stratum k k k


感兴趣的是 τ \tau τ

τ k \tau_k τk​可以用前面的FRT和Neyman’s estimator之类的推断,
τ \tau τ有类似的FRT和Neymanian inference,就是要考虑 π [ k ] \pi_{[k]} π[k]​进去



【写这个主要是为了后面看propensity score时候用,
因为,记倾向得分为 e ( X ) e(X) e(X),Theorem 11.1得到
在strong ignorability 下,有

if D ⊥ { Y ( 1 ) , Y ( 0 ) } ∣ X D \bot \{Y(1), Y(0)\}|X D⊥{Y(1),Y(0)}∣X$, then D ⊥ { Y ( 1 ) , Y ( 0 ) } ∣ e ( X ) D \bot \{Y(1), Y(0)\}|e(X) D⊥{Y(1),Y(0)}∣e(X)

那么如果 e ( X ) e(X) e(X)已知且离散的话,其实可以将总体按照 e ( X ) = e 1 , … , e K e(X) = e_{1},\ldots,e_{K} e(X)=e1​,…,eK​去分层考虑,这样问题就转换成了SRE。】

causal

Stratification Randomized Experiments (SRE)

Definition: We conduct K K K independent CREs within the K strata of a discrete covariate X X X.

【分层标准:离散协变量 X X X】

提出SRE的原因

CRE wtih 离散协变量 X ∈ { 1 , … , K } X\in\{1,\ldots,K\} X∈{1,…,K},定义

  • n [ k ] 1 = # { i : X i = k , D i = 1 } n_{[k]1} = \#\{i : X_i = k, D_i = 1 \} n[k]1​=#{i:Xi​=k,Di​=1}: X i = k X_i = k Xi​=k的个体里接受治疗的
  • n [ k ] 0 = # { i : X i = k , D i = 0 } n_{[k]0} = \#\{i : X_i = k, D_i = 0 \} n[k]0​=#{i:Xi​=k,Di​=0}: X i = k X_i = k Xi​=k的个体里对照组的

【问题在于:对于不同的 k k k而言,可以 k k k组内的所有个体都没治疗或者治疗了,这样covariate就不balance了,会导致
n [ k ] 1 n 1 − n [ k ] 0 n 0 \frac{n_{[k]1} }{n_1} -\frac{n_{[k]0} }{n_0} n1​n[k]1​​−n0​n[k]0​​差的特别大,因为有的 n [ k ] 1 n_{[k]1} n[k]1​或者 n [ k ] 0 n_{[k]0} n[k]0​可以为0.】
???为啥要算这个?因为要在每个层内算 E { Y ( 1 ) − Y ( 0 ) } E\{Y(1)-Y(0)\} E{Y(1)−Y(0)},所以要✖️在这个层里的 D = 1 D=1 D=1 or 0 0 0的概率??

那咋整,那就提前固定 n [ k ] 1 n_{[k]1} n[k]1​或者 n [ k ] 0 n_{[k]0} n[k]0​,让它不是0就行了

定义within stratum k, the proportion of units receiving the treatment is 治疗比例
e [ k ] = n [ k ] 1 n [ k ] e_{[k]} = \frac{n_{[k]1}}{n_{[k]}} e[k]​=n[k]​n[k]1​​
也叫倾向得分(propensity score)

于是,SRE和CRE的区别就是:SRE的 e [ k ] e_{[k]} e[k]​提前固定,但CRE的 e [ k ] e_{[k]} e[k]​是随机的。

分层ACE

For stratum k k k, we have stratum-specific average causal effect
τ [ k ] = n [ k ] − 1 ∑ i : X i = k τ i \tau_{[k]} = n_{[k]}^{-1}\sum_{i:X_i = k}\tau_i τ[k]​=n[k]−1​i:Xi​=k∑​τi​

故ACE为
τ = n − 1 ∑ i = 1 n τ i = n − 1 ∑ k = 1 K ∑ i : X i = k τ i = n − 1 ∑ k = 1 K n [ k ] τ [ k ] = ∑ k = 1 K n [ k ] n τ [ k ] : = ∑ k = 1 K π [ k ] τ [ k ] \tau = n^{-1}\sum_{i=1}^{n}\tau_i = n^{-1} \sum_{k=1}^{K} \sum_{i: X_i = k} \tau_i \\= n^{-1} \sum_{k=1}^{K} n_{[k]}\tau_{[k]} = \sum_{k=1}^{K} \frac{n_{[k]}}{n}\tau_{[k]}\\ := \sum_{k=1}^{K} \pi_{[k]}\tau_{[k]} τ=n−1i=1∑n​τi​=n−1k=1∑K​i:Xi​=k∑​τi​=n−1k=1∑K​n[k]​τ[k]​=k=1∑K​nn[k]​​τ[k]​:=k=1∑K​π[k]​τ[k]​

π [ k ] = n [ k ] n \pi_{[k]} = \frac{n_{[k]}}{n} π[k]​=nn[k]​​: proportion of units in stratum k k k
e [ k ] = n [ k ] 1 n [ k ] e_{[k]} = \frac{n_{[k]1}}{n_{[k]}} e[k]​=n[k]​n[k]1​​: propensity score in stratum k k k


感兴趣的是 τ \tau τ

τ k \tau_k τk​可以用前面的FRT和Neyman’s estimator之类的推断,
τ \tau τ有类似的FRT和Neymanian inference,就是要考虑 π [ k ] \pi_{[k]} π[k]​进去



【写这个主要是为了后面看propensity score时候用,
因为,记倾向得分为 e ( X ) e(X) e(X),Theorem 11.1得到
在strong ignorability 下,有

if D ⊥ { Y ( 1 ) , Y ( 0 ) } ∣ X D \bot \{Y(1), Y(0)\}|X D⊥{Y(1),Y(0)}∣X$, then D ⊥ { Y ( 1 ) , Y ( 0 ) } ∣ e ( X ) D \bot \{Y(1), Y(0)\}|e(X) D⊥{Y(1),Y(0)}∣e(X)

那么如果 e ( X ) e(X) e(X)已知且离散的话,其实可以将总体按照 e ( X ) = e 1 , … , e K e(X) = e_{1},\ldots,e_{K} e(X)=e1​,…,eK​去分层考虑,这样问题就转换成了SRE。】

本文标签: causal