master

分支 (1)

管理

管理

master

CIP
/
贾寰宇-厦门大学

---
marp: true
---
&emsp;
> &#x1F34E;   [论文解读：Total, Direct, and Indirect Effects in Logit and Probit Models]


> **作者：** 贾寰宇 (厦门大学)
> **邮箱：** <[email protected]>


> **Source:** Breen, R., Karlson, K. B., & Holm, A. (2013). Total, Direct, and Indirect Effects in Logit and Probit Models. Sociological Methods & Research, 42(2), 164–191. [Link](https://doi.org/10.1177/0049124113494572), [PDF](http://sci-hub.ren/10.1177/0049124113494572), [Google](<https://scholar.google.com/scholar?q=Total, Direct, and Indirect Effects in Logit and Probit Models>), [-cited-](https://scholar.google.com/scholar?cites=911547364244366067&as_sdt=2005&sciodt=0,5&hl=zh-CN).
>
**目录**
[TOC]


## 1. 问题提出

社会科学研究人员有时会对 **Logit 和 probit 模型中的中介效应分析** 感兴趣。例如，社会分层研究人员可能对不同种族之间收入差异是否归因于教育水平的不均匀分布感兴趣。为了测量中介效应，研究人员通常比较在包含不同中介变量的模型中同一核心解释变量的回归系数。

在线性模型中，这些系数的差异衡量了x对y的影响通过中介变量而产生的关联程度。这是基于**路径分析**的原理，该原理将预测变量 **x** 对结果变量 **y** 的效应分解为两部分，一部分由变量 **z** 介导，另一部分未被 **z** 介导。以 **z** 为中介的部分称为间接效应，而未以 **z** 为中介的部分称为直接效应。

间接效应和直接效应的总和称为总效应，它等于当不包含中介变量时，**x** 对 **y** 的效应。

如如下公式和图片所示：

$(1) \quad y^*=\beta_{y x} x+e$
$(2) \quad y^*=\beta_{y x \cdot z} x+\beta_{y z \cdot x} z+v$
$(3) \quad z=\theta_{z x} x+w$

![](https://fig-lianxh.oss-cn-shenzhen.aliyuncs.com/%E8%B4%BE%E5%AF%B0%E5%AE%87%20khb%20%E5%9B%BE1%20%E8%B7%AF%E5%BE%84%E5%88%86%E8%A7%A3.jpg)

直接效应: $\beta_{y x ;  z}$

间接效应: $\theta_{z x} \times \beta_{y z x}$

总效应 : $\beta_{y x}=\beta_{y x: z}+\theta_{z x} \times \beta_{y z: x}$

然而，在 Logit 和 Probit 等非线性二元概率模型中，总效应无法像线性模型那样分解为直接效应和间接效应（Fienberg 1977;  Karlson, Holm, and Breen 2012; MacKinnon and Dwyer 1993；Winship and Mare 1983）。这是因为在非线性二元概率模型中，误差方差可能在不同模型中有所不同，回归系数和误差方差不能分别识别。

相反，模型返回的系数估计值等于真实回归系数与一个缩放参数的比值，该缩放参数是误差标准差的函数（e.g., Amemiya 1975；Winship and Mare 1983）。

## 2. 方法介绍

### 2.1 理论部分

为了解决这个问题，本文提出了一种在非线性概率模型（如 logit 或 probit）中评估中介效应的通用框架。该方法将线性模型的分解性质扩展到线性参数的非线性概率模型中，使研究人员能够将总效应分解为直接效应和间接效应的和。

logit 模型中， 直接比较模型（1）和模型（2）预测变量 **x** 前面的系数无法得到间接效应，因为估计出来的是真实系数估计值与残差标准差的函数的比值。

当把中介变量 **z** 从模型（2）中去除时，缩放因子会变化，且新的误差项也未必会服从 logistic 分布或正态分布（即便 **z** 与 **x** 正交），所以系数差异法不能直接用于估计间接效应。

这里 **b** 对应的是 logit 模型估计出来的系数值，而 **β** 是系数真实值。

$(4) \quad\operatorname{logit}\left[\operatorname{Pr}\left(y^*>0\right)\right]=b_{y x . z} x+b_{y z . x} z=\frac{\beta_{y x . z}}{\sigma_e} x+\frac{\beta_{y z . x}}{\sigma_e} z$
$(5) \quad \operatorname{logit}(\operatorname{Pr}(y=1))=b_{y x} x=\frac{\beta_{y x} x}{\tilde{\sigma}_e}$
$(6) \quad b_{y x}-b_{y x . z}=\frac{\beta_{y x}}{\tilde{\sigma}_o}-\frac{\beta_{y x . z}}{\sigma_o} \neq \beta_{y x}-\beta_{y x . z}$

本文提出借助模型（2）和线性辅助回归模型（3），而不使用模型（1）。即把模型（3）带入模型（2），得到（7）式。这样可得出直接效应与间接效应的相对大小，如（8）式所示。

$(7) \operatorname{logit}\left[\operatorname{Pr}\left(y^*>0\right)\right]==\frac{\beta_{y x . z}}{\sigma_e} x+\frac{\beta_{y z . x}\times \theta_{z x}}{\sigma_e} x$

此时，总效应、直接效应和间接效应可重新表示为：

直接效应 : $b_{y x . z}=\frac{\beta_{y x \cdot z}}{\sigma_e}$

间接效应 : $\theta_{z x} b_{y z x}=\frac{\theta_{z x} \times \beta_{y z: x}}{\sigma_e}$

总效应 : $\frac{\beta_{y x}}{\sigma_e}=\frac{\beta_{y x: z}+\theta_{z x} \times \beta_{y z \cdot x}}{\sigma_e}$

$(8) \quad \frac{b_{y z x} \times \theta_{z x}}{b_{y x . z}+b_{y z x} \times \theta_{z x}} \times 100=\frac{\frac{\beta_{y z x} \times \theta_{z x}}{\sigma_e}}{\frac{\beta_{y x . z}+\beta_{y z x} \times \theta_{z x}}{\sigma_e}} \times 100=\frac{\beta_{y z x} \times \theta_{z x}}{\beta_{y x . z}+\beta_{y z . x} \times \theta_{z x}} \times 100$


### 2.2 一些拓展

存在多个中介变量时，该方法仍然适用。

如果存在混杂因素（即 **x**、**z** 和 **y** 的共同原因），把这些协变量加入全部方程中即可控制住其对中介效应分解的潜在影响。

对于二元中介变量，只要使用线性概率模型估计模型（3），而不使用 logit 或其他非线性概率模型，该中介效应分解方法仍然适用。

该方法还可用于报告 Average Partial Effects（分别计算每个样本上的边际效应，然后取平均）。与 logit 模型的系数相比，APE 的一个优势在于它们是在概率尺度上测量的，因此更直观、更容易理解。

需要注意的是，当研究者对不同组别中介效应的差异感兴趣时，可分组应用该分解方法，比较间接效应百分比的差异。但是当把 **x** 和 **z** 的交互项引入模型中时，由于异方差的存在，不同组别的缩放因子不同，导致间接效应不可直接比较。

因此，作者建议研究者在非线性概率模型中，谨慎推断处理组和对照组之间（或者说预测变量的不同水平之间）的中介效应异质性。

### 2.3 因果中介效应的识别条件

**顺序可忽略性假设**（sequential ignorability assumption）是进行因果中介分析时需要满足的一个关键假设。

它包括两部分：
（1）在控制了协变量之后，预测变量 **x** 与不可观测的混杂因素 **u** 是独立的。

（2）在控制了预测变量 **x** 和协变量之后，中介变量 **z** 与不可观测的混杂因素 **u** 是独立的。


## 3. Stata 命令实例

### 3.1 实例分析
作者使用 1988 年的美国国家教育纵向调查（NELS）来演示该方法。NELS 是对 1988 年美国八年级学生的全国代表性调查，一直追踪到 2000 年。本文研究了父母社会经济地位（**SES**）对 2000 年四年制大学毕业（**COL**）的影响在多大程度上通过学生的学术能力（**ABIL**）和教育志向水平（**LEA**）进行中介。本文将 **SES**、**ABIL** 和 **LEA** 标准化为均值为零，方差为一。

本文预计能力和志向都会起到中介作用。还探讨了能力和志向中哪个是更大的中介变量。由于怀疑分解可能受到潜在混淆变量的影响，本文还包括了性别（**MALE**）、种族（**RACE**）和完整家庭（**INTACT**）作为协变量。最终样本包括 9,820 个个体。

本文使用 Stata 命令 `khb` 计算分解。本文将分析分为四个步骤。

首先，本文使用 **ABIL**作为中介变量对 **SES** 对 **COL** 的效应进行分解。

其次，本文将 **LEA** 添加到分解中，并评估 **ABIL** 或 **LEA** 哪个变量具有更大的间接效应。

第三，本文将三个协变量 **MALE**、**RACE** 和 **INTACT** 添加到分解中，以控制可能的混淆变量。

第四，本文以 APE（平均偏效应）的形式报告结果，以给分解提供更具实践含义的解释。由于结果可能对模型选择敏感，本文同时报告 logit 模型和 probit 模型的结果。

表 3（原论文中）报告了使用 **ABIL** 作为中介变量对 **SES** 对 **COL** 的分解结果。本文将总效应 1.348（0.781）以 logit（probit）的形式分解为直接部分 0.914（0.524）和间接部分 0.434（0.257）。使用 Karlson 等人（2012 年）提出的检验统计量，可以看到所有效应都具有高度统计学显著性。

可以看到间接效应的大小约为直接效应的一半。如表 3 倒数第二行所示，在 logit 模型中，间接效应占总效应（本文将其称为中介百分比）的 32.2%，在 probit 模型中占 32.9%。对于 logit 模型和 probit 模型来说，这两者非常相似，这表明本文的分解对于 logit 或probit 模型选择不敏感。

在最后一行，本文报告了简单比较系数所得到的中介百分比。在 logit 模型中，这个百分比为 25.3%，在 probit 模型中为 26.8%，这表明简单比较会低估间接效应的真实大小。

![](https://fig-lianxh.oss-cn-shenzhen.aliyuncs.com/%E8%B4%BE%E5%AF%B0%E5%AE%87%20khb%20%E8%A1%A83%20%E8%B7%AF%E5%BE%84%E5%88%86%E8%A7%A3.jpg)

在表 4 中，本文将 **LEA** 添加到分解中。发现所有效应都具有高度统计显著性。由于 logit 和 probit 返回几乎相同的结果，本文只关注前者的结果。可以看到与表 3 相比，中介比例从 32.2% 增加到 56.6%。

然而，SES 的效应更多地通过 **LEA** 而不是 **ABIL** 进行中介，LEA 占总效应的 37.5%，ABIL 占 19.1%。与表 3 中报告的 32.2% 相比，ABIL 的中介比例要小得多。在分解中包括 **LEA** 减少了 **ABIL** 对总效应的约 13 个百分点的贡献，这是因为 **LEA** 与 **SES**、**ABIL** 和 **COL** 呈正相关。本文还注意到，仅比较 logit 系数会低估中介比例约 15 个百分点。

![](https://fig-lianxh.oss-cn-shenzhen.aliyuncs.com/%E8%B4%BE%E5%AF%B0%E5%AE%87%20khb%20%E8%A1%A84%20%E8%B7%AF%E5%BE%84%E5%88%86%E8%A7%A3.jpg)

表 5 中添加了三个可能影响分解的协变量 **MALE**、**RACE** 和 **INTACT**。这些协变量包含在用于分解的所有模型中，从而保持结果受其可能影响的恒定。本文发现，除间接效应的检验统计量外（该效应仍然具有高度统计显著性），结果与第 4 表中报告的几乎完全相同。表明表 4 中呈现的实质性结果不受协变量的影响。

![](https://fig-lianxh.oss-cn-shenzhen.aliyuncs.com/%E8%B4%BE%E5%AF%B0%E5%AE%87%20khb%20%E8%A1%A85%20%E8%B7%AF%E5%BE%84%E5%88%86%E8%A7%A3.jpg)

表 6 中报告了表 5 中的 APE 结果，并再次关注 logit 模型的结果。可以看到总效应为 0.228，这意味着对于 SES 的一个标准差变化，大学毕业的概率平均增加 22.8 个百分点。将此效应分解为直接效应为 9.7 个百分点，间接效应为 13.0 个百分点。

将间接效应分解为其两个组成部分，发现通过 **ABIL** 的间接效应为 3.9 个百分点，通过 **LEA** 的间接效应为 9.1 个百分点。 由**LEA** 所介导的间接效应更大。

表 6 中所示的中介百分比与表 5 相等。然而，简单比较系数值则会得到明显差距。

![](https://fig-lianxh.oss-cn-shenzhen.aliyuncs.com/%E8%B4%BE%E5%AF%B0%E5%AE%87%20khb%20%E8%A1%A86%20%E8%B7%AF%E5%BE%84%E5%88%86%E8%A7%A3.jpg)

### 3.2 Stata 命令介绍
Kohler, Karlson and Holm （2011）所编写的 Stata 命令`khb`可用于实现该分解，其语法结构如下：

```stata
khb model-type depvar key-vars || z-vars [if] [in] [weight] [ , options ]
```

- `model-type`： 模型类型，包括regress, logit, ologit, probit, oprobit, cloglog等；
- `depvar`：被解释变量y；
- `key-vars`：要分解总效应的解释变量x；
- `z-vars`：中介变量z；
- `||`: 用于隔开中介变量与解释变量

可选项：
- `summary`：显示每个待分解变量的分解情况；
- `disentangle`：显示每个中介变量对应的间接效应大小；
- `concomitant(varlist)`：协变量；
- `vce(vcetype)`：设置标准误类型；
- `ape`：显示平均偏效应APE；
- `verbose`：提供估计模型的详细信息；
- `zstandard`：将x标准化；
- `rescale`：将z标准化。

由于未能获取原文数据，使用`khb`命令帮助文件中的数据集**dlsy_khb.dta** 对命令进行演示。该数据可通过**search**获取。系数含义不进行过多解释，详见 3.1 实例分析。

```stata
khb logit univ fses || abil fgroup , c(intact boy) d

Decomposition using the KHB-Method

Model-Type:  logit                                 Number of obs     =    1896
Variables of Interest: fses                        Pseudo R2         =    0.20
Z-variable(s): abil fgroup
Concomitant: intact boy
------------------------------------------------------------------------------
        univ |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
fses         |
     Reduced |   .5175857   .0761812     6.79   0.000     .3682733    .6668981
        Full |   .2268777   .0837762     2.71   0.007     .0626794    .3910761
        Diff |   .2907079   .0445459     6.53   0.000     .2033995    .3780164
------------------------------------------------------------------------------

Components of Difference

      Z-Variable |      Coef    Std_Err     P_Diff  P_Reduced
    -------------+---------------------------------------------
    fses         |
            abil |  .1545696   .0282221      53.17      29.86
          fgroup |  .1361384   .0352813      46.83      26.30
    -----------------------------------------------------------
```

可以看出，总效应 0.5175857，直接效应 0.2268777，间接效应 0.2907079。其中，由变量 **abil** 介导的间接效应占总效应比 29.86%，由变量 **fgroup** 介导的中介效应占总效应比例为 26.3%
&emsp;

## 4. 结语

1.	在线性回归模型中，总效应可以分解为直接效应和间接效应的和。但是在 Logit 和 Probit 这类非线性概率模型中，由于模型系数与误差方差无法分离识别，总效应无法直接分解为直接效应和间接效应的和。

2. 本文提供了在 logit 和 probit 模型中估计和解释总效应、直接效应和间接效应的方法。该方法弥补了非线性概率模型中基于 “系数差异法” 和 “系数乘积法” 的中介分析结果之间的差距。

3. 该方法报告了在 logit 或 probit 模型系数尺度和概率尺度上测量的效应，并在顺序可忽略性假设下识别了因果中介效应。
4. 与其他方法相比，该方法在计算上更简单，且总体表现始终相当与或优于 Imai、Keele and Tingley（2010）以及 Imai、Keele and Yamamoto（2010）提出的方法的表现。

5. 文章还指出，在非线性概率模型中识别异质中介效应时存在一个迄今未被认识的问题。在包含自变量和中介变量交互项的非线性概率模型中，由于系数只能确定到比例尺度上（coefficients from these models are identified only up to scale）， 识别中介效应会受到限制。


6. 文章最后应用了该方法对 1988 年全国教育纵向研究数据进行了中介效应估计的实证分析。

总的来说，这篇文章提出了一种新的分解方法，能够在 Logit 和 Probit 这类非线性概率模型中分解总效应，为社会学研究中的中介效应分析提供了新的工具。

&emsp;

## 5. 相关推文

> Note：产生如下推文列表的 Stata 命令为：
> &emsp;  `lianxh logit`
> &emsp;  `lianxh probit`
> &emsp;  `lianxh khb`
> 安装最新版 `lianxh` 命令：
> &emsp;  `ssc install lianxh, replace`


- 专题：[Probit-Logit](https://www.lianxh.cn/blogs/27.html)
  - 张雪娇, 2020, [Stata：Logit 模型评介](https://www.lianxh.cn/details/212.html) 连享会 No.212.
  - 连玉君, 杨柳, 2020, [Stata：Logit模型一文读懂](https://www.lianxh.cn/details/170.html) 连享会 No.170.
  - 吴思锐, 2020, [Stata：二元Probit模型](https://www.lianxh.cn/details/162.html) 连享会 No.162.
  - 黄彩虹, 2024, [二元选择模型：Probit 还是 Logit？](https://www.lianxh.cn/details/235.html) 连享会 No.235.
  - 陈卓然, 2022, [全面解读Logit模型](https://www.lianxh.cn/details/965.html) 连享会 No.965.
  - 黄熹, 2021, [秒懂小罗肥归：logit与mlogit详解](https://www.lianxh.cn/details/573.html) 连享会 No.573.
  - 张雪娇,2020, [Stata：何时使用线性概率模型而非Logit？](https://www.lianxh.cn/details/206.html) 连享会 No.206.

- 专题：[交乘项-调节-中介](https://www.lianxh.cn/blogs/21.html)
  - 陈炜,2023,[Stata：非线性模型的中介效应检验-khb](https://www.lianxh.cn/details/1200.html) 连享会 No.1200.


&emsp;
&emsp;