3.5.1 合成:一些技术细节

在本节的剩余部分,我们将证明一个更复杂的合成定理。为此,我们需要一些定义和引理,用分布之间的距离度量重新表述差异隐私。在下面的分数量中,如果分母为零,那么我们将分数的值定义为无穷大(分子总是正的)。

定义3.5(KL散度) KL-散度(Kullback-Leibler divergence),又称为 相对熵。两个随机变量 YYZZ(取同一域的值)之间的 KL-散度定义为:

D(YZ)=EyY[lnPr[Y=y]Pr[Z=y]]=yYPr(y)lnPr[Y=y]Pr[Z=y]=pY(y)lnpY(y)pZ(y)dy \begin{aligned} D(Y||Z) = \mathbb{E}_{y \backsim Y}\Big[\ln\frac{\text{Pr}[Y=y]}{\text{Pr}[Z=y]}\Big] &= \sum_{y \backsim Y}\text{Pr}(y)\ln\frac{\text{Pr}[Y=y]}{\text{Pr}[Z=y]}\\ &=\int_{-\infty}^{\infty}p_Y(y)\ln\frac{p_Y(y)}{p_Z(y)}dy \end{aligned}

(译者注:增加离散和连续的两种相对熵等价定义)

已知 D(YZ)0D(Y||Z)\geq 0 ,且当且仅当 YYZZ 分布相同时具有相等性。然而,DD 是非对称的,不满足三角不等式,甚至可以是无限的,特别是当 Supp(Y)\text{Supp}(Y) 不包含在 Supp(Z)\text{Supp}(Z) 中时。

译者注:支撑集 Supp()\text{Supp}():其实就是函数的非零部分子集,比如 ReLU 函数的支撑集就是 (0,+)(0, +\infty),一个概率分布的支撑集就是所有概率密度非零部分的集合。具体定义见 维基百科

定义3.6(最大散度) 取自同一域的两个随机变量 YYZZ 之间的最大散度定义为:

D(YZ)=maxSSupp(Y)[lnPr[YS]Pr[ZS]] D_{\infty}(Y||Z) = \max_{S \subseteq \text{Supp}(Y)}\Big[\ln\frac{\text{Pr}[Y\in S]}{\text{Pr}[Z \in S]}\Big]

YYZZ 之间的 δ\delta-近似最大散度定义为:

Dδ(YZ)=maxSSupp(Y):Pr[YS]δ[lnPr[YS]δPr[ZS]] D_{\infty}^{\delta}(Y||Z) = \max_{S \subseteq \text{Supp}(Y):\text{Pr}[Y \in S] \geq \delta}\Big[\ln\frac{\text{Pr}[Y\in S]-\delta}{\text{Pr}[Z \in S]}\Big]

备注3.1 请注意,机制 M\mathcal{M} 为:

  • 1.当且仅当在每对相邻数据库 x,y,D(M(x)M(y))ε,D(M(y)M(x))εx,\enspace y,\enspace D_{\infty}(\mathcal{M}(x)||\mathcal{M}(y)) \leq \varepsilon, \enspace D_{\infty}(\mathcal{M}(y)||\mathcal{M}(x)) \leq \varepsilon时,机制为 ε\varepsilon -差分隐私。
  • 2.当且仅当在每两个相邻的数据库 x,yDδ(M(x)M(y))εDδ(M(y)M(x))εx,\enspace y \enspace D_{\infty}^{\delta}(\mathcal{M}(x)||\mathcal{M}(y)) \leq \varepsilon \enspace D_{\infty}^{\delta}(\mathcal{M}(y)||\mathcal{M}(x)) \leq \varepsilon 时,机制为 (ε,δ)(\varepsilon,\delta) -差分隐私。

另一个有用的距离度量是两个随机变量 YYZZ 之间的统计距离,定义为:

Δ(Y,Z)=defmaxSPr[YS]Pr[ZS] \Delta(Y,Z) \overset{\text{def}}{=} \max_{S}|\text{Pr}[Y \in S]-\text{Pr}[Z \in S]|

如果 Δ(Y,Z)δ\Delta(Y,Z)\leq \delta,我们说 Y,ZY,Z 是δ-接近(原文“δ-close”)的,

我们将根据确切的最大散度和统计距离重新制定最大散度公式:

引理 3.17

  • 1.当且仅当存在一个随机变量 YY' 满足 Δ(Y,Y)δ,D(YZ)ε\Delta(Y,Y')\leq \delta,\enspace D_{\infty}(Y'||Z)\leq \varepsilon 时,Dδ(YZ)εD_{\infty}^{\delta}(Y||Z)\leq \varepsilon 成立
  • 2.当且仅当存在随机变量 Y,ZY',Z' 满足 Δ(Y,Y)δ/(eε+1),Δ(Z,Z)δ/(eε+1),D(YZ)ε\Delta(Y,Y')\leq \delta/(e^{\varepsilon}+1),\enspace\Delta(Z,Z')\leq \delta/(e^{\varepsilon}+1),\enspace D_{\infty}(Y'||Z')\leq \varepsilon 时,Dδ(YZ)ε,Dδ(ZY)εD_{\infty}^{\delta}(Y||Z)\leq \varepsilon,\enspace D_{\infty}^{\delta}(Z||Y)\leq \varepsilon 成立。

【证明】

引理 3.18 假设随机变量 Y,ZY,\enspace Z 满足 D(YZ)εD(ZY)εD_{\infty}(Y||Z)\leq \varepsilon \enspace D_{\infty}(Z||Y)\leq \varepsilon,则 D(YZ)ε(eε1)D(Y||Z)\leq \varepsilon\cdot(e^{\varepsilon}-1)

【证明】 由KL散度性质可知:任意 Y,ZY,\enspace ZD(YZ)0D(Y||Z)\geq0,所以 D(YZ)D(Y||Z) 可以被 D(YZ)+D(ZY)D(Y||Z) + D(Z||Y) 约束:

D(YZ)D(YZ)+D(ZY)=yPr[Y=y](lnPr[Y=y]Pr[Z=y]+lnPr[Z=y]Pr[Y=y])+(Pr[Z=y]Pr[Y=y])(lnPr[Z=y]Pr[Y=y])y[0+Pr[Z=y]Pr[Y=y]ε]=εy[max{Pr[Y=y],Pr[Z=y]}min{Pr[Y=y],Pr[Z=y]}]εy[(eε1)min{Pr[Y=y],Pr[Z=y]}]ε(eε1) \begin{aligned} D(Y||Z) &\leq D(Y||Z) + D(Z||Y)\\ &= \sum_y \text{Pr}[Y=y]\cdot\Big(\ln\frac{\text{Pr}[Y=y]}{\text{Pr}[Z=y]}+\ln\frac{\text{Pr}[Z=y]}{\text{Pr}[Y=y]}\Big)\\ &\enspace \enspace + (\text{Pr}[Z=y]-\text{Pr}[Y=y])\cdot \Big(\ln\frac{\text{Pr}[Z=y]}{\text{Pr}[Y=y]}\Big)\\ &\leq \sum_y[0+|\text{Pr}[Z=y]-\text{Pr}[Y=y]|\cdot\varepsilon]\\ &= \varepsilon\cdot\sum_y[\max\{\text{Pr}[Y=y],\text{Pr}[Z=y]\}\\ &\enspace \enspace -\min\{\text{Pr}[Y=y],\text{Pr}[Z=y]\}]\\ &\leq \varepsilon\cdot\sum_y[(e^\varepsilon-1)\cdot\min\{\text{Pr}[Y=y],\text{Pr}[Z=y]\}]\\ &\leq \varepsilon(e^\varepsilon-1) \end{aligned}

【引理 3.18 证毕】

补充该证明过程省略许多步骤,会造成迷惑,这边对证明过程加以补充。首先第一步的推导,由定义可得:

D(YZ)+D(ZY)=yPr[Y=y]lnPr[Y=y]Pr[Z=y]+yPr[Z=y]lnPr[Z=y]Pr[Y=y]=yPr[Y=y]lnPr[Y=y]Pr[Z=y]+y{Pr[Z=y]+Pr[Y=y]Pr[Y=y]}lnPr[Z=y]Pr[Y=y]=y[Pr[Y=y](lnPr[Y=y]Pr[Z=y]+lnPr[Z=y]Pr[Y=y])+(Pr[Z=y]Pr[Y=y])(lnPr[Z=y]Pr[Y=y])] \begin{aligned} D(Y||Z) + D(Z||Y) &= \sum_y \text{Pr}[Y=y]\cdot\ln\frac{\text{Pr}[Y=y]}{\text{Pr}[Z=y]}+\sum_y \text{Pr}[Z=y]\cdot\ln\frac{\text{Pr}[Z=y]}{\text{Pr}[Y=y]}\\ &= \sum_y \text{Pr}[Y=y]\cdot\ln\frac{\text{Pr}[Y=y]}{\text{Pr}[Z=y]}\\ &\enspace \enspace +\sum_y \Big\{\text{Pr}[Z=y]+\text{Pr}[Y=y]-\text{Pr}[Y=y]\Big\}\cdot\ln\frac{\text{Pr}[Z=y]}{\text{Pr}[Y=y]}\\ &= \sum_y \Big[\text{Pr}[Y=y]\cdot\Big(\ln\frac{\text{Pr}[Y=y]}{\text{Pr}[Z=y]}+\ln\frac{\text{Pr}[Z=y]}{\text{Pr}[Y=y]}\Big)\\ &\enspace \enspace + (\text{Pr}[Z=y]-\text{Pr}[Y=y])\cdot \Big(\ln\frac{\text{Pr}[Z=y]}{\text{Pr}[Y=y]}\Big)\Big]\\ \end{aligned}

由于 D(ZY)εD_{\infty}(Z||Y)\leq \varepsilon ,由 最大散度 的定义可知:

lnPr[Z=y]Pr[Y=y]D(ZY)=maxSSupp(Y)[lnPr[Z=y]Pr[Y=y]]ε \ln\frac{\text{Pr}[Z=y]}{\text{Pr}[Y=y]} \leq D_{\infty}(Z||Y) = \max_{S \subseteq \text{Supp}(Y)}\Big[\ln\frac{\text{Pr}[Z=y]}{\text{Pr}[Y=y]}\Big]\leq \varepsilon

且由两式相减必小于等于两式相减的绝对值,故:

D(YZ)y[0+Pr[Z=y]Pr[Y=y]ε] D(Y||Z) \leq \sum_y[0+|\text{Pr}[Z=y]-\text{Pr}[Y=y]|\cdot\varepsilon]

又因绝对值公式 max{f(x),g(x)}min{f(x),g(x)}=f(x)g(x)\max\{f(x),g(x)\}-\min\{f(x),g(x)\}=|f(x)-g(x)|,可以得到:

y[0+Pr[Z=y]Pr[Y=y]ε]=εy[max{Pr[Y=y],Pr[Z=y]}min{Pr[Y=y],Pr[Z=y]}] \begin{aligned} \sum_y[0+|\text{Pr}[Z=y]-\text{Pr}[Y=y]|\cdot\varepsilon] &= \varepsilon\cdot\sum_y[\max\{\text{Pr}[Y=y],\text{Pr}[Z=y]\}\\ &\enspace \enspace -\min\{\text{Pr}[Y=y],\text{Pr}[Z=y]\}] \end{aligned}

Pr[Y=y]>Pr[Z=y]\text{Pr}[Y=y]>\text{Pr}[Z=y] 时,max{Pr[Y=y],Pr[Z=y]}=Pr[Y=y]\max\{\text{Pr}[Y=y],\text{Pr}[Z=y]\} = \text{Pr}[Y=y],由给定条件和 最大散度 定义可知:

lnPr[Y=y]Pr[Z=y]D(YZ)=maxSSupp(Y)[lnPr[Y=y]Pr[Z=y]]εPr[Y=y]eεPr[Z=y]max{Pr[Y=y],Pr[Z=y]}eεPr[Z=y] \begin{aligned} \ln\frac{\text{Pr}[Y=y]}{\text{Pr}[Z=y]} &\leq D_{\infty}(Y||Z) = \max_{S \subseteq \text{Supp}(Y)}\Big[\ln\frac{\text{Pr}[Y=y]}{\text{Pr}[Z=y]}\Big]\leq \varepsilon\\ &\implies \text{Pr}[Y=y] \leq e^{\varepsilon}\cdot \text{Pr}[Z=y]\\ &\implies \max\{\text{Pr}[Y=y],\text{Pr}[Z=y]\} \leq e^{\varepsilon}\cdot \text{Pr}[Z=y] \end{aligned}

反之:Pr[Y=y]<Pr[Z=y]\text{Pr}[Y=y]<\text{Pr}[Z=y] 亦然,max{Pr[Y=y],Pr[Z=y]}eεPr[Y=y]\max\{\text{Pr}[Y=y],\text{Pr}[Z=y]\} \leq e^{\varepsilon}\cdot \text{Pr}[Y=y],所以两者中的最大值必然小于等于两者最小值乘上 eεe^\varepsilon,形式化表示为: max{Pr[Y=y],Pr[Z=y]}eεmin{Pr[Y=y],Pr[Z=y]}\max\{\text{Pr}[Y=y],\text{Pr}[Z=y]\}\leq e^\varepsilon\cdot\min\{\text{Pr}[Y=y],\text{Pr}[Z=y]\} 故有:

εy[max{Pr[Y=y],Pr[Z=y]}min{Pr[Y=y],Pr[Z=y]}]εy[(eε1)min{Pr[Y=y],Pr[Z=y]}] \begin{aligned} \varepsilon\cdot\sum_y[\max\{\text{Pr}[Y=y],\text{Pr}[Z=y]\} &-\min\{\text{Pr}[Y=y],\text{Pr}[Z=y]\}]\\ &\leq \varepsilon\cdot\sum_y[(e^\varepsilon-1)\cdot\min\{\text{Pr}[Y=y],\text{Pr}[Z=y]\}]\\ \end{aligned}

引理3.19(Azuma不等式)C1,...CkC_1,...C_k 为实值变量满足任意一个 i[k],Pr[Ciα]=1i\in[k],\text{Pr}[|C_i|\leq \alpha]=1,且对于每一个 (c1,...,ci1)Supp(C1,...Ci1)(c_1,...,c_{i-1})\in \text{Supp}(C_1,...C_{i-1}) 我们有:

E[CiC1=c1,...,Ci1=ci1]β \mathbb{E}[C_i|C_1=c_1,...,C_{i-1}=c_{i-1}]\leq\beta

对于任一 z>0z > 0,我们有:

Pr[i=1kCi>kβ+zkα]ez2/2 \text{Pr}\Big[\sum_{i=1}^kC_i>k\beta + z\sqrt{k}\cdot\alpha\Big] \leq e^{-z^2/2}

Copyright © GuoJohnny 2019 all right reserved,powered by Gitbook修订时间: 2019-12-16 09:54:06

results matching ""

    No results matching ""