3.6.1 稀疏算法

现在,我们展示如何使用合成技术处理多个“高于阈值”的查询。

稀疏算法可以认为是:当查询进入时,它会反复调用 AboveThreshold。 每次报告高于阈值的查询后,该算法仅在 AboveThreshold 的新实例上重新启动剩余的查询流。在重新启动AboveThreshold cc 次之后停止(即在出现 cc 个高于阈值的查询之后)。 由于 AboveThreshold 的每个实例都是(ε,0)(\varepsilon,0)- 差分隐私的,因此适用合成定理。

Sparse

定理 3.25 稀疏算法是 (ε,δ)(\varepsilon,\delta)-差分隐私的。

【证明】 我们发现到 Sparse 算法完全等同于以下过程:我们对查询流 {fi}\{f_i\} 运行 AboveThreshold 算法 (D,{fi},T,ε)(D,\{f_i\},T,\varepsilon'),并设置:

ε={εcif δ=0;ε8cln1δOtherwise. \varepsilon' = \begin{cases} \frac{\varepsilon}{c} &\text{if } \delta = 0 ;\\ \frac{\varepsilon}{\sqrt{8c\ln \frac{1}{\delta}}} &\text{Otherwise.} \end{cases}

使用 AboveThreshold 算法提供答案。当 AboveThreshold 算法停止时(在回答了1个超过阈值的查询之后),我们只需在剩余的查询流上重新启动 Sparse算法(D,{fi},T,ε)(D,\{f_i\},T,\varepsilon') ,并继续这个过程直到我们重新启动 AboveThreshold 算法 cc 次。第 ccAboveThreshold 算法停止后,Sparse算法 也停止。我们已经证明了AboveThreshold 算法 (D,{fi},T,ε)(D,\{f_i\},T,\varepsilon')(ε,0)(\varepsilon',0)-差分隐私的。最后,根据高级合成定理(定理 3.20 和 推论 3.21),ccε=ε8cln1δ\varepsilon' = \frac{\varepsilon}{\sqrt{8c\ln \frac{1}{\delta}}}-差分隐私算法的合成是 (ε,δ)(\varepsilon,\delta) -差分隐私,并且 ccε=ε/c\varepsilon' = \varepsilon/c- 差分隐私算法的合成是 (ε,0)(\varepsilon,0) -差分隐私。

需要证明 包含 ccAboveThreshold 算法 的 Sparse 算法的准确性。我们注意到,如果对于每个 AboveThreshold 算法 (α,β/c)(\alpha,\beta/c) 精确的,那么 Sparse 算法将是 (α,β)(\alpha,\beta) 精确的。

【定理 3.25 证毕】

定理 3.26 对于 k 个查询的任何序列,f1,...,fkf_1,...,f_k 使得 L(T){i:fi(D)Tα}cL(T)\equiv|\{i:f_i(D)\geq T - \alpha\}|\leq c。如果 δ>0\delta >0,当:

α=(lnk+ln2cβ)512cln1δε \alpha = \frac{(\ln k+\ln\frac{2c}{\beta})\sqrt{512c\ln\frac{1}{\delta}}}{\varepsilon}

Sparse 算法是 (α,β)(\alpha,\beta) 精确的。

如果 δ=0\delta =0,当:

α=8x(lnk+ln(2c/β))ε \alpha = \frac{8x(\ln k + \ln(2c/\beta))}{\varepsilon}

Sparse 算法是 (α,β)(\alpha,\beta) 精确的。

【证明】 运用 定理3.24 的证明方法,将 β\beta 设为β/c\beta/c,并分别根据 δ>0\delta > 0δ=0\delta=0ε\varepsilon 设为 ε8cln1δ\frac{\varepsilon}{\sqrt{8c\ln \frac{1}{\delta}}}ε/c\varepsilon/c 即可。

Copyright © GuoJohnny 2019 all right reserved,powered by Gitbook修订时间: 2019-12-16 09:59:31

results matching ""

    No results matching ""