Score:1

ความเป็นส่วนตัวที่แตกต่าง: กลไก Gaussian เมื่อ $\epsilon >1$, กลไก Laplace เมื่อ $\epsilon = 0$

ธง cn

ในแหล่งข้อมูล Differential Privacy กรณีจำกัดของ $\epsilon, \เดลต้า$ ไม่ได้รับความเป็นธรรมเพียงพอ

ตัวอย่างเช่นเมื่อ วิกิพีเดียว่ากันว่ากลไกเกาส์เซียนจะทำงานก็ต่อเมื่อ $\epsilon < 1$. อย่างไรก็ตาม กลไก Gaussian ใด ๆ ที่ตอบสนอง เช่น $(0.1, \เดลต้า)$-Differential Privacy ตอบโจทย์อยู่แล้ว $(1, \เดลต้า)$- ความเป็นส่วนตัวที่แตกต่างกันหรือ $(5^{100}, \เดลต้า)$-Differential Privacy ฉันถูกต้องไหม

ในทำนองเดียวกัน ในบางทรัพยากร คำจำกัดความของ DP มีไว้สำหรับ $\epsilon \geq 0 $แต่ก็อ้างว่ากลไก Laplace บรรลุผลสำเร็จ $(\epsilon, 0)$- ความเป็นส่วนตัวที่แตกต่างสำหรับใด ๆ $\epsilon$. อย่างไรก็ตามสิ่งที่เกี่ยวกับ $\epsilon = 0$? การกระจายตัวของ Laplace ด้วยความหนาแน่น $\propto 1/\epsilon$ ไม่ได้กำหนดไว้ในกรณีนี้ เรายังมีบ้างไหม สารเติมแต่ง กลไกที่ตอบโจทย์ $(0,0)$- ความเป็นส่วนตัวที่แตกต่าง?

แก้ไข: ความเข้าใจของฉันมีดังต่อไปนี้ ไม่มีกลไกเสียงรบกวนเพิ่มเติมที่สามารถบรรลุ DP ด้วย $\epsilon = 0 , \delta = 0$. สิ่งนี้เป็นไปไม่ได้เลยเนื่องจากเรา เพิ่ม สัญญาณรบกวนบางอย่าง (แน่นอน สมมติว่าความไวไม่ใช่ $0$ ซึ่งในกรณีนี้เราไม่ต้องใส่เสียงด้วยซ้ำ) ยิ่งไปกว่านั้น กลไก Laplace บรรลุ DP ด้วย $\epsilon>0,\delta = 0$หมายความว่ายังใด ๆ $\epsilon>0,\delta \geq 0$ จะเป็นไปได้ ในทางกลับกัน ต้องใช้กลไกเกาส์เซียน $\epsilon, \delta > 0$ดังนั้นสิ่งนี้จึงไม่ได้สรุปอะไรในกรณีของ Laplace ในแง่ของความเป็นไปได้ (เช่น สิ่งที่ทำได้ สิ่งที่ทำไม่ได้) ดังนั้นฉันคิดว่าความคลุมเครือเพียงอย่างเดียวคือ: เรามีกลไกการเติมแต่งที่บรรลุ DP ด้วย $\epsilon = 0$ และอื่น ๆ $\เดลต้า > 0$?

Score:2
ธง ru

ในกรณีของกลไก Gaussian สิ่งสำคัญคือต้องแยกแยะการใช้ $\epsilon$ เพื่อกำหนดพารามิเตอร์การแจกแจงแบบเกาส์เซียนและการใช้เพื่อกำหนดระดับความเป็นส่วนตัวที่แตกต่างกัน สำหรับใดๆ $0<\epsilon<1$ และ $0<\เดลต้า<1$ เราสามารถสร้างกลไกที่เพิ่มการกระจายเสียง $$\mathcal N(0,2\log(5/4\delta)(\Delta f)^2/\epsilon^2)$$ จากนั้นเรามีการรับประกันทางสถิติว่าสิ่งนี้มอบให้ $(\epsilon,\delta)$- ความเป็นส่วนตัวที่แตกต่างกันและแน่นอน $(\epsilon',\delta')$- ความเป็นส่วนตัวที่แตกต่างสำหรับใด ๆ $\epsilon'\ge\epsilon$ และ $\delta'\ge\delta$. แต่ถ้า (เช่น) เราถือเอาว่า $\epsilon=2$ และ $\delta=1/2$ แม้ว่าเรายังสามารถสร้างฟังก์ชันเสียงได้ $$\mathcal N(0,2\log(5/2)(\Delta f)^2/4),$$ เราไม่สามารถใช้ทฤษฎีบทเพื่อบอกว่าเรามี $(2,0.5)$- การรักษาความปลอดภัยที่แตกต่างกัน วิกิพีเดียพยายามแสดงข้อจำกัดของสิ่งที่พิสูจน์ได้โดยใช้โครงสร้าง Gaussian แทนที่จะจำกัดช่วงของความหมายของความเป็นส่วนตัวที่แตกต่างกัน

ในทำนองเดียวกัน ในกรณีของ Lagrange การก่อสร้างไม่ได้กำหนดไว้สำหรับ $\epsilon=0$ ดังนั้นจึงไม่สามารถใช้กับพารามิเตอร์นี้ได้ อีกครั้ง นี่เป็นข้อจำกัดในการก่อสร้าง Lagrange มากกว่าขีดจำกัดของขอบเขตของความหมายของความเป็นส่วนตัวที่แตกต่างกัน

ในแง่ของ $(0,0)$-Differential Privacy นี่จะหมายความว่าอัลกอริทึมของเรา $\คณิตศาสตร์ A$ สร้างเอาต์พุตแบบกระจายที่เหมือนกันสำหรับชุดข้อมูลทั้งหมด นี่หมายความว่า $\คณิตศาสตร์ A$ เป็นอิสระจากชุดข้อมูลและไม่สามารถสร้างแบบจำลองโดยการเพิ่มสัญญาณรบกวนให้กับอัลกอริทึมที่ขึ้นกับชุดข้อมูล

independentvariable avatar
cn flag
ขอบคุณสำหรับคำตอบที่ดีของคุณ! โดยรวมแล้ว เรามีกลไกที่ทำงานกับ $\epsilon = 0$ และ $\delta > 0$ หรือไม่ หรือขึ้นอยู่กับโครงสร้างของชุดข้อมูลทั้งหมด?
Daniel S avatar
ru flag
เรามาถึงขีด จำกัด ของความรู้ของฉันที่นี่ เห็นได้ชัดว่ากลไกใด ๆ ที่ให้ไว้คือความเป็นส่วนตัว $(0,1)$-differential สำหรับค่ากลางของ $\delta$ ฉันสงสัย (แต่ไม่รู้) ว่าสิ่งนี้จะขึ้นอยู่กับ $\mathcal A$ และการโต้ตอบกับชุดข้อมูลเป็นอย่างมาก
independentvariable avatar
cn flag
นั่นคือสัญชาตญาณของฉันเช่นกัน ขอบคุณมาก!

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา