Score:5

วิธีที่ดีที่สุดในการปลอมแปลงที่อยู่ IP ในขณะที่ยังคงรักษาความสามารถในการระบุที่อยู่ที่ใช้เครือข่ายย่อยร่วมกันคืออะไร

ธง us

พื้นหลัง: ฉันกำลังพัฒนาแอปที่อาศัยผู้ใช้ที่ลงทะเบียนลงคะแนนในสิ่งต่างๆ และฉันต้องการสร้างการวิเคราะห์พฤติกรรมที่เกี่ยวข้องกับที่อยู่ IP เพื่อเป็นวิธีหนึ่งในการตั้งค่าสถานะบัญชีสำหรับการตรวจสอบเพิ่มเติมเกี่ยวกับการใช้หลายบัญชี + การโหวตในทางที่ผิด เพื่อผลประโยชน์ของความเป็นส่วนตัว/การลดข้อมูลให้เหลือน้อยที่สุด/ข้อผูกมัดของ GDPR ดูเหมือนว่ากลยุทธ์ที่ดีที่สุดคือการจัดเก็บคีย์แฮชของ IP ซึ่งสามารถใช้นามแฝงได้เพียงพอแต่เป็นตัวกำหนดสำหรับการตรวจสอบการจับคู่ ดังนั้นฉันสามารถใช้ HMAC-SHA256 หรือที่คล้ายกันกับที่อยู่ทั้งหมดและทำมันได้

อย่างไรก็ตาม สำหรับฉันแล้ว มันอาจมีประโยชน์ที่จะไม่เพียงแต่ระบุ IP ที่เหมือนกันเท่านั้น แต่ยังรวมถึง IP ที่ใช้เครือข่ายย่อยร่วมกันด้วย ซึ่งจะต้องใช้บางสิ่งที่ไม่ทึบจนเกินไป วิธีที่ชัดเจนในการทำเช่นนี้คือการแฮชแต่ละส่วนของ IP แยกกัน ปัญหาคือเมื่อใช้ HMAC-SHA256 (ตัวอย่าง) เอาต์พุตทั้งหมดมีขนาดใหญ่เกินไป โดยเฉพาะอย่างยิ่งสำหรับที่อยู่ IPv6 (8 x 256 = 2048 บิตสำหรับแต่ละที่อยู่ 128 บิต) นอกจากนี้ยังจะลดขนาดของพื้นที่อินพุตลงอย่างมาก (ค่า 1 ไบต์สำหรับ IPv4, ค่า 2 ไบต์สำหรับ IPv6) - ฉันคิดว่าจะเป็นการดีที่สุดถ้าใช้คีย์ที่แตกต่างกันสำหรับแต่ละส่วน ถ้าฉันจะทำเช่นนี้ ซึ่ง ฟังดูไม่สนุกเลย

วิธีที่ดีในการบรรลุเป้าหมายของฉันในขณะที่รักษาขนาดที่เก็บไว้ค่อนข้างเล็กคืออะไร อาจไม่เป็นไรที่จะตัดทอนเอาต์พุตเมื่อใช้ SHA256 อาจเนื่องจากเป็น HMAC และคีย์เป็นความลับจึงเป็นเรื่องปกติที่จะใช้ฟังก์ชันแฮชที่เล็กลงและอ่อนแอกว่าในตอนแรกเช่น MD5 อาจมีฟังก์ชันแฮชอื่นที่เหมาะกับกรณีการใช้งานประเภทนี้โดยเฉพาะ คำแนะนำใด ๆ ที่ชื่นชม

kelalaka avatar
in flag
ดู. การเข้ารหัสแบบรักษารูปแบบ
knaccc avatar
es flag
"ดูเหมือนว่ากลยุทธ์ที่ดีที่สุดคือการจัดเก็บคีย์แฮชของ IP ซึ่งสามารถใช้นามแฝงได้เพียงพอ แต่สามารถกำหนดได้สำหรับการตรวจสอบการจับคู่"
eddydee123 avatar
mk flag
ฉันคิดว่ามากกว่าการรักษารูปแบบที่จำเป็นเพื่อรักษาความสัมพันธ์เช่นเครือข่ายย่อยทั่วไป
Score:1
ธง us

หลังจากค้นหาเพิ่มเติม (ขอบคุณสำหรับตัวชี้ในความคิดเห็น) ฉันเจอ รูปแบบ Crypto-PAN (มักสะกดโดยไม่มียัติภังค์เป็น CryptoPAn) ซึ่งอธิบาย/พัฒนาขึ้นเพื่อจุดประสงค์นี้โดยเฉพาะ มีการปรับใช้ซอฟต์แวร์จำนวนหนึ่งในภาษาต่างๆ ซึ่งบางภาษารองรับ IPv6

คุณสมบัติที่ฉันกำลังมองหาเรียกว่า "การรักษาคำนำหน้า" และบทความที่แนะนำ Crypto-PAN เสนอข้อพิสูจน์ทางคณิตศาสตร์ว่ามีวิธีทั่วไปเพียงวิธีเดียวที่จะทำได้ (อย่างน้อยก็ในวิธีที่ค่าสำหรับแต่ละส่วนของคำนำหน้า ขึ้นอยู่กับทุกสิ่งที่มาก่อน ตรงข้ามกับโครงการอิสระที่ฉันเสนอ)

Crypto-PAN เกี่ยวข้องกับการใช้ (ซ้ำ) ของฟังก์ชันหลอกเทียม (PRF) ซึ่งในการใช้งานอ้างอิงและอื่น ๆ ส่วนใหญ่เป็น AES-128-ECB ที่อยู่ IP ที่ใช้นามแฝงสามารถถอดรหัสได้ (เมื่อทราบรหัสลับ) แม้ว่าจะใช้ฟังก์ชันแฮชสำหรับ PRF เนื่องจากวิธีการทำงานของอัลกอริทึม กล่าวคือ Crypto-PAn เป็นรูปแบบการเข้ารหัสโดยไม่คำนึงถึง PRF

Crypto-PAN ยังเกิดขึ้นเพื่อรักษารูปแบบ ดังนั้นจึงเป็นไปได้ที่จะทำงานกับที่อยู่ที่ใช้นามแฝงเช่นเดียวกับที่คุณทำกับต้นฉบับ

การกำหนดและการเก็บรักษาคำนำหน้าและการดำเนินการในพื้นที่ค่าขนาดเล็กมาพร้อมกับข้อเสียที่โครงการจำเป็นต้องอ่อนแอต่อการวิเคราะห์ความหมาย เป็นที่ชัดเจนว่าเพื่อให้ได้ยูทิลิตี้ที่ต้องการ ต้องมีการแลกเปลี่ยนความเป็นส่วนตัวอย่างหลีกเลี่ยงไม่ได้ (ซึ่งผมรู้ตั้งแต่เริ่มต้น) กล่าวอีกนัยหนึ่งคือความพยายามที่ดีที่สุด แต่ก็ดีกว่าการจัดเก็บที่อยู่ IP ดั้งเดิม แน่นอนว่ามีเทคนิคเพิ่มเติมที่อาจหรือควรใช้เพื่อช่วยลดความเสี่ยง (เช่น การหมุนเวียนคีย์ การลบหลังจากเวลาที่กำหนด การแบ่งพาร์ติชันด้วยคีย์ที่แตกต่างกัน) เห็นได้ชัดว่าฉันหวังว่าแนวทางปฏิบัติด้านความปลอดภัยอื่น ๆ ของฉันจะป้องกันไม่ให้ข้อมูลถูกเปิดเผยตั้งแต่แรก

มี IETF RFC จากปี 2020 ซึ่งรวมถึง ตารางเทคนิคการลบชื่อที่อยู่ IP / นามแฝง. นอกจาก Crypto-PAn แล้ว สิ่งเดียวที่อยู่ภายใต้หมวดหมู่ "นามแฝง" และ "การรักษาคำนำหน้า" คือสิ่งที่เรียกว่า "การไม่ระบุตัวตนที่จำลองแบบย่อยของทรีแฮช (TSA)" ซึ่งเห็นได้ชัดว่าได้รับการปรับให้เหมาะสมสำหรับความเร็ว (อาจไม่ใช่สิ่งที่ดี ในบริบทนี้หรือไม่) แต่มันมาพร้อมกับหมายเหตุที่แนะนำว่าที่อยู่ IPv6 อาจต้องใช้หน่วยความจำมากเกินไป และฉันไม่พบการใช้งานใดๆ เลย

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา