วิธีที่ดีที่สุดในการปลอมแปลงที่อยู่ IP ในขณะที่ยังคงรักษาความสามารถในการระบุที่อยู่ที่ใช้เครือข่ายย่อยร่วมกันคืออะไร

Inkling

8/4/23 08:03

พื้นหลัง: ฉันกำลังพัฒนาแอปที่อาศัยผู้ใช้ที่ลงทะเบียนลงคะแนนในสิ่งต่างๆ และฉันต้องการสร้างการวิเคราะห์พฤติกรรมที่เกี่ยวข้องกับที่อยู่ IP เพื่อเป็นวิธีหนึ่งในการตั้งค่าสถานะบัญชีสำหรับการตรวจสอบเพิ่มเติมเกี่ยวกับการใช้หลายบัญชี + การโหวตในทางที่ผิด เพื่อผลประโยชน์ของความเป็นส่วนตัว/การลดข้อมูลให้เหลือน้อยที่สุด/ข้อผูกมัดของ GDPR ดูเหมือนว่ากลยุทธ์ที่ดีที่สุดคือการจัดเก็บคีย์แฮชของ IP ซึ่งสามารถใช้นามแฝงได้เพียงพอแต่เป็นตัวกำหนดสำหรับการตรวจสอบการจับคู่ ดังนั้นฉันสามารถใช้ HMAC-SHA256 หรือที่คล้ายกันกับที่อยู่ทั้งหมดและทำมันได้

อย่างไรก็ตาม สำหรับฉันแล้ว มันอาจมีประโยชน์ที่จะไม่เพียงแต่ระบุ IP ที่เหมือนกันเท่านั้น แต่ยังรวมถึง IP ที่ใช้เครือข่ายย่อยร่วมกันด้วย ซึ่งจะต้องใช้บางสิ่งที่ไม่ทึบจนเกินไป วิธีที่ชัดเจนในการทำเช่นนี้คือการแฮชแต่ละส่วนของ IP แยกกัน ปัญหาคือเมื่อใช้ HMAC-SHA256 (ตัวอย่าง) เอาต์พุตทั้งหมดมีขนาดใหญ่เกินไป โดยเฉพาะอย่างยิ่งสำหรับที่อยู่ IPv6 (8 x 256 = 2048 บิตสำหรับแต่ละที่อยู่ 128 บิต) นอกจากนี้ยังจะลดขนาดของพื้นที่อินพุตลงอย่างมาก (ค่า 1 ไบต์สำหรับ IPv4, ค่า 2 ไบต์สำหรับ IPv6) - ฉันคิดว่าจะเป็นการดีที่สุดถ้าใช้คีย์ที่แตกต่างกันสำหรับแต่ละส่วน ถ้าฉันจะทำเช่นนี้ ซึ่ง ฟังดูไม่สนุกเลย

วิธีที่ดีในการบรรลุเป้าหมายของฉันในขณะที่รักษาขนาดที่เก็บไว้ค่อนข้างเล็กคืออะไร อาจไม่เป็นไรที่จะตัดทอนเอาต์พุตเมื่อใช้ SHA256 อาจเนื่องจากเป็น HMAC และคีย์เป็นความลับจึงเป็นเรื่องปกติที่จะใช้ฟังก์ชันแฮชที่เล็กลงและอ่อนแอกว่าในตอนแรกเช่น MD5 อาจมีฟังก์ชันแฮชอื่นที่เหมาะกับกรณีการใช้งานประเภทนี้โดยเฉพาะ คำแนะนำใด ๆ ที่ชื่นชม

116

0 + 0

ไม่เปิดเผยชื่อ

การรักษารูปแบบ

กำหนดการเข้ารหัส

ความเป็นส่วนตัวของข้อมูล

หลอกสุ่มเรียงสับเปลี่ยน

kelalaka

8/4/23 09:28

ดู. การเข้ารหัสแบบรักษารูปแบบ

ตอบกลับ

knaccc

8/4/23 19:58

"ดูเหมือนว่ากลยุทธ์ที่ดีที่สุดคือการจัดเก็บคีย์แฮชของ IP ซึ่งสามารถใช้นามแฝงได้เพียงพอ แต่สามารถกำหนดได้สำหรับการตรวจสอบการจับคู่"

ตอบกลับ

eddydee123

28/4/23 09:03

ฉันคิดว่ามากกว่าการรักษารูปแบบที่จำเป็นเพื่อรักษาความสัมพันธ์เช่นเครือข่ายย่อยทั่วไป

ตอบกลับ

Score:1

Crypto

Inkling

23/4/23 03:20

หลังจากค้นหาเพิ่มเติม (ขอบคุณสำหรับตัวชี้ในความคิดเห็น) ฉันเจอ รูปแบบ Crypto-PAN (มักสะกดโดยไม่มียัติภังค์เป็น CryptoPAn) ซึ่งอธิบาย/พัฒนาขึ้นเพื่อจุดประสงค์นี้โดยเฉพาะ มีการปรับใช้ซอฟต์แวร์จำนวนหนึ่งในภาษาต่างๆ ซึ่งบางภาษารองรับ IPv6

คุณสมบัติที่ฉันกำลังมองหาเรียกว่า "การรักษาคำนำหน้า" และบทความที่แนะนำ Crypto-PAN เสนอข้อพิสูจน์ทางคณิตศาสตร์ว่ามีวิธีทั่วไปเพียงวิธีเดียวที่จะทำได้ (อย่างน้อยก็ในวิธีที่ค่าสำหรับแต่ละส่วนของคำนำหน้า ขึ้นอยู่กับทุกสิ่งที่มาก่อน ตรงข้ามกับโครงการอิสระที่ฉันเสนอ)

Crypto-PAN เกี่ยวข้องกับการใช้ (ซ้ำ) ของฟังก์ชันหลอกเทียม (PRF) ซึ่งในการใช้งานอ้างอิงและอื่น ๆ ส่วนใหญ่เป็น AES-128-ECB ที่อยู่ IP ที่ใช้นามแฝงสามารถถอดรหัสได้ (เมื่อทราบรหัสลับ) แม้ว่าจะใช้ฟังก์ชันแฮชสำหรับ PRF เนื่องจากวิธีการทำงานของอัลกอริทึม กล่าวคือ Crypto-PAn เป็นรูปแบบการเข้ารหัสโดยไม่คำนึงถึง PRF

Crypto-PAN ยังเกิดขึ้นเพื่อรักษารูปแบบ ดังนั้นจึงเป็นไปได้ที่จะทำงานกับที่อยู่ที่ใช้นามแฝงเช่นเดียวกับที่คุณทำกับต้นฉบับ

การกำหนดและการเก็บรักษาคำนำหน้าและการดำเนินการในพื้นที่ค่าขนาดเล็กมาพร้อมกับข้อเสียที่โครงการจำเป็นต้องอ่อนแอต่อการวิเคราะห์ความหมาย เป็นที่ชัดเจนว่าเพื่อให้ได้ยูทิลิตี้ที่ต้องการ ต้องมีการแลกเปลี่ยนความเป็นส่วนตัวอย่างหลีกเลี่ยงไม่ได้ (ซึ่งผมรู้ตั้งแต่เริ่มต้น) กล่าวอีกนัยหนึ่งคือความพยายามที่ดีที่สุด แต่ก็ดีกว่าการจัดเก็บที่อยู่ IP ดั้งเดิม แน่นอนว่ามีเทคนิคเพิ่มเติมที่อาจหรือควรใช้เพื่อช่วยลดความเสี่ยง (เช่น การหมุนเวียนคีย์ การลบหลังจากเวลาที่กำหนด การแบ่งพาร์ติชันด้วยคีย์ที่แตกต่างกัน) เห็นได้ชัดว่าฉันหวังว่าแนวทางปฏิบัติด้านความปลอดภัยอื่น ๆ ของฉันจะป้องกันไม่ให้ข้อมูลถูกเปิดเผยตั้งแต่แรก

มี IETF RFC จากปี 2020 ซึ่งรวมถึง ตารางเทคนิคการลบชื่อที่อยู่ IP / นามแฝง. นอกจาก Crypto-PAn แล้ว สิ่งเดียวที่อยู่ภายใต้หมวดหมู่ "นามแฝง" และ "การรักษาคำนำหน้า" คือสิ่งที่เรียกว่า "การไม่ระบุตัวตนที่จำลองแบบย่อยของทรีแฮช (TSA)" ซึ่งเห็นได้ชัดว่าได้รับการปรับให้เหมาะสมสำหรับความเร็ว (อาจไม่ใช่สิ่งที่ดี ในบริบทนี้หรือไม่) แต่มันมาพร้อมกับหมายเหตุที่แนะนำว่าที่อยู่ IPv6 อาจต้องใช้หน่วยความจำมากเกินไป และฉันไม่พบการใช้งานใดๆ เลย

0 + 0

Kulap

คำถามนี้เป็นภาษาอื่นๆ:

EN: What is the best way to pseudonymise IP addresses while retaining the ability to identify those that share a subnet?

TH: วิธีที่ดีที่สุดในการปลอมแปลงที่อยู่ IP ในขณะที่ยังคงรักษาความสามารถในการระบุที่อยู่ที่ใช้เครือข่ายย่อยร่วมกันคืออะไร

RO: Care este cea mai bună modalitate de a pseudonimiza adresele IP, păstrând în același timp capacitatea de a le identifica pe cele care partajează o subrețea?

RU: Каков наилучший способ псевдонимизации IP-адресов, сохраняя при этом возможность идентифицировать тех, кто находится в одной подсети?

VI: Cách tốt nhất để đặt tên giả cho địa chỉ IP trong khi vẫn giữ được khả năng xác định những địa chỉ dùng chung mạng con là gì?

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา