Score:3

ความแตกต่างระหว่างการสุ่มแบบไม่สม่ำเสมอและการสุ่มแบบสม่ำเสมอ

ธง bt

ฉันกำลังอ่านเกี่ยวกับ Key Deriving Functions (KDF) และในส่วนของ หนังสือ Cryptographic โลกแห่งความเป็นจริง โดย David Wong กำลังทำการเปรียบเทียบกับ Pseudorandom number generator (PRNG) และความแตกต่างอย่างหนึ่งก็คือ KDF ใช้อินพุตความยาวตามอำเภอใจแบบสุ่มแบบไม่สม่ำเสมอ ในขณะที่ PRNG ใช้คีย์ k-บิตแบบสุ่มแบบสม่ำเสมอ แม้ว่าทั้งสองจะมีเอาต์พุตความยาวตามอำเภอใจแบบสุ่มอย่างสม่ำเสมอ

โดยพื้นฐานแล้วมีการกล่าวกันว่า ความแตกต่างที่สำคัญคือ KDF ไม่คาดหวังความลับแบบสุ่มอย่างเต็มรูปแบบเป็นอินพุต (ตราบเท่าที่มีเอนโทรปีเพียงพอ)

การสุ่มแบบไม่สม่ำเสมอและการสุ่มแบบสม่ำเสมอในบริบทนี้หมายความว่าอย่างไร เอนโทรปีหมายความว่าอย่างไรในบริบทนี้

ดูเหมือนว่าการเข้าใจคำศัพท์เหล่านี้ดีขึ้นจะช่วยให้เข้าใจความแตกต่างระหว่าง KDF และ PRNG ได้ดีขึ้น

Ievgeni avatar
cn flag
คุณช่วยเพิ่มการอ้างอิงและ/หรือลิงก์เพื่อให้มีบริบทเพิ่มเติมได้ไหม
Score:5
ธง ng

สุ่มอย่างสม่ำเสมอ หมายความว่าค่าที่เป็นไปได้ทั้งหมดมีโอกาสเท่ากันโดยที่ "ค่าที่เป็นไปได้ทั้งหมด" จะเป็นค่าในบางชุด ซึ่งเมื่อไม่ได้กำหนดไว้เป็นอย่างอื่น ชุดของบิตสตริงจะเท่ากับขนาดของตัวแปรที่พิจารณา

ตัวอย่างของการป้อนข้อมูลแบบไม่สม่ำเสมอไปยัง KDF คือเมื่อป้อน KDF ด้วยผลลัพธ์ของการแลกเปลี่ยนคีย์ DiffieâHellman ใน $\mathbb Z_p^*$ กับ $g$ เครื่องกำเนิดไฟฟ้าของทั้งกลุ่มนั้น อินพุตของ KDF อาจเป็นค่าของ $g^{a\,b}\bmod p$ แสดงเป็น bytesting (เช่น big-endian) ขนาดคงที่ (ของ $p$, ปัดเศษขึ้นเป็นผลคูณของ 8 บิต) ด้วย $a$ และ $ข$ ความลับชั่วคราวแบบสุ่ม การทดสอบไบต์บางอย่างที่ถูกต้องที่อินพุตของ KDF ไม่สามารถเกิดขึ้นได้ในการใช้งานจริงนั้น: การทดสอบอินพุตที่ไม่ได้แสดงจำนวนเต็มใน $[1,p-1]$รวมถึงสตริงการทดสอบแบบ all-0x00 และ all-0xFF และในบรรดาสิ่งเหล่านั้นที่สามารถเข้าถึงได้ สารตกค้างกำลังสอง (ถึงเมื่ออย่างใดอย่างหนึ่ง $a$ หรือ $ข$ เป็นเลขคู่) มีโอกาสมากกว่าสารตกค้างที่ไม่ใช่กำลังสองถึงสามเท่า (ถึงเมื่อ $a$ และ $ข$ แปลก)

อีกตัวอย่างหนึ่งของอินพุตที่ไม่สม่ำเสมอคือวลีรหัสผ่าน ซึ่งเป็นอินพุตทั่วไปสำหรับ KDF บางตัว (เช่น Argon2 สมัยใหม่หรือ PBKDF2 ที่ล้าสมัย)


เอนโทรปีของแชนนอน (เป็นบิต) ของกระบวนการสร้างตัวแปร $X$ ที่สามารถทำได้ $n$ ค่าที่แตกต่างกับค่าความน่าจะเป็น $p_i$ กับ $0\le ฉัน<n$ด้วยประการฉะนี้ $1=\displaystyle\sum_{0\le i<n}p_i$ และ $0\le p_i\le1$ถูกกำหนดเป็นปริมาณ $$H(X)=\sum_{0\le i<n\text{ และ }p_i\ne0}p_i\log_2(1/p_i)$$

เอนโทรปีที่มีประโยชน์อีกอย่างหนึ่งคือ นาที-เอนโทรปีกำหนดเป็น $$H_\text{min}(X)=\log_2(1/\max_{0\le i<n}{p_i})$$

มันถือเสมอ $H_\text{นาที}(X)\le H(X)$.

กระบวนการสร้าง a $ข$บิตบิตสตริง $X$ มี $ข$เอนโทรปีบิต (สำหรับคำจำกัดความอย่างใดอย่างหนึ่ง) ก็ต่อเมื่อมันสร้างบิตสตริงแบบสุ่มที่สม่ำเสมอ เมื่อสุ่มแบบไม่สม่ำเสมอ ค่าเอนโทรปีจะน้อยกว่า $ข$-บิตลงไป $0$ เมื่อมันสร้างบิตสตริงเดียวกันเสมอ

อย่างไม่เป็นทางการ มีเอนโทรปีเพียงพอที่อินพุตของ KDF หากเอาต์พุตของ KDF นั้นเป็นแบบสุ่มอย่างสม่ำเสมอ (สำหรับคำจำกัดความที่เข้มงวดมากขึ้นหรือน้อยลง) เป็นไปได้เมื่ออินพุตของ KDF ไม่สุ่มอย่างสม่ำเสมอ แต่ถ้าอินพุตนั้นมีเอนโทรปี (นาที-) อย่างน้อยที่สุดความกว้างเอาต์พุตของ KDF คือ $ข$ บิต (หรืออย่างน้อย $ข$ ดังนั้น $2^b$ ท้าทายการแจกแจงโดยศัตรู) และนั่นก็ไม่ใช่เงื่อนไขที่เพียงพอ

dade avatar
bt flag
โดยพื้นฐานแล้วหากค่าที่เป็นไปได้ทั้งหมด - มีโอกาสไม่เท่ากัน - เนื่องจากข้อ จำกัด ใด ๆ - แสดงว่าคุณมีการสุ่มแบบไม่สม่ำเสมอ?
fgrieu avatar
ng flag
@เดด: แค่นั้นแหละ ยกเว้นเราจะพูดว่า "การสุ่มแบบไม่สม่ำเสมอ" หรือ "การสุ่มแบบไม่สม่ำเสมอ"
dade avatar
bt flag
คำถามที่เกี่ยวข้อง ... "การสุ่มแบบไม่สม่ำเสมอ" จะมี "เอนโทรปีเพียงพอ" ได้อย่างไร
Paul Uszak avatar
cn flag
@dade อย่าคิดมากเรื่องนี้ - มันง่ายมาก ลองนึกภาพว่าคุณต้องการ 128 รายการซึ่งเพียงพอสำหรับการเข้ารหัส ถ้ามันมาในอัตรา 8 (การกระจายแบบสม่ำเสมอภายในไบต์) คุณต้องใช้ 16 เท่านั้น แต่คุณสามารถได้ 128 ของ âitâ ที่อัตรา 5.3 (การแจกแจงแบบแปลกๆ) ถ้าคุณใช้ 25 ไป
Score:4
ธง cn

การสุ่มแบบไม่สม่ำเสมอและการสุ่มแบบสม่ำเสมอในบริบทนี้หมายความว่าอย่างไร เอนโทรปีหมายความว่าอย่างไรในบริบทนี้

นี่คือการสุ่มที่มีการแจกแจงแบบไม่สม่ำเสมอซึ่งแสดงเป็นฟังก์ชันมวลความน่าจะเป็น (PMF):-

น

คุณจะเห็นว่าเลขศูนย์แพร่หลายมาก หากการสุ่มเป็นแบบเดียวกัน ค่าทั้งหมดจะสอดคล้องกับเส้นสีน้ำเงินที่ p = 0.0039 ซึ่งก็คือ $\frac{1}{256}$. เนื่องจากในการเข้ารหัสเราสนใจขั้นต่ำ เอนโทรปี $\big(H_{\infty} = -\log_2 (p_{สูงสุด}) \big)$การแจกแจงข้างต้น (หาก I.I.D) มี $H_{\infty} \ประมาณ 5.3$ บิต/ไบต์

หาก PMF สุ่มอย่างสม่ำเสมอ เราก็จะได้ $H_{\infty} = 8$ บิต/ไบต์ นี่คือเอนโทรปีสูงสุดซึ่งเป็นลักษณะของการแจกแจงแบบสม่ำเสมอ

ดังนั้นการสุ่มแบบไม่สม่ำเสมอจึงเข้าสู่ KDF (บางทีรหัสผ่านเช่น '123456') และการสุ่มแบบสม่ำเสมอจะออกมา

fgrieu avatar
ng flag
"การสุ่มแบบไม่สม่ำเสมอจะเข้าสู่ KDF และการสุ่มแบบสม่ำเสมอจะออกมา" _if_ มีอินพุตเพียงพอในเอนโทรปี
Paul Uszak avatar
cn flag
@fgrieu Ah, ye olde เกาลัด - ความแตกต่างระหว่างความซับซ้อนของ Kolmogorov, เอนโทรปีการเข้ารหัสและเอนโทรปีของข้อมูล เราควรแก้ปัญหานี้ให้ได้ในสักวันหนึ่งจริงๆ...

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา