Score:2

การดึงข้อมูลแบบสุ่มจากแหล่ง Santha-Vazirani (กึ่งสุ่ม)

ธง us

ในการแสวงหาเพื่อทำความเข้าใจตัวแยกการสุ่มให้ดีขึ้น (ในบริบทของการประมวลผลหลังการประมวลผล TRNG) ฉันได้อ่านบทความเกี่ยวกับ โดย Neumann Extractor และ แหล่งที่มาของ Santha-Vazirani (SV-). von Neumann extractor เป็นอัลกอริธึมง่ายๆ ที่ทำงานบนแหล่งข้อมูลอิสระที่มีอคติ เช่น เหรียญที่มีอคติ อย่างไรก็ตาม แหล่งที่มาของการสุ่มทางกายภาพที่มีอยู่นั้นไม่สมบูรณ์และมีความลำเอียง และสัมพันธ์กัน. Santha และ Vazirani นิยามแหล่งที่มาดังกล่าว ซึ่งเรียกว่า SV-source

เห็นได้ชัดว่ากระดาษ Santha-Vazirani แสดงให้เห็นว่าเป็นไปไม่ได้ที่จะแยกบิตสุ่มที่เกือบจะเหมือนกันออกจากแหล่ง SV ฉันไม่มีพื้นฐานทางคณิตศาสตร์ที่จำเป็นในการทำความเข้าใจการสาธิต แต่การอ้างสิทธิ์นี้ทำให้ฉันฉงนฉงาย ตัวอย่างเช่น ฉันคาดว่าฟังก์ชันแฮชจะสร้างบิตสุ่มแบบเดียวกันจากแหล่ง SV

การสาธิตนี้หมายความว่าอย่างไร? เป็นไปไม่ได้หรือไม่ที่จะสร้าง TRNG ที่ดีจากแหล่งข้อมูลที่มีอคติและมีความสัมพันธ์กัน (ซึ่งใช้ไม่ได้กับหลายแหล่ง)

Paul Uszak avatar
cn flag
ฉันไม่สนใจคนที่เปลี่ยนชื่อแหล่งที่มาที่รู้จักโดยทั่วไปตามชื่อตัวเอง ละเว้น _"SV"_ และเรียกมันว่า "สัมพันธ์กัน" เหมือนที่คนอื่นทำ
Score:2
ธง cn

อย่างไรก็ตาม แหล่งที่มาของการสุ่มทางกายภาพที่มีอยู่นั้นไม่สมบูรณ์และมีความลำเอียงและสัมพันธ์กัน

ไม่พวกเขาไม่ใช่. แหล่งที่มาไม่ได้สร้างเอนโทรปีใด ๆ จริง ๆ ไม่มี. ลองนึกภาพซีเนอร์ไดโอดหรือวงจรออสซิลเลเตอร์วงแหวนที่อยู่ตรงหน้าคุณ พวกเขาแค่นั่งดูวงจร

เดอะ ผู้สังเกตการณ์ สร้างเอนโทรปีเมื่อสุ่มตัวอย่างแหล่งที่มา แหล่งที่มาไม่ได้ สิ่งนี้นำไปสู่แนวคิดของ $ (\epsilon, \tau) $-เอนโทรปีต่อหน่วยเวลา โดยที่ "$ (\epsilon, \tau) $-เอนโทรปีคือจำนวนข้อมูลที่สร้างขึ้นต่อหน่วยเวลาในระดับที่แตกต่างกัน $\tau$ ของเวลาและ $\epsilon$ ของสิ่งที่สังเกตได้" อัตราตัวอย่างและความละเอียดอย่างมีประสิทธิภาพ ซึ่งหมายความว่าผู้สังเกตสามารถเปลี่ยนแปลงอัตราเอนโทรปีของแหล่งที่มาได้อย่างไม่มีที่สิ้นสุดตามที่เห็นสมควร โดยการเปลี่ยนแปลงอย่างใดอย่างหนึ่ง $\tau$ หรือ $\epsilon$.

สิ่งนี้นำไปสู่ปัญหาสองด้านที่ไม่สมมาตร: เราจะวัดได้อย่างไร $H_{\infty}$ สำหรับแหล่งที่มาที่เกี่ยวข้อง? มีสองวิธีแก้ปัญหาแบบอสมมาตร:-

  1. พยายามที่จะกำหนด $H_{\infty}$ สำหรับแหล่งที่มาที่สัมพันธ์กันซึ่งมีความเชื่อมั่นต่ำมาก

  2. ปรับของคุณ $ (\epsilon, \tau) $ ระบบการสุ่มตัวอย่างเพื่อสร้างข้อมูลที่ไม่สัมพันธ์กันด้วยความแน่นอนสูง

แทบไม่มีใครทำอันดับ 1 ได้ แม้แต่ NIST ก็มี กล่าว มันเกือบจะเป็นไปไม่ได้ (ความคิดเห็นที่ไม่ได้ตั้งใจของ Kerry McKay) ฉันนึกไม่ออกว่าอะไร $H_{\infty}$ หมายถึงในทางปฏิบัติในสถานการณ์ที่สัมพันธ์กัน ดังนั้นทำ #2 อย่างที่คนส่วนใหญ่ทำกัน รับ $H_{\infty}$ เช่น $-\log_2{(p_{\text{max}})}$ และสารสกัดจาก

ดังนั้นมัน เป็น เป็นไปได้ที่จะสร้าง TRNG ที่ดีจาก ลำเอียงและสัมพันธ์กัน แหล่งที่มา.

เห็นได้ชัดว่ากระดาษ Santha-Vazirani แสดงให้เห็นว่าเป็นไปไม่ได้ที่จะแยกบิตสุ่มที่เกือบจะเหมือนกันออกจากแหล่ง SV

ไม่เชิง มันพูดจริง " ในทางตรงกันข้าม เราพิสูจน์ได้ว่าไม่มีอัลกอริทึมใดที่สามารถดึงบิตที่เป็นกลางแม้แต่บิตเดียวจากแหล่งกึ่งสุ่ม (อันที่จริง ไม่ดีไปกว่า 1 - $\เดลต้า$ ลำเอียงเล็กน้อย) " นี่เป็นความรู้ที่จัดตั้งขึ้นและปรากฏในเอกสาร 'extractor' ทุกรูปแบบ หมายความว่าการสุ่มที่แยกออกมาจะมี 1 - $\เดลต้า$ อคติ. NIST เพียงแนะนำให้คุณเก็บไว้ด้านล่าง $2^{-64}$ ซึ่งเป็นเรื่องง่าย


อ้างอิง: ปิแอร์ แกสปาร์ด และ เสี่ยวจิง หวัง เสียงรบกวน ความวุ่นวาย และ $ (\epsilon, \tau) $-เอนโทรปีต่อหน่วยเวลา, รายงานฟิสิกส์ (ส่วนทบทวนจดหมายฟิสิกส์) 235, ฉบับที่ 6 (1993) 291â343. นอร์ทฮอลแลนด์

DurandA avatar
us flag
ขอบคุณ. ฉันเริ่มอ่านการอ้างอิงของ Gaspard-Wang ในกรณีของสัญญาณตัวอย่างแบบดิจิทัล $\epsilon$ คือพื้นที่สัญลักษณ์ (เช่น 2 สำหรับสัญญาณไบนารี)
Paul Uszak avatar
cn flag
@DurandA ฉันคิดว่าพวกเขาปล่อยให้มันคลุมเครือเพราะอาจมีไม่กี่อย่าง อาจเป็นความละเอียด ADC เป็นบิตหรืออาจเป็นมิลลิโวลต์ (แน่นอนว่าเกี่ยวข้องกัน) ในบางอย่างเช่น `haveged` TRNG มันคือจำนวนของค่าบิต โดยพื้นฐานแล้ว มันคือสิ่งที่คุณ _"สังเกต_" เช่น วัด (นั่นไม่ใช่เวลาเพราะเป็น $\tau$)
DurandA avatar
us flag
ตอนนี้ฉันเข้าใจคำพูดของคุณมากขึ้นเกี่ยวกับการสุ่มตัวอย่างความถี่สูงของแหล่งที่มาที่เกี่ยวข้องกันใน[คำถามที่เกี่ยวข้อง](https://crypto.stackexchange.com/q/92020/39499)
Paul Uszak avatar
cn flag
@DurandA ใช่ ลองจินตนาการถึงการโยนแฟร์ดายทุกๆ 10 วินาที สุ่มตัวอย่างที่ 1 ตัวอย่าง/วินาที และคุณมีความสัมพันธ์ที่เกือบจะสมบูรณ์แบบ แต่สุ่มตัวอย่างทุกๆ 11 วินาที และคุณมีแหล่งที่มาที่ไม่เกี่ยวข้องกัน และไม่สำคัญว่าคุณจะช้าลงในกรณีหลัง เช่นในกรณีแรก อัตราเอนโทรปีของคุณจะต่ำมากเนื่องจากความสัมพันธ์อัตโนมัติ
DurandA avatar
us flag
"_we แสดงว่าไม่มีอัลกอริธึมการแยกบิตใดที่ดีเท่าๆ กันสำหรับการแจกแจงกึ่งสุ่มทุกครั้งด้วยพารามิเตอร์ $\delta$_": สิ่งนี้จะนำไปใช้กับฟังก์ชันแฮชได้อย่างไร
Paul Uszak avatar
cn flag
@DurandA ฉันคิดเลขไม่เป็น - ฉันเป็นพวกชอบทดลองมีกระดาษแยกจำนวนมากพร้อมคณิตศาสตร์ แต่ฟังก์ชันแฮชถูกกำหนดขึ้น พวกเขาเองไม่ได้แนะนำเอนโทรปี ลองนึกภาพฟังก์ชันแฮช 8 บิตที่ป้อนโดยเอนโทรปีดิบ 8 บิตแบบลำเอียง (ลำเอียงเพื่อให้ค่าทั้งหมด > 63) แม้ว่าโดเมนเอาต์พุตจะกระจายอย่างสม่ำเสมอในแวบแรก แต่ก็จำเป็นต้องขาดหายไปหนึ่งในสี่ของค่าที่เป็นไปได้เนื่องจากเป็นการทำแผนที่ 1:1 (จริง ๆ แล้วมีการคาดคะเน แต่ไม่สนใจสิ่งนั้น) คุณสามารถลด $\delta$ ได้ แต่ไม่ต้องถึงศูนย์สัมบูรณ์
DurandA avatar
us flag
ฉันไม่ทราบว่าการรับข้อมูลที่มีอคติเป็นเวลานานเช่น การแฮช 1 Mb ของข้อมูลสุ่มที่มีอคติและสัมพันธ์ถึง 256 บิตจะไม่สร้างเอาต์พุตที่สม่ำเสมอ แต่ค่อนข้างใกล้เคียงกับเครื่องแบบ การสาธิตใช้กับข้อมูลที่เอนเอียง **และสัมพันธ์กัน** เท่านั้นใช่ไหม มิฉะนั้น ข้อมูลจะถูกประมวลผลล่วงหน้าโดยตัวแยกข้อมูล von Neumann ขอขอบคุณสำหรับเวลาของคุณ.
Paul Uszak avatar
cn flag
@DurandA ฉันใช้เวลาทำงานกับ TRNG และฉันเชื่อว่าวิธีที่ง่ายที่สุด (และปลอดภัยที่สุด) คือการปรับระบบการสุ่มตัวอย่างของคุณ $(\epsilon, \tau)$ เพื่อให้ตัวอย่างของคุณไม่มีความสัมพันธ์กัน vN จะไม่เกี่ยวข้อง

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา