Score:1

เกี่ยวกับการทดสอบบางอย่างในฟังก์ชัน NIST SP 800-22 rev 1a และ erfc

ธง in

ฉันกำลังเรียนรู้การทดสอบการสุ่มของเอกสารประกอบ NIST SP 800-22 rev 1a

https://csrc.nist.gov/publications/detail/sp/800-22/rev-1a/final

ขณะที่ฉันกำลังอ่านอยู่ มีคำถามสองสามข้อขึ้นมา และฉันก็ตั้งมันขึ้นมาแบบนี้ คำถามของฉันคือ:

  1. ในการทดสอบความถี่ภายในบล็อก 2.2 ดูที่ (3) ของ 2.2.4 มีส่วนที่คำนวณได้ดังนี้ $$\chi^2(obs)=4M\sum_{i=1}^{N}(\pi_i - 1/2)^2$$ ฉันไม่เข้าใจว่าทำไมมันถึงคูณด้วย 4 ที่นี่

  2. ในการทดสอบรัน 2.3 ค่า p จะถูกคำนวณเป็น $$P-value = erfc(\frac{|V_n(obs)-2n\pi(1-\pi)|}{2\sqrt{2n}\pi(1-\pi)}).$$ ค่าของตัวส่วนตรงนี้คืออะไร? ฉันรู้แล้ว $2\pi(1-\pi)$ คือค่าเฉลี่ย แต่ฉันไม่รู้ว่าตัวส่วนมาจากไหน

  3. มีเหตุผลใดที่ต้องค้นหาค่า p ผ่าน erf แทนการแจกแจงแบบปกติใน (2)

ขอขอบคุณ.

Score:0
ธง ru
  1. นี่เป็นเรื่องที่น่าเป็นห่วง ปกติ เพียร์สัน $\chi^2$ ทดสอบ อยากจะเป็น $$M\sum_{i=1}^n\frac{\left(\pi_i-\frac12\right)^2}{\frac12}=2M\sum_{i=1}^n\left(\pi_i- \frac12\right)^2.$$ ฉันจะคิดมากกว่านี้ แต่มันอาจจะคุ้มค่าที่จะทิ้งชั้นหินอุ้มน้ำไปที่ NIST

  2. มันควรจะเป็นค่าเบี่ยงเบนมาตรฐาน สำหรับบิตอิสระที่กระจายเหมือนกัน สถิติการวิ่งควรกระจายแบบทวินาม ทฤษฎีบทขีดกลางบอกเราว่าทวินามสามารถประมาณได้ด้วยการแจกแจงแบบปกติ อย่างไรก็ตาม โปรดทราบว่าเครื่องหมายกรณฑ์ควรขยายเหนือเครื่องหมายกรณฑ์ $\pi(1-\pi)$ ปัจจัย.

  3. ฟังก์ชัน erf คำนวณการแจกแจงแบบปกติสองด้าน เราสนใจทั้งกรณีที่การวิ่งแพร่หลาย (เช่น เมื่อมีคู่ 00 และ 11 ติดต่อกันหลายคู่) และกรณีที่วิ่งขาด (เช่น เมื่อมีคู่ 01 และ 10 จำนวนมาก) ทั้งสองแสดงปัญหาเกี่ยวกับการกระจาย แต่ถูกคิดโดยหางที่ตรงกันข้าม

pioneer avatar
in flag
ขอบคุณสำหรับการตอบกลับของคุณ. แต่ฉันไม่ค่อยเข้าใจคำตอบที่สอง ถ้าฉันเขียนนิพจน์ตามที่คุณพูด ไม่ควร $p-value$ be $erfc(\frac{|V_n(obs)-n\pi|}{\sqrt{n\pi(1-\pi)}} )$?เพราะสำหรับ CLT ฉันต้องสร้างนิพจน์ $\frac{V_n-np}{\sqrt{npq}}$
Daniel S avatar
ru flag
สถิติของคุณจะถูกต้องสำหรับการทดสอบจำนวน 1 วินาที ($\pi$ คือความน่าจะเป็นที่ 1 จะถูกส่งออก) พวกเขากำลังนับจำนวน 01 และ 10 สิ่งเหล่านี้เกิดขึ้นด้วยความน่าจะเป็น $(1-\pi)\pi$ และ $\pi(1-\pi)$ ดังนั้นเราจึงมี $\mathrm{Bin}(n-1,2\pi(1-\pi) ) $ การกระจาย เมื่อมองลึกลงไป ดูเหมือนว่าจะมีการประมาณการแปลกๆ เกิดขึ้นโชคดีที่เอกสารนี้กำลังได้รับการแก้ไข ดังนั้นอาจมีโอกาสแก้ไขสิ่งต่างๆ ในเวอร์ชันใหม่
pioneer avatar
in flag
ดังที่คุณกล่าวถึง เป็นที่เข้าใจได้ว่า $V_n(obs)$~$Bin(n-1, 2\pi(1-\pi))$ เป็นที่พอใจ เพราะพวกมันนับจำนวน 10s และ 01s อย่างไรก็ตาม เนื่องจากแม้แต่กรณีดังกล่าวก็เป็นไปตามนิพจน์ $P-value = erfc(\frac{|V_n(obs)-2n\pi(1-\pi)|}{\sqrt{n2\pi(1-\pi)( 1-2\pi(1-\pi))}}).$, นิพจน์ในเอกสารไม่เป็นที่พอใจ สำนวนในเอกสารผิดหรือไม่? (+ที่จริงควรเขียนเป็น $n-1$ แทน $n$ เปลี่ยนตามอำเภอใจได้ไหม?)
Daniel S avatar
ru flag
ฉันลังเลที่จะอ้างว่าไม่ถูกต้อง เนื่องจากพวกเขาอาจใช้การประมาณค่าความแปรปรวนที่ฉันไม่ทราบ โปรดทราบว่านิพจน์ erf ของคุณต้องการ $\sqrt 2$ ในตัวส่วน ข้อผิดพลาดในการเปลี่ยนจาก $n-1$ เป็น $n$ นั้นเล็กน้อยเมื่อ $n$ เพิ่มขึ้น ฉันคิดว่ามันคุ้มค่าที่จะแจ้งเรื่องนี้และข้อความค้นหาแรกของคุณกับ NIST หากนิพจน์ยังคงปรากฏอยู่ในเวอร์ชันที่แก้ไขแล้ว ฉันจะพยายามดำเนินการให้
pioneer avatar
in flag
ฉันเข้าใจแล้ว ครั้งต่อไป ฉันหวังว่า NIST จะแก้ไขข้อเท็จจริงเหล่านี้ให้ถูกต้องหรือจัดพิมพ์เอกสารที่มีคำอธิบายเพียงพอในเรื่องนี้ ขอบคุณมากสำหรับคำตอบที่ดี

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา