Score:1

"สุ่ม" แยกไม่ออก vs "กำหนด" แยกไม่ออก

ธง cn

อนุญาต $X$ เป็นพื้นที่ที่วัดได้ แต่ละ $n\in\mathbb N$, อนุญาต $P_n$ และ $Q_n$ น่าจะเป็นบน $X$. เราว่านะ $(P_n)_{n\in\mathbb N}$ และ $(Q_n)_{n\in\mathbb N}$ เป็น แยกไม่ออกทางสถิติ iff สำหรับชุดที่วัดได้ทั้งหมด $E\subseteq X$, ฟังก์ชั่น \begin{สมการ} n\mapsto |P_n(E) - Q_n(E)| \end{สมการ} เป็นเรื่องเล็กน้อย

แต่ถ้าเราปล่อยให้ "สุ่ม" ล่ะ? สมมติว่า $(P_n)_{n\in\mathbb N}$ และ $(Q_n)_{n\in\mathbb N}$ เป็น แบบสุ่มแยกไม่ออกทางสถิติ (ฉันเพิ่งสร้างคำศัพท์นี้ขึ้นมา) iff สำหรับพื้นที่ที่วัดได้ทั้งหมด $Y$ครอบครัวความน่าจะเป็นทั้งหมด $(R_n)_{n\in\mathbb N}$ บน $Y$และชุดที่วัดได้ทั้งหมด $E\subseteq X\times Y$, ฟังก์ชั่น \begin{สมการ} n\mapsto |(P_n\times R_n)(E) - (Q_n\times R_n)(E)| \end{สมการ} เป็นเรื่องเล็กน้อย

ความสามารถในการจำแนกทางสถิติแบบสุ่มนั้นบ่งบอกถึงความไม่สามารถแยกแยะได้ทางสถิติอย่างชัดเจน แต่การสนทนาเป็นความจริงหรือไม่?

us flag
เป็นไปได้ที่ซ้ำกันของ
Mark avatar
ng flag
จากการอ่านของฉันดูเหมือนว่าคุณกำลังถามว่าหากการแจกแจงความน่าจะเป็นสองครั้งมีค่าใกล้เคียงกัน แสดงว่าการแจกแจงใกล้เคียงกัน (ซึ่งเห็นได้ชัดว่าเป็นเท็จ) ฉันเข้าใจอะไรผิดหรือเปล่า?
kelalaka avatar
in flag
[ข้ามโพสต์ด้วย math.se](https://math.stackexchange.com/q/4403008/338051)
Score:2
ธง ng

ขอเตือนไว้ก่อนว่าฉันไม่ใช่ผู้ที่มีความน่าจะเป็น และคำตอบของคุณก็ไม่ได้มีการเข้ารหัสมากนัก ดังนั้นอาจเหมาะกับการถามผู้ที่มีความน่าจะเป็นมากกว่า (เช่นใน math.se หรืออย่างอื่น)

ดังที่กล่าวไว้ในความคิดเห็น นี่เป็นเรื่องเท็จได้ง่าย อนุญาต $P_n, Q_n$ ทั้งสองจะกระจายเป็นการกระจายแบบสมมาตรใดๆ และปล่อยให้ $R_n\sim \{-1,1\}$ เป็นเครื่องแบบ กำหนดการกระจายร่วม $P_n\ครั้ง R_n$ และ $Q_n\ครั้ง R_n$ ดังนี้ --- ขอบทั้งสอง $X$ และ $Y$ ได้รับการแก้ไขตามข้างต้น แต่

$$\Pr[(P_n\times R_n)\in E] = \Pr[(P_n\times R_n)\in E\mid R_n = b]\Pr[R_n = b].$$

ตอนนี้ในขณะที่เรากำลังพูดถึงเรื่องสมมาตร ให้เขียน $X = X_1\ถ้วย X_{-1}$. สมมติว่าสมมาตรสลับส่วนประกอบทั้งสองนี้ ตอนนี้เรากำหนดการแจกแจงแบบมีเงื่อนไข

$$\Pr[(P_n\times R_n)\in E\mid R_n = b] = \begin{cases}0 & E\cap X_{b}\neq \emptyset \ 2\Pr[P_n(E_X)]&\text{else} \end{กรณี}.$$

นี่คือการบอกว่าการแจกแจงแบบมีเงื่อนไขถูกกำหนดให้ตัวแปรสุ่มด้วย $R_n = b$ อยู่ใน $X_b$, เช่น. ส่วนประกอบ $P_n, R_n$ "สัมพันธ์กันอย่างสมบูรณ์" สำหรับ $Q_n$, ทำเช่นเดียวกันแต่กลับบทบาทของ $X_1, X_{-1}$, เช่น. มี $Q_n, R_n$ เป็น "การต่อต้านความสัมพันธ์อย่างสมบูรณ์"

เป็นเรื่องง่ายที่จะเห็นว่าตัวแปรสุ่มเหล่านี้มีระยะขอบที่เหมือนกัน ดังนั้นจึงแยกไม่ออกอย่างสมบูรณ์ (และแยกไม่ออกทางสถิติด้วย) มันคือ อีกด้วย ตรงไปตรงมาเพื่อดูว่ามีการแจกแจงร่วมกัน $P_n\ครั้ง R_n$ และ $Q_n\ครั้ง R_n$ มีการสนับสนุนที่ไม่ปะติดปะต่อดังนั้น

$$0 = \Delta(P_n, Q_n) \leq \Delta(P_n\times R_n, Q_n\times R_n) = 1,$$

และด้วยเหตุนี้พวกมันจึงไม่สามารถแยกความแตกต่างทางสถิติแบบสุ่มได้

โปรดทราบว่าหากคุณถือว่า $P_n, R_n$ เป็นอิสระ (ในภาษาของคุณ $E$ ปัจจัยเช่น $E_X\ครั้ง E_Y$ ฉันคิดว่า) คำตอบนั้นเป็นจริงได้อย่างง่ายดาย ในรูปของการพิสูจน์ โดยความไม่เท่าเทียมกันในการประมวลผลข้อมูล เรามีสิ่งนั้น $\Delta(P_n, Q_n) \geq \Delta(f(P_n), f(Q_n))$ สำหรับการสุ่มใดๆ $f$, รวมทั้ง $f : X\to X\times Y$ ตัวอย่างนั้น $R_n$ อย่างอิสระและเอาต์พุต $f(x) = (x, R_n)$. นี่ไม่ใช่สิ่งที่คุณถาม แต่ก็ยังมีประโยชน์ที่ควรทราบ

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา