Score:0

Flink taskmanager บน ECS ไม่สามารถเชื่อมต่อกับ jobmanager บน EC2

ธง in

ฉันมีอินสแตนซ์ EC2 ซึ่งอยู่ใน us-east-1b และกำลังเรียกใช้ flink jobmanager ซึ่งมีหน้าที่รับผิดชอบในการประสานงานระหว่างตัวจัดการงานหลายตัวผ่าน RPC และเซิร์ฟเวอร์ประวัติฉันสามารถดูได้จาก netstat ว่าผู้จัดการงานกำลังฟังอยู่ :::6123 สำหรับการเชื่อมต่อตัวจัดการงานที่เข้ามา

ฉันมีกลุ่มปรับขนาดอัตโนมัติซึ่งจะเรียกใช้อินสแตนซ์ EC2 ใน az, เครือข่ายย่อยและกลุ่มความปลอดภัยเดียวกันกับอินสแตนซ์ EC2

กลุ่มความปลอดภัยอนุญาตการรับส่งข้อมูลทั้งหมดบนพอร์ตทั้งหมดจากแหล่งใด ๆ ในกลุ่มไปยังปลายทางใด ๆ ในกลุ่ม: กฎขาเข้า กฎขาออก

ฉันใช้ ASG นั้นเป็นผู้ให้บริการความจุสำหรับงาน ECS ฉันกำลังพยายามเรียกใช้งานใน ECS ที่เรียกใช้ตัวจัดการงานและใช้ ASG นั้น

ตัวจัดการงานเริ่มต้นขึ้น แต่จะไม่เชื่อมต่อกับตัวจัดการงาน:

2021-09-28 13:52:08,651 INFO org.apache.flink.runtime.taskexecutor.TaskExecutor [] - ไม่สามารถแก้ไขที่อยู่ ResourceManager akka.tcp://[email protected] ภายใน:6123/user/rpc/resourcemanager_* กำลังลองใหม่ในอีก 10,000 มิลลิวินาที: ไม่สามารถเชื่อมต่อกับปลายทาง rpc ภายใต้ที่อยู่ akka.tcp://[email protected]:6123/user/ rpc/ผู้จัดการทรัพยากร_*

ฉันได้ ssh-d ไปยังอินสแตนซ์ที่เรียกใช้โดย ASG และยืนยันว่าฉันสามารถม้วนตัวจัดการงานได้ ip-xxx-xx-x-xxx.ec2.internal:8081 - มันได้ผล. ดังนั้นฉันจึงรู้ว่าตัวจัดการงานสามารถเห็นตัวจัดการงานได้

สรุป:

  • ตัวจัดการงานและตัวจัดการงานอยู่ใน VPC เดียวกัน, AZ เดียวกัน, เครือข่ายย่อยเดียวกัน และกลุ่มความปลอดภัยเดียวกัน
  • กลุ่มความปลอดภัยอนุญาตการรับส่งข้อมูลขาเข้าทั้งหมดจากแหล่งที่มาในกลุ่มความปลอดภัยเดียวกัน
  • กลุ่มความปลอดภัยอนุญาตให้ทราฟฟิกขาออกทั้งหมดไปยังปลายทางใดก็ได้
  • jobmanager กำลังทำงานบนอินสแตนซ์ EC2 ที่สร้างขึ้นด้วยตนเอง
  • ตัวจัดการงานกำลังทำงานบนอินสแตนซ์ EC2 ที่สร้างขึ้นโดยเป็นส่วนหนึ่งของ ASG โดย ECS ตัวจัดการงานทำงานในคอนเทนเนอร์บน ECS
  • ฉันสามารถม้วนตัวจัดการงานจากโหนดตัวจัดการงาน
  • ผู้จัดการงานและผู้จัดการงานสื่อสารผ่าน RPC
  • ผู้จัดการงานจะไม่แก้ไขที่อยู่ให้กับผู้จัดการงาน

ทำไมงานของฉันถึงไม่เชื่อมต่อ ฉันได้ลองใช้ IP สาธารณะ (v4) และ IP ส่วนตัว (v4) แล้ว

Tim avatar
gp flag
Tim
โปรดแก้ไขคำถามของคุณเพื่อเพิ่มภาพหน้าจอของกฎการเข้า/ออกของ SG และอธิบายด้วยว่าตัวจัดการงาน/ตัวจัดการงานคืออะไรและทำงานที่ไหน ลองเพิ่มกลุ่มความปลอดภัยของคุณในกฎขาเข้า ซึ่งอนุญาตให้อินสแตนซ์ในกลุ่มเดียวกันสื่อสารกันได้ สิ่งสำคัญที่ต้องทำความเข้าใจคือ SG เป็นไฟร์วอลล์รอบ ๆ อินเทอร์เฟซเครือข่ายแต่ละอัน ไม่เหมือนซับเน็ตแบบเดิมที่ทุกอย่างสามารถสื่อสารได้ตามค่าเริ่มต้น
ndtreviv avatar
in flag
@Tim ฉันได้ให้รายละเอียดที่คุณร้องขอแล้ว
Tim avatar
gp flag
Tim
เพิ่มกฎความปลอดภัยขาออกไปยัง SG เดียวกัน การอนุญาต 0.0.0.0/0 นั้นแตกต่างจากการอนุญาตให้เข้าถึงกลุ่มความปลอดภัยเฉพาะ ไม่แน่ใจ 100% ว่านี่คือวิธีแก้ปัญหา แต่คุณไม่ได้ให้ข้อมูลเพียงพอให้ฉันแน่ใจ นอกจากนี้ เมื่อทำภาพหน้าจอ SG คุณควรใส่ส่วนบนซึ่งแสดง SG ID SG ขาเข้าแรกของคุณครอบคลุมทราฟฟิกทั้งหมด ส่วนอื่นๆ นั้นซ้ำซ้อน
ndtreviv avatar
in flag
ฉันได้เพิ่มกฎขาออกไปยัง SG เดียวกันที่อนุญาตการรับส่งข้อมูลทั้งหมด ไม่มีการเปลี่ยนแปลง ฉันสามารถ ping อินสแตนซ์ ECS จากอินสแตนซ์ EC2 และในทางกลับกันได้ ฉันขอขอบคุณสำหรับความช่วยเหลือของคุณ และฉันได้ให้ทุกสิ่งที่คุณขอไปแล้ว หากคุณยังต้องการข้อมูลเพิ่มเติม เรายินดีที่จะใส่ไว้ในนั้น
Score:1
ธง in

วันนี้ฉันค้นพบว่าทำไมสิ่งนี้ถึงใช้งานไม่ได้

ผู้จัดการงานได้รับการกำหนดค่าด้วย:

jobmanager.rpc.address: localhost

ดังนั้น ในขณะที่ฟังพอร์ต rpc ที่ถูกต้อง ไม่ยอมรับการรับส่งข้อมูลไปยังที่อยู่อื่น

เมื่อฉันเปลี่ยนให้ตรงกับตัวจัดการงาน:

jobmanager.rpc.ที่อยู่: ip-xxx-xx-x-xxx.ec2.internal

จากนั้นตัวจัดการงานจะเชื่อมต่อทันที

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา