ฉันกำลังพยายามสร้าง AMI สำหรับคลัสเตอร์คู่ขนาน ฉันใช้สต็อก AMI ของ amazon (ami-0436692c7b452bae4 สำหรับ us-west-2, ภูมิภาคที่ฉันอยู่และ alinux) และแก้ไขเล็กน้อยโดยเพิ่มแพ็คเกจเล็กน้อย
อย่างไรก็ตามเมื่อฉันวิ่ง pcluster สร้าง foo --norollback
ฉันได้รับข้อผิดพลาด:
การเริ่มต้นสร้างคลัสเตอร์สำหรับคลัสเตอร์: stockAWS
การสร้างสแต็คชื่อ: parallelcluster-stockAWS
สถานะ: คลัสเตอร์คู่ขนาน-stockAWS - ROLLBACK_IN_PROGRESS
การสร้างคลัสเตอร์ล้มเหลว เหตุการณ์ที่ล้มเหลว:
- AWS::AutoScaling::AutoScalingGroup ComputeFleet การสร้างทรัพยากรถูกยกเลิก
- AWS::CloudFormation::WaitCondition MasterServerWaitCondition รับสัญญาณ FAILURE ด้วย UniqueId i-booyaa
จากนั้นฉันก็วิ่ง จุ๊ฟๆ
และดูที่เข้าสู่ระบบ /var/log/cfncluster-init.log
ซึ่งแสดงบันทึกข้อผิดพลาดแบบยาว ซึ่งฉันได้ระบุไว้ด้านล่าง:
2021-07-28 23:16:49,659 [ข้อผิดพลาด] Command Chef (chef-client --local-mode --config /etc/chef/client.rb --log_level auto --force-formatter --no-color - -chef-zero-port 8889 --json-attributes /etc/chef/dna.json --override-runlist aws-parallelcluster::_prep_env) ล้มเหลว
2021-07-28 23:16:49,659 [DEBUG] เอาต์พุตคำสั่ง Chef: การเริ่มต้น Chef Client เวอร์ชัน 14.2.0
[2021-07-28T23:16:47+00:00] WARN: มีการแทนที่ Run List แล้ว
[2021-07-28T23:16:47+00:00] WARN: มีการแทนที่ Run List แล้ว
[2021-07-28T23:16:47+00:00] WARN: รายการเรียกใช้ดั้งเดิม: [สูตรอาหาร[aws-parallelcluster::slurm_config]]
[2021-07-28T23:16:47+00:00] WARN: รายการเรียกใช้ดั้งเดิม: [สูตรอาหาร[aws-parallelcluster::slurm_config]]
[2021-07-28T23:16:47+00:00] WARN: Overridden Run List: [สูตร[aws-parallelcluster::_prep_env]]
[2021-07-28T23:16:47+00:00] WARN: Overridden Run List: [สูตร[aws-parallelcluster::_prep_env]]
กำลังแก้ไขตำราอาหารสำหรับรายการที่รัน: ["aws-parallelcluster::_prep_env"]
การซิงโครไนซ์ตำราอาหาร:
- aws-parallelcluster (2.5.1)
- ชั่งหลาม (1.7.0)
- น้ำมันดิน (2.1.1)
- ซีลีนุกซ์ (2.1.1)
- nfs (2.6.4)
- ยำ (5.1.0)
- ยำอีเพล (3.1.0)
- opensh (2.6.3)
- ฉลาด (7.0.0)
- ชื่อโฮสต์ (0.4.2)
- บรรทัด (2.4.1)
- ขีด จำกัด (1.0.0)
- pyenv (3.1.1)
- kernel_module (1.1.2)
- สมดุล (2.8.2)
- ท่าทางภาษา (2.1.2)
- iptables (8.0.0)
- ไฟล์โฮสต์ (3.0.1)
- คลังเก็บถาวร (1.5.0)
ตัวจัดการการวิ่ง:
[2021-07-28T23:16:49+00:00] ข้อผิดพลาด: กำลังเรียกใช้ตัวจัดการข้อยกเว้น
[2021-07-28T23:16:49+00:00] ข้อผิดพลาด: กำลังเรียกใช้ตัวจัดการข้อยกเว้น
ตัวจัดการการรันเสร็จสมบูรณ์
[2021-07-28T23:16:49+00:00] ข้อผิดพลาด: ตัวจัดการข้อยกเว้นเสร็จสมบูรณ์
[2021-07-28T23:16:49+00:00] ข้อผิดพลาด: ตัวจัดการข้อยกเว้นเสร็จสมบูรณ์
ลูกค้าเชฟล้มเหลว 0 ทรัพยากรอัปเดตใน 11 วินาที
[2021-07-28T23:16:49+00:00] FATAL: Stacktrace ถูกทิ้งไปที่ /etc/chef/local-mode-cache/cache/chef-stacktrace.out
[2021-07-28T23:16:49+00:00] FATAL: Stacktrace ถูกทิ้งไปที่ /etc/chef/local-mode-cache/cache/chef-stacktrace.out
[2021-07-28T23:16:49+00:00] FATAL: โปรดระบุเนื้อหาของไฟล์ stacktrace.out หากคุณยื่นรายงานข้อผิดพลาด
[2021-07-28T23:16:49+00:00] FATAL: โปรดระบุเนื้อหาของไฟล์ stacktrace.out หากคุณยื่นรายงานข้อผิดพลาด
[2021-07-28T23:16:49+00:00] FATAL: Chef::Exceptions::CookbookChefVersionMismatch: Cookbook 'iptables' เวอร์ชัน '8.0.0' ขึ้นอยู่กับเวอร์ชันของเชฟ [">= 15.3"] แต่การทำงาน เวอร์ชันเชฟคือ 14.2.0
[2021-07-28T23:16:49+00:00] FATAL: Chef::Exceptions::CookbookChefVersionMismatch: Cookbook 'iptables' เวอร์ชัน '8.0.0' ขึ้นอยู่กับเวอร์ชันของเชฟ [">= 15.3"] แต่การทำงาน เวอร์ชันเชฟคือ 14.2.0
2021-07-28 23:16:49,659 [ข้อผิดพลาด] พบข้อผิดพลาดระหว่างการสร้าง ChefPrepEnv: คำสั่ง Chef ล้มเหลว
Traceback (การโทรครั้งล่าสุดล่าสุด):
ไฟล์ "/usr/lib/python3.7/site-packages/cfnbootstrap/construction.py", บรรทัด 573 ใน run_config
CloudFormationCarpenter(config, self._auth_config).build(เวิร์กล็อก)
ไฟล์ "/usr/lib/python3.7/site-packages/cfnbootstrap/construction.py", บรรทัด 273 ในบิลด์
self._config.commands)
ไฟล์ "/usr/lib/python3.7/site-packages/cfnbootstrap/command_tool.py", บรรทัด 127, นำไปใช้
ยก ToolError(u"คำสั่ง %s ล้มเหลว" % ชื่อ)
cfnbootstrap.construction_errors.ToolError: คำสั่งเชฟล้มเหลว
2021-07-28 23:16:49,661 [ข้อผิดพลาด] ----------------------- สร้างไม่สำเร็จ!------------ -------------
ถ้าฉันวิ่ง iptables -- รุ่น
ฉันเข้าใจ v1.8.4
. เช่นเดียวกับการรันด้วย sudo เชฟคือ 14.2.0
สิ่งที่น่าผิดหวังคือถ้าฉันสร้างขนานคลัสเตอร์สแต็คกับสต็อก aws AMI ฉันจะได้รับพฤติกรรมเดียวกันทุกประการ เกิดอะไรขึ้นที่นี่?