Score:2

อินสแตนซ์ล้มเหลวในเครื่องมือคำนวณของ Google

ธง in

ฉันมีอินสแตนซ์ GCE ซึ่งใช้งานมาหลายปีแล้ว ในช่วงกลางคืน อินสแตนซ์ถูกรีสตาร์ทด้วยบันทึกต่อไปนี้:

2022-02-13 04:46:36.370 CET compute.instances.hostError Instance ถูกยุติโดย Compute Engine
2022-02-13 04:47:08.279 CET compute.instances.automaticRestart Instance รีสตาร์ทโดยอัตโนมัติโดย Compute Engine

อย่างไรก็ตาม อินสแตนซ์ไม่ได้รีสตาร์ท

ฉันสามารถเชื่อมต่อกับคอนโซลอนุกรมที่ฉันเห็นสิ่งนี้:

พอร์ตอนุกรม: เชื่อมต่อกับ ***.europe-west1-b.*** พอร์ต 1 (
[ TIME ] หมดเวลารออุปกรณ์ ***
[DEPEND] การพึ่งพาล้มเหลวสำหรับ File⦠***
[DEPEND] การพึ่งพาล้มเหลวสำหรับ /data
[DEPEND] การพึ่งพาล้มเหลวสำหรับระบบไฟล์ในเครื่อง
[ ตกลง ] หยุดส่งรหัสผ่านไปยัง Console Directory Watch แล้ว
[ ตกลง ] หยุดส่งต่อรหัสผ่านไปยัง Wall Directory Watch แล้ว
[ ตกลง ] ถึงตัวจับเวลาเป้าหมายแล้ว
         กำลังเริ่มต้นอินเทอร์เฟซเครือข่าย Raise...
[ ตกลง ] ปิดซ็อกเก็ต Syslog
[ ตกลง ] เข้าถึงข้อความแจ้งการเข้าสู่ระบบเป้าหมายแล้ว
[ ตกลง ] ถึงเส้นทางเป้าหมายแล้ว
[ ตกลง ] ถึงซ็อกเก็ตเป้าหมายแล้ว
[ ตกลง ] เริ่มเชลล์ฉุกเฉิน
[ ตกลง ] ถึงโหมดฉุกเฉินเป้าหมายแล้ว
         กำลังเริ่มสร้างไฟล์และไดเร็กทอรีที่เปลี่ยนแปลงได้...
[ ตกลง ] เสร็จสิ้นการสร้างไฟล์และไดเร็กทอรีที่ระเหยได้
         กำลังเริ่มการซิงโครไนซ์เวลาเครือข่าย...
         กำลังเริ่มอัปเดต UTMP เกี่ยวกับการบูต/ปิดระบบ...
[ ตกลง ] เสร็จสิ้นการอัปเดต UTMP เกี่ยวกับการบูต/ปิดระบบ
         กำลังเริ่มอัปเดต UTMP เกี่ยวกับการเปลี่ยนแปลงระดับการเรียกใช้ระบบ...
[ ตกลง ] เสร็จสิ้นการอัปเดต UTMP เกี่ยวกับการเปลี่ยนแปลงระดับการรันของระบบ
[ ตกลง ] เริ่มการซิงโครไนซ์เวลาเครือข่าย
[ ตกลง ] ถึงเป้าหมายที่ตั้งเวลาระบบแล้ว
[ ตกลง ] ซิงโครไนซ์เวลาของระบบเป้าหมายแล้ว
         กำลังหยุดการซิงโครไนซ์เวลาของเครือข่าย...
[ ตกลง ] หยุดการซิงโครไนซ์เวลาเครือข่าย
         กำลังเริ่มการซิงโครไนซ์เวลาเครือข่าย...
[ ตกลง ] เริ่มการซิงโครไนซ์เวลาเครือข่าย
[ ตกลง ] เสร็จสิ้น เพิ่มอินเทอร์เฟซเครือข่าย
[ ตกลง ] ถึงเครือข่ายเป้าหมายแล้ว
[ ตกลง ] เครือข่ายที่เข้าถึงเป้าหมายออนไลน์อยู่
คุณอยู่ในโหมดฉุกเฉิน หลังจากเข้าสู่ระบบ พิมพ์ "journalctl -xb" เพื่อดู
บันทึกของระบบ "รีบูต systemctl" เป็น r
ไม่สามารถเปิดการเข้าถึงคอนโซลได้ บัญชีรูทถูกล็อค
ดูหน้าคน sulogin(8) สำหรับรายละเอียดเพิ่มเติม
กด Enter เพื่อดำเนินการต่อ

ดูเหมือนว่าดิสก์ตัวใดตัวหนึ่งไม่สามารถเชื่อมต่อได้ â แต่ฉันจะทำอย่างไรกับมันตอนนี้ ดูเหมือนว่าดิสก์จะพร้อมใช้งานตามปกติภายในเครื่องมือคำนวณ

John Hanley avatar
cn flag
ฉันเดาว่ามีปัญหาเครือข่าย Google Cloud VPC ที่เกิดขึ้นชั่วคราว ลองรีบูตอินสแตนซ์ หากคุณยังประสบปัญหาอยู่ ให้แก้ไขคำถามของคุณพร้อมรายละเอียดเกี่ยวกับอินสแตนซ์และการกำหนดค่า GCP
in flag
ขอบคุณสำหรับการตอบสนองของคุณ อินสแตนซ์ยังคงไม่เริ่มต้นอย่างถูกต้อง รายละเอียดแบบใดที่จะเป็นประโยชน์? อินสแตนซ์คือ 'e2-small' ทำงานใน 'europe-west1-b' โดยมีดิสก์สองแผ่น â ดิสก์สำหรับบูตปกติหนึ่งแผ่นและดิสก์ ssd หนึ่งแผ่นซึ่งดูเหมือนจะไม่สามารถแนบได้
John Hanley avatar
cn flag
ฉันแนะนำให้เปิดตั๋วสนับสนุน Google Cloud
PjoterS avatar
ve flag
คุณไม่มีปัญหากับการเรียกเก็บเงินใช่หรือไม่ อิมเมจของ VM นี้คืออะไร คุณเปลี่ยนประเภทเครื่องเมื่อเร็ว ๆ นี้หรือไม่? คุณเคยใช้ Persistent SSD หรือ Local SSD หรือไม่ คุณสามารถสร้าง VM อื่นได้โดยไม่มีปัญหาหรือไม่ คุณพยายามดำเนินการ `journalctl -xb` และ `systemctl reboot` หรือไม่
in flag
อินสแตนซ์ไม่สามารถเริ่มต้นได้อย่างถูกต้อง - ค้างอยู่ที่ "กด Enter เพื่อดำเนินการต่อ" แต่ก็ไม่มีอะไรเกิดขึ้น ดังนั้นฉันจึงไม่สามารถลองใช้ Journalcrl ได้ เมื่อรีสตาร์ทเครื่องจะหยุดทำงานโดยหมดเวลาของดิสก์เหมือนด้านบน ฉันไม่มีปัญหาในการเรียกเก็บเงิน ทุกอย่างยังทำงานได้อย่างถูกต้อง ฉันไม่ได้สัมผัสเครื่องเมื่อเร็ว ๆ นี้ มันเพิ่งตายในตอนกลางคืน ดิสก์เป็นดิสก์ถาวร
in flag
ฉันรายงานไปยังฝ่ายสนับสนุนของ gce แต่จนถึงตอนนี้พวกเขาไม่มีประโยชน์มากนัก และตอนนี้ฉันรอมา 18 ชั่วโมงแล้วตั้งแต่คำตอบล่าสุด
Score:2
ธง ve

ฉันเกรงว่าคุณไม่สามารถทำอะไรกับ VM ที่ได้รับผลกระทบนี้ได้

ใน โฮสต์เหตุการณ์ เอกสารหรือ คำถามที่พบบ่อย คุณสามารถค้นหาข้อมูล:

ข้อผิดพลาดของโฮสต์ (compute.instances.hostError) หมายความว่ามีปัญหาเกี่ยวกับฮาร์ดแวร์หรือซอฟต์แวร์บนเครื่องจริงที่โฮสต์ VM ของคุณ ซึ่งทำให้ VM ของคุณขัดข้อง ข้อผิดพลาดของโฮสต์ที่เกี่ยวข้องกับความล้มเหลวของฮาร์ดแวร์ทั้งหมดหรือปัญหาฮาร์ดแวร์อื่นๆ อาจป้องกันได้ การโยกย้ายสด ของ VM ของคุณ

อินสแตนซ์ VM ซึ่งอยู่ใน "คลาวด์" ยังคงเป็นเครื่องจริงที่กำลังเรียกใช้ปริมาณงานของคุณ น่าเสียดายที่อินสแตนซ์นี้มีความล้มเหลวของฮาร์ดแวร์หรือซอฟต์แวร์ และคุณทำอะไรไม่ได้

GCP แนะนำสิ่งที่เรียกว่า การโยกย้ายสด ที่ป้องกันสถานการณ์แบบนี้

Compute Engine นำเสนอการย้ายข้อมูลแบบสดเพื่อให้อินสแตนซ์เครื่องเสมือนของคุณทำงานต่อไป แม้ว่าจะมีเหตุการณ์ของระบบโฮสต์ เช่น การอัปเดตซอฟต์แวร์หรือฮาร์ดแวร์เกิดขึ้น แต่ฉันเดาว่ามันสายเกินไปที่จะกำหนดค่านี้

...

การโยกย้ายแบบสดช่วยให้อินสแตนซ์ของคุณทำงานในระหว่าง:

  • การบำรุงรักษาและอัปเกรดโครงสร้างพื้นฐานเป็นประจำ
  • การบำรุงรักษาเครือข่ายและกริดไฟฟ้าในศูนย์ข้อมูล
  • ฮาร์ดแวร์ที่ล้มเหลว เช่น หน่วยความจำ CPU การ์ดอินเทอร์เฟซเครือข่าย ดิสก์ พลังงาน และอื่นๆ สิ่งนี้ทำบนพื้นฐานความพยายามอย่างดีที่สุด หากฮาร์ดแวร์ล้มเหลวโดยสิ้นเชิงหรือขัดขวางการย้ายแบบสด VM จะหยุดทำงานและรีสตาร์ทโดยอัตโนมัติและบันทึก hostError

...

การโอนย้ายแบบสดจะไม่เปลี่ยนแอตทริบิวต์หรือคุณสมบัติของ VM เอง กระบวนการย้ายข้อมูลจริงเพียงแค่ถ่ายโอน VM ที่ทำงานอยู่จากเครื่องโฮสต์เครื่องหนึ่งไปยังเครื่องโฮสต์อีกเครื่องหนึ่งภายในโซนเดียวกัน

วิธีแก้ปัญหาที่เป็นไปได้

เมื่อคุณพูดถึงว่าดิสก์นั้นคงอยู่และยังคงมองเห็นได้ใน GCP คุณสามารถลองติดตั้งดิสก์เหล่านั้นอีกครั้งกับ VM อื่น ดู How to Guide ได้ใน การสร้างและแนบดิสก์ เอกสาร

Score:1
ธง in

ในที่สุดฉันก็พบสาเหตุที่แปลกประหลาดสำหรับข้อผิดพลาดนี้ - ดูต้นฉบับ /etc/fstab:

/dev/disk/by-id/google-***-data /data ext4 ยกเลิก ค่าเริ่มต้น 0 2

แต่ไม่มีอุปกรณ์ดังกล่าวในเส้นทางนี้ ฉันแก้ไขสิ่งนี้โดยแนบ /dev/sdb แทน แต่ฉันคิดว่านี่ไม่ใช่ทางออกที่ดีที่สุด ฉันสงสัยว่าสิ่งนี้เกิดขึ้นได้อย่างไรว่าอุปกรณ์นั้นหายไปทันทีและในท้ายที่สุดก็ฆ่าเครื่องจักร

โพสต์คำตอบ

คนส่วนใหญ่ไม่เข้าใจว่าการถามคำถามมากมายจะปลดล็อกการเรียนรู้และปรับปรุงความสัมพันธ์ระหว่างบุคคล ตัวอย่างเช่น ในการศึกษาของ Alison แม้ว่าผู้คนจะจำได้อย่างแม่นยำว่ามีคำถามกี่ข้อที่ถูกถามในการสนทนา แต่พวกเขาไม่เข้าใจความเชื่อมโยงระหว่างคำถามและความชอบ จากการศึกษาทั้ง 4 เรื่องที่ผู้เข้าร่วมมีส่วนร่วมในการสนทนาด้วยตนเองหรืออ่านบันทึกการสนทนาของผู้อื่น ผู้คนมักไม่ตระหนักว่าการถามคำถามจะมีอิทธิพลหรือมีอิทธิพลต่อระดับมิตรภาพระหว่างผู้สนทนา