นอกเหนือจากที่กล่าวไว้ ฉันต้องการเพิ่มเงินของฉัน แต่สิ่งนี้เป็นการพิจารณาที่สำคัญ
อะไร การขับ เมื่อเซกเตอร์อ่านช้า?
น่าจะเป็นไดรฟ์ที่ออกแบบมาเพื่อใช้งานคนเดียว e. กรัม ไดรฟ์ "เดสก์ท็อป" ทั่วไป ให้สันนิษฐานไว้ก่อนว่าไม่มีวิธีอื่นในการดึงข้อมูลที่จัดเก็บไว้ในเซกเตอร์เสียนั้น พวกเขาจะพยายามดึงข้อมูลโดยเสียค่าใช้จ่ายทั้งหมด ทำซ้ำครั้งแล้วครั้งเล่าเป็นระยะเวลานาน แน่นอนว่าพวกเขาจะทำเครื่องหมายว่าเซกเตอร์นั้นล้มเหลวด้วย ดังนั้นพวกเขาจะแมปใหม่อีกครั้งในครั้งต่อไปที่คุณเขียน แต่คุณต้องเขียนเพื่อสิ่งนั้น จนกว่าคุณจะเขียนใหม่ พวกเขาจะสำลักทุกครั้งที่คุณอ่านจากสถานที่นั้น ในการตั้งค่า RAID หมายความว่าสำหรับ RAID ไดรฟ์ยังคงใช้งานได้และไม่มีเหตุผลที่จะต้องยกเลิก แต่สำหรับแอปพลิเคชัน อาร์เรย์จะช้าลงจนรวบรวมข้อมูลได้
ในทางกลับกัน ไดรฟ์ "องค์กร" โดยเฉพาะไดรฟ์ "แบรนด์" มักจะคิดว่าไดรฟ์เหล่านี้ใช้ในการตั้งค่า RAID เสมอ ตัวควบคุม "แบรนด์" เห็นไดรฟ์ "แบรนด์" จริง ๆ แล้วอาจจะด้วยซ้ำ แจ้ง เฟิร์มแวร์ของพวกเขาเกี่ยวกับการมีอยู่ของ RAID ดังนั้นไดรฟ์จะหยุดทำงานก่อนกำหนดและรายงานข้อผิดพลาด I/O แม้ว่าจะสามารถพยายามอีกหลายครั้งและอ่านเซกเตอร์ได้ จากนั้นคอนโทรลเลอร์จะมีโอกาสตอบกลับเร็วขึ้น ทำมิเรอร์การอ่านคำสั่งไปยังไดรฟ์พี่น้อง (และไล่อันที่เสียออกจากอาร์เรย์) เมื่อคุณดึงออกและสำรวจ/ทดสอบไดรฟ์ที่เตะอย่างละเอียด คุณจะไม่พบปัญหาใดๆ ที่ชัดเจน – เป็นเพียงการชะลอตัวลงชั่วขณะและนั่นก็เพียงพอแล้วที่จะหยุดใช้งาน ตามตรรกะของคอนโทรลเลอร์
ฉันเดาว่านี่อาจจะเป็น เพียง ความแตกต่างระหว่างไดรฟ์ "เดสก์ท็อป" กับ "แบรนด์"/"องค์กร" NL-SAS และ SATA นี่อาจเป็นเหตุผลว่าทำไมคุณถึงจ่ายเพิ่มขึ้นสามเท่าเมื่อคุณซื้อไดรฟ์ "HPE" ซึ่งผลิตโดย Toshiba จริง ๆ เมื่อเทียบกับการซื้อไดรฟ์ที่มีตราสินค้า "Toshiba"
อย่างไรก็ตาม ไดร์ฟบางไดร์ฟรองรับการควบคุมทั่วไปบางประการ มันถูกเรียกว่า SCT ERC ซึ่งใช้สำหรับ การควบคุมการกู้คืนข้อผิดพลาดในการขนส่งคำสั่ง SMART. นี่คือลักษณะที่ปรากฏ สมาร์ทคอนโทรล
:
ไม่รองรับ
# smartctl --all /dev/sda
=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
ความสามารถของ SCT: (0x3037) รองรับสถานะ SCT
รองรับการควบคุมคุณสมบัติ SCT
รองรับตารางข้อมูล SCT
ได้รับการสนับสนุน
=== จุดเริ่มต้นของการอ่านข้อมูลสมาร์ทส่วน ===
...
ความสามารถของ SCT: (0x003d) รองรับสถานะ SCT
รองรับการควบคุมการกู้คืนข้อผิดพลาด SCT
รองรับการควบคุมคุณสมบัติ SCT
รองรับตารางข้อมูล SCT
หากคุณโชคดี คุณสามารถควบคุมฟีเจอร์นี้ได้ด้วย สมาร์ทคอนโทรล
. คุณสามารถเรียกดูหรือตั้งค่าการหมดเวลาได้ 2 ครั้ง ระยะเวลาที่จะพยายามอ่านซ้ำ และระยะเวลาที่จะพยายามเขียนซ้ำ:
# smartctl -l ssterc /dev/sda
การควบคุมการกู้คืนข้อผิดพลาด SCT:
อ่าน: 70 (7.0 วินาที)
เขียน: 70 (7.0 วินาที)
# smartctl -l ssterc /dev/sde
การควบคุมการกู้คืนข้อผิดพลาด SCT:
อ่าน: ปิดการใช้งาน
เขียน: ปิดการใช้งาน
# smartctl -l ssterc /dev/sdd
คำเตือน: อุปกรณ์ไม่รองรับคำสั่ง SCT Error Recovery Control
smartctl -l scterc,120,60 /dev/sde
ซึ่งหมายความว่า: 120 ในสิบของวินาทีเพื่อลองอ่านใหม่ 60 ในสิบวินาทีเพื่อลองเขียนใหม่ ศูนย์หมายถึง "ลองใหม่จนกว่าคุณจะตาย" ไดรฟ์ที่แตกต่างกันมีการตั้งค่าเริ่มต้นที่แตกต่างกันสำหรับสิ่งนี้
ดังนั้น หากคุณใช้ไดรฟ์ "รุ่น RAID" เพียงอย่างเดียว ควรตั้งค่าการหมดเวลาของ ERC เป็นศูนย์ มิฉะนั้นคุณอาจสูญเสียข้อมูล ในทางกลับกัน หากคุณใช้ไดรฟ์ใน RAID คุณควรตั้งค่าที่ไม่ใช่ศูนย์ในระดับต่ำที่เหมาะสม
ที่มาโดย amarao @ Habrahabr ในภาษารัสเซีย.
ป.ล. และหมายเหตุเกี่ยวกับ SAS ใช้ เอสดีปาร์ม
รองรับการควบคุมมากกว่านี้