สถานการณ์สงครามล่าสุด จากเหตุการณ์ความขัดแย้งในตะวันออกกลางที่มีรายงานข่าวว่าโดรนหรือวัตถุไม่ทราบชนิดพุ่งชนโครงสร้างพื้นฐานในประเทศสหรัฐอาหรับเอมิเรตส์ (UAE) และส่งผลกระทบต่อ Availability Zone (AZ) ของผู้ให้บริการคลาวด์ระดับโลก เป็นกรณีศึกษาสำคัญที่สะท้อนว่า “ระบบอยู่บนคลาวด์” ไม่ได้หมายความว่า “ไม่มีวันล่ม”
จากการรายงานข่าวสถานการณ์สงครามล่าสุด ระบุว่าเกิดเหตุไฟไหม้และการตัดระบบไฟฟ้าใน AZ หนึ่งของ Region ตะวันออกกลาง (me-central-1) ทำให้บริการบางส่วนหยุดชะงักชั่วคราว และมีรายงานผลกระทบด้านพลังงาน/การเชื่อมต่อในบาห์เรน (me-south-1) ในช่วงเวลาใกล้เคียงกัน แม้ผู้ให้บริการจะออกแบบ AZ ให้แยกโครงสร้างพื้นฐานด้านพลังงาน เครือข่าย และระบบระบายความร้อนออกจากกัน แต่เหตุการณ์ด้านความมั่นคงระดับภูมิภาคสามารถสร้างผลกระทบเชิงกายภาพที่ลุกลามเกินกว่าความคาดหมาย
กรณีนี้จึงเป็นบทเรียนเชิงกลยุทธ์สำหรับองค์กรทั้งภาครัฐและเอกชน โดยเฉพาะในมุมของ Recovery Strategy และ Disaster Recovery (DR) ภายใต้มาตรฐานสากล
สถานการณ์สงครามล่าสุด : บทเรียนจากเหตุการณ์ความขัดแย้งในตะวันออกกลาง ถอดบทเรียน Data Center ถูกโจมตี ควรออกแบบ DR อย่างไร
คลาวด์ไม่ใช่ภูมิคุ้มกันสมบูรณ์แบบ เหตุการณ์ดังกล่าวสะท้อนประเด็นสำคัญ 3 ประการ:
- ความเสี่ยงเชิงภูมิรัฐศาสตร์มีผลต่อดาต้าเซ็นเตอร์จริง แม้จะเป็นศูนย์ข้อมูลมาตรฐานสูง แต่ยังคงตั้งอยู่ในประเทศที่มีความเสี่ยงด้านความมั่นคง
- AZ ไม่ได้ป้องกันความเสี่ยงระดับ Region เสมอไป หากโครงสร้างพื้นฐานภายนอก เช่น ระบบไฟฟ้าภูมิภาค หรือเหตุการณ์ความไม่สงบ ส่งผลกระทบเป็นวงกว้าง AZ หลายแห่งอาจได้รับผลกระทบทางอ้อม
- องค์กรลูกค้าอาจได้รับผลกระทบ แม้ผู้ให้บริการยังทำงานบางส่วนได้หากระบบของลูกค้าออกแบบพึ่งพาเพียง AZ เดียว หรือไม่มี Cross-Region Replication
ดังนั้น ความเข้าใจว่า “อยู่บนคลาวด์แล้วไม่ล่ม” จึงเป็นความเข้าใจที่ไม่ครบถ้วน
มุมมองตามมาตรฐาน ISO 22301 (BCMS)
ISO 22301:2019 กำหนดกรอบการบริหารความต่อเนื่องทางธุรกิจ โดยเฉพาะเรื่อง Recovery Strategy
- ต้องทำ Business Impact Analysis (BIA) เพื่อกำหนด RTO และ RPO ตามผลกระทบจริง
- ต้องออกแบบ Recovery Strategy รองรับเหตุการณ์ระดับ Region หรือประเทศ
- ต้องมีการทดสอบ DR และฝึกซ้อมเหตุการณ์จำลอง
- ต้องประเมินภัยคุกคามใหม่ เช่น ภัยกายภาพจากความขัดแย้งทางทหาร
ในบริบทข่าวการโจมตี หากองค์กรไม่มีแผนรองรับกรณี “Region ใช้งานไม่ได้ทั้งหมด” จะไม่สอดคล้องกับหลักการของ ISO 22301 ด้านความเพียงพอของกลยุทธ์การกู้คืน
มุมมองตามมาตรฐาน ISO/IEC 27017 – Disaster Recovery บนคลาวด์
ISO/IEC 27017 เน้นการบริหารความมั่นคงปลอดภัยในบริบท Cloud และ Shared Responsibility
- ต้องกำหนด ความรับผิดชอบ DR ระหว่าง Cloud Provider และลูกค้า
- ต้องมี Data Backup & Restore Testing
- ต้องประเมิน Location Risk ของ Region ที่เลือกใช้งาน
- SLA ต้องรองรับ Major Incident และกระบวนการแจ้งเหตุ
เหตุการณ์นี้ย้ำว่า การพึ่งพาเพียง SLA ของผู้ให้บริการโดยไม่มีสถาปัตยกรรม DR ของตนเอง ไม่เพียงพอในเชิงมาตรฐาน
มุมมองตามมาตรฐาน CSA STAR – Governance และ Resilience
CSA STAR และ Cloud Controls Matrix (CCM) เน้น Operational Resilience และ Third-Party Risk
- ต้องมี Business Continuity & Operational Resilience Framework
- ต้องออกแบบ Redundancy และ Automatic Failover
- ต้องบริหารความเสี่ยงผู้ให้บริการคลาวด์ในฐานะ Critical Third Party
- ต้องมี Exit Strategy และ Contingency Plan
เหตุการณ์ในข่าวสะท้อนว่าการกำกับดูแลคลาวด์ต้องอยู่ในระดับเดียวกับการบริหารความเสี่ยงเชิงองค์กร
สถานการณ์สงครามล่าสุด และแนวทางการเตรียมความพร้อม
จากเหตุคลาวด์ล่มระดับ Region สำหรับองค์กรภาครัฐและเอกชน
- กำหนดให้กลยุทธ์ Multi-Region ออกแบบระบบสำคัญให้ทำงานข้าม Region (Active-Active หรือ Active-Standby) และกำหนดไว้ชัดในสัญญาหรือ TOR
- ทำ Business Impact Analysis (BIA) วิเคราะห์ผลกระทบกรณี AZ/Region ล่ม เพื่อกำหนด RTO/RPO และระดับการลงทุน DR ที่เหมาะสม
- จัดทำและทดสอบ DR Plan มีแผนรองรับกรณี Region ใช้งานไม่ได้ และทดสอบอย่างน้อยปีละ 1 ครั้ง
- จัดการ Backup ให้ทนทาน ทำ Cross-Region Backup ใช้ Immutable Backup และทดสอบการกู้คืนจริง
- ประเมินความเสี่ยง Location พิจารณาความเสี่ยงภูมิรัฐศาสตร์ พลังงาน และโครงสร้างพื้นฐานก่อนเลือก Region วิเคราะห์ Worst-Case Scenario จำลองกรณี Region ล่มทั้งหมด และใช้ผลวิเคราะห์ปรับกลยุทธ์ความทนทา