[News] CrowdStrike เผยสาเหตุที่ทำให้ระบบต่างๆ จอฟ้าทั่วโลก เกิดจากเครื่องมือทดสอบมีบั๊ก และไม่ได้ทดสอบทั้งระบบ

หลังจากที่ทำให้เกิดเหตุการณ์จอฟ้าบน Windows ทำให้ระบบต่างๆ ล่มจนใช้งานไม่ได้เกือบทั่วโลก ในที่สุด CrowdStrike ก็ออกรายงานเบื้องต้นถึงสาเหตุที่ทำให้เกิดเหตุการณ์ดังกล่าวแล้ว แต่เนื่องจากรายงานตัวจริงยาวมาก เราจึงจะตัดสรุปส่วนที่สำคัญมาให้สั้นๆ และแปลให้เข้าใจง่ายที่สุด ดังนี้
.
โดยตัว CrowdStrike Falcon ที่เป็น Agent หลักที่ทำให้เกิดการจอฟ้าหรือ Blue Screen Of Death ขึ้นมาทั่วโลก จะมีการอัปเดต 2 แบบ คือ Sensor Content ที่เป็นเหมือนอัปเดตใหญ่ของตัว Falcon กับอีกแบบที่เรียกว่า Rapid Response Content ที่จะเป็นการอัปเดตเร่งด่วนให้กับตัว Falcon Agent ทั่วโลก ถ้าให้เข้าใจง่ายๆ ก็คือเหมือนส่งหมายจับไปทั่วโลกว่ามีภัยคุกคามตัวใหม่อะไรบ้าง และต้องรับมืออย่างไร
.
ปัญหาคือตัว Rapid Response Content ที่อัปเดตออกมาในวันที่ 19 ก.ค.ไม่ได้ถูกตรวจพบจากการทดสอบภายในของ CrowdStrike เอง เนื่องจากมันถูกออกแบบมาให้ปล่อยอัปเดตให้ไวที่สุดเพื่อต่อสู้กับภัยคุกคามทางไซเบอร์ใหม่ และเมื่อมองย้อนไปถึงเดือน ก.พ. ตัว Sensor Content เวอร์ชันล่าสุดที่มีระบบการทำงานแบบใหม่ และผ่านการทดสอบเรียบร้อยแล้ว ก็ปกติดีกับระบบต่างๆ และปล่อยออกมาตั้งแต่เดือนเม.ย. ซึ่งที่ผ่านมาก็ราบรื่นไม่มีปัญหาอะไรเป็นเวลานับเดือน
.
และเมื่อวันที่ 19 ก.ค. มีการออกอัปเดตตัวใหม่ที่ก่อให้เกิดปัญหา ประกอบกับเครื่องมืออีกตัวที่เรียกว่า “Content Validator” ซึ่งมีหน้าที่ตรวจสอบ Rapid Response Content อีกทีว่าจะไม่มีปัญหาใดๆ กลับมีบั๊กในตัวซ้ำซ้อนอีก ทำให้ตัว Rapid Response Content ที่เป็นปัญหาและควรจะต้องตรวจเจอตั้งแต่ตอนนั้น ผ่านการทดสอบภายในไปได้ ซึ่งการทดสอบดังกล่าวเป็นการตรวจสอบไฟล์ดังกล่าวเท่านั้น แต่ไม่ได้นำมาทดสอบกับตัว Sensor Content จริงๆ
.
สุดท้ายด้วยความเชื่อมั่นว่าตัว Sensor Content ที่โดนปล่อยออกไปก่อนหน้าก็ทำงานได้ดี ไม่เจอปัญหาอะไร จากการทดสอบตอนเดือน มี.ค. เลยเป็นสาเหตุให้ตัว Rapid Response Content ถูกอัปเดตออกไปทั่วโลก และเกิดปัญหาจอฟ้าตามมา จนกระทั่ง CrowdStrike ตรวจเจอปัญหานี้ และทำการ Revert กลับไปเป็นเวอร์ชันก่อนหน้าที่ไม่มีปัญหาแทน
.
จากความเสียหายที่เกิดขึ้นทั่วโลก ทาง CrowdStrike ออกมาให้คำมั่นว่า จะเพิ่มความรอบคอบในการทดสอบมากขึ้น รวมถึงการตรวจสอบภายในให้มากขึ้น แต่ยังไม่มีการระบุถึงการชดเชยความเสียหายที่เกิดขึ้นในตอนนี้ และจะมีการออกรายงาน Root Cause Analysis เพิ่มเติมภายหลัง

Sheapgamer Comments

แสดงความคิดเห็น