Milliók Tanulják Meg, Mi a CrowdStrike – És Ez Nem Jó Dolog
Tömegek szerte a világon, akik eddig nem hallottak a CrowdStrike-ról, most kénytelenek szembesülni a nevükkel, és ez nem a legjobb körülmények között történik. Eközben a Microsoft is hibáztatva van a globális hálózati leállásokért, és péntek reggel még mindig nem világos, hogy pontosan ki okozta a problémákat.
Frissítés Káosza
A CrowdStrike kibervédelmi cég Falcon Sensor szoftverének frissítése után a Windows-alapú rendszerek kék halál képernyővel (BSOD) kezdtek leállni. A problémák Ausztráliában kezdődtek és onnan terjedtek tovább az időzónák mentén.
TV-hálózatok, 911-es hívásközpontok és még a párizsi olimpiai játékok is érintettek voltak. Bankok és pénzügyi rendszerek Indiában, Dél-Afrikában, Thaiföldön és más országokban összeomlottak, amikor a számítógépek hirtelen leálltak. Egyes dolgozók észrevették, hogy a céges laptopjaik kék halál képernyőre bootolnak péntek reggel. Az üzemzavarok leállították nem csak a Starbucks mobil rendeléseit, hanem egy wyomingi motel működését is.
A légitársaságokat, amelyek sosem voltak híresek a rugalmasságukról, különösen súlyosan érintette az eset. Az American Airlines, a United, a Delta és a Frontier légitársaságokat is túlterhelték péntek reggel.
A CrowdStrike CEO „Mélyen Sajnálja”
A CrowdStrike és a Microsoft által javasolt megoldások a végtelenül összeomló Windows rendszerekhez olyan javaslatokat tartalmaztak, mint a „15-ször újraindítani” vagy az egyes illesztőprogramok törlése a virtuális OS lemezeken belül. Az érintett eszközökön lévő BitLocker meghajtótitkosítás tovább bonyolítja a helyzetet.
A CrowdStrike vezérigazgatója, George Kurtz, az X-en (korábban Twitter) reggel 5:45-kor keleti idő szerint közzétette, hogy a cég egy „Windows hosztok egyetlen tartalmi frissítésében talált hibán” dolgozik, a Mac és Linux hosztok nem érintettek. „Ez nem egy biztonsági incidens vagy kibertámadás. A problémát azonosítottuk, izoláltuk és egy javítást már be is vezettünk,” írta Kurtz. Kurtz az NBC Today Show műsorában péntek reggel kijelentette, hogy a CrowdStrike „mélyen sajnálja az ügyfeleknek okozott kellemetlenségeket.”
A Mastodonon a LittleAlex néven ismert felhasználó megjegyezte, hogy Kurtz a McAfee biztonsági cég technológiai igazgatója volt, amikor 2010 áprilisában a cég egy frissítést küldött, amely törölte egy kulcsfontosságú Windows XP fájlt, ami széleskörű leállásokat okozott és rendszeres fájlhelyreállítást igényelt.
Egyszerre Több Leállás, Tisztázatlan Felelősség
A Microsoft szolgáltatások, látszólag borzalmas véletlen egybeesés miatt, szintén leálltak csütörtök este. Több Azure szolgáltatás leállt csütörtök este, az okokat egy „háttérfürt-kezelési munkafolyamat konfigurációs változtatásának” tulajdonították, amely blokkolta a háttér hozzáférést az Azure Tárhely fürtök és a központi USA régió számítási erőforrásai között.
A Microsoft szóvivője pénteken közleményben nyilatkozta az Ars Technicának, hogy a CrowdStrike frissítésnek nincs köze a július 18-i Azure leálláshoz. „Az a probléma már teljesen helyreállt,” áll a közleményben.
A leállásokról szóló hírek eddig vagy a Microsoftot, vagy a CrowdStrike-ot, vagy a kettő keverékét hibáztatták a különböző leállásokért. Elkerülhetetlen lehet, hogy az összes leállás egy platformon, a Windows-on történik. A Microsoft maga is kiadott egy „Awareness” értesítést a CrowdStrike BSOD problémájáról a Windows-t futtató virtuális gépeken. A cég folyamatosan frissítette ezt pénteken, egy olyan javítással, amely talán nem is lepi meg az IT veteránokat.
„Visszajelzést kaptunk az ügyfelektől, hogy több újraindítás (akár 15 is) szükséges lehet, de az általános visszajelzés szerint az újraindítások hatékony hibakeresési lépésnek bizonyulnak ebben a szakaszban,” írta a Microsoft a közleményében. Alternatívaként a Microsoft azt ajánlotta, hogy az ügyfelek, akiknek van biztonsági mentésük „július 18-án 19:00 UTC előtti időpontról,” állítsák vissza azt, vagy csatlakoztassák az OS lemezt egy javító VM-hez, majd töröljék a fájlt (Windows/System32/Drivers/CrowdStrike/C00000291*.sys), amely a boot loop középpontjában áll.
A biztonsági tanácsadó, Troy Hunt, aki a kettős hibát „a történelem legnagyobb IT leállásának” nevezte, azt mondta: „Gyakorlatilag amitől mindannyian féltünk az Y2K-val, most valóban megtörtént.”
Az United Airlines az Ars-nak elmondta, hogy „néhány járatot újraindítanak, de várhatóan folytatódnak a menetrendi zavarok egész pénteken,” és bejelentették, hogy az utasok módosíthatják utazási terveiket. Az American Airlines péntek reggel közölte, hogy 5:00 keleti idő szerint helyreállították működésüket, de egész pénteken késésekre és járattörlésekre számítanak.
Az Ars kapcsolatba lépett a CrowdStrike-val a kommentárokért és frissíteni fogja ezt a bejegyzést, amint válasz érkezik.
Érdekesség:
A mesterséges intelligencia már képes előre jelezni bizonyos hálózati leállásokat és hibákat, de a CrowdStrike és Microsoft esetében az emberi tényező is nagy szerepet játszott a hiba bekövetkeztében.
Források: Ars Technica, NBC Today Show, Mastodon