سرویس آمازون به دلیل قطعی سرور ضرر چند میلیارد دلاری را تجربه کرد
به دلیل یک باگ نرمافزاری ساده
قطعی گسترده سرویسهای آمازون وب سرویسز (AWS) که هفته گذشته اینترنت را فلج کرد و خسارتی میلیارد دلاری به همراه داشت، ظاهرا ناشی از یک باگ نرمافزاری واحد بوده است.
برخلاف تصور برخی، این مشکل ناشی از برخورد فیزیکی با سرور نبوده، بلکه یک نقص داخلی نرمافزاری باعث آن شده است. طبق گزارش Ars Technica این باگ در سیستم مدیریت DNS آمازون به نام DynamoDB رخ داده است. DNS که به دفترچه تلفن اینترنت تشبیه میشود، وظیفه تبدیل نام دامنههای مورد استفاده کاربران به آدرسهای IP مورد نیاز سیستمها را دارد. در اینترنت مدرن، خدماتی مانند رایانش ابری و استریمینگ نیاز دارند تا یک دامنه را به چند IP مختلف اختصاص دهند تا بهرهوری سرورهای پراکنده جغرافیایی افزایش یابد.
مشکل از سمت کامپوننت DNS Enactor در DynamoDB بود که وظیفه بهروزرسانی جداول DNS را بر عهده دارد. این کامپوننت با تاخیر غیرمعمولی در بهروزرسانی چند نقطه پایانی DNS مواجه شد و مجبور بود چندین بار عملیات را تکرار کند. در همین حال، DynamoDB برنامههای جدیدی تولید میکرد که یک نسخه دیگر از DNS Enactor که به موقع کار میکرد، سعی داشت آنها را اجرا کند.
تنظیمات جدید DNS که تولید شد، توسط یک نسخه کاملا قدیمیتر از تنظیمات زمانی که Enactor دیررس توانست به روزرسانی کند، بازنویسی شد. این عمل از سیستمی که برای جلوگیری از چنین خطاهایی طراحی شده بود عبور کرد، چون همان سیستم هم به خاطر تاخیر در عملکرد، نتوانسته بود به موقع عمل کند. Enactor دوم هم در نهایت متوجه شد که این برنامه قدیمی منسوخ شده و آن را حذف کرد.
این پیچیدگیها باعث شد طیف گستردهای از خطاها در سیستمهای AWS رخ دهد و مهندسان مجبور شدند به صورت دستی مشکل را تشخیص داده و رفع کنند. این حادثه بار دیگر نشان میدهد که اینترنت چقدر شکننده است و حتی خطاهای منطقی درونی میتواند باعث اختلالات گسترده شود؛ درست مانند خطراتی که ممکن است توسط عوامل غیرمنتظرهای همچون کوسههای زیر دریا که به کابلهای فیبر نوری علاقه دارند، ایجاد شود.
توانایی انجام کارهای پیچیده و سریع مانند پریدن از جت جنگی، هدفگیری دقیق و بازگشت سریع به هواپیما در بازی Battlefield 6، یک شاهکار مهندسی در حد فرستادن انسان به ماه است؛ اما این حادثه نشان داد که گاهی کوچکترین نقصها میتوانند به فروپاشیهای بزرگی منجر شوند.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.