انقطاع خدمة Canva

20 يناير, 2025 | Miscelanea

ما وراء انقطاع خدمة Canva في نوفمبر 2024: ما الخطأ الذي حدث وما هو التالي

واجهت Canva مؤخرًا انقطاعًا كبيرًا في الخدمة أدى إلى انقطاع الوصول إلى منصتها لما يقرب من ساعة، مما منع المستخدمين حول العالم من الوصول إلى أداة التصميم. وقد أدى هذا الانقطاع إلى انقطاع سير العمل لدى المبدعين والمسوقين وأصحاب المشاريع الصغيرة الذين يعتمدون على Canva في مهام مثل إنشاء رسومات التواصل الاجتماعي والعروض التقديمية والمواد الترويجية، مما يُبرز الدور المحوري الذي تلعبه المنصة في العمليات اليومية. ومن الساعة 9:08 صباحًا بالتوقيت العالمي المنسق إلى الساعة 10:00 صباحًا بالتوقيت العالمي المنسق، انقطع موقع canva.com تمامًا، وهو أمر نادر الحدوث بالنسبة للمنصة. تتناول هذه المدونة الأسباب الجذرية للانقطاع، وكيفية حدوثه، والخطوات الفورية المتخذة لاستعادة القدرة على العمل، والإجراءات الوقائية التي تتخذها Canva لتجنب حوادث مماثلة في المستقبل.

تشريح الانقطاع

وقد نتج الانقطاع عن تضافر عدة عوامل، بما في ذلك:

  • مشكلة في نشر البرنامجقدّمت عملية الطرح تحسينات على مُحرّر Canva، بما في ذلك تحسين أداء لوحة الكائنات وميزات إضافية لإدارة الطبقات. ومع ذلك، تسبب خلل غير متوقع في مسار النشر في مشاكل توافق مع التخزين المؤقت من جانب العميل، مما ساهم في وقوع الحادث.
  • عدم استقرار الشبكة:واجهت Cloudflare، موفر شبكة CDN الخاصة بشركة Canva، مشكلات تتعلق بالزمن وفقدان الحزم في مسار شبكتها من سنغافورة إلى Ashburn.
  • مشكلة قفل في بوابة API:أدى خطأ القياس عن بعد في البنية التحتية لـ Canva إلى تفاقم تحديات الأداء.

في نهاية المطاف، أدت هذه المشكلات المترابطة إلى إغراق بوابة API الخاصة بـ Canva، وهو مكون أساسي يتعامل مع المصادقة والترخيص وتحديد معدل طلبات API، مما تسبب في فشل متتالي جعل الموقع غير قابل للوصول.

كيف تطورت الحادثة

النشر الأولي (8:47 صباحًا بتوقيت UTC)
أُطلقت نسخة جديدة من مُحرّر Canva، مما يُتيح لأجهزة العميل جلب أصول ثابتة مُحدّثة من نظام التخزين المؤقت الخاص بـ Cloudflare. من بين هذه الأصول، ملف JavaScript أساسي لعرض لوحة عناصر المُحرّر.

ظهور تأخير في الشبكة
في الوقت نفسه، شهد مسار شبكة Cloudflare من سنغافورة إلى أشبورن زيادةً ملحوظةً في زمن الوصول، حيث ارتفعت أوقات الوصول إلى أول بايت بنسبة تزيد عن 1700%. استغرق تحميل ملف جافا سكريبت بالغ الأهمية ما يصل إلى 20 دقيقة، مما حرم المستخدمين في آسيا من تحميل لوحة الكائنات.

التحميل الزائد لتدفق ذاكرة التخزين المؤقت
جمع نظام التخزين المؤقت الخاص بـ Cloudflare أكثر من 270,000 طلب لملف JavaScript نفسه. عند تحميل الأصل أخيرًا في الساعة 9:07 صباحًا بتوقيت UTC، غمرت موجة هائلة من 1.5 مليون طلب API متزامن بوابة API الخاصة بـ Canva، مما أدى إلى زيادة حمل الذروة المعتاد ثلاثة أضعاف.

انهيار بوابة API
بسبب ازدياد حركة البيانات، انخفض أداء بوابة API بسبب خلل في القياس عن بُعد تسبب في مشاكل في قفل الخيوط. أدى ذلك إلى استهلاك مفرط للذاكرة، مما أدى إلى تفعيل برنامج Linux Out-Of-Memory Killer، وإيقاف جميع المهام التي تعمل على البوابة. بحلول الساعة 9:08 صباحًا بتوقيت UTC، كان موقع canva.com متوقفًا عن العمل تمامًا.

التخفيف من حدة الأزمة

استجاب فريق الهندسة في Canva بسلسلة من الإجراءات:

  1. توسيع نطاق مهام بوابة API:فشلت المحاولات الأولية لتوسيع نطاق المهام تلقائيًا حيث أصبحت المهام الجديدة مثقلة بارتفاعات حركة المرور المستمرة.
  2. حظر حركة المرور على مستوى CDNفي الساعة 9:29 صباحًا بتوقيت UTC، قامت Canva بحظر جميع حركة المرور مؤقتًا على طبقة CDN لتثبيت بوابة API.
  3. استعادة حركة المرور تدريجيا:بدءًا من المستخدمين الأستراليين الذين يخضعون لحدود أسعار صارمة، قامت Canva باستعادة إمكانية الوصول العالمية تدريجيًا، مما يضمن استقرار النظام في كل خطوة.

بحلول الساعة 10:00 صباحًا بتوقيت UTC، عادت المنصة للعمل عبر الإنترنت.

الدروس المستفادة وخطة العمل

لتعزيز الموثوقية ومنع الانقطاعات المستقبلية، حددت Canva تدابير فورية وطويلة الأمد لمعالجة المجالات الحرجة:

من حيث استجابة الحادثتعمل Canva على تطوير دليل تشغيل شامل لإدارة حركة المرور في حالات الطوارئ، وتعمل على تحسين تواصل المستخدمين من خلال توفير صفحات أخطاء أوضح أثناء فترات التوقف. لتعزيز مرونة بوابة APIيخطط الفريق لزيادة قدرته الأساسية وتخصيص الذاكرة، وتنفيذ قواعد تخفيف الأحمال من أجل التعامل بشكل أفضل مع زيادة حركة المرور، وإجراء اختبارات تحميل منتظمة لمحاكاة السيناريوهات المتطرفة.

لمعالجة قضايا محددة مثل خطأ القياس عن بعدقامت Canva بنشر تصحيح لإصلاح مشكلة قفل الخيوط، وتعمل على تحسين عمليات الاختبار لتجنب حدوث مضاعفات مماثلة في المستقبل. نشر الدرابزينيتم تقديم ضمانات إضافية، بما في ذلك مراقبة أحداث اكتمال تحميل الصفحة، وتمديد فترات إصدار Canary لاكتشاف المشكلات بشكل أفضل أثناء عمليات الطرح المرحلية، وإضافة مهلة زمنية لطلبات الأصول لتجنب التأخير المطول.

وأخيرًا، تتعاون Canva بشكل وثيق مع كلودفلاري لتحسين آليات توجيه حركة البيانات والتخزين المؤقت، لضمان معالجة أكثر سلاسةً للحالات عالية الطلب. تهدف هذه الإجراءات مجتمعةً إلى تعزيز البنية التحتية لـ Canva ومنع تكرار انقطاعات مماثلة.

الالتزام بالشفافية

يُعد هذا الانقطاع أول تقرير حوادث يُعلن عنه علنًا من Canva، مما يعكس التزامها بالشفافية والتحسين المستمر. ومع نمو قاعدة مستخدمي Canva، يتزايد التزامها ببناء بنية تحتية متينة تدعم رسالتها في تمكين العالم من التصميم.

تؤكد جهود كانفا لتحليل ومعالجة الانقطاع نهج الشركة الاستباقي في التعلم من التحديات. ومن خلال تطبيق هذه التغييرات، تهدف كانفا إلى ضمان منصة أكثر متانة وموثوقية لملايين مستخدميها حول العالم.

الاستفادة من الحلول لمنع الانقطاعات

غالبًا ما يمكن التخفيف من حدة انقطاعات مثل انقطاعات Canva أو حتى منعها تمامًا باستخدام حلول فعّالة مصممة لتعزيز مرونة البنية التحتية. أدوات مثل RELIANOIDتوفر وكلاء 'عالية الأداء' وتحسينات بوابة API مزايا رئيسية، بما في ذلك موازنة الأحمال في الوقت الفعلي، وتوجيه حركة مرور متقدم، وآليات التعافي التلقائي من الأعطال. ومن خلال نشر أنظمة قياس عن بُعد متطورة وميزات إعادة التشغيل الفوري، تضمن هذه الأدوات عمليات سلسة حتى في ظل الظروف القاسية. ويمكن للمؤسسات التي تتبنى هذه الحلول معالجة اختناقات الأداء بشكل استباقي، وتحسين الاستجابة للحوادث، والحفاظ على استمرارية التشغيل للتطبيقات الحيوية. اتصل بنا للمزيد من المعلومات.

مدونات ذات صلة

أرسلت بواسطة reluser | 30 مارس 2026
مع ازدياد تطور السفن تقنياً - من خلال أنظمة الملاحة الرقمية، وأنظمة إنترنت الأشياء، والمحركات الصديقة للبيئة - لا يزال الأمن السيبراني الخاص بها متخلفاً بشكل خطير. ويحذر عدد متزايد من العاملين في هذا القطاع من أن...
253 يحبالتعليقات مغلقة نظرة عالمية على الأمن السيبراني البحري
أرسلت بواسطة reluser | 26 مارس 2026
في المشهد الرقمي الحالي، تتجاوز خروقات البيانات مجرد كونها حوادث أمنية، إذ يمكن أن تكون كارثية، وتؤدي إلى خسائر مالية فادحة، وفقدان ثقة العملاء، وحتى الإفلاس. وقد شهدنا مؤخرًا انهيارًا لـ...
309 يحبالتعليقات مغلقة حول لماذا يجب على الشركات التعامل بجدية مع اختراقات البيانات
أرسلت بواسطة reluser | 24 مارس 2026
في عالم رقمي دائم التطور، تتبنى الشركات باستمرار تقنيات الحوسبة السحابية لتبسيط العمليات، ودفع عجلة الابتكار، والتواصل مع العملاء في جميع أنحاء العالم. ومع نقل المؤسسات المزيد من عملياتها...
309 يحبالتعليقات مغلقة لماذا تُعد إدارة وضع أمن الحوسبة السحابية (CSPM) مهمة للشركات؟