Η συχνότητα και η σοβαρότητα των διακοπών λειτουργίας που παρουσιάζονται σε κέντρα δεδομένων μειώνεται, αλλά όταν συμβαίνουν περιστατικά μπορεί να είναι πολύ δαπανηρά για τον οργανισμό που εμπλέκεται.
Ενώ το αποτύπωμα των data centers επεκτείνεται για να καλύψει τη ζήτηση που προκαλείται από την αύξηση της χρήσης generative AI εφαρμογών, ο συνολικός αριθμός των διακοπών λειτουργίας που σχετίζονται με τα κέντρα δεδομένων είναι πιθανό να αυξηθεί.
Ωστόσο, σύμφωνα με μια νέα έκθεση του Ινστιτούτου Uptime, υπήρξε μια σταθερά πτωτική τάση στη συχνότητα και τη σοβαρότητα των διακοπών λειτουργίας, σε σχέση με την αύξηση της χωρητικότητας των υποδομών πληροφορικής τα τελευταία χρόνια.
Αυτό σημαίνει ότι, ενώ υπάρχουν περισσότερα περιστατικά από πριν, ο ρυθμός αύξησής τους είναι χαμηλότερος από τον ρυθμό με τον οποίο επεκτείνεται η ίδια η χωρητικότητα των σχετικών υποδομών.
Υπάρχουν διάφοροι λόγοι για αυτό, συμπεριλαμβανομένου του ότι πολλοί οργανισμοί επενδύουν περισσότερο στις φυσικές υποδομές. Άλλοι λόγοι περιλαμβάνουν τη μετάβαση στο δημόσιο cloud και την υιοθέτηση νέας τεχνολογίας για συμμόρφωση με κανονισμούς.
Η ετήσια ανάλυση για το 2024 αναφέρει ότι το 55 τοις εκατό των ερωτηθέντων παρόχων ανέφεραν ότι είχαν βιώσει διακοπές λειτουργίας τα τελευταία τρία χρόνια, αλλά αυτό είναι μειωμένο από 60 τοις εκατό για το προηγούμενο έτος και 69 τοις εκατό το προηγούμενο έτος.
Ταυτόχρονα, μόνο μία στις δέκα διακοπές κατά τη διάρκεια του περασμένου έτους κατηγοριοποιήθηκε ως σοβαρή. Πρόκειται για βελτίωση κατά τέσσερις ποσοστιαίες μονάδες σε σχέση με το προηγούμενο έτος και κατά δέκα ποσοστιαίες μονάδες σε σύγκριση με το αμέσως προηγούμενο.
Ωστόσο, περισσότεροι από τους μισούς ερωτηθέντες (54 τοις εκατό) ανέφεραν ότι η πιο πρόσφατη σημαντική ή σοβαρή διακοπή λειτουργίας κόστισε στον οργανισμό περισσότερα από 100.000 δολάρια, με το 16 τοις εκατό να λέει ότι τους κόστισε πάνω από 1 εκατομμύριο δολάρια.
Όσον αφορά στις πιο σοβαρές διακοπές λειτουργίας, η διακοπή της διανομής ρεύματος είναι σταθερά ο μεγαλύτερος μεμονωμένος παράγοντας εδώ και αρκετά χρόνια, όπως καταγράφεται στο 52 τοις εκατό των περιστατικών.
Το Uptime ισχυρίζεται ότι υπάρχουν κάποιες ενδείξεις ότι μια στροφή προς πιο δυναμικά δίκτυα ηλεκτρικής ενέργειας, που χρησιμοποιούν ανανεώσιμες πηγές ενέργειας, μειώνει την αξιοπιστία του δικτύου και ότι τα κέντρα δεδομένων ενδέχεται να παρουσιάσουν αύξηση των διακοπών, καθώς προχωρά αυτή η τάση. Πολλές διακοπές συμβαίνουν όταν ένα UPS ή μια γεννήτρια αποτυγχάνει να ανταποκριθεί.
Η δεύτερη μεγαλύτερη αιτία είναι η αστοχία ή η ελλιπής απόδοση του εξοπλισμού ψύξης. Αυτό φάνηκε πέρυσι, όταν 2,5 εκατομμύρια συναλλαγές πληρωμών δεν μπόρεσαν να ολοκληρωθούν όταν το σύστημα ψύξης απέτυχε σε ένα κέντρο δεδομένων της Equinix που χρησιμοποιούσαν δύο τράπεζες στη Σιγκαπούρη – η DBS και η Citibank.
Το Uptime σημειώνει ότι τα θέματα τρίτων παρόχων έχουν σημειώσει μικρή αλλά σταθερή αύξηση από το 2020, αυξάνοντας κατά πέντε ποσοστιαίες μονάδες για να αντιπροσωπεύουν σχεδόν μία στις δέκα διακοπές λειτουργίας το 2023. Αυτό πιθανότατα περιλαμβάνει αποτυχίες σε φορείς εκμετάλλευσης cloud και μπορεί να αυξάνεται λόγω της ανάπτυξης του φόρτου εργασίας στο public cloud.
Τούτου λεχθέντος, η έκθεση διαπιστώνει ότι το ανθρώπινο λάθος είναι ένας παράγοντας που συμβάλλει σε πολλές διακοπές λειτουργίας, που κυμαίνονται από τα δύο τρίτα έως τα τέσσερα πέμπτα όλων των περιστατικών. Αυτά μπορεί να οφείλονται σε αδυναμία του προσωπικού να ακολουθήσει τις διαδικασίες ή ακόμη και σε ανεπάρκεια των ίδιων των διαδικασιών.
Το Uptime υποστηρίζει ότι εδώ υπάρχει μια ευκαιρία για τους οργανισμούς να μειώσουν περαιτέρω τις διακοπές λειτουργίας μέσω καλύτερης εκπαίδευσης του προσωπικού και προσεκτικής αναθεώρησης των διαδικασιών, για να εξαλειφθούν τυχόν σημεία αποτυχίας.
Σύμφωνα με την εταιρεία, υπάρχουν συνήθως περίπου 10-20 υψηλού προφίλ διακοπές IT ή συμβάντα στα datacenter παγκοσμίως κάθε χρόνο που οδηγούν σε σοβαρές οικονομικές απώλειες ή αναστάτωση των επιχειρήσεων και των πελατών. Σε πολλές περιπτώσεις, αυτά οδηγούν επίσης σε ζημιά στη φήμη.