Έρευνα του Pew Research Center δείχνει πως το ένα τέταρτο όλων των ιστοσελίδων που υπήρχαν κάποια στιγμή μεταξύ 2013 και 2023 δεν είναι πλέον προσβάσιμες. Στις περισσότερες περιπτώσεις, μια μεμονωμένη σελίδα διαγράφηκε ή αφαιρέθηκε σε έναν κατά τα άλλα λειτουργικό ιστότοπο, με τη συγκεκριμένη τάση να είναι ακόμη πιο έντονη για το παλαιότερο περιεχόμενο. Περίπου το 38% των ιστοσελίδων που υπήρχαν το 2013 δεν είναι διαθέσιμες σήμερα, σε σύγκριση με το 8% των σελίδων που υπήρχαν το 2023.
Το 23% των ειδησεογραφικών ιστοσελίδων περιέχουν τουλάχιστον έναν «σπασμένο» σύνδεσμο, όπως και το 21% των ιστοσελίδων από κυβερνητικούς ιστότοπους. Οι ειδησεογραφικοί ιστότοποι με υψηλό επίπεδο επισκεψιμότητας και εκείνοι με λιγότερη, είναι εξίσου πιθανό να περιέχουν κατεστραμμένους συνδέσμους, ενώ οι ιστοσελίδες τοπικής αυτοδιοίκησης είναι ιδιαίτερα πιθανό να έχουν κατεστραμμένους συνδέσμους. Την ίδια στιγμή, το 54% των σελίδων της Wikipedia περιέχουν τουλάχιστον έναν σύνδεσμο στην ενότητα «αναφορές» που οδηγεί σε μια σελίδα η οποία δεν υπάρχει πλέον.
Είναι χαρακτηριστικό πως, στο Twitter, σχεδόν ένα στα πέντε tweets δεν είναι πλέον δημόσια ορατά, λίγους μήνες μετά τη δημοσίευσή του. Στο 60% αυτών των περιπτώσεων, ο λογαριασμός που δημοσίευσε αρχικά το tweet έγινε ιδιωτικός, τέθηκε σε αναστολή ή διαγράφηκε εντελώς. Στο άλλο 40%, ο κάτοχος του λογαριασμού διέγραψε το μεμονωμένο tweet, αλλά ο ίδιος ο λογαριασμός συνέχισε να υπάρχει.
Ορισμένοι τύποι tweets τείνουν να εξαφανίζονται πιο συχνά από άλλους. Είναι χαρακτηριστικό πως, πάνω από το 40% των tweets που γράφτηκαν στα τουρκικά ή στα αραβικά, δεν είναι πλέον ορατά εντός του γνωστού κοινωνικού δικτύου εντός τριών μηνών από τη δημοσίευσή τους. Επιπρόσθετα, τα tweets από λογαριασμούς με τις προεπιλεγμένες ρυθμίσεις προφίλ είναι ιδιαίτερα πιθανό να εξαφανιστούν από τη δημόσια προβολή.
Για τη διεξαγωγή της μελέτης στις ιστοσελίδες, συλλέχθηκε ένα τυχαίο δείγμα περίπου 1 εκατομμύριου ιστοσελίδων από τα αρχεία της Common Crawl, μιας υπηρεσίας αρχειοθέτησης που συλλέγει περιοδικά στιγμιότυπα του Διαδικτύου, όπως αυτά εντοπίζονται σε διαφορετικές χρονικές στιγμές. Διαπιστώθηκε ότι το 25% όλων των σελίδων από το 2013 έως το 2023 δεν ήταν πλέον προσβάσιμες από τον Οκτώβριο του 2023.
Αυτός ο αριθμός είναι το άθροισμα δύο διαφορετικών τύπων «σπασμένων» σελίδων: το 16% των σελίδων είναι μεμονωμένα απροσπέλαστες αλλά προέρχονται από έναν κατά τα άλλα λειτουργικό ιστότοπο. Το άλλο 9% δεν είναι προσβάσιμο επειδή ολόκληρος ο ιστότοπος δεν είναι πλέον λειτουργικός.
Δεν αποτελεί έκπληξη το γεγονός ότι τα παλαιότερα στιγμιότυπα είχαν το μεγαλύτερο μερίδιο απροσπέλαστων συνδέσμων. Από τις σελίδες που συλλέχθηκαν από το στιγμιότυπο του 2013, το 38% δεν ήταν πλέον προσβάσιμο το 2023. Αλλά ακόμη και για τις σελίδες που συλλέχθηκαν στο στιγμιότυπο του 2021, περίπου μία στις πέντε δεν ήταν πλέον προσβάσιμη μόλις δύο χρόνια μετά.