Internet sta svanendo: uno studio rivela il fenomeno del “Digital Decay”

Il Pew Research Center di Washington ha pubblicato un’analisi che svela come un vastissimo numero di news e contenuti stia effettivamente e lentamente scomparendo dal web secondo il fenomeno del “Digital Decay”.

Una parte dello studio ha esaminato un campione rappresentativo di pagine web esistite negli ultimi dieci anni per vedere quante siano ancora accessibili oggi. Il centro di ricerca indipendente statunitense, per questa analisi, ha raccolto un campione di pagine dal repository web Common Crawl (un’organizzazione no-profit che esegue la scansione di tutto il web e fornisce gratuitamente al pubblico i propri archivi e set di dati) per ogni anno dal 2013 al 2023. Il passo successivo dei ricercatori è stato quindi quello di provare ad accedere a quelle pagine per vedere quante ne esistessero ancora. Internet è un archivio inimmaginabilmente vasto della vita moderna, con centinaia di miliardi di pagine web indicizzate. Questi contenuti tuttavia a volte scompaiono. Infatti è risultato che un quarto di tutte le pagine web esistenti tra il 2013 e il 2023 non sono più accessibili a partire da ottobre 2023. La ricerca rivela che nella maggior parte dei casi questo è dovuto al fatto che una singola pagina è stata cancellata o rimossa da un sito web funzionante. Per i contenuti più vecchi, questa tendenza è ancora più forte. Circa il 38% delle pagine web esistenti nel 2013 non sono disponibili oggi, al contrario, solo l’8% delle pagine create nel 2023 ha subito lo stesso destino, suggerendo una possibile evoluzione nelle tecnologie o nelle strategie di conservazione web.

Questo “decadimento digitale” si verifica in differenti ambiti online. Lo studio ha esaminato i collegamenti che compaiono sui siti web governativi e di notizie, nonché nella sezione “Riferimenti” delle pagine di Wikipedia a partire dalla primavera del 2023. Questa analisi ha rilevato che il 23% delle pagine web di notizie contiene almeno un collegamento interrotto, così come il 21% di pagine web da siti governativi. Il 54% delle pagine di Wikipedia contiene almeno un collegamento nella sezione “Riferimenti” che punta a una pagina che non esiste più.

Il decadimento digitale si manifesta anche sui social media, è stato raccolto un campione di tweet in tempo reale durante la primavera del 2023 sulla piattaforma di social media X (nota come Twitter) e monitorato per i successivi tre mesi. Di questo campione quasi un tweet su cinque non è più visibile pubblicamente sul sito pochi mesi dopo essere stato pubblicato. Nel 60% di questi casi, l’account che originariamente aveva pubblicato il tweet è stato reso privato, sospeso o cancellato del tutto. Nel restante 40% il titolare dell’account ha cancellato il singolo tweet, anche se l’account esiste ancora.

Alcuni tipi di tweet tendono a scomparire più spesso di altri. Oltre il 40% dei tweet scritti in turco o arabo non sono più visibili sul sito entro tre mesi dalla pubblicazione. E i tweet provenienti da account con le impostazioni predefinite del profilo hanno maggiori probabilità di scomparire dalla vista del pubblico.

Secondo il Pew Research Center, questi risultati sottolineano l‘importanza di sviluppare strategie più robuste per la conservazione dei contenuti digitali, specialmente considerando il loro ruolo fondamentale come depositari della storia moderna e come risorse educative e informative. Il fenomeno del digital decay pone sfide significative per l’archiviazione digitale e la memoria collettiva online, spingendo a riflessioni sulla durabilità e l’accessibilità a lungo termine dei contenuti digitali.