Ricerca e riparazione dei link rotti e degli errori 404 con WordPress

ATTENZIONE: questo articolo è stato scritto oltre un anno fa, ed i contenuti potrebbero non essere più validi o compatibili. Sei pregato di tenerne conto, e se hai informazioni in merito di segnalarmele, grazie.

Tanti anni di nuove pagine all’attivo, ricche di collegamenti, sia interni che esterni, in un sito è inevitabile con il tempo che molti di questi vadano persi per strada. Di più quelli esterni, ovviamente, meno controllabili, ma anche i link interni non sono da sottovalutare. Pagine modificate, spostate o dismesse sono all’ordine del giorno diventano fastidiosi errori 404. Un problema che chiunque voglia un sito ben inserito nei motori di ricerca dovrebbe evitare come la peste.

Come aggiustare gli Errori 404 con WordPress

Non solo siti e blog datati, quello dei link rotti e degli errori 404 riguardano anche altre situazioni. Come quando si decide di rifare di sana pianta il sito, o quando tocca metter le mani su un vecchio sito, magari fatto da altri per attualizzarlo, tipico esempio un sito statico da convertire in qualcosa di più moderno e dinamico, grazie a WordPress o altri CMS. Una cosa che mi capita di frequente.

Qui oltre ai collegamenti che inevitabilmente si perdono nelle modifiche strutturali, tocca anche guardare eventuali link rotti già da prima. O almeno bisognerebbe, questo è ciò che penso io, ed è quello che io faccio sempre, specie se si tratta di un lavoro per terzi, anche solo per scrupolo nei confronti del committente, e per evitarmi brutte sorprese/figure poi.

Se l’argomento può interessare, ecco come faccio io.

Prendiamo per comodità il caso di un vecchio sito statico di terzi da trasformare in dinamico, grazie a WordPress. Una situazione che mi vede sempre più spesso coinvolto.

1. Individuare gli errori del sito tramite Google

Se non lo fosse, per prima cosa iscrivo il sito nei Webmaster Tools di Google, e in pochi giorni si ottiene una lista già molto completa.
Da quando si prende in carico un lavoro del genere, a quando lo si inizia nella pratica, passano giorni, settimane a volte, di bozze e riunioni per decidere la strada da seguire. Un tempo sufficiente a Google per restituire una lista esaustiva degli errori di scansione. Quando è il momento di iniziare a lavorare sul serio, questa lista va salvata da qualche parte, che tornerà molto comoda.

2. Realizzare una sitemap aggiornata del vecchio sito

Una sitemap aggiornata del sito da modificare a portata di mano. Anche questa è molto utile per limitare al minimo gli errori nei link interni, al momento di inaugurare la nuova versione del sito. Se non c’è già, previa verifica della sua attendibilità, ci sono tanti strumenti per realizzarla, a piacere. Io preferisco sempre farmene una mia, ed a suo tempo avevo acquistato, per questo scopo, Sitemap Generator di Rage Software.

3. Porsi un obiettivo

Lo scopo è ovviamente quello di arrivare all’inaugurazione del nuovo sito con il minor numero possibile di errori. È utile per affrontare serenamente una buona politica di posizionamento sui motori di ricerca, ecco perché è fondamentale correggere anche gli errori vecchi, quelli che esistevano prima del nostro intervento. Il posizionamento del sito ringrazierà, i risultati non tarderanno.

4. Correggere i vecchi errori 404 recuperati dai Webmaster Tools di Google

Con i due elenchi appena citati, un po’ di lavoro di redirect per i link recuperabili, e modifiche al robots.txt quando invece non lo sono, si può arrivare allo scopo facilmente.

Correggere significa creare dei redirect (quelli buoni, permanent, con codice di risposta 301) delle URL con errore alle nuove pagine dedicate allo stesso argomento.
Indirizzare tutti gli errori ad una pagina di risposta generica, per quanto fatta ad arte, secondo me non è una buona soluzione. Non lo è nei confronti del committente, dei visitatori del sito e, non meno importante, per i motori di ricerca.
Meglio armarsi di santa pazienza, e fare un lavoro fatto a modino.

Riguardo i redirect, si possono fare agevolmente a mano scrivendo regole di Rewrite nel file .htaccess, ma se si preferisce uno strumento più amichevole viene in aiuto l’ottimo plugin Redirection, di cui ho già scritto. Facilissimo da utilizzare e che offre pure un simpatico controllo di quante visite arrivano dai singoli redirect, che altrimenti si sarebbero tradotti in fastidiosi e dannosi errori 404.
Il plugin offre anche diverse altre opzioni, compreso un comodo log degli errori 404, ma di queste magari ne parleremo in un secondo tempo, se non le scoprite da soli prima.

5. Identificare e correggere i link rotti dopo la revisione del sito

A questo punto tocca occuparsi degli eventuali errori nei link presenti nelle nuove pagine, che per quanto meticolosi si possa esser stati non mancano mai, specie se i contenuti delle vecchie pagine vengono recuperati effettuando dei copia/incolla, per comodità, link compresi.

Impensabile controllarli tutti uno ad uno, e allora qui entra in azione un altro plugin per WordPress, Broken Link Checker.

La configurazione è semplice, basta farlo partire e lui comincia ad avvisare, anche via mail, degli errori trovati. La lista degli errori permette di risolverli in modo semplice e veloce, senza dover andare ad aprire tutte le pagine con i link in questione.
Il plugin inoltre è comodo anche per il visitatore del sito, marcando i link sbagliati in modo da evidenziarli dagli altri.

6. Un occhio alle risorse di WordPress

Entrambi i plugin non mi pare appesantiscano in modo rilevante il nostro CMS preferito, il sto tenendo attivi su diversi WordPress, alcuni anche ben frequentati, e non mi pare di notare controindicazioni particolari.

Merita qualche nota l plugin Redirection: una volta che lo si è utilizzato per creare i redirect, occorre tenerlo attivo affinché questi funzionino correttamente. Poi è prudente tener sotto controllo i log. Redirection tende a scrivere parecchi log, sono utili in fase di verifica e sviluppo, ma tendono a riempire il database. Meglio settare la cancellazione automatica dei log in tempi più brevi di quelli consigliati, almeno dopo aver terminato il grosso del lavoro.

Brocken link Checker invece lo si può disabilitare senza problemi dopo esser certi di aver sistemato tutti i link eventualmente segnalati come rotti, magari svuotando la sua cache e rifacendo una scansione delle pagine ex-novo. Alla bisogna, è sempre possibile riattivarlo.

Io ho fatto l’esempio che mi capita più spesso, quello di rifare dei siti importandoli in WordPress, ma è chiaro che il problema dei broken link e degli errori su Google può essere ricondotto a tante altre situazioni. Prima fra tutte, come dicevamo all’inizio, un blog con diversi anni di attività e tanti link che potrebbero nel frattempo essere cambiati.

Una buona occasione per fare un controllino, no?

7. Un occhio all’ottimizzazione futura

Dato che stiamo facendo tutto questo per recuperare degli errori che potrebbero causare, oltre che dei pruriti nei navigatori, dei problemi nell’indicizzazione futura del sito, tanto vale tener presente quello che sarà la nuova struttura dello stesso al momento di creare i redirect.

È importante, realizzare una buona struttura fa parte dell’opera di SEO, e cominciare un’ottimizzazione di massima delle pagine che sostituiranno le vecchie, per far sì che si incastonino bene nella nuova struttura, che rientrino in una politica eventuale di ottimizzazione sui motori di ricerca, significa partire con una marcia in più.

Plugin sul SEO e soliti consigli a parte, ora entra un campo un fattore molto importante: la sensibilità nei confronti dei meccanismi che muovono i motori di ricerca, e qui non ci sono Bignami che tengano…

Tags: , , , , , , , , , , ,

5 Risposte a “Ricerca e riparazione dei link rotti e degli errori 404 con WordPress”

  1. kOoLiNuS 21 Set 2012 at 19:59 #

    MOLTO interessante. Grazie!

  2. Marco 16 Nov 2013 at 09:59 #

    Ciao Roberto, ti chiedo un aiuto, se puoi, ad un problema che mi sta facendo scervellare…
    In pratica ho un WordpPress 3.7.1 con WooCommerce 2.0.19 installato ed i prodotti caricati sono quasi tutti variabili (almeno 1 o 2 variabili per prodotto). Se vuoi dare un’occhiata questo è il link http://www.gostampa.it/

    Il mio problema è che quando genero una sitemap XML completa anche di tutte le variabili (di solito utilizzo Google XML Sitemaps 3.3) mi genera molti link tipo: http://www.gostampa.it/?product_variation che ovviamente vengono rilevati da Google (Webmaster Tools) come errori. Inoltre mi restituisce molti altri link “normali” tipo: http://www.gostampa.it/?product_variation=product-26-variation-16 ma comunque non funzionanti (pagina 404). Ovviamente sono stato costretto a disattivare la spunta su “Variabili” e generare una sitemap semplice.

    Il problema maggiore però, si pone ora che ho fatto l’iscrizione a Google Merchant Center (ex Google Shopping), in sostanza generando un file XML dei prodotti con Purple XMLs, il plugin mi restituisce questo errore: https://www.dropbox.com/s/sad7f9cb65ro521/purple_xmls.png e anche volendo creare a mano il file dei prodotti da sottoporre al servizio non potrei visto che i link ai prodotti variabili non funzionano…

    Sperando che tu abbia una teoria/soluzione a questo mio problema, ti ringrazio infinite anticipatamente!!

    • Roberto Rota 16 Nov 2013 at 10:23 #

      Non siamo nella discussione giusta per questo problema, in ogni caso il problema delle sitemap con i prodotti variabili è noto, ci sono molte discussioni in rete a tal proposito, tanto che i più consigliano di non mappare le variabili ed altre caratteristiche.
      Non mi risulta al momento che ci sia una soluzione una soluzione diversa.

      rob

      • Marco 16 Nov 2013 at 10:31 #

        Grazie mille per la tua risposta!
        Scusami se ho scritto qui allora, ma mi sembrava l’argomento più simile al mio problema..
        Magari proverò a scriverti in privato.

        Grazie ancora!

Trackbacks/Pingbacks

  1. √ La struttura migliore per i permalink di WordPress | Roberto Rota - 13 Feb 2013

    […] lo state già usando per altre cose, Redirection va bene (qui lo abbiamo valutato per gli errori 404). Ma non è molto più facile della soluzione a manina sul […]

Dubbi o suggerimenti? Lascia un commento!

I love Instagram