Eliminare il Contenuto Duplicato in WordPress

Pubblicato da Yuri Carlenzoli | 05 Agosto 2008

Il contenuto duplicato compromette il posizionamento nella serp, ecco come fare a eliminare il contenuto duplicato in un sito o blog basato su wordpress per avere un posizionamento migliore.

contenuto-duplicato

Per eliminare il contenuto duplicato io mi sono basato direttamente alla guida per l'ottimizzazione lato seo del file robots.txt suggerito da wordpress.org, però risulta non aggiornata e io che non mettendo il tag more e non uso il plugin per il contenuto duplicato che fa il riassunto dell'articoli ho dovuto rivederlo in alcuni punti.
Ecco il pezzo del mio mio robots.txt anti contenuto duplicato e previene anche occhi indiscreti in directory importanti del blog:
User-agent: *
Allow: /
Disallow: /blog/category/*/*/page
Disallow: /blog/category/*/page
Disallow: /blog/tag/*/page
Disallow: /blog/tag/*/*/page
Disallow: /blog/page
Disallow: /blog/scripts
Disallow: /blog/tags
Disallow: /blog/cgi-bin
Disallow: /blog/wp-admin
Disallow: /blog/wp-includes
Disallow: /blog/wp-content/plugins
Disallow: /blog/wp-content/cache
Disallow: /blog/wp-content/themes
Disallow: /blog/trackback
Disallow: /blog/feed
Disallow: /blog/comments
Disallow: /blog*/trackback
Disallow: /blog*/feed
Disallow: /blog*/comments
Disallow: /blog/*?*
Disallow: /blog/*?
Disallow: /blog/*.html$
Disallow: /blog/*.ico$
Disallow: /blog/*.opml$
Disallow: /blog/*.php$
Disallow: /blog/*.shtml$
Disallow: /blog/*.xml$
Disallow: /blog/*.php$
Disallow: /blog/*.js$
Disallow: /blog/*.inc$
Disallow: /blog/*.css$
Allow: /blog/*?$
Allow: /blog/wp-content/uploads
Allow: /blog/index.php
Allow: sitemap.xml
Allow: /blog/sitemap.xml
Allow: /blog/sitemap.gz

Come si può vedere all'inizio del robots.txt ho dovuto evitare che i robots passassero dalle pagine delle categorie e dei tag altrimenti risulta il meta description duplicato, poi si vedono le regole che evitano passaggio del robots/indicizzazzione in directory di wordpress sensibili, un aumento della sicurezza, poi ancora regole che evitano l'indicizzazione di trackback e file che darebbero contenuto duplicato ed infine le directory/file permesse/i per l'indicizzazione.

Un altro accorgimento che ho dovuto utilizzare è stato cambiare il meta title dei tag perché era uguale al title di alcune categorie (questo è stato fatto con il plugin all-in-one-seo-pack):

il title della categoria linux é: Linux | Tip and Tricks di computer

il title del tag linux è: Linux | T&T di Computer

Infine sempre lato seo ho aggiunto il meta robots solo ai post singoli perché il resto è bloccato dal robots.txt, per chi ha all-in-one-seo-pack basta che aggiunge <meta name="Robots" content="index,follow" /> nel campo addictional post headers.

Thanks to image: Tagliaerbe

6 commenti su “Eliminare il Contenuto Duplicato in WordPress

  1. Paik

    guida utle e vorrei poterti chiedere un consiglio, utilizzando un plug in per la traduzione sono stati creati qualsi 60 contenuti duplicati e mi hanno causato una penalizazione su google. Hodisattivato e disinstallato il plugin in questione ma le pagine risultano comunque duplicate e in lingua italiana. Vorrei chiederti per eliminare tutti i link duplicati riesco a risolvere semplicemene scrivendo nel file robots questo?
    "User-agent: *
    Disallow: /da/?
    Disallow: /el/?
    Disallow: /en/?
    Disallow: /fi/?
    Disallow: /fr/?
    Spero di averti fatto capire e spero mi possa aiutare. Ciao

  2. yuri Autore del post

    è il motivo per cui non lo metto per il momento, comunque devi fare un redirect 301 tramite .htaccess

    RedirectMatch 301 ^/(pt|cs|hr|ru|de|en|es|fr|nl|hr)/(.*)$ http://http://totumweb.com/$

    questa soluzione l'ho trovata su etechs, come ha detto tagliaerbe... google, non è penalizzante il contenuto duplicato, ma qui sono pagine non trovate, corri ai ripari alla svelta.

    ciao paik

  3. Gianluca Borgna

    Salve Yuri, mi ricollego al problema di paik. Solito problema per me, oltre ai contenuti duplicati del tipo /domande/259/pluridecennale-esperienza-costruzioni-trovare-lavoro-urgente
    /domande/?qa=259/pluridecennale-esperienza-costruzioni-trovare-lavoro-urgente
    installai a suo tempo un plugin multilingua che mi restituisce tantissimi errori 404..la soluzione che hai suggerito a Paik è valida comunque?
    Grazie

  4. yuri Autore del post

    Si Gianluca, se il problema è uguale anche la soluzione lo è, potresti anche rimuovere le path con i webmaster tools (a suo tempo non esisteva questa funzionalità) oppure restituire un header HTTP 410.

    Riguardo i duplicati causati dall'URL potresti fare un redirect 301 oppure utilizzare il rel="canonical".

    Buona giornata,
    Yuri.

  5. Gianluca Borgna

    Grazie Yury!
    è però evidente che fare un redirect per ogni pagina della sezione domande mi sembrerebbe fuori luogo.
    Esiste un comando preciso per redirezionare e cambiare il contenuto di tutte le URL della sezione domande per esempio da
    http://www.italcaribeclub.com/domande/?qa=208/campi-da-calcetto-buon-investimento
    a
    http://www.italcaribeclub.com/domande/208/campi-da-calcetto-buon-investimento
    quindi evitando la scrittura del punto interroagativo e qa= visto che mi causano contenuto duplicato?

  6. yuri Autore del post

    Con una riga di codice ed un espressione regolare puoi fare il redirect di tutte le pagine, per fare l'espressione regolare viene comodo ad esempio REGex TESTER.

    Ciao, buona Pasqua!,
    Yuri.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Moderazione dei commenti attiva. Il tuo commento non apparirà immediatamente.