En un post anterior explicaba algunas técnicas útiles para detectar el contenido duplicado en un sitio web.

Una vez detectado dónde está el problema, debemos darle una solución. En este post explicaré cómo solucionar el problema del contenido duplicado, haciendo uso de:

  • Redirecciones 301
  • Canonicals o “canonicalización”.
  • Páginas alternativas con diferentes versiones idiomáticas de un sitio web.
  • Desindexación.

 

1. Redirecciones 301 para solucionar el contenido duplicado:

Debemos utilizar las redirecciones 301 cuando migramos de un contenido antiguo a uno nuevo.
Tanto si se trata de una única URL, como un set de URLs dentro de un mismo directorio.

Solemos utilizar la redirección 301 porque es la única válida en SEO  (aparte de la 302, aunque esta de forma temporal) para transferir todo el histórico y popularidad de la página antigua  a la nueva página. Es, como se dice en el argot, la redirección SEO friendly, que permite enviar al usuario de un lugar del sitio web a otro sin que exista intervención por su parte. Es, entonces, una redirección también usable.

Podemos utilizarla para redireccionar un dominio sin –www a dominio canónico con www.

Depende del servidor,  se deberá incluir la instrucción de la redirección de una forma diferente, como el objeto de este post no es tratar específicamente la redirección 301, os dejo un par de sitios donde se explica con bastante claridad:

http://www.trimedia.es/blogs/posicionamiento-web/redireccion-301
http://techtastico.com/post/%C2%BFque-es-la-redireccion-301-y-como-hacerla/

Es importante añadir que el exceso de redirecciones 301 sobrecargar el servidor y empeoran el tiempo de carga del site.

2. Canonicals o “canonicalización” para solucionar el contenido duplicado.

Con la redirección 301 la página antigua deja de estar disponible en el sitio web, con que solo la página nueva es accesible.

Con las canonicals, sin embargo, ambas urls o todas las urls que comparten el mismo contenido están perfectamente disponibles, pero solo una es la URL canónica o preferida.  A esa URL preferida “apuntan” todas las demás, para que los robots sepan que son contenido duplicado y dónde está el contenido prioritario y original.

Por tanto, imaginemos varias urls (son ficticias, algunas no existen realmente):

www.zoiseo.es/20/09/2011/como-detectar-contenido-duplicado-sitio-web
www.zoiseo.es/como-detectar-contenido-duplicado-sitio-web
www.zoiseo.es/20/09/2011/como-detectar-contenido-duplicado-sitio-web?category=seo

Las tres tienen el mismo contenido (contenido duplicado), pero por la razón que sea, queremos que las tres estén disponibles en el site, lo que deberemos hacer para no ser penalizados es determinar cuál es la URL canónica e indicarlo en las URLs que no lo son.

Para indicar esta “canonicalización” se deberá poner en el <HEAD> de todas las URLs duplicadas lo siguiente:

<link rel=”canonical” href=” http://www.zoiseo.es/20/09/2011/como-detectar-contenido-duplicado-sitio-web”>

El uso de canonicals también puede utilizarse entre dominios diferentes. Y es importante que las URLs duplicadas donde se ha puesto el elemento link rel=”canonical” estén perfectamente indexadas por los buscadores.

3. Páginas alternativas.

Antes de nada, es importante que sepáis que el mismo contenido en diferentes idiomas (es decir, traducciones en varios idiomas de un contenido en otra lengua), no se considera contenido duplicado.

Pero sí puede haber un problema de contenido duplicado con el mismo contenido en una única lengua pero en versiones geolocalizadas diferentes de un mismo sitio web. Me explico.

Imaginemos este blog www.zoiseo.es  que está escrito en castellano y geolocalizado para usuarios de habla española.

Supongamos que creo una versión en catalán www.zoiseo.es/cat/  y una versión en italiano www.zoiseo.es/it/

Como no me ha dado tiempo a traducirlo todo, la página www.megazoi.es/sobre-zoilo-andres la mantengo en castellano en el sitio en catalán www.megazoi.es/cat/sobre-zoilo-andres/ y en el sitio en italiano www.megazoi.es/it/sobre-zoilo-andres

Efectivamente, tengo un problema de contenido duplicado, que puedo solucionar con el elemento link rel=”alternate” hreflang=”[código del idioma]”, que se debe incluir en la URL canónica.

Con este elemento  indico que deseo que la versiones en catalán e italiano de esa página sean indexadas y posicionadas en los buscadores  para Cataluña e Italia, pero que son un contenido alternativo de esa página en la versión en castellano.

<link rel=”alternate” hreflang=”cat” href=http://www.zoiseo.es/sobre-zoilo-andres>
<link rel=”alternate” hreflang=”it” href=http://www.zoiseo.es/sobre-zoilo-andres>

4. Desindexación

Si por algún motivo, la redirección 301 o la canonicalización no es posible. Podemos cortar por lo sano y directamente impedir la indexación de las URLs duplicadas.

Antes debemos plantearnos muy bien si de verdad queremos desindexar esas URls. Puedes podría ser que tengan buenos rankings o un histórico interesante que convendría mejor transferir a otras páginas del sitio web, para lo cual habría que utilizar la redirección 301.

La desindexación puede realizarse a nivel de página con una etiqueta META en el <HEAD>:

  • Indicamos a los robots que no queremos que indexe la página, ni que tenga en cuenta los enlaces que haya en ella: <meta name=”robots” content=”noindex, nofollow”>
  • No indexamos la página pero sí permitimos que los robots sigan y tengan en cuenta sus enlaces: <meta name=”robots” content=”noindex, follow”>
  • Permitimos la indexación de la página, pero excluimos  a los robots de seguir los enlaces: <meta name=”robots” content=”index, nofollow”> à

A nivel del dominio utilizaremos el fichero robots.txt

User Agent: *
Disallow /

Con esta instrucción evitaremos que los robots entren e indexen todas las páginas del site.

 

User Agent: *
Disallow: /tag/

Podemos indicar directorios concretos cuyas páginas no queremos que sean indexadas, como en el ejemplo anterior.

¿Te ha parecido interesante este artículo? ¿Crees que podemos solucionar el contenido duplicado con otras técnicas? ¿Cuál es tu experiencia tratando este problema? Anímate a comentar y hacer tus preguntas.

¡Compártelo!