El contenido duplicado consiste en disponer en un sitio web de contenido ya publicado con anterioridad. En SEO hablamos de dos tipos de contenido duplicado, el contenido duplicado “in-site” y el contenido duplicado “inter-sites”.

El primero de ellos es aquel contenido que por problemas en el control de edición  del contenido o por errores del CMS o servidor se genera idénticamente más de una vez en el mismo site, alojándose en páginas o URL diferentes. Se trataría entonces del contenido de una página X alojado 1 o n veces en otras páginas diferentes.

Contenido duplicado “in-site”

 

Por otro lado el contenido duplicado “inter-sites” es aquel contenido idéntico en varios sitios web. Es en esencia contenido copiado, contenido sindicado o contenido extraído de bases de datos, publicado en varias páginas de sitios web diferentes. Con la herramienta Copyscape podemos detectar, dada una URL de nuestro site, otros sitios web donde han copiado su contenido.

Contenido duplicado “inter-sites”

 

En ambos casos el contenido duplicado es un factor que resta el posicionamiento de un sitio web. Siempre ha sido un factor SEO, pero recientemente ha cobrado más protagonismo en el algoritmo de Google con la última actualización de este buscador: El Google Panda Update.

Al contenido duplicado dentro del propio sitio web se le debe dar un correcto tratamiento SEO puesto que supone disponer de varias URL con el mismo contenido, y esto puede perjudicar el posicionamiento de nuestro site por varias razones, entre ellas:

–          Google encuentra varias URL con el mismo contenido y no sabe discernir cuál de esas URL debe posicionar mejor.

–          Gooogle no quiere “ensuciar” su índice con todas esas URLs.

–          Todas esas URL con el mismo contenido y las mismas palabras clave pueden llevar a pensar a Google que queremos engañarle para que nos posicione mejor porque tenemos varias páginas  sobre un mismo tema o keyword.

–          Esas páginas entran en competencia y canivalización dentro del propio site porque son diferentes URLs sobre la misma keyword.

El contenido duplicado “in-site” no solo se puede producir a nivel del propio contenido textual, también en títulos y meta etiquetas “meta description”, imágenes o vídeos.

En este post me gustaría explicaros algunas técnicas para identificar este contenido duplicado, para después darle un correcto tratamiento SEO.

 

PASO 1 para identificar Contenido Duplicado: Comando site

–          Dominio con y sin www.: Si a tu sitio web se puede acceder con el nombre del dominio por ejemplo http://www.zoiseo.es y http://zoiseo.es tienes un problema de contenido duplicado.

Con el comando site: en Google podemos ver si existen indexadas páginas de ambas versiones del site.

Acompañando este comando de –www podremos extraer las páginas indexadas sin el dominio con www.

 

El comando –www también nos mostrará subdominios del dominio principal. Es posible que en estos subdominios también podamos encontrar contenido duplicado.

 

–          Variables  o parámetros dinámicos en la URL: Los parámetros dinámicos en URL pueden ocasionar que algunos elementos de contenido de la página con un parámetro X sean idénticos (por tanto duplicados) en la misma página con parámetro Y

Podemos detectar si las URL con parámetros están indexadas por Google añadiendo al comando site: inurl:[nombre_del_parámetro]

 

 

–          Si sospechamos que un contenido concreto lo hemos duplicado podemos comprobar si está indexado en Google con site: y entre comillas poner un extracto del texto en cuestión

 

 

Tras esto podemos utilizar esta herramienta de WebConfs para ver el grado de duplicidad de contenido entre dos URL.

PASO 2 para detectar Contenido Duplicado: Google Webmaster Tools

–          Como indicaba antes, para Google los títulos y meta descripciones también son contenido duplicado. Por eso podemos echar mano de esta herramienta para detectar aquellas páginas con este problema.

 

Entrando en detalle podremos encontrar la causa de esta etiquetas duplicadas. En este caso se debe a un parámetro sobre la URL que Google indexa.

 

 

PASO 3 para detectar Contenido Duplicado: Xenu Link Sleuth

–          Esta herramienta que todo especialista SEO debería conocer rastrea un sitio web y nos proporciona, entre otros muchos datos,  información sobre posible URL con títulos duplicados.

Lo aconsejable es descargarse el informe de resultados a una hoja de Excel para poder trabajar mejor. En este caso vemos que existen enlaces a las urls con el parámetro “replytocom” por tanto este programita las rastrea y nos las presenta.

 

No obstante, esto no quiere decir que tengamos un problema de contenido duplicado, un vistazo a este parámetro a través del comando site: nos demuestra que Google no indexa estas URL. No todas las URL que presenta Xenu están indexadas por Google y por tanto suponen un problema de contenido duplicado

 

PASO 4 para detectar Contenido Duplicado: Google Analytics

–          Después de seleccionar un período bastante amplio de tiempo, nos proponemos ver las páginas de destino del site.

–          Después seleccionamos que deseamos mostrar el título de la página. Una vez hecho esto, ordenamos los títulos de las páginas alfabéticamente.

–          Incluimos una dimensión secundaria: La página de destino, para poder ver la URL a la que hace referencia cada título de página.

 

 

Dimensión secundaria: página de destino para obtener la URL

 

–          Mostramos el máximo posible de filas (500). Después nos vamos a la URL de Google Analytics y cambiamos el 500 de “explorer-table.rowCount%3D500%” por el número de filas que nos interese mostrar, por ejemplo 1000.

–          Ahora que tenemos un buen número de filas sobre las que trabajar, exportamos a una hoja de Excel CSV los datos para poder filtrar más cómodamente en Excel y detectar los títulos duplicados.

Espero que os hayan resultado útiles estos consejos. En este post explico las formas de tratamiento para solucionar el contenido duplicado.

 

 

¿Qué otras técnicas para detectar contenido duplicado utilizas? ¿Con qué problemas te enfrentas en la gestión del contenido duplicado del site? ¿Te animas a opinar?

Si te ha interesado este tema. Te propongo estos consejos para diseñar tu estrategia de contenidos web.

¡Compártelo!