Uno de los principales problemas que puede tener un sitio web es el de Contenido Duplicado. Google ha manifestedo varias veces que no existe una “penalización” por contenido duplicado, sin embargo, en la optimización de un sitio web es recomendable evitar este problema.
Básicamente, contenido duplicado quiere decir que se le presenta a Google 2 o más páginas que contienen la misma información, o muy similar.
Google siempre va a tratar de indexar contenido único, con la finalidad de mostrar varios resultados que sean relevantes para una búsqueda (y tiene sentido, pues Google rara vez muestra la misma información para una misma búsqueda).
Si el contenido duplicado se encuentra en dominios diferentes, Google podrá filtrar los resultados, y mostrar un único resultado dependiendo algunos factores, entre los que se pueden considerar:
Una vez Google aplique el filtro, seleccionará la página que considere tenga el contenido original, y las demás no las mostrará.
Los problemas de contenido duplicado no se aplican únicamente para contenido en dominios diferentes, es posible contar con problemas de este tipo en nuestro propio sitio web.
Una forma de verificar, e identificar problemas de contenido duplicado dentro de nuestro propio sitio web es a través del comando site: de Google. Al ejecutar una consulta en Google con este comando, podremos ver la cantidad de páginas indexadas de Google sobre nuestro sitio.
Voy a tomar como ejemplo la página web de Snickers Latinoamerica, al ejecutar el comando site:snickersla.com en Google, obtenemos los siguientes resultados:

Se puede ver como claramente Google retorna resultados que son bastante similares. Google indexará estas páginas de todas formas, pero es poco probable que empiecen a posicionarse, pues básicamente se le está diciendo a Google que todas las páginas que ha indecado de Snickers tratan de “Deportes Extremos y Cultura Urbana“, a pesar de que seguramente el sitio web tendrá mucho más contenido que mostrar aparte de Deportes Extremos, o Cultura Urbana.
De esta forma se ve cómo, gracias al comando link: de Google, se puede diagnosticar rápidamente problemas que pueda tener un sitio web, como lo es la generación de contenido duplicado.
Otro caso tÃpico donde se pueden presentar problemas de contenido duplicado es en un blog, y en el uso excesivo de etiquetas.
Las etiquetas funcionan muy bien para posicionar palabras del “long tail”, pero aveces estas etiquetas también generan contenido duplicado, pues se está generando varias páginas totalmente idénticas con el mismo contenido (en caso que una etiqueta se use pocas veces, o incluso una única vez).
Por ejemplo, al crear este artÃculo, se pueden agragar las etiquetas “contenido duplicado” y “problemas contenido duplicado”, lo cual generarÃa las URLs:
Las cuales tendrÃan básicamente la misma información. Google puede ver esto como contenido duplicado, y filtrar alguna de las dos en las páginas de resultados de los motores de búsqueda.