Contenido duplicado: cómo detectarlo y evitarlo
Uno de los principios más importantes de la optimización de los motores de búsqueda es el contenido único. Con él, se asegura la mejor clasificación de una página web entre los resultados de búsqueda y hace que la experiencia del usuario sea más enriquecedora. Además, es la base de una estrategia de contenidos exitosa.
Lo contrario del contenido único se conoce como contenido duplicado. El término describe bloques de texto o sitios web completos que se duplican en varias URL. Evitar este tipo de contenido en favor del contenido único es importante para el éxito de la optimización de los motores de búsqueda. Es decir, el contenido duplicado afecta de forma negativa a la clasificación de una página web y a su usabilidad.
- Certificado SSL Wildcard
- Registro privado
- 1 cuenta de correo electrónico por contrato
¿Qué es el contenido duplicado?
El término contenido duplicado se refiere a las páginas web o pasajes de texto que están duplicados en más de una URL.
En general, se distinguen dos tipos:
- El contenido duplicado interno se refiere al contenido duplicado en un solo dominio.
- El contenido duplicado externo se encuentra en distintos dominios.
Ambos términos se refieren a páginas o bloques de texto que se comparten sin modificaciones. Cuando el contenido no es 100 % idéntico, pero sí muy parecido, se habla de contenido casi duplicado.
Ejemplos comunes de contenido duplicado
La mayoría de los gestores de páginas web conocen los efectos negativos del contenido duplicado y, por tanto, lo evitan. Sin embargo, el contenido duplicado interno es muy común. A menudo tiene causas técnicas. Puedes encontrar más información al respecto en la sección “Causas técnicas del contenido duplicado”.
A menudo, el mismo contenido puede encontrarse varias veces en varias subpáginas de un dominio. Las tiendas online, en particular, se enfrentan a este problema. Cuando un producto se asigna a varias categorías o está disponible en diferentes variaciones, la descripción del producto suele ser en gran medida la misma en varias páginas. Esto se considera contenido duplicado. A menudo, no se suele tener en cuenta a los PDF que contienen información sobre productos. Si su contenido coincide con el de la página de destino de un producto, se cuentan como contenido duplicado. Otro ejemplo es la declaración de la filosofía de una empresa que puede aparecer en varias subpáginas.
Las tiendas online también suelen verse afectadas por casos de contenido duplicado externo. Al comprar sus productos a un mayorista, es posible que otros minoristas utilicen las mismas descripciones de productos en sus páginas web. En este caso, un contenido idéntico no solo afecta negativamente a la clasificación en los motores de búsqueda, sino también a la decisión de compra de los clientes potenciales. Si la presentación de un producto no difiere entre los distribuidores, la decisión de compra se basa en el precio. Es mejor utilizar descripciones de producto únicas y comprobar regularmente si otros comerciantes las han copiado.
El contenido duplicado externo también se crea cuando se copian contenidos de terceros, incluso como parte de una colaboración y con el consentimiento del autor. Las versiones de tu página web en distintos países e idiomas a través de diferentes nombres de dominio también suponen un riesgo de contenido duplicado externo.
- Mejora tu posicionamiento en Google sin necesidad de una agencia
- Responde los comentarios y publica en redes sociales más rápido
- Sin necesidad de conocimientos de SEO o marketing online
¿Por qué es problemático el contenido duplicado?
Los motores de búsqueda como Google utilizan un algoritmo para evaluar todas las páginas web potencialmente relevantes y utilizan ciertos criterios para determinar el orden en que se muestran los resultados de la búsqueda. El objetivo de esta evaluación es presentar al usuario el contenido más relevante en la parte superior de la clasificación.
Si el mismo contenido aparece en varias páginas web, los motores de búsqueda no pueden hacer una evaluación adecuada. Esto complica la asignación de confianza, relevancia y reputación y, como resultado, también complica la creación de un ranking. Por lo tanto, los motores de búsqueda suelen evitar indexar el mismo contenido varias veces y mostrarlo en los resultados de búsqueda, ya que esto no ofrece ningún valor añadido para los usuarios. Por lo tanto, la clasificación de las páginas que contienen contenido duplicado caerá.
Debido a los efectos negativos del contenido duplicado, se deben evitar los llamados web scrapers. Este tipo de software copia los sitios web uno a uno. Un motor de búsqueda como Google puede reconocer los web scrapers en base a varios parámetros y los distingue de las páginas web “reales”.
Entre el 25 y el 35 por ciento del contenido de todos los sitios web es contenido duplicado. El contenido duplicado no es necesariamente algo malo. Este vídeo explica cómo trata Google el contenido duplicado y lo que hay que evitar a toda costa:
¿Cómo detectar el contenido duplicado?
Es aconsejable comprobar regularmente si una página web tiene contenido duplicado. En muchos casos ocurre sin que el administrador del sitio web lo sepa, por ejemplo, cuando se crean nuevas páginas o cuando los enlaces internos son incoherentes. A continuación, te mostraremos los métodos más comunes que puedes utilizar para localizar el contenido duplicado.
Comprueba manualmente tu sitio web
Si tu página web consta de un número limitado de subpáginas, es una buena idea comprobarlas manualmente. Presta especial atención a las secciones de texto que utilizas varias veces en tu página web. Normalmente se trata de presentaciones de la empresa o de CTA (llamadas a la acción).
¿Sospechas que un módulo de texto aparece más de una vez? En este caso, una búsqueda en Google puede ayudar. Introduce el texto entre comillas en el cuadro de búsqueda y comprueba si aparecen diferentes URL de tu página web en los resultados de la búsqueda.
En realidad, Google oculta los resultados de búsqueda duplicados para mostrar solo páginas relevantes a los usuarios. Si reinicias la búsqueda, los resultados previamente ocultos se mostrarán en el ranking.
Búsqueda de contenido duplicado mediante una herramienta de análisis
En el caso de un gran número de subpáginas o en el comercio electrónico, las búsquedas manuales requieren mucho tiempo. Dado que muchos administradores de sitios web se enfrentan a este problema, existen varias herramientas que buscan automáticamente el contenido duplicado.
Google Search Console es una herramienta de análisis útil y gratuita que ayuda a la optimización de los motores de búsqueda y a la búsqueda de contenido interno duplicado. Encuentra las palabras clave principales bajo las cuales posiciona tu sitio web. Después puedes filtrar las consultas exactas. Si la herramienta enumera varias subpáginas, comprueba si hay contenido duplicado en ellas. En el informe “Cobertura del índice”, en “Páginas excluidas”, puedes ver las subpáginas que han sido identificadas como duplicadas y, en consecuencia, excluidas.
Para descubrir el contenido duplicado externo necesitarás una herramienta de análisis como Copyscape o Siteliner. Simplemente introduce tu URL y las herramientas enumeran todas las páginas internas y externas en las que el contenido coincide con tu URL.
¿Cómo evitar el contenido duplicado?
Ahora ya sabes cómo detectar el contenido duplicado. Pero lo mejor es evitarlo desde el principio. Estos consejos deberían ayudarte:
- Crea subpáginas que se distingan claramente por su temática y utiliza diferentes palabras clave principales en cada página. La mejor manera de controlar las cosas es elaborar de antemano una estrategia de palabras clave.
- Evita colocar párrafos generalizados en varias subpáginas.
- Evita copiar textos preescritos (a menos que sea una cita obligada o un texto legal).
- Presta atención a la coherencia de los enlaces internos y evita diferentes entradas para la misma URL. Suelen crearse añadiendo index.htm a la URL de la página de inicio o a través de variantes con o sin la barra final (/).
- Utiliza dominios de primer nivel en las versiones de tu sitio web en varios idiomas y países, como por ejemplo https://www.ejemplo.com en contraposición a subdominios como https://www.ejemplo.org/en.
Por lo general, no puedes influir en la creación de contenido duplicado externo si otros webmasters copian tu contenido. Por lo tanto, es aconsejable iniciar el rastreo manualmente después de crear una nueva página. Si tu página web se indexa con el contenido respectivo como la primera página, se clasifica como la original.
Causas técnicas del contenido duplicado
Las causas técnicas a menudo conducen a la creación de contenido duplicado interno sin el conocimiento del administrador del sitio web. Es aconsejable comprobar su presencia en línea en los siguientes puntos:
Múltiples variantes de una dirección web
Cuando se cambia a HTTPS (Hypertext Transfer Protocol Secure) encriptado, es importante configurar el reenvío desde tu antigua dirección web. Si tu antiguo sitio web sigue siendo accesible a través de http://, se crea un contenido duplicado al 100%.
Asegúrate de comprobar si se puede acceder a tu sitio web utilizando diferentes caracteres. Algunos ejemplos típicos son:
- Tu página de inicio es accesible a través de index.php así como con y sin barra final
- Tu sitio web es accesible con y sin www como parte de la URL
- Tu URL distingue entre mayúsculas y minúsculas
Si detectas dos o más URL que conducen a la misma subpágina, configura una redirección 301 a la página principal para todas las variantes.
Otras medidas técnicas
- Si tu página web dispone de versiones en diferentes idiomas o países, márcalas con hreflang para evitar el contenido duplicado.
- Comprueba los parámetros de tu URL. A menudo se crean distintas URL únicas que dirigen al mismo contenido. Esta es una causa común de contenido duplicado, especialmente con las funciones de filtro en las tiendas online.
- Presta atención a las ID de sesión que forman parte de una URL. Con su uso, es posible que los rastreadores reciban un nuevo ID cada vez que acceden a una subpágina y, por tanto, llegar a una nueva URL.
- Excluye de la indexación las versiones para imprimir de los sitios web.
Cómo gestionar correctamente el contenido duplicado
La copia manipulada e intencionada de contenidos de terceros está prohibida por razones de derechos de autor y de acuerdo con las directrices de Google. Sin embargo, la aparición de contenido duplicado en línea es normal y no se castiga directamente. No obstante, es aconsejable evitar el contenido duplicado siempre que sea posible.
Cuando un sitio web contiene dos o más subpáginas con contenido similar o idéntico, puedes fusionar el contenido en una sola página o ampliar las respectivas subpáginas añadiendo contenido único y palabras clave individuales para optimizar su contenido SEO. La opción más adecuada depende de la relevancia de las páginas y de si existe la posibilidad de reforzar las palabras clave.
Elige palabras clave más potentes para los encabezamientos, la meta descripción y el meta título. Esto evita que se clasifiquen como contenido duplicado y mejora la clasificación en los motores de búsqueda. Para modificar los textos existentes y diferenciarlos, utiliza viñetas, listas y tablas, o integra imágenes y vídeos.
Los motores de búsqueda pueden detectar los elementos que se repiten en los pies de página o los encabezados y no los consideran contenido duplicado. En este caso, no es necesario crear un contenido diferente para cada subpágina.
Si deseas compartir un contenido existente, por ejemplo, un artículo del blog o una nota de prensa en otras páginas, utiliza este canonical tag rel="canonical" en la cabecera. Al hacerlo, estás designando la URL seleccionada como el recurso estándar o la URL original. La etiqueta es invisible para los usuarios y sigue dejando claro a los motores de búsqueda cómo se vinculan las páginas entre sí.
El contenido duplicado es solo un aspecto de la optimización de los motores de búsqueda. El IONOS rankingCoach optimiza tu sitio web paso a paso con la ayuda de útiles videotutoriales.