Curated by: Luigi Canali De Rossi
 


14 July 2008

Contenido Duplicado Online: Problemas Y Soluciones

Contenido Duplicado: ¿es un asunto que debería preocuparte? Ya sea que estés en la situación de los que publican contenido que luego es duplicado en otros sitios o que republiques contenido de colaboradores, es importante entender cuáles son las cuestiones reales y los problemas que el contenido duplicado puede generar y separarlos de los mitos y la fácil especulación.

Robin-Good-duplicate-content-issues-480.jpg
Mira, más abajo en este artículo, el video de Robin Good sobre contenido duplicado

Me sentí motivado a escribir esta nota pues fui amablemente involucrado en una conversación vía correo electrónico en la que un webmaster se quejaba de que su contenido era replicado en otro sitio, especialmente porque Google había ubicado al contenido duplicado por encima del original en los resultados de búsqueda.

En apariencia, parecería que el autor original tiene todos los derechos de quejarse e invitar al "reeditor" a suspender dicha práctica y ponerse a escribir sus propios artículos.

Pero este tema a veces, especialmente cuando se mira un poco más en profundidad, es mucho más sutil y complejo.

 


Robin Good sobre contenido duplicado

 

Factores Clave De La Duplicación De Contenido

Es muy diferente si el sitio replicador/duplicador otorga el crédito completo al autor original y al sitio no sólo citando el texto sino específicamente colocando un enlace al sitio original. Un enlace claramente visible con crédito al contenido original, que incluye tanto el nombre del sitio, el autor y el título del artículo original (con un enlace a el) es lo mínimo que debería proporcionar un editor online por sindicar o republicar el contenido de otro autor.

El segundo factor relevante que puede dar vuelta esta situación es si el sitio que duplica el contenido le agrega "valor extra" ya sea mediante una introducción, enlaces y referencias adicionales, contenido relacionado y novedades del mismo tema, ilustraciones relevantes y más contenido que puede resultar útil al lector final.

El tercer elemento clave es el permiso. Si te tomas tres minutos para escribir un email pidiendo permiso para republicar un artículo y explicas claramente lo que intentas hacer con el, estás definitivamente en el camino seguro y ético. (Jamás escuché a alguien quejarse de contenido duplicado si lo había autorizado.)

A favor de la replicación de contenido en otros sitios, puedo decir que si se lo hace éticamente (siguiendo los tres puntos arriba mencionados) y también ampliando las formas en que otras personas pueden llegar a el (usando un título diferente y contenido introductorio) puede ser una forma muy positiva y natural de propagar nuevas ideas e información valiosa.

En el otro extremo tenemos sitios que republican en forma totalmente superficial, tomando contenido de escaso valor de cientos de dominios, con el único objetivo de poder monetizar ese contenido cuyo costo para ellos fue cero (es el caso de los que levantan artículos ya listos de los directorios de artículos) o también tenemos el caso de los pequeños editores online que desean obtener rápida tracción y visibilidad en los buscadores y propagan su contenido de baja calidad en esos mismos directorios con la esperanza de conseguir muchos enlaces de los sitios que republican gratis ese contenido.

Pero esta es solo mi opinión.




El Contenido Duplicado Según Google

Esto es lo que Google oficialmente tiene para decir al respecto:

"Contenido Duplicado generalmente se refiere a considerables bloques de contenido dentro del o en distintos dominios que coinciden completamente con otros contenidos o son muy similares. En la mayoría de los casos, no es de origen engañoso.

Algunos ejemplos de contenido duplicado no malintencionado podrían incluir:

Foros de Discusión que pueden generar tanto páginas regulares como reducidas al mínimo para dispositivos móviles.

Productos mostrados o enlazados vía múltiples y distintas URLs.

Versiones sólo imprimibles de páginas web.

Sin embargo, en algunos casos, un contenido es deliberadamente duplicado en varios dominios en un intento por manipular el posicionamiento en los buscadores o para ganar más tráfico. Este tipo de prácticas engañosas pueden resultar en una pobre experiencia para el usuario, cuando este encuentra el mismo contenido repetido en un grupo de resultados de búsqueda.

Google se esmera por indexar y mostrar páginas con información distinta.

En los raros casos en los que Google percibe que el contenido duplicado podría tener la intención de manipular nuestro posicionamiento y engañar a nuestros usuarios, haremos también los ajustes adecuados en la indexación y clasificación de los sitios involucrados.

Como resultado, el posicionamiento de dicho sitio podría sufrir, o ser removido enteramente del index de Google, en cuyo caso no aparecerá mas en los resultados de búsqueda."

Los usuarios de Google en general quieren ver una muestra de contenido único cuando realizan búsquedas. En contraste, están comprensiblemente molestos cuando ven sustancialmente el mismo contenido dentro de un conjunto de resultados de la búsqueda.

"Sin embargo, preferimos concentrarnos en filtrar en vez de hacer ajustes de posicionamiento ... por eso, en la vasta mayoría de casos, lo peor que le puede ocurrir a un webmaster es ver que mostramos en nuestro index la versión "menos deseada" de una página."

(Fuente: Google Webmaster Central)

"Google se esmera por indexar y mostrar páginas con información diferente. [Generalmente filtramos y descartamos los duplicados y] elegimos uno de ellos para listar.

En los raros casos en los que Google percibe que el contenido duplicado podría tener la intención de manipular nuestro posicionamiento y engañar a nuestros usuarios, haremos también los ajustes adecuados en la indexación y clasificación de los sitios involucrados."

(Fuente: Google Webmaster Central)




Contenido Duplicado Y Quien Se Clasifica Primero: ¿Dónde Está El Problema Realmente?

Ahora, presta atención a esto:

La mayoría de los problemas sobre los que Google actúa cuando se trata de contenido duplicado son actualmente causados por contenido duplicado en tu propio sitio y no por otra persona que republica tu contenido en otro lado.

En realidad, permíteme hacer de esto un nuevo axioma:

Si otro sitio republica parte de tu contenido y este se posiciona mejor en las páginas de resultados de Google, DEFINITIVAMENTE tienes un problema que resolver en TU sitio. (y el problema NO es ir y gritar o amenazar a la persona que republicó tu contenido, sino que debes despertar y ser lo suficientemente curioso para ver el motivo por el cual tu sitio es tan malo que hasta Google prefiere el duplicado al tuyo.)




Entonces Cuando Otro Sitio Republica Tu Contenido ¿Deberías Enojarte O No?

Hasta donde puedo comprobar con mi experiencia cotidiana de administrar unos pocos sitios web, la única preocupación de Google es servir contenido de alta calidad, contenido pertinente que coincide perfectamente con la pregunta formulada. Si otro sitio, que está utilizando algunos de tus contenidos se ubica antes que el tuyo, mira bien dentro de tu sitio antes alguien de culpar a otro que republica tu contenido.

También pienso que tienes todo el derecho a escribirles a los duplicadores y quejarte si no te contactaron antes de republicar tu contenido (siempre asumiendo que tu contenido no está bajo una licencia de redistribución como Creative Commons, en cuyo caso no es necesario que te contacten).

Pero en muchos casos, el duplicador o reeditor (y aquí excluyo a todos los republicadores automáticos y a los sitios spam que claramente están robando contenido para su único beneficio económico) no sólo esta sacando provecho de tu contenido, sino que también están extendiendo y apoyando tus campañas e ideas, a la vez que añade valor al enlazar tu sitio, al mismo tiempo que es transparente en lo que concierne al origen y propiedad del contenido que usa.

En todos estos casos, no sería correcto que te quejaras o restringieras su actividad, dado que esa persona está realmente extendiendo y contribuyendo positivamente a tus esfuerzos de comunicación.

El hecho de que el sitio que duplica tu contenido pueda posicionarse mejor en los resultados de búsqueda no debería impedirte mejorar tu contenido, actualizarlo, a la vez de reducir la cantidad de contenido innecesario y auto promocional que podría estar "duplicando" en tus propias páginas.

Permíteme explicarlo mejor.




Y ¿Quién Debería Aparecer Primero En Las SERPs?

En esta historia del intercambio por email en la que me vi involucrado, el autor original se quejaba de que su contenido original era opacado en las páginas de resultados de los buscadores debido a la mayor relevancia del contenido "copiado" y republicado por otro sitio.

Exploré ambos sitios y mirando más allá de la superficie el contenido que aparecía en ambos sitios ¿qué encontré? La página original indexada por Google tenía unos 60 KB de contenido pero casi el 50% no formaba parte realmente del contenido del artículo. Sólo estaba lleno de enlaces hacia otros artículos del mismo autor que ocupaban más espacio que el contenido real del artículo.

Por otro lado estaba el sitio del "duplicador" quien, no sólo había escrito una buena introducción, llena de enlaces adicionales y recursos relacionados, créditos claros y enlaces al original, sino que también había reunido varios artículos de ese autor para profundizar el análisis del tema y hacerlo más comprensible. Además, el contenido del "duplicador", tal cual fue indexado por Google era tres veces más grande que el original y si uno se fijaba con atención, el contenido relevante dominaba la página, ocupando la navegación, la publicidad y otras informaciones, sólo una parte marginal del espacio disponible.

Ese el motivo por el cual Google, no obstante conocer bien quien escribió el contenido primero y donde se originó (dado que el sitio que lo duplicaba no lo ocultaba pues lo enlazaba y le otorgaba el crédito extensamente), prefiere mostrar primero en los resultados de búsqueda al artículo "replicado".

En pocas palabras, tel sitio reproductor está haciendo, desde todo punto de vista, un mejor trabajo extendiendo el valor del contenido original creado por el otro sitio, a la vez que lo enlaza y le da todo el crédito.

El sitio originario se lamenta de su incapacidad para mantener un posicionamiento alto pero no tiene humildad para examinar el valor del contenido que sirve y mejorarlo, actualizarlo de forma tal que sea más valioso que cualquier otro contenido publicado sobre el tema. El sitio originario corre el riesgo de enajenar tan importantes puntos de "enlace" al quejarse de sus esfuerzos y la cortesía de enlazarlo y en enfocarse demasiado en aferrase a una visibilidad inmerecida y olvidarse de mejorar y servir a los mejores intereses del usuario.

Sólo en un frente falló el sitio "replicador". Al asumir demasiado tácitamente el sitio "replicador" se tomo demasiado permiso para hacer cosas sin siquiera tener la amabilidad de solicitar autorización para utilizar el contenido que consideraba relevante.

La moraleja de la historia para el tipo de sitio que utiliza contenido duplicado: A menos que veas un texto que dice sin sombra de dudas: "Adelante, copia mi contenido en tu sitio..." (lo que no es raro de encontrar - para un buen ejemplo fíjate al pie de esta página) es SIEMPRE tu obligación tomarte el tiempo necesario para contactar al autor de todo contenido original que quieras republicar y pedir permiso para republicarlo en tu sitio. Punto.




El Consejo de Google

Hay algunos pasos que puedes implementar para tratar proactivamente los problemas relacionados con los contenidos duplicados y asegurarte de que los visitantes ven el contenido que tu quieres que vean (Recuerda que Google piensa MAS en términos de contenido duplicado en TU PROPIO sitio en vez de en otros, dado que Google puede manejar esos otros muy bien por sí mismo).

  • El contenido duplicado en un sitio no es motivo de acción en ese sitio ia menos que aparezca que la intención del contenido duplicado es engañar y manipular los resultados de la búsqueda. Si tu sitio tiene problemas de contenido duplicado y no sigues los consejos presentados arriba, nosotros hacemos un buen trabajo al seleccionar una versión del contenido para mostrar en los resultados de búsqueda.

    Sin embargo, si nuestra revisión indica que has participado en prácticas engañosas y tu sitio ha sido retirado de nuestros resultados de búsqueda, revisa tu sitio cuidadosamente. Si tu sitio fue quitado de nuestros resultados, revisa la guía para webmaster para obtener más información. Una vez que hayas hecho los cambios y estés seguro de que tu sitio ya no viola nuestras directivas, presenta tu sitio para reconsiderarlo.

  • No te aflijas demasiado por los sitios que emplean scraping (se apropian indebidamente y republican) tu contenido. Aunque es molesto, es altamente improbable que ese tipo de sitios puedan impactar negativamente la presencia del tuyo en Google. Si divisas un caso que es particularmente frustrante, es aconsejable que presentes una solicitud DMCA (Digital Millennium Copyright Act) para reclamar la propiedad del contenido y dejar que nosotros nos encarguemos del sitio pícaro
  • Si encuentras otro sitio que duplica tu contenido mediante scraping (se apropian indebidamente y republican) es altamente improbable que impacte negativamente el posicionamiento del tuyo en las páginas de resultados de Google. Si divisas un caso que es particularmente frustrante, es aconsejable que presentes una solicitud DMCA para reclamar la propiedad del contenido y pedir que el otro sitio sea retirado del index de Google.
  • Aún así, entiende que nosotros siempre mostraremos la (desbloqueada) versión que pensamos es más apropiada para los usuarios en cada búsqueda, que puede o puede no ser la versión que tu prefieres.
  • Sindica cuidadosamente: Si sindicas tu contenido en otros sitios, Google siempre mostrará la versión que creemos que es más apropiada para los usuarios en cada búsqueda, que podría ser o no la versión que tu prefieres. Sin embargo, es útil asegurase que cada sitio en el que tu contenido es sindicado, incluya un enlace al artículo original. También puedes pedirles a los sitios que usan tu contenido sindicado que bloqueen la versión en sus sitios mediante el archivo robot.txt.
  • Y luego mira bien dentro de tu propio sitio:

  • Minimiza la repetición de textos estándares: Por ejemplo, en vez de incluir un largo texto sobre derechos de autor al pie de cada página, incluye una breve nota con un enlace a una página con más detalles.
  • Minimiza el contenido similar: Si tienes muchas páginas similares, considera la posibilidad de expandirlas o consolidarlas en una sola. Por ejemplo, si tienes un sitio de viajes con páginas separadas para dos ciudades pero la misma información en ambas páginas, deberías considerar juntarlas en una sola página o podrías expandir cada página con contenido único para cada ciudad.
  • Considera bloquear páginas para que no sean indexadas: En vez de dejar que los algoritmos de Google determinen la "mejor" versión de un documento, podrías guiarnos a tu versión preferida. Por ejemplo, si no quieres que indexemos la versión para imprimir de los artículos en tu sitio, deshabilita esos directorios o haz uso de las expresiones regulares en tu archivo robot.txt.
  • Usa redireccionamientos 301: Si haz reestructurado tu sitio, utiliza redireccionamientos 301 ("Redireccionamiento Permanente") en tu archivo .htaccess para redireccionar inteligentemente a tu usuarios, al Googlebot y otros robots buscadores. (En Apache, puedes hacerlo con un archivo .htaccess; in IIS, puedes hacerlo mediante la consola administrativa.)
  • Se consistente: Trata de mantener tu sistema de enlace interno consistente. Por ejemplo, no enlaces a http://www.example.com/page/ y a http://www.example.com/page y a http://www.example.com/page/index.htm.
  • Usa dominios de nivel superior: Para ayudarnos a servir la versión más apropiada de un documento, usa dominios de nivel superior (top-level domains) donde sea posible manejar contenido específico de un país. Es más probable que sepamos que www.example.de contiene contenido relacionado con Alemania, por ejemplo, que www.example.com/de ó de.example.com
  • Usa Webmaster Tools para decirnos cómo prefieres que indexemos tu sitio: Puedes decirle a Google tu dominio preferido (por ejemplo, www.example.com ó http://example.com).
  • Evita las publicaciones truncas: A los usuarios no les gusta ver páginas "vacías", por eso evita los textos de relleno en la medida de lo posible. Por ejemplo, no publiques páginas para las cuales no tienes todavía contenido real. Si creas páginas con texto de relleno (placeholder) usa el archivo robots.txt para bloquearlas.
  • Entiende tu sistema de gestión de contenidos (CMS): Asegúrate de familiarizarte con la forma en que el contenido se muestra en tu sitio. Blogs, foros y sistemas relacionados a menudo muestran el mismo contenido en múltiples formatos. Por ejemplo, una entrada de blog puede aparecer en la home de ese blog, en la página archivo, y en una página de otras entradas con la misma etiqueta.

(Fuentes: Google Advice on Duplicate Content

Google Webmaster Central

Google Duplicate Content Guidelines article)




Pero desafortunadamente Google no contesta realmente oficialmente las preguntas más difíciles y candentes que muchos editores tienen en este tema. Aquí hay un par que claramente no fueron contestadas en el blog Google Webmaster Central sobre Contenido Duplicado:

Kristen Veraldi comentó... (5 Febrero, 2008)

"Gracias Susan,

No podría estar más de acuerdo contigo - en el mundo del contenido SE TRATA de agregar valor de forma oportuna y pertinente desde una perspectiva propia, única y honesta.

Sin embargo, para aquellos que comprenden esto y que regularmente siguen ese mantra para construir sus bases, ¿crees que agregar a la ecuación contenido genérico proveniente de terceros (digamos un 25% del tiempo, por ejemplo) podría empañar la reputación del sitio?

¿Qué pasaría si ese contenido de terceros no se originó inicialmente en ese sitio (no hay un enlace al original, solo el mismo contenido en otros 100 sitios (¿cuál es el primero?)) y se proporcionó exclusivamente para ser ampliamente distribuido y re utilizado por alguna clase de generador de contenidos específicos?.

¿Qué pasa si esos artículos sí agregan valor a tu esfera local (es decir, la gente que no estás necesariamente tratando de conectar mediante la búsqueda, sino los que ya te siguen)?

Creo que lo que pregunto es - si no te importa optimizar ese contenido genérico y el valor es más intrínseco, puedes ofrecerlo y todavía sentirte relativamente tranquilo que no perjudicará el contenido original en las búsquedas (¡dado que naturalmente nos interesa alguna indexación!).

Esta es una situación muy común, por eso pregunto a todos los que tienen sitios de plantillas si están expuestos.

Si este fuera un motivo de preocupación, ¿podría atenuarse utilizando etiquetas no follow en las páginas que tienen esos contenidos?

Me imagino que estas preguntas son prácticamente imposibles de contestar en forma definitiva, pero cualquier cosa que pueda agregar será apreciada. ¡Gracias!""

o
adwords escribió (2 de Marzo, 2008):

"Tengo un directorio de artículos que es efectivamente 100% contenido duplicado (More Than Articles). Poco después de comenzar noté una declinación en el tráfico y encontré que todas mis páginas estaban en el index suplementario. Suministro los artículos formateados en HTML y en texto, así como la versión estándar. Entonces básicamente cada artículo aparece 3 veces con variaciones mínimas.

He rearmado la navegación y el archive robot.txt para excluir todas excepto la versión estándar del index. Esto hizo que todas las páginas volvieran al index principal y gradualmente se incrementó el tráfico.

A partir de esa experiencia llego a la conclusión que el duplicado dentro del mismo dominio es mucho más importante que la duplicación entre diferentes dominios"

Por eso, a falta de algunas respuestas oficiales, aquí está mi consejo definitivo sobre contenido duplicado:




El Consedo de Robin Good:



Para los que republican contenido de otros:

  1. Pide permiso primero: siempre
  2. Agrega Valor - Como mínimo: Agrega una introducción y un título diferente
  3. Agrega Valor - En el mejor de los casos: Extiende, suministra más valor; ofreciendo contenido relacionado, imágenes, tu propio comentario y cualquier otro componente de información que suministre un mayor valor al lector final que busca información en el tema.
  4. Atribuye el crédito en forma completa: independientemente de las normas y requerimientos que encuentres sobre la forma correcta de enlazar el artículo original que republicaste completo en tu sitio:

    a) Atribuye el mérito del autor y pone un enlace a su nombre y a su biografía/perfil online si está disponible.

    b) Reconoce el sitio del autor, con su nombre y un enlace

    c) Referencia el título original del artículo, fecha de publicación y un enlace al mismo

  5. Menciona la licencia original cuando sea posible: No hagas que el autor original piense o asumir en modo alguno que estás aplicando tus liberales licencias, Creative Commons o Dominio Público a su contenido protegido por derechos de autor. No tienes derecho a hacerlo y él tiene todo el derecho a enojarse.



.... y para aquellos cuyo contenido es republicado por otros:

  1. Déjalo ir. Mantener el contenido solo en tu sitio no es en general en tu beneficio. Si hay otros sitios que honestamente quieren extender tu contenido al mismo tiempo que proveen valor adicional, déjalos hacerlo
  2. Reconoce el valor y la contribución que hacen estos otros sitios a extender la visibilidad y el alcance de tu contenido, ideas y autoría a una audiencia mayor; especialmente cuando tales sitios lo hacen de forma justa y transparente otorgándote el crédito, el reconocimiento y una referencia al contenido original.
  3. No te enojes automáticamente si un sitio que usa alguno de tus contenidos obtiene una mejor posición en los resultados de una búsqueda en Google. No los culpes. Examina tu propio sitio y ve como mejorar el valor de lo que le das a tus lectores, de forma de no tener competencia en ese frente con los otros sitios. Si Google ubica a otro sitio encima del tuyo, casi nunca es un error
  4. En todo caso, haz que tu contenido sea más fácilmente compartido y republicado en otros sitios via alimentadores RSS, widgets y licencias abiertas que claramente muestren que estás a favor de dejar ir al contenido siempre y cuando te otorguen el debido crédito y enlace.



Si el contenido es republicado con permiso, al agregar valor, cambiar el título, agregar una introducción y otorgándole el crédito a la fuente original, pienso que tanto el autor original como el sitio que republica se benefician enormemente. Mas personas leerán el contenido, más personas conocerán al sitio y autor original y su mensaje será recogido por un grupo mucho mayor de gente gracias al servicio gratuito de distribución adicional que los buscadores darán a las copias adicionales que provean valor complementario al original.

 

Originalmente escrito por y publicado por primera vez en MasterNewMedia.

 

Robin Good -
Referencia: Master New Media [ Seguir leyendo ]
Si te gustó la nota puedes recibir actualizaciones suscribiéndote via RSS o via email.

O compartirla:
 
 
 
 
Comentar    
blog comments powered by Disqus
 


 

 

 

 

Creative Commons License
This work is licensed under a Creative Commons License.

 

13883


Curated by

Publisher MasterNewMedia.org - New media explorer - Communication designer
Web Analytics