Keegy y wikio. ¿Cómo han crecido?. Plagiando.
Febrero 10th, 2008
Keegy ha lanzado una nueva versión de su portal. He de decir que ha sido un cambio muy acertado, pues deja atrás todas aquellas tácticas de dudosa ética que hicieron crecer al sitio. Si no tuviera tapujos diría que ahora es como Wikio pero menos “sucio”…
Y es que Keegy era lo que comunmente se podía denominar un plagiador republicador de contenido. Su sistema era sencillo, duplicaba el contenido de blogs, y debido a su alta actualización, podía incluso aparecer como el contenido original, es decir, los indexadores de contenido de los buscadores visitaban con mayor frecuencia su portal que la mayoría de los blogs, puesto que actualizaba más frecuentemente (actualizaba cada vez que uno de los blogs que tenía en el sistema lo hacía). Entonces era probable y habitual que cuando alguien creaba contenido original en su blog, fuera plagiado republicado y los buscadores, por ejemplo Google, pensaran que el blog plagiaba de Keegy, penalizándole en las búsquedas.
Esto se podía haber evitado citando y poniendo un link al autor. Se hacía, pero con “trampa”. Es cierto que te ponía el nombre del autor, y un enlace al contenido original. De cara a la galería y a los autores ya cumplía. Sin embargo, ¿de cara al buscador cómo se comportaba?:
Los enlaces no eran directos, si no a través de un script llamado out.php, es decir, no enlazaban a la página con el contenido original, si no a una página de Keegy que a su vez redireccionaba a la del contenido original. De cara al buscador NO existía enlace al contenido saliente, y si alguno osaba dudarlo para eso los bloqueaba el archivo robots.txt (que todavía sigue intacto en este momento a pesar del cambio de página), tal que así:
User-agent: Googlebot
Disallow: /*/?rss=1
Disallow: /*/?modo=rss
Disallow: /*/out
Disallow: /*/header.phpUser-agent: IRLbot
Disallow: /User-agent: Slurp
Crawl-delay: 60
Disallow: /*/?rss=1
Disallow: /*/?modo=rss
Disallow: /*/out
Disallow: /*/header.phpSitemap: http://www.keegy.com/sitemap_index.xml
¿Cual era la consecuencia de estas tácticas?
Que cuando alguien buscaba algo relacionado con la entrada del blog pues buscadores como Google ponían la entrada de Keegy que había plagiado republicado, con sus respectivos banners y la trampa del enlace saliente. Por ejemplo, alguien hablaba de las fiesta de su pueblo de 12 habitantes, la información era plagiada republicada al momento en Keegy, Google indexa antes a Keegy con la información plagiada republicada que al blog original. Un usuario busca información de las fiestas de ese pueblo y aparece la página de Keegy y el blog original queda relegado a un segundo plano, o incluso, no aparecía directamente en la página de búsqueda.
¿Que opción te daba Keegy si no querías sufrir esto en tu blog?
En la información aparecida al final de la página, bajo el enlace Webmaster, te daba la opción de añadir una entrada a tu robots.txt para evitar que fueras plagiado:
Eliminar su sitio como fuente de Keegy.com
Si desea excluir su feed como fuente de información de Keegy.com puede colocar un archivo en el directorio raíz de su servidor llamado robots.txt. Para evitar que el robot de Keegy.com explore su sitio, coloque el siguiente texto dentro de un archivo robots.txt en el directorio raíz de su servidor:
User-Agent: KeegyBot
Disallow: /
…
Además, si desea configurar la frecuencia con la que el KeegyBot debe revisar su sitio para verificar si hubo actualizaciones, puede incluir el siguiente código en su archivo robots.txt (el ejemplo detalla una frecuencia de 2 horas):
User-Agent: KeegyBotRequest-rate: 2
Espero que en la nueva versión funcione y le den a la posibilidad al usuario de elegir y poder, al menos, usar eso para evitarlo. Pero hasta el momento NO funciona. Básicamente se pasa el robots.txt por el arco del triunfo, tampoco obedece al “Request-Rate” que indica en las instrucciones ni mandarle un email pidiendo que elimine la fuente de tu blog.
Conclusión:
Doy la enhorabuena a Keegy por haber abandonado esa táctica. No cuesta poner un enlace directo al contenido original o dejar elegir al dueño del blog si quiere que su información sea penalizada en los buscadores a favor de lo que era Keegy.
¿Y que hay sobre Wikio?
Wikio hace prácticamente lo mismo, no enlaza directamente si no a través de un script: http://www.wikio.es/webinfo?id=xxxxxx .
Dirección que es bloqueada también a los indexadores de información de los buscadores:
User-agent: *
Disallow: /thirdparty
Disallow: /webinfo
…
Wikio asegura que los editores pueden enviar un correo para pedir la eliminación o modificación (previa confirmación de la entidad) sobre la “republicación” de sus blogs. Algo escondido pero al menos viene:
El responsable del sitio sólo debe enviar un correo electronico a editeur@wikio.com con sus datos. Un documentalista volverá a contactarle cuanto antes para validar su identidad y hacer las modificaciones deseadas.
No lo he probado, espero que funcione.
Actualización: Me ha funcionado, aunque a la segunda petición por correo. En la primera debió de haber un fallo en su “sistema” y no metieron bien la orden de borrar (o eso me han dicho). Al menos funciona.
Disclaimer: Me baso en la experiencia de un blog diferente a este.
Yo tengo un blog y “existo” gracias a Keegy y Wikio, dado que gran parte del trafico me lo envian ellos. Yo estoy MAS que contento con estos agregadores. Esto que pones tu es como decir que Google hace plagio.