martes, enero 08, 2008

Visita del Robot BaiDuSpider

Hace un par de días que un robot denominado "BaiDuSpider" visitó una de nuestras webs.

He buscado información sobre el robot BaiDuSpider, ya que me quedaba la duda razonable de si, como correspondería con su nombre, sería el robot de indexación del famoso buscador chino BAIDU. Aunque las estadísticas de visitas no han sido exageradas, (14 hits para su primera visita), me gusta controlar el uso y abuso que hacen del contenido de la web los robots "desconocidos" o poco habituales, que en general dan muy pocos resultados.

Por si os interesa, la gente de BAIDU.com dice que su robot cumple las exclusiones, cuando se realizan normalmente mediante el fichero robots.txt . Como lo dice exclusivamente en Chino, os recomiendo utilizar el traductor Babel Fish de Yahoo (Chino simplificado a Inglés).

He comprobado que, a pesar de la visita, aun no aparece referencia alguna de nuestra página en Baidu.com ; como es posible que necesite más tiempo para mostrar la información tomada de nuestra web, le daré un tiempo antes de decidir bloquearlo.

3 comentarios:

Canaro dijo...

Hola muy interesante tu blog mis felicitaciones ya que estoy aprendiendo mucho de ti y otros jejeje una pregunta por que quieres anular al robot? perdona si te parece simple la pregunta pero estoy empezando en este mundo y aprendo poco a poco , sin mas agradecerte tu tiempo y tu blog.Me gustaria ponerte en mi blogroll si me lo permites

menorca dijo...

yo acabo de cerrarle la entrada a mi web a ese robot de mierda consume mucho para no indexar nada de nada de nada en un dia se metian mas de 20 robor baiduspider y accedi a su web i no salia ni por un tubo que graciosos ( cerrado mi web a baiduspider y que se vallan a por setas chinas )

Fernando X dijo...

Puro consumo de ancho de Banda de los robots chinos, algunos como BADU que se identifica es posible bloquearlos pero hay otros que no encuentro como y tengo miles de scans diarios y ademas aparecen en intentos de abrir paginas que no existen como phpadmin paginas con login como que rastrean y buscan paginas de acceso al servidor,
Como bien dice uno por ahi son los ZETAS chinos que mafia porfavor alguien que explique como acabar con eso