Encuentro muy interesante el conocido como efecto Sandbox de Google pues entiendo viene a ser la evidencia de un cambio en el comportamiento del buscador Google.
Sergio del blog Guía Buscadores sigue erre que erre (se lo agradecemos mucho) escribiendo una serie de interesantes artículos sobre el efecto Sandbox de Google:
En el post Sandbox IV Sergio habla de una penalización dividida en dos fases. En Les pénalités infligées par Google de Jean Luc Halleux (webmaster de http://www.annuaire-info.com/) y en la discusión del artículo en el foro de Webraninfo (también en francés). Jean-Luc Halleux habla de cuatro tipos de penalizaciones diferentes por parte de Google a los webmasters :
He encontrado unas buenas FAQ en inglés Google Sandbox Frequently Asked Questions. También podemos recordar las FAQ de Xeoweb:
Personalmente lo único que puedo aportar, además de un montón de divagaciones, es la experiencia (totalmente por casualidad, sonó la flauta) de haber sacado un sitio web que se encontraba bien posicionado gracias a técnicas de esas de al borde del abismo de una importante penalización de Google que duró unos quince días tras eliminar miles de enlaces que se encontraban en los pies de las páginas de otros dominios.
Como parece que pueda tener algo que ver con enlaces, The Effect of New Links on Google PageRank es un artículo del instituto francés INRIA (Instituto Nacional de Investigación en Informática y Automática de investigaciones) que elucubra hasta que punto puede ser bueno o malo que una web reciba nuevos enlaces. Creo que las conclusiones están bastante curiosas (igual hasta demasiado), aunque eso sí, reconozco que no he comprendido absolutamente nada de los cálculos matemáticos previos:
We conclude that having no outgoing link is a bad policy, and that the best policy is to link to pages from the same Web community. Surprisingly, a new incoming link might be not a good news if a page that points to us gives many other irrelevant links at the same time
Sobre el mismo tema (¿Hay malos enlaces?) tienen un pequeño hilo de discusión abierto en los foros de Searenginewatch llamado BadRank & Page Penalization
Tras la reciente aparición de una solicitud de patente por parte de Google llamada Information retrieval based on historical data entran en juego nuevos parametros para comprender cómo funciona Google:la antigüedad puede ser un grado, y la evolución más ¿pero cómo la miden? En Seomoz.org hay un informe en inglés Google's Patent: Information Retrieval Based on Historical Data que desmenuza la susodicha patente (un gran trabajo, por cierto, ahora sólo hay que echarle horas y horas de lectura).
Es fácil decirlo ahora, pero creo que la aparición de esta patente (31/03/2005) y lo que propone respecto a recogida de datos históricos se veía venir de alguna manera. Reparto de medallas (no me lo tengan muy en cuenta):
No creo en el sandbox como un fenomeno de eliminación sistemática de los nuevos sitios en los rankings de Google [...] creo en una curva de evolución con un grado de tolerancia, un poco como la curva de crecimiento de un niño Seguramente tiene en cuenta varios parámetros, entre los que pienso que se encuentran la edad y la popularidad
Quedarían en el tintero docenas de otros criterios que ni siquiera sospechamos, pero creo que el posicionamiento en Internet no solo debe centrarse en los motores de búsqueda, sino que hay que apostar por el volumen de contenidos, su calidad, frecuente actualización y, sobre todo, el criterio que siempre defiendo: la continuidad en el tiempo. Me consta que Google premia notablemente esa "solera".
Leyendo lo que se decía del sandbox en Xeoweb tuve la impresión de que Google había introducido algún tipo de variable temporal a sumar a los criterios conocidos. Digamos ... una variable temporal "razonable" ¿Cual puede ser? algo así como un crecimiento ordenado, no desmesurado ... siguiendo algún patrón.
Actualización:
Datos temporales: Sea lo que sea lo que mide el MysteryRank, es algo relacionado con lo temporal, por lo que su propia naturaleza hace que las webs nuevas no vayan a tener nada para ser medido hasta después de pasado un tiempo.
Otros artículos: Sandbox, Recuperación de la información basada en datos históricos
Fantástico post, barbol.
Ya he olvidado casi todo lo que escribí del tema en xeoweb, pero a día de hoy me inclinaría por algo parecido a lo que dice "tu medalla de oro".
Habría una influencia de varios parametros, todos ellos relacionados con el tiempo, como la edad de la web, ninguno de ellos determinante por si mismo para entrar o salir del sandbox, y no influiría la popularidad en sí tal y como la conocemos, sino diversos factores temporales de la popularidad. Si una web ha conseguido enlaces a lo largo del último mes, parece recibir un "boost" positivo, en cambio, si deja de recibirlos durante un mes, el "boost" parece negativo, y esto estaría equilibrado con que la antigüedad de los enlaces también sería valorada (y con otros factores, no hay más que ver la patente, a saber cuales tienen en cuenta). Curioso es, que todos estos factores, son favorables a los blogs (un blog tiene enlaces antiguos desde que se creo, y como es actualizado suele recibir enlaces continuamente de una forma más o menos constante, del mismo modo que recibe contenidos, explicaría porque casi ningún blog actualizado constamente ha caído en el sandbox. Yo he dejado de escribir en xeoweb, y ha desaparecido completamente de las búsquedas.)
A ver si un día nos dicen qué es ;).
Enviado por Fran. Abril 16, 2005 03:03 PM
Hola Fran, muchas gracias por el extenso comentario.
De la misma manera que un mes puedes recibir un "boost negativo", o "positivo", según está el tema, también puedes recibir uno "demasiado positivo" ¿no?
Está claro que si tomamos a los blogs como patrón, el lema sería ... "despacito y buenos alimentos" ;)
¿no tienes pensado volver a escribir en Xeoweb?
Enviado por Barbol. Abril 19, 2005 03:15 PM
Bueno, el análisis temnporal también iba a ser mi gran revelación, pero antes de escribir el post correspondiente, salió lo de la patente. Venga esa medalla de platino. Ejem, ejem. ¿Cuela?
En serio, la relación patente-sandbox aún no está del todo clara. Por una razón, sobre todo: esta patente (y algunas más sobre análisis temporal que habían salido antes, como una de IBM) se centran en que las webs nuevas, siempre que consigan enlaces 'legítimos', no se encuentren en una inferioridad de condiciones tan grande ante webs bien establecidas (lo que se ha llamado recientemente en círculos posicionariles como 'Filthy Linking Rich' o 'Rich get richer')... que es justo lo contrario que hemos observado con el sandbox. Entonces, la patente ¿es un McGuffin? ¿O se ha tratado simplemente de los dolores de un parto... que ha durado más de un año?
Además, las webs que yo he visto salir del sandbox 'fuera de temporada' lo han hecho a fuerza de esas técnicas que se supone que Google quiere combatir: bloguestbookspam, intercambios, compra de enlaces... eso sí, realizadas a un nivel monstruoso. Alguna de esas webs sigue sólidamente situada en las primeras posiciones.
Enviado por Don Erre que Erre. Abril 20, 2005 07:56 PM
Madre, qué triste, llego tarde a los comentarios de mi propio blog. Muchas gracias, Sergerrequerre, por el comentario.
La verdad es que he sido cicatero, y te mereces la de platino, ahora lo actualizo, ha sido más por vaguería que por otras cosa.
Enviado por Barbol. Abril 25, 2005 10:46 PM
Articulo muy interesante. Estoy buscando informacion sobre el sandbox, ya que tengo una web en este estado. A ver si de una puta vez salgo ya del temido efecto sandbox. Voy a empezar eliminando centenares de backlinks...
Enhorabuena por el articulo.
Enviado por Jose. Marzo 18, 2006 03:21 PM