Cómo funciona el algoritmo de Google Panda

Este artículo sigue siendo la mejor descripción disponible de cómo funciona el algoritmo de Google Panda.

No hay ninguna justificación para raspar los comentarios aleatorios y no elaborados (y resumir en lugar de citar los vídeos y artículos originales) y llamar a eso una explicación de Panda.

Puede que también te interese: raiola manda y no el panda

Tales intentos amateurs, mal informados de documentar Panda sustituyen las especulaciones salvajes por lo que son esencialmente las señales indocumentadas utilizadas por este algoritmo para anotar páginas de “calidad”.

El error más común cometido por la gente al intentar analizar las degradaciones de Panda es suponer que el algoritmo encuentra respuestas para las preguntas de ejemplo compartidas por Google. No funciona de esa manera.

Tampoco el algoritmo puede utilizar “métricas de participación del usuario” porque no están disponibles para Google en la mayoría de los sitios (y los Googlers han insistido repetidamente en que no utilizan datos de Google Analytics).

Lo que sabemos acerca de cómo funciona el algoritmo Panda independientemente de las observaciones de Google

El algoritmo Panda es un algoritmo heurístico. Es decir, escanea un gran conjunto de datos y busca tipos específicos de soluciones a preguntas o problemas (por ejemplo, “¿Qué combinación de señales estadísticas dividiría los datos en grupos ALFA y BETA?”).

Lo que puede ser revolucionario sobre el algoritmo de Panda (creo) es que (creo) que pretende eliminar o evitar las comparaciones innecesarias y los cálculos, reduciendo así el número total de cálculos necesarios para encontrar la mejor coincidencia para una determinada solución deseada.

Lo que Google tenía que hacer era desarrollar un conjunto de señales de clasificación y / o pesos que les ayudaran a separar sitios web en sitios de “alta calidad” y “baja calidad”. La encuesta Quality Rater Survey se utilizó aparentemente para dividir un grupo de sitios web secretamente seleccionados en un plano segregado.

Los ingenieros de Google volvieron a Panda sueltos en sus inmensos volúmenes de datos sobre sitios web con el objetivo de encontrar el mejor agrupamiento de señales y valores ponderados para aquellas señales que producirían la coincidencia más cercana a las opciones colectivas de los evaluadores de calidad.

A través de muchas iteraciones públicas Google parece haber estado cambiando (probablemente mayormente agrandando) el conjunto (conjunto de aprendizaje) de sitios web que se utiliza para determinar qué combinación de señales y pesos debe usarse para determinar la puntuación de una página web (página / sitio). Esta puntuación (si existe) probablemente se añade al PageRank.

Matt Cutts describió el algoritmo como un “clasificador de documentos”, que en uso establecido significa que es un programa que escanea documentos Web individuales y los evalúa.

Por lo tanto, su “puntuación Panda” se asigna a páginas individuales, y acumulativamente páginas suficientes en su sitio web puede verse afectado negativamente que “arrastrar” el resto de su sitio, un escenario posible que Googlers han reconocido.

Cambiar el conjunto de aprendizaje debe significar que la mezcla de las mejores señales y pesos también cambiará, aunque sólo sea sutil.

Lo que creo que esto significa acerca de cómo funciona el algoritmo de Google Panda

¿Cómo sabe Google si un sitio web en el conjunto de aprendizaje debe ser calificado como “alta calidad” o “baja calidad”? Creo que han llevado a cabo varias, tal vez muchas, nuevas encuestas de calidad Rater, ya que han ampliado su conjunto de aprendizaje.

Cada vez que se añaden sitios al conjunto de aprendizaje, los evaluadores de calidad proporcionan retroalimentación sobre los sitios y los ingenieros usan esa retroalimentación para determinar si los sitios son de alta calidad o de baja calidad.

Puedes ver cómo recuperarse de una penalización por Panda en este artículo.

De esta manera, Google siempre tiene un plan bastante actual de cómo se ve la Web.

Este modelo se utiliza para ayudar al algoritmo de Panda a encontrar la mejor combinación de señales de un sitio web y cómo sopesar esas señales para producir un conjunto de puntuaciones (que se asignarán a páginas individuales) que dividen la Web en “alta calidad” y “baja calidad”.

Sospecho que ahora, el algoritmo de Panda es más o menos automatizado, debe haber umbrales que protejan una “capa media” indeterminada de sitios web cuyas páginas no pueden ser realmente consideradas de “alta calidad” o “baja calidad”.

Tal vez este contenido no se le asigna una puntuación de Panda en absoluto. Tal vez sólo significa que la puntuación no afecta a la valoración de un documento en el índice de Google de una manera u otra.

Te dejamos con un vídeo que explica cómo funciona Google Panda.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra Aviso Legal y Política de Cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies