La reciente filtración de documentos internos de Google Search ha generado un gran interés y debate en la comunidad tecnológica y entre los profesionales del marketing digital. Estos documentos filtrados ofrecen una visión inédita sobre el funcionamiento interno del algoritmo de clasificación de Google, proporcionando detalles sobre los factores que influyen en los resultados de búsqueda y la filosofía detrás de su diseño y evolución. A continuación, se desglosan las revelaciones clave de esta filtración y su implicación en la comprensión del algoritmo de Google.
Qué sucedió con los documentos filtrados
Un conjunto de documentos filtrados de Google nos ha ofrecido una mirada sin precedentes al funcionamiento interno de su motor de búsqueda y ha revelado algunos de los factores clave que Google utiliza para clasificar el contenido.
Miles de documentos, que parecen provenir del Content API Warehouse interno de Google, fueron publicados a mediados de marzo en Github por un bot automatizado llamado yoshi-code-bot. Estos documentos fueron compartidos con Rand Fishkin, cofundador de SparkToro, a principios de mayo.
Los documentos permiten una visión detallada de cómo podría funcionar el algoritmo de clasificación de Google, proporcionando una valiosa información para los expertos en SEO, quienes están en la mejor posición para interpretar estos datos. En 2023, una filtración similar reveló los factores de clasificación de Yandex Search, marcando uno de los acontecimientos más importantes del año en el ámbito de SEO.
Una muestra sin precedentes
Veamos cuáles son las cosas más relevantes sobre el SEO de los documentos filtrados de Google. ¡Toma nota!
- Se trata de una documentación que es precisa y actual. De hecho, los documentos filtrados indican que la fecha está actualizada precisamente en marzo de este mismo año. Por ello se trata de una información muy reciente.
- La clasificación muestra características específicas. Entre ellas, el que 2 mil 596 módulos están representados en la documentación de la API. A su vez, estos módulos cuentan con catorce mil 14 atributos.
- Los documentos filtrados no especifican la ponderación de las características de la clasificación. Pero si permiten demostrar que existe dicha ponderación.
- Expertos aseguran que hay presencia de Twiddlers. Estas son funciones de reclasificación capaces de ajustar la puntuación de recuperación de un documento. También pueden cambiar la clasificación de los documentos.
- Los documentos filtrados permitieron indagar más acerca de las degradaciones. Se descubrió que hay varios motivos por los que puede degradarse el contenido. Entre estos motivos cuentan los siguientes:
- Cuando los enlaces no coinciden con el sitio de destino
- Cuando hay insatisfacción por parte de los usuarios, que pueden ser detectadas por ciertas señales de SERP.
- Las reseñas de productos también pueden contribuir a la degradación del contenido.
- Los dominios de coincidencia exacta figuran como otro factor.
- Finalmente, también figura la presencia de pornografía como una causa de la degradación del contenido dentro de los documentos filtrados.
Historial de cambios
Otro dato significativo que surge de la filtración de documentos es el referente al historial de cambios. Al parecer, Google guarda una copia de cada versión de cada página que ha indexado. Esto implica que Google puede, de alguna manera, recordar cada modificación realizada en una página. Sin embargo, al analizar los enlaces, Google solo utiliza los últimos 20 cambios de una URL.
Además, los documentos filtrados también arrojan luz sobre los mecanismos de penalización que Google emplea para combatir el spam y el contenido de baja calidad. Estas penalizaciones pueden resultar en una disminución significativa en el ranking de las páginas afectadas. Además, se menciona la frecuencia y el propósito de las actualizaciones del algoritmo, destacando que se realizan regularmente para adaptarse a las nuevas tendencias y asegurar que los resultados de búsqueda sigan siendo útiles y relevantes.
Enlaces y clics
Uno de los hechos que se desprende de los documentos filtrados es la importancia de los enlaces. La diversidad y la relevancia de los enlaces siguen siendo fundamentales, como se muestra en los documentos, y el PageRank continúa desempeñando un papel crucial en las funciones de clasificación de Google. El PageRank de la página de inicio de un sitio web se considera en todos los documentos.
Esto no necesariamente contradice las declaraciones de los portavoces de Google, quienes han afirmado que los enlaces no son uno de los tres factores de clasificación más importantes o que su importancia ha disminuido. Es posible que ambas afirmaciones sean ciertas simultáneamente. Aunque no se conoce exactamente cómo se ponderan estas características, está claro que se trata de un aspecto significativo.
Además, los clics exitosos también son importantes. Aunque esto no debería sorprender, los documentos confirman que para obtener una buena clasificación, es crucial seguir creando contenido y experiencias de usuario excepcionales. Google utiliza una variedad de mediciones para evaluar esto, incluidas métricas como badClicks, goodClicks, lastLongestClicks y unsquashedClicks.
Asimismo, los documentos revelan que los textos más largos pueden ser truncados, mientras que los contenidos más breves son evaluados en función de su originalidad. También se asignan puntuaciones específicas a contenidos en áreas como salud y noticias.
Documentos filtrados y posicionamiento
En cualquier caso, el consejo es que para lograr mejores posiciones, es necesario seguir generando clics exitosos. Para ello se puede utilizar un conjunto más amplio de consultas y lograr una cantidad más grande y diversa de enlaces. De hecho, esto tiene sentido, porque es algo que puede conseguirse contando con un contenido muy sólido. Es decir, la idea es que te enfoques en generar un tráfico mejor calificado para a su vez lograr una mejor experiencia de usuario. Son acciones que le enviarán señales a Google acerca de que tu página merece estar en un mejor posicionamiento.
Otro dato que se desprende del reciente juicio antimonopolio que se realizó entre Estados Unidos y Google, es que este último se sirve de los clics para lograr la clasificación.
La marca importa
Una de las conclusiones importantes del análisis de los documentos filtrados es que la marca importa más que cualquier otra cosa. Esto es, que para los que desean mejorar ampliamente su clasificación y tráfico de búsqueda orgánica, deben construir una marca notable, popular y reconocida en su espacio, fuera de la búsqueda de Google.
Sumado a ello, hay que saber que Google almacena información del autor asociada con el contenido e intenta determinar si una entidad es el autor del documento. Para ello, Google utiliza algo llamado “site Authority”.
Hace ya varios años que la organización está avisando de la existencia de esto. Hace más de una década, específicamente en 2011, Google informó que los sitios que tengan contenido de baja calidad en alguna parte, afectaría al sitio en su conjunto. Estas declaraciones públicas fueron realizadas luego del lanzamiento de la actualización de Panda en ese año.
Más datos en documentos filtrados
Según los documentos filtrados de Google, hay algunos otros factores clave en el funcionamiento del algoritmo de clasificación. Por ejemplo:
- Frescura del contenido: Google considera la frescura como un factor importante. Analiza las fechas en el título (bylineDate), la URL (syntacticDate) y el contenido de la página (semanticDate) para evaluar la actualidad de la información.
- Tema central del sitio web: Google vectoriza páginas y sitios, comparando las incrustaciones de páginas (siteRadius) con las incrustaciones de sitios (siteFocusScore) para determinar si un documento es un tema central del sitio web.
- Información de registro de dominio: Google almacena información del registro de dominio (RegistrationInfo), lo que puede influir en la clasificación.
- Importancia de los títulos de las páginas: Los títulos de las páginas siguen siendo un factor relevante. Google utiliza una función llamada titlematchScore para medir qué tan bien coincide el título de una página con una consulta.
- Tamaño de fuente y texto de anclaje: Google mide el tamaño de fuente ponderado promedio de los términos en los documentos (avgTermWeight) y el texto de anclaje, lo que puede influir en la relevancia del contenido.
Estos documentos ofrecen una visión detallada de cómo Google evalúa y clasifica el contenido en su motor de búsqueda, proporcionando a los expertos en SEO información valiosa para optimizar sus estrategias.
Imagen cortesía de https://pixabay.com, a quien pertenecen todos los derechos