Captura de contenidos de pago con datos estructurados

El fenómeno de los «contenidos de pago» ha afectado significativamente a la forma en que los usuarios acceden a la información en línea. Los sitios web y las plataformas en línea colocan cada vez más sus contenidos valiosos tras un muro de pago, exigiendo a los usuarios que paguen para acceder a determinados artículos, informes de investigación u otros recursos. Esto llevó a buscar métodos alternativos para seguir accediendo a esta información (para los motores de búsqueda).

¿Qué son los datos estructurados?
Por datos estructurados se entiende cualquier forma de datos organizada y de fácil lectura para las máquinas. En el contexto del desarrollo web, los datos estructurados se utilizan a menudo para ayudar a los motores de búsqueda a comprender mejor el contenido de una página web. Esto se hace marcando partes específicas del contenido con etiquetas normalizadas que indican lo que ese contenido representa, como el título de un artículo, el autor, la fecha de publicación, etc. Para más información, consulte mi artículo sobre datos estructurados.
¿Qué forma se utiliza para los contenidos de pago?
Para marcar contenido que está detrás de un paywall con datos estructurados, podría utilizar el siguiente marcador de posición de datos estructurados, siguiendo las directrices de schema.org:
{
«@context»: «http://schema.org»,
«@type»: «NewsArticle»,
«titular»: «Ejemplo de título de artículo»,
«datePublished»: «2024-02-08»,
«isAccessibleForFree»: «Falso»,
«hasPart»: {
«@type»: «WebPageElement»,
«isAccessibleForFree»:
«Falso»,
«cssSelector»:
«.paywallContent» }
}
Este código marca un artículo a cuyas partes específicas (denotadas por el selector .paywall Content CSS) no se puede acceder gratuitamente. Personalícelo en función de la estructura y el contenido específicos de su sitio web. Este es un ejemplo general; consulte la documentación y las directrices oficiales de Google y schema.org para obtener instrucciones de implementación detalladas.
A menudo se trata de artículos de noticias, por lo que puede utilizar NewsArticle como sección y utilizar específicamente la propiedad isAccessibleForFree.
Los contenidos de pago y su impacto en el SEO de un vistazo
¿No tiene tiempo para un artículo largo? No hay problema. Vea en el vídeo siguiente un resumen de este artículo.
¿Existe algún riesgo (relacionado con la filtración de contenidos)?
El otro día leí un artículo sobre esto, así que he pensado utilizar parte de este artículo para profundizar en el tema. El artículo en SERoundtable discute cómo el enfoque de Google a los contenidos de pago y de suscripción a través de datos estructurados no es permeable, frente a las críticas de la comunidad de que el sistema todavía proporciona formas de acceder a los contenidos detrás de los muros de pago.
La solución de Google, introducida en 2017, permite a los editores compartir contenido completo con el rastreador de Google para una mejor comprensión e indexación, sin hacerlo accesible al público. Danny Sullivan, de Google, subrayó que el método es seguro siempre que los editores sigan las directrices de Google, incluida la verificación de las direcciones IP de Googlebot y el bloqueo de las copias en caché si es necesario.
Las críticas al sistema sugieren que cambiar el agente de usuario a Googlebot podría dar lugar a accesos no autorizados, pero Sullivan lo refuta afirmando que la autenticación de IP puede bloquear tales intentos.
En mi opinión, se trata de un método bastante hermético para controlar los contenidos. Yo no pondría mis mayores secretos en ello, pero cuando se trata de contenidos a los que de otro modo podrías acceder por una suscripción de diez euros al mes, éste es un buen método.
Para más información, lea el artículo completo en SERoundtable en este enlace: Google dice que su método de datos estructurados de pago y suscripción no tiene filtraciones.
Ampliación de la aplicación
A menudo, esta forma de datos estructurados se utiliza para una gran parte de un sitio web. La implantación de datos estructurados en un sitio web de gran tamaño, especialmente para contenidos de pago, requiere un planteamiento sistemático. Esto incluye:
- Analizar la estructura del contenido: Comprender cómo está organizado el contenido (por ejemplo, artículos, blogs, páginas de productos) e identificar qué partes son de pago.
- Actualización de plantillas: Actualice las plantillas para insertar automáticamente datos estructurados en las páginas pertinentes, utilizando propiedades como
isAccessibleForFree
. - Modificaciones del CMS: Adaptar el sistema de gestión de contenidos (CMS) para que admita campos de datos estructurados, de modo que los editores puedan añadir las marcas necesarias.
- Automatización: utilice scripts o herramientas de software para añadir datos estructurados a las páginas existentes de forma masiva, si es posible.
- Validación y pruebas: Utilice la herramienta de prueba de datos estructurados de Google o la prueba de resultados enriquecidos para verificar la correcta implementación.
- Supervisión y mantenimiento: Supervise el rendimiento y ajústelo cuando sea necesario, especialmente tras actualizaciones del sitio web o cambios en las directrices de datos estructurados.

Un enfoque estructurado y automatizado es esencial para la escalabilidad y la coherencia en un sitio web de gran tamaño.
Resumen
El contenido que quieras proteger yo lo haría de la forma que indica el propio Google. Dando acceso a las direcciones IP listadas por el propio Google. Entonces, en principio, debería ser bastante posible posicionarse con contenidos de pago sin revelarlos inmediatamente.
Lo que es importante mencionar en esto es que usted tiene al menos una gran desventaja en la clasificación de este tipo de contenido: una tasa de rebote por las nubes y un montón de pogosticking debido al hecho de que casi nadie va a pagar por su contenido para leerlo, mientras que a menudo hay un montón de otros sitios web que dan contenido de forma gratuita. ¡Buena suerte!