Capturer les contenus payants à l’aide de données structurées
Le phénomène du « contenu payant » a considérablement modifié la manière dont les utilisateurs accèdent à l’information en ligne. Les sites web et les plateformes en ligne placent de plus en plus souvent leur contenu de valeur derrière un mur payant, obligeant les utilisateurs à payer pour accéder à certains articles, rapports de recherche ou autres ressources. Cela a conduit à la recherche de méthodes alternatives pour continuer à accéder à ces informations (pour les moteurs de recherche).
Qu’est-ce qu’une donnée structurée ?
Les données structurées désignent toute forme de données organisées et facilement lisibles par les machines. Dans le contexte du développement web, les données structurées sont souvent utilisées pour aider les moteurs de recherche à mieux comprendre le contenu d’une page web. Pour ce faire, des parties spécifiques du contenu sont marquées par des étiquettes standardisées ou des balises qui indiquent ce que le contenu représente, comme le titre d’un article, l’auteur, la date de publication, et bien d’autres choses encore. Pour en savoir plus, consultez mon article sur les données structurées.
Quel est le formulaire utilisé pour les contenus payants ?
Pour marquer le contenu qui se trouve derrière un paywall avec des données structurées, vous pouvez utiliser l’espace réservé aux données structurées suivant, conformément aux lignes directrices de schema.org :
{
« @context » : « http://schema.org »,
« @type » : « NewsArticle »,
« headline » : « Exemple de titre d’article »,
« datePublished » : « 2024-02-08 »,
« isAccessibleForFree » : « False »,
« hasPart » : {
« @type » : « WebPageElement »,
« isAccessibleForFree » :
« Faux »,
« cssSelector » :
« .paywallContent » }
}
Ce code signale un article dont certaines parties (désignées par le sélecteur CSS .paywall Content) ne sont pas accessibles gratuitement. Personnalisez-le en fonction de la structure et du contenu spécifiques de votre site web. Il s’agit d’un exemple général ; consultez la documentation et les instructions officielles de Google et schema.org pour obtenir des instructions de mise en œuvre détaillées.
Il s’agit souvent d’articles d’actualité, vous pouvez donc utiliser NewsArticle comme section et utiliser spécifiquement la propriété isAccessibleForFree.
Le contenu payant et son impact sur le référencement en un coup d’œil
Vous n’avez pas le temps de rédiger un long article ? Il n’y a pas de problème. Regardez la vidéo ci-dessous pour un résumé de cet article.
Existe-t-il des risques (liés à la fuite de contenu) ?
J’ai lu un article à ce sujet l’autre jour, et j’ai donc décidé d’utiliser une partie de cet article pour approfondir la question. L’article de SERoundtable explique que l’approche de Google concernant les contenus payants et sur abonnement via les données structurées n’est pas une fuite, malgré les critiques de la communauté qui estime que le système permet toujours d’accéder à des contenus derrière des murs payants.
La solution de Google, introduite en 2017, permet aux éditeurs de partager des contenus entiers avec le robot d’exploration de Google pour une meilleure compréhension et indexation, sans pour autant les rendre accessibles au public. Danny Sullivan, de Google, a souligné que la méthode est sûre tant que les éditeurs respectent les lignes directrices de Google, notamment en vérifiant les adresses IP de Googlebot et en bloquant les copies mises en cache si nécessaire.
Les critiques du système suggèrent que la modification de l’agent utilisateur en Googlebot pourrait conduire à un accès non autorisé, mais M. Sullivan réfute cette idée en déclarant que l’authentification de l’IP peut bloquer de telles tentatives.
À mon avis, il s’agit d’une méthode de contrôle du contenu assez étanche. Je n’y mettrais pas mes plus grands secrets, mais lorsqu’il s’agit d’un contenu auquel vous pouvez accéder pour un abonnement de dix euros par mois, c’est une bonne méthode.
Pour plus d’informations, lisez l’article complet sur SERoundtable à ce lien : Google affirme que sa méthode de données structurées payantes et par abonnement n’est pas fuyante.
Élargissement de la mise en œuvre
Souvent, cette forme de données structurées est utilisée pour une grande partie du site web. La mise en œuvre de données structurées sur un grand site web, en particulier pour le contenu payant, nécessite une approche systématique. Il s’agit notamment de
- Analyser la structure du contenu : comprendre comment le contenu est organisé (par exemple, articles, blogs, pages de produits) et identifier les parties payantes.
- Mise à jour des modèles : mettre à jour les modèles afin d’insérer automatiquement des données structurées sur les pages pertinentes, en utilisant des propriétés telles que
isAccessibleForFree
. - Modifications du CMS: Adapter le système de gestion de contenu (SGC) pour qu’il prenne en charge les champs de données structurées afin que les rédacteurs puissent ajouter les balises nécessaires.
- Automatisation: utilisez des scripts ou des outils logiciels pour ajouter des données structurées aux pages existantes en masse, si possible.
- Validation et test: Utilisez l’outil de test des données structurées de Google ou le test des résultats enrichis pour vérifier que la mise en œuvre est correcte.
- Contrôle et maintenance: contrôlez les performances et ajustez-les si nécessaire, en particulier après des mises à jour du site web ou des changements dans les lignes directrices relatives aux données structurées.
Une approche structurée et automatisée est essentielle pour assurer l’évolutivité et la cohérence d’un grand site web.
Résumé
Pour le contenu que vous souhaitez protéger, je vous conseille de suivre la procédure décrite par Google. Donner accès aux adresses IP répertoriées par Google lui-même. En principe, il devrait donc être tout à fait possible de classer un contenu payant sans le révéler immédiatement.
Ce qu’il est important de mentionner ici, c’est que le classement de ce type de contenu présente au moins un inconvénient majeur : un taux de rebond très élevé et beaucoup de pogosticking dû au fait que presque personne ne va payer pour votre contenu pour le lire, alors qu’il y a souvent beaucoup d’autres sites web qui donnent du contenu gratuitement. Bonne chance !