| Glossaire du SEO Sémantique

Entité et Balisage sémantique

Une entité est un objet structuré qui identifie précisément un élement d'information (personne, organisation, lieu, événement, produit ou tout autre élément thématique).

Le travail d'identification et de balisage des entités permet d'ajouter aux contenus Web de l'information lisible et compréhensible par les moteurs de recherche, ce qui améliore leurs performances d'indexation et de référencement.

Microsoft décrit ainsi les objectifs de ce processus :

"L'objectif d'un système d'identification et désambiguïsation d'entités est de reconnaitre dans un texte les entités mentionnées, de les désambiguïser et de les connecter à un graphe de connaissance. "

(Source : web-ngram.research.microsoft.com/erd2014)

Le graphe de connaissance évoqué par Microsoft désigne une collection de pages de référence, dont l'identifiant est la plupart du temps directement issu de Wikipedia ou d'un site apparenté (Wikidata, Freebase, ...). Dans le cas de Google et de son Knowledge Graph , on parle de graphe d'entités. Google utilise ce graphe pour améliorer ses capacités de compréhension et mieux répondre aux requetes de ses utilisateurs.

Différence entre mot-clé et entité

La différence essentielle entre un mot-clé et une entité est qu'un mot-clé peut faire référence à plusieurs entités distinctes n'ayant aucun rapport entre elles. L'exemple suivant avec le mot clé "Bercy", fréquemment utilisé dans l'actualité économique, sportive et musicale, en est une bonne illustration.

L'enjeu principal d'un Balisage sémantique performant est de réussir à affecter à chaque mot-clé l'entité qui lui correspond exactement. C'est ce qu'on nomme l'étape de désambiguïsation.

Connectée au Knowledge Graph de Google

L'objectif des moteurs de recherche est de fournir des réponses toujours plus pertinentes aux requêtes de leurs utilisateurs. Pour cela, les principaux moteurs de recherche (Google, Bing, Yahoo, Yandex) ont élaboré un standard commun (schema.org), qui précise la façon dont les entités peuvent être identifiées dans un texte (tout en restant invisibles pour les lecteurs humains).

Grâce à cette grammaire formelle, une expression telle que "SEO sémantique "peut être précisément rattachée à une entité parfaitement définie (i.e. Search Engine Optimization) et être ainsi directement connectée au Knowledge Graph de Google.

Que se passe-t'il alors si VOUS (en tant qu'entité personne), votre société (en tant qu'entité organisation) n'êtes pas connecté à ce Knowledge Graph ? La réponse est simple : vous n'existez pas. En tout cas, pas au sens ou Google l'entend.

Pour exister, vous devez vous connecter (vous, votre société, vos pages Web) à ce qu'on appelle le Web des données (ou Web des entités), qui réunit les différentes bases de données et graphes de connaissances disponibles sur le Web et qui aide à le structurer.


Le Linked Open Data

Pour cette raison, le balisage sémantique détaillé et systèmatique des contenus disponibles sur le Web est devenu incontournable. Les moteurs de recherche délaissent progressivement la recherche par mot-clé pour une recherche par entité ("from strings to things"), ce qui leur permet de mieux cerner le contexte des contenus (donc minimiser les erreurs d'interprétation), pour mieux répondre aux requêtes des internautes.

En passant du mot clé à l'entité, et en reliant l'entité à une page de référence au moyen de données structurées, vous permettez aux machines de mieux comprendre le sens et le contexte de vos contenus, ce qui leur permet de mieux les indexer et mieux les référencer.

(Cet article comporte 45 données structurées)

A lire : Comment semanticMarker fait le lien entre mots-clés et entités