Qu’est-ce que Schema.org ?

Schema.org est un projet collaboratif des moteurs de recherche Google, Microsoft, Yahoo et Yandex.  Le but de l’initiative est une uniformisation des annotations sémantiques servant à présenter vos contenus Web. Sur le site Web du même nom (http://schema.org/) se trouvent des balises pour les administrateurs Web et un vaste vocabulaire destinés à l’édition de codes HTML.  On parle dans ce cas de données structurées, qui constituent la base du Web sémantique.  Les présentations proposées sur Schema.org sont compatibles avec les formats RDFa, Microdata et JSON-LD.

Trois raisons de choisir Schema.org

Les données structurées gagnent de plus en plus d’importance chez les administrateurs Web. Contrairement à des visiteurs humains, les programmes d’indexation Web nécessitent des balises appropriées pour interpréter le contexte sémantique d’une page Web. Ces données structurées jouent en effet un rôle décisif dans l’indexation d’une page. Les administrateurs de sites Internet peuvent également profiter de ces annotations sémantiques. Si les contenus sont traités uniformément, cela permet aux moteurs de recherche d’extraire des informations de manière ciblée et d’utiliser ces dernières pour exposer les pages Web dans les pages de résultats de recherche (SERP pour Search Engine Results Pages). Les plus pertinents sont ce qu’on appelle les « rich snippets » ou extraits enrichis du contenu d’une page Web. Il s’agit d’éléments d’informations qui élargissent le contenu du résultat et qui captent ainsi l’attention. Afin d’assurer l’uniformité nécessaire des annotations sémantiques malgré les différents formats de données, Schema.org propose des schémas standardisés appelés « types » qui peuvent être munis de sets spécifiques de propriétés. Ces annotations de Schema.org proposent aux administrateurs Web trois avantages non négligeables:

  • Standardisation : ces annotations sont basées sur un accord entre les plus gros moteurs de recherche au monde. Si les contenus sont annotés selon Schema.org, l’annotation choisie par les Webmasters sera de facto considérée comme standard.
  • Compatibilité : l’uniformité des schémas et la compatibilité avec les formats de données les plus courants (RDFa, Microdata et JSON-LD) fournit une compatibilité maximale de l’annotation sémantique. Les exploitants de sites Web qui traitent leurs contenus selon Schema.org peuvent, sont adaptés à tous les types de clients Web.  
  • Validation : un standard uniforme offre l’avantage de faciliter et d’accélérer l’analyse d’erreurs. Les balises inscrites avec Schema.org aux formats Microdata, RDFa et JSON-LD sont également compatibles avec l’outil de test gratuit de données structurées de Google, qui permet de les valider ou non. 

Hiérarchie des types selon Schema.org

Le système d’annotations de Schema.org est constitué de types et de propriétés. Tandis que les types sont classés par éléments de contenus afin d’être caractérisés par des items bien définis, les propriétés servent à attribuer une valeur précise à ces types définis. Le projet Schema.org propose donc un set de types structurés hiérarchiquement. De plus, l’attribution de propriétés à certains types est déterminée de manière durable.

Le spectre de types, auxquels un item peut être attribué, va de définitions très précises à d’autres très générales comme « chose » (pour « Thing ») ou « film » (pour « movie »).  Chaque type, à l’exception du type « chose », peut avoir un ou plusieurs types-parents :

  • Thing > CreativeWork > Movie

Tandis que « Thing » est caractérisé d’item non spécifique, « Creative Work » est quant à lui plus spécifique et désigne une œuvre de création comme un livre, une photographie ou encore un film. Le type « Movie » est donc une sous-catégorie du type « Creative Work », qui est lui-même une sous-catégorie de « Thing ». Cette hiérarchie est pertinente car les propriétés de types spécifiques sont inhérentes aux propriétés de leurs types-parents.  Un item caractérisé de « Movie » se verra donc attribuer toutes les propriétés d’un film (acteurs, régisseurs, trailer,…).

Le type « Movie » englobe donc par ailleurs aussi les propriétés de son type-parent « Creative Work », car toute œuvre de création a, comme un film, un auteur, un genre ou des critiques. De plus, le type « Movie » hérite des propriétés du type-parent « Thing » (nom, description, URL et image). Toutes les propriétés se voient attribuer des valeurs individuelles respectivement selon l‘élément.

Les types et propriétés définis sur Schema.org s’utilisent de la même manière avec RDFa, Microdata et JSON-LD. L’intégration d’une balise dans un site Web diffère cependant considérablement selon le format du fichier utilisé.

Le choix du format de données

Si une décision a été prise quant à la balise selon Schema.org, il reste à choisir le format de ces données. Les articles ci-dessous proposent une description détaillée des annotations avec RDFa, Microdata et JSON-LD sur la base des types et propriétés standardisés de Schema.org.

  • Tutoriel : balise avec RDFa
  • Tutoriel : balise avec Microdata
  • Tutoriel : balise avec JSON-LD