Skip to content

Référencement / SEO #915

@johanricher

Description

@johanricher

Contexte

Les moteurs de recherche grand public comme Google sont aujourd'hui de loin le principal point d'entrée des parcours utilisateurs aboutissant à l'utilisation de données sur les portails open data comme data.gouv.fr.

Actuellement ecologie.data.gouv.fr est le seul portail basé sur udata-front-kit qui est bien référencé par les moteurs de recherche.

Exemples Image Image Image

Travaux spécifiques faits sur ecologie.data.gouv.fr, voir notamment :

Point-clés
  • Il y a de la logique côté front pour générer des métadonnées SEO potables, l'enjeu est de les rendre découvrable par les moteurs de recherche
  • Sur ecologie, on a fait le choix de ne pas indexer les jeux de données et les organisations, on considère jusqu'à présent que data.gouv.fr est la source canonique
  • Il y a un fichier robots.txt personnalisable par verticale, cf celui d'ecologie qui exprime les contraintes citées plus haut https://ecologie.data.gouv.fr/robots.txt (celui de logisitique est celui par défaut, il autorise tout)
  • On a effectivement branché la console Google search pour monitorer un peu le résultat, de mémoire via un TXT sur le DNS via data.gouv.fr pour valider le domaine
  • Malgré des infos parfois différentes, Google n'est toujours pas capable de crawler correctement une SPA. Le seul moyen que j'ai trouvé de contourner ça est de générer un sitemap https://ecologie.data.gouv.fr/sitemap.xml avec les pages qui nous intéressent.
  • Google n'est pas capable de récupérer un sitemap généré via une SPA ou un sitemap hébergé sur un autre domaine, il faut donc s'arranger pour générer et servir de manière statique le sitemap.xml. La logique de génération est ici https://github.com/ecolabdata/ecospheres-sitemap, le script tourne sur les infras de data.gouv.fr et la redirection vers le bon fichier est faite également par data.gouv.fr.

Description

Ce ticket concerne de manière générale l'amélioration du référencement par les moteurs de recherche de tous les portails basé sur udata-front-kit. Différentes tâches plus ou moins complexes peuvent être envisagées pour améliorer le référencement, qui feraient l'objet de tickets dédiés et qui seront le cas échéant listés ci-dessous.

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions