Le Rapport sommaire sur les discussions en table ronde sur les données ouvertes

 

Contexte

En mars, avril et mai, le Secrétariat du Conseil du Trésor a tenu une série de consultations publiques sur le Portail de données ouvertes du gouvernement fédéral en prévision du relancement de celui-ci. Cinq consultations ont eu lieu à Toronto, Edmonton, Vancouver, Ottawa et Montréal. Des intervenants des domaines suivants ont été invités et y ont participé : universités, espace de développement de logiciels, secteur à but non lucratif, secteur de la technologie, gouvernements locaux et provinciaux. Au cours des cinq événements, 82 intervenants ont participé aux consultations. En outre, le ministre a participé à la plus grande partie des séances à Edmonton et à  Toronto, et a prononcé un discours d’ouverture lors de la séance à Ottawa.

Chacune des consultations a duré 2 heures au cours desquelles on a posé 6 questions (voir Annexe A). Pour les deux premières questions, les intervenants étaient répartis en petits groupes de quatre où leurs idées faisaient l’objet de discussions et de débats. Les groupes se sont réunis en séance plénière et mis en commun leur rétroaction. Pour les quatre dernières questions, les réponses, mises en commun, ont fait l’objet d’une discussion. En outre, la question 3 avait été rajoutée seulement pour les consultations de Vancouver, Montréal et Ottawa.  Enfin, bien que les participants se soient montrés enthousiasmés par la discussion des questions 1, 2 et 6, les questions 4 et 5 ont reçu une rétroaction moins enthousiaste. De nombreux participants avaient déjà participé à la consultation sur la licence et étaient plus intéressés à discuter des données que le gouvernement avait à offrir.

Ce rapport ne prétend aucunement prioriser les besoins d’un intervenant par rapport à ceux d’un autre. Il tentera plutôt de refléter la conversation et les recommandations formulées par les intervenants, en notant à la fois les intérêts communs et les points de divergence.

Ce qui suit est une distillation de cette rétroaction.

Sommaire

Bien que la conversation portant sur les façons d’améliorer le portail du gouvernement sur les données ouvertes était riche et que de nombreuses recommandations sont décrites dans le présent rapport, il y a cinq recommandations de base qui sont ressorties de chaque séance et qui étaient citées les plus souvent. Les voici :

  1. Établir des objectifs
    Préparer un énoncé clair de l’objectif pour Données.gc.ca qui décrit clairement son objectif à l’intention des citoyens, utilisateurs et responsables gouvernementaux.
  2. Améliorer la fonction recherche
    Les intervenants ont convenu à la quasi-unanimité que les fonctionnalités de recherche sur Données.gc.ca ont grandement besoin d’être améliorées. Il faut prévoir une meilleure fonction de recherche, des recommandations par les pairs et l’assignation de descripteurs pour faciliter la découverte des données.
  3. Métadonnées et documentation
    Pour pouvoir utiliser efficacement les données, les utilisateurs doivent pouvoir accéder à des métadonnées et à des documents et se conformer aux normes concernant les métadonnées dans la mesure du possible.
  4. Renforcement de la collectivité, mobilisation et formation
    Élaborer une stratégie de mobilisation de la collectivité en vue de lier et de mobiliser les utilisateurs. En outre, mettre au point de meilleurs outils pour informer les utilisateurs des changements et des mises à jour.
  5. Les données
    Bien que les intervenants aient manifesté le désir d’accéder à plus de données de tous les types, certains thèmes principaux sont ressortis. Les données sur les codes postaux et d’autres ensembles de données « de base » qui tiennent lieu de toile de fond dans les applications composites et les analyses sont particulièrement importantes. En outre, les utilisateurs ont exprimé un intérêt à ce que plus de données comportent un balisage géographique. Ils souhaitaient également que les données soient aussi détaillées que possible, ainsi que longitudinales de manière à pouvoir déterminer les tendances à long terme.

Recommandations en provenance des groupes

1. Établir un objectif

Recommandations :

  • Préparer un énoncé clair de l’objectif pour Données.gc.ca qui décrit clairement son objectif à l’intention des citoyens, utilisateurs et responsables gouvernementaux. Ce document devrait contribuer à prioriser :
    • L’affectation des ressources (p.ex. « la mobilisation et la formation de la collectivité » par opposition à « la divulgation ciblée visant à promouvoir les objectifs stratégiques » par opposition à « améliorer les ensembles de données existantes »).
    • Les demandes différentes et parfois concurrentielles; les différents groupes d’utilisateurs devraient disposer d’un portail de données ouvertes.

Ce qui a été dit :

Tandis que les questions ont servi de message-guide utile pour inciter les intervenants à parler du portail de données du gouvernement, elles mènent presque inévitablement à une discussion plus vaste portant sur les deux défis jumelés qui ont fait l’objet d’une discussion explicite ou implicite lors de chacune des séances : quel est l’objectif de Données.gc.ca et qui en est le groupe cible?

À mesure que les intervenants examinaient de plus en plus en profondeur les questions auxquelles doit faire face le Conseil du Trésor, ils sont venus à respecter l’ampleur du défi lié à la création du prochain portail de données ouvertes du gouvernement fédéral. La diversité des rôles et d’objectifs des intervenants qui ont participé aux événements reflète la diversité des besoins et d’objectifs potentiels que le portail de données ouvertes pourrait satisfaire ou devra peut-être satisfaire. Les défenseurs de la transparence cherchaient des données sur la responsabilisation du gouvernement, les universitaires se souciaient de la provenance, des métadonnées et du contexte, les développeurs de logiciels et les secteurs des affaires étaient préoccupés par des données qui fourniraient des renseignements opérationnels ou sur les services de première ligne tandis que les homologues locaux et provinciaux étaient intéressés à explorer comment les données de différents ordres de gouvernement pourraient être regroupés et partagés plus facilement. Et cela ne tient pas compte des nombreux groupes d’intervenants, sous-groupes ou même les Canadiens qui accéderont au portail sans aucun but précis ou sans aucune expérience du travail des données.

Ceci dit, les intervenants eux-mêmes ont souvent reconnu qu’il ne sera peut-être pas possible de plaire de façon égale à tous les intervenants. Par conséquent, plusieurs d’entre eux ont exprimé le désir que le gouvernement soit plus explicite concernant ses objectifs relativement au portail de données ouvertes. Le principal objectif du portail est-il de rendre le gouvernement plus transparent? D’améliorer l’accès aux données qui intéressent les milieux de la politique ou universitaires? De permettre aux vendeurs de concevoir des produits soit pour les citoyens, soit pour le gouvernement, d’améliorer les services et/ou accroître la concurrence dans l’espace des fournisseurs? Ou, l’objectif est-il d’aider à favoriser les connaissances des données chez les citoyens qui seraient alors mieux en mesure de penser de façon critique et de participer à une économie du 21e siècle?  Il pourrait s’agir, en fin de compte, de tous ces objectifs – mais tout effort visant à créer un nouveau portail de données devrait au moins tenter de résoudre cette question de manière que les citoyens, les utilisateurs et les responsables gouvernementaux qui mettent en œuvre le portail soient sûrs de son objectif et, par conséquent, peut-être mieux en mesure de s’en prévaloir, et dans le cas des responsables gouvernementaux, concevoir, appuyer et bâtir une stratégie connexe.

2. Recherche améliorée

Recommandations

  • Améliorer la fonction recherche de tout site futur, permettre aux gens de trouver leurs données plus facilement.
  • Envisager d’avoir de multiples portails (ou au moins assurer la continuation des portails actuels) qui ciblent des questions précises (p.ex. données géographiques, données statistiques ou environnementales) et qui intéressent des groupes importants d’intervenants, par exemple, les universitaires, les responsables de l’élaboration des politiques aux niveaux local, provincial et fédéral.
  • Aider les utilisateurs à créer leurs propres façons de naviguer les ensembles de données au moyen de descripteurs
  • Avoir recours aux services de bibliothécaires pour la conception et l’organisation des données
  • Explorer les possibilités de faciliter la recherche dans les données de plusieurs administrations de façon que des ensembles de données comparables détenus aux niveaux local et provincial soient également affichés.

Ce qui a été dit :

La capacité de trouver des données du gouvernement constitue une des principales responsabilités, voire peut-être la plus importante, d’un portail de données ouvertes. Sans une fonction de recherche efficace, les utilisateurs et les citoyens ne pourront jamais trouver ce dont ils ont besoin ou sont curieux d’explorer plus à fond. La réduction des coûts de friction liés à la recherche de données ne garantit aucunement une utilisation généralisée et exhaustive, mais les coûts élevés de friction eux, garantiront peu ou pas d’utilisation des données gouvernementales.

Presque sans exception, la plainte la plus fréquente concernant le portail de données ouvertes du gouvernement fédéral était la qualité de la recherche.  Les participants ont parlé de leur recherche pour des ensembles de données qui existaient, à leur connaissance, mais qui demeuraient introuvables sans avoir besoin d’entrer une phrase précise ou de connaître un terme clé. L’utilité principale d’un portail de données est de lier les utilisateurs aux données qu’ils cherchent. Il est donc impératif de trouver la bonne solution à ce problème.   En outre, si le gouvernement continue à s’inspirer du R.-U. et des É.-U. et d’accroître la disponibilité des données, cela ne fera qu’en accroître l’importance à mesure que grandissent le nombre, le type et la diversité des ensembles de données.

De nombreuses autres fonctionnalités liées à la recherche ont été mentionnées au cours des consultations. Bon nombre d’utilisateurs souhaitaient voir de meilleures « recommandations ». Par exemple, les utilisateurs qui trouvaient un ensemble de données trouveraient probablement intéressants les ensembles de données correspondantes. D’autres ont suggéré que les descripteurs à la fois officiels et produits par les utilisateurs soient appliqués aux ensembles de données, de façon que les utilisateurs puissent chercher à partir de termes qui pourraient être plus accessibles aux profanes et aux non professionnels. En effet, selon un participant de Toronto, sur un site Web de bibliothèque, les descripteurs générés par les utilisateurs étaient utilisés plus fréquemment pour naviguer le site Web que la structure formelle de catalogage.

Plusieurs utilisateurs ont mentionné la quantité d’ensembles de données sur Données.gc.ca qui pouvait être trouvée sur d’autres portails de données gouvernementales plus ciblés (tels que GeoGratis). Parce que ces portails ont tendance à cibler un groupe plus restreint, ils offrent souvent des fonctions de recherche plus efficaces (des faux positifs de données non pertinentes n’encombrent pas les résultats) ainsi que des métadonnées et d’autres renseignements sous un format plus facile à comprendre par le groupe cible (quoique possédant habituellement des compétences précises). Deux intérêts étaient présentés ici. L’un était un désir non équivoque d’accéder à une recherche thématique. L’autre était, encore une fois, la reconnaissance que plusieurs des pratiques exemplaires citées étaient déjà utilisées par ces portails plus ciblés. Les participants s’inquiétaient du fait qu’un portail unique de données ouvertes gouvernementales mettrait fin à ces sites des données ouvertes plus ciblées, dont bon nombre sont entourés de collectivités d’utilisateurs formels et informels.

En fin de compte, si la recherche constitue un élément critique de la réussite du portail de données, les intervenants ont convenu pour ainsi dire universellement que le gouvernement ait recours à l’expertise de bibliothécaires de données dans la création et l’organisation d’une nouvelle génération de portail de données ouvertes.

Pour illustrer à quel point il peut être difficile de se procurer des données existantes au Canada, un intervenant de Montréal a raconté la merveilleuse anecdote qui suit. Il avait besoin de trouver des parcours de chemin de fer pour créer une application d’horaire.  Il a commencé par communiquer avec VIA qui prétendait qu’elle ne possédait pas les données et lui a dit de chercher auprès de CN. CN a dit qu’elle n’était pas sûre de posséder les données. En fin de compte, le développeur a pu obtenir les données d’une agence du gouvernement américain qui disposait de données sur les parcours de chemin de fer pour toute l’Amérique du Nord.

3. Métadonnées et documentation

Recommandations :

  • Adopter des normes sur les métadonnées le plus rapidement possible
  • Permettre aux utilisateurs d’ajouter des métadonnées manquantes aux ensembles de données
  • En ce qui a trait aux métadonnées, il faudra peut-être faire appel à une gamme d’utilisateurs allant de spécialistes possédant une expertise approfondie en la matière jusqu’aux profanes.

Ce qui a été dit :

On entend par métadonnées et documentation des renseignements concernant les données. Ce que signifient les données, comment elles ont été mesurées et recueillies. L’utilisation à la fois efficace et responsable exige de bonnes métadonnées, en particulier lorsque les utilisateurs essayent de les appliquer à des fins non prévues à l’origine.

Presque tous les intervenants ont convenu qu’il était critique de disposer de meilleures métadonnées pour encourager l’utilisation. Toutefois, il était évident qu’il existait des opinions divergentes sur la signification des métadonnées pour différents intervenants.

Les membres des collectivités des universitaires, des responsables de la politique et des bibliothécaires avaient un sens plus poussé des exigences précises qu’ils voulaient faire respecter (telles que la norme sur les métadonnées Dublin core). En revanche, les développeurs et d’autres – bien qu’ils ne soient pas désintéressés par de telles métadonnées- étaient également intéressés par les renseignements qui pourraient être plus immédiatement accessibles aux profanes. La plupart des participants souhaitaient avoir accès à la documentation concernant la raison d’être de la collecte des données et aussi, de façon critique, les coordonnées de l’employé du gouvernement qui a créé l’ensemble de données et/ou en a tenu lieu de gardien. La capacité d’accéder directement à la source de données – la personne responsable- a été perçue comme étant critique par de nombreux intervenants dans tous les secteurs.

On reconnaissait aussi, généralement, qu’il peut être difficile de créer des métadonnées – en particulier après la création d’un ensemble de données. De nombreux intervenants ont fortement incité le gouvernement à  permettre aux utilisateurs de permettre aux utilisateurs d’ajouter des métadonnées manquantes, à l’instar de la Bibliothèque du Congrès (qui permet aux utilisateurs d’ajouter des descripteurs aux photos, ce qui contribue à améliorer le catalogue). Ce type de métadonnées pourraient porter la mention qu’elles ont été créées par les utilisateurs et sont, par conséquent, moins fiables – mais cela serait toujours mieux que rien et attirerait de nouveaux utilisateurs au site.

4. Renforcement des collectivités, mobilisation et formation

Recommandations :

  • Rédiger une stratégie de renforcement des collectivités et faire en sorte d’y inclure des ressources
  • Inviter les créateurs de données et les utilisateurs dans l’ensemble du gouvernement et à l’extérieur du gouvernement de consigner par écrit leurs expériences sur le portail de données ouvertes
  • Rendre les processus liés à la demande de renseignements plus transparents et informer l’utilisateur des délais pour les réponses
  • Afficher les ensembles de données actuellement demandés et ceux qui ont été rejetés antérieurement, de façon que les membres de la collectivité ne puissent pas faire des demandes en double pour ces ensembles de données en particulier
  • Ciblez les endroits que fréquentent les utilisateurs et/ou créez des espaces conviviaux où les gens peuvent se réunir. Il existe plusieurs listes de diffusion où les utilisateurs de données se « rassemblent » et encore de nombreux endroits qui sont très spécialisés (p. ex. utilisateurs de SIG ou spécialistes du logement)
  • Créer des collectivités liées à des ensembles précis de données ou même des catégories précises de données
  • Envisager une fonction formation pour le site Web, notamment, prévoir des outils de façon que tous les Canadiens puissent collaborer et apprendre à utiliser les données publiques.

La mobilisation et le renforcement des collectivités, bien qu’ils soient liés, répondent à deux fonctions précises demandées par les intervenants. La mobilisation concerne surtout le site Web et sert à fermer la boucle de rétroaction – à la fois des programmes ouverts aux utilisateurs et vice versa. Par collectivité on entend la capacité d’établir des liens à la fois avec les gestionnaires de programmes de données ouvertes ainsi qu’avec d’autres utilisateurs en vue de poser des questions et d’y répondre, se renseigner au sujet des utilisations faites des données, des capacités de renforcement et tout simplement de trouver l’inspiration.

Bien que de nombreux utilisateurs appréciaient les efforts déployés jusqu’à ce jour par l’équipe exploitant le portail de données ouvertes, la plupart ont convenu qu’il y aurait amplement lieu d’améliorer à la fois la mobilisation – perçue comme étant faible – et le renforcement de la collectivité – qui est généralement perçue comme inexistante.

De nombreux utilisateurs ont signalé que très souvent, on n’accusait pas réception de la rétroaction fournie sur le site Web et on ne répondait pas aux utilisateurs – en particulier lors d’une demande d’ensemble de données. Selon certains intervenants, des utilisateurs ont perdu confiance à l’égard du site et d’autres caractéristiques qui exigeaient leur apport. La plupart ont convenu que lorsque l’on sollicite des renseignements des utilisateurs ou que ceux-ci font des demandes de renseignements, il leur serait agréable de recevoir un accusé de réception ainsi qu’une idée de la date à laquelle ils pourraient s’attendre à recevoir une réponse. Pas un seul intervenant n’a demandé une réponse immédiate – seulement une indication de leur situation dans le processus.

Dans le cadre de la conversation susmentionnée, les intervenants ont également exprimé le désir de signaler des erreurs dans les ensembles de données de façon qu’elles puissent être reconnues et, le cas échéant, corrigées. Des utilisateurs plus chevronnés ont mentionné qu’ils aimeraient bifurquer (reproduire) des ensembles de données et ensuite faire part de ces bifurcations au gouvernement, de façon que  d’autres utilisateurs puissent en profiter.

Il y avait également un sentiment de frustration que le portail n’essayait aucunement de tenir les utilisateurs à jour au sujet de questions de base comme la modification d’un ensemble de données. Les utilisateurs de données seraient probablement très intéressés par toute modification d’un ensemble de données. Ceux-ci ont exprimé le désir de voir la création d’une sorte de système de notification qui signalerait à quelle date un ensemble est modifié ou devient contesté.

Des responsables des gouvernements provinciaux – en particulier la Colombie-Britannique – ont fait part de leur expérience concernant le besoin de renforcer la collectivité en vue de favoriser l’utilisation des données. De nombreux utilisateurs ont cité le site Web de la Colombie-Britannique, qui affiche régulièrement des articles de blogues mettant en valeur de nouveaux ensembles de données disponibles. D’autres ont mentionné la liste de diffusion de la ville de Vancouver qui  informait des abonnés au sujet de nouveaux ensembles de données. En outre, ils ont mentionné une collectivité créée par le groupe Google, dont se prévalaient des utilisateurs de données à Vancouver, mais à laquelle le personnel municipal participait régulièrement en répondant aux questions et même parfois en demandant des conseils, comme exemple excellent de la mobilisation efficace des collectivités. Dans la même veine, on a également mentionné un groupe de données ouvertes de Google auquel participent des fonctionnaires provinciaux.  

Les intervenants appréciaient beaucoup le fait que les employés du gouvernement participaient à ces groupes directement – pour répondre aux questions et traiter les demandes de renseignements rapidement sans l’intermédiaire d’un agent des communications. De tels groupes contribuent à bâtir la collectivité et la confiance. De nombreux intervenants avaient le sentiment que le renforcement et la mobilisation des collectivités exigeraient des ressources spécialisées et qu’il y aurait lieu de les prévoir dès la création d’un programme de données ouvertes. Il va sans dire que les exemples du Royaume-Uni et des États-Unis ont été largement évoqués, puisque ces gouvernements ont consacré du personnel pour interagir avec les utilisateurs et entretenir de bonnes relations avec ceux-ci.

De nombreux intervenants de tous les secteurs étaient d’avis que le portail de données ouvertes offrait au gouvernement une occasion importante de mener une initiative de sensibilisation au sujet de la compréhension de l’utilisation des données et même de fournir une formation à cet égard. Dans certaines séances, les intervenants ont dit qu’ils espéraient qu’il y aurait un cours intitulé Données ouvertes 101 ou des cours magistraux sur le sujet pour aider à expliquer comment utiliser les ensembles de données de diverses façons. On reconnaissait, généralement, que les participants aux tables rondes n’étaient pas des Canadiens ordinaires, mais des personnes qui s’intéressaient déjà aux données et qui les utilisaient souvent. Selon eux, il y aurait lieu de montrer les possibilités à ceux qui étaient moins familiers avec l’utilisation des données.

Toutefois, il y a un besoin manifeste d’une formation plus répandue et le gouvernement devra décider si, et dans quelle mesure, il s’agit d’un des objectifs fondamentaux du portail. En général, les participants étaient de l’avis qu’il y avait un avantage à en faire plus à la fois d’une perspective d’équité sociale et de l’économie numérique. En outre, la formation et la mobilisation des collectivités pourraient, en réalité, contribuer à réduire les coûts liés à la gestion du portail de données ouvertes puisqu’on pourrait utiliser à profit la capacité d’utilisateurs courants du portail pour aider les autres. En plus, de nouveaux utilisateurs pourraient peut-être alléger la demande faite pour d’autres ressources gouvernementales. À ce titre, explicitement ou implicitement, une pression sera exercée sur le gouvernement pour qu’il ajoute une composante de formation à ces programmes de données ouvertes.

5. Les données

Recommandations :

  • Confirmer davantage ce qui constitue des ensembles de données « de base » et prioriser leur diffusion
  • Faciliter l’organisation des données selon des critères géographiques – à la fois en affichant des « formes» géographiques qui sont pertinentes pour les utilisateurs – et en organisant des données en fonction de ces limites géographiques.
  • Créer un ensemble de données canoniques tenu par le gouvernement de façon que les utilisateurs puissent mieux prioriser les données qu’ils souhaitent diffuser et mieux comprendre pourquoi certains ensembles de données ne peuvent pas être diffusés.
  • Traiter le portail de données ouvertes tant comme un centre d’archivage que de diffusion pour les données puisqu’il y aura un intérêt non seulement pour les données récentes, mais pour les données historiques.
  • Pour des ensembles de données importants, permettre aux utilisateurs de télécharger un échantillon d’ensembles qu’ils peuvent mettre à l’essai.

Ce qui a été dit :

Bien que tous les intervenants, pour ainsi dire, ont visité Données.gc.ca, à un moment donné, seulement entre 50-70 % avaient téléchargé un ensemble de données et un nombre plus restreint, par exemple 15-20 %, avaient utilisé un ensemble de données pour effectuer une analyse ou dans une application. Ceci tenait en partie à l’incapacité de trouver des ensembles de données intéressants. Que voulaient, donc, les utilisateurs? Sur ce point, ils étaient moins clairs, étant donné que l’intérêt différait autant que les participants. Toutefois, certains thèmes de base sont ressortis.

  1. Ensembles de données de base
    • Les utilisateurs ont déterminé que certains ensembles de données étaient des ensembles « clés ». Ces données sont souvent essentielles à l’utilisateur pour l’utilisation d’autres ensembles de données puisqu’ils font fonction d’identificateurs uniques pour divers objets. Puisque ces ensembles de données constituent souvent les composantes de base des analyses et des applications, il a été généralement convenu qu’il était prioritaire de les rendre ouvertes et disponibles.
    • Voici une liste non exhaustive des données : codes postaux, bases de données de registres d’organisations à but non lucratif et d’entreprises, données sur les limites administratives, par exemple les données sur les autorités sanitaires et autres. En outre, certains ensembles de données, par exemple sur les dépenses gouvernementales et le budget, étaient considérés comme non fondamentaux, à proprement parler, mais néanmoins nettement importants.
  2. Organisation selon des critères géographiques
    • L’établissement d’un lien entre les données et la géographie constitue une des utilisations les plus populaires, à la fois pour l’analyse et le développement des applications. De nombreux utilisateurs ont remarqué qu’actuellement, les données ne sont pas organisées selon un ordre en particulier à l’échelle du gouvernement – il n’existe aucune carte de référence canonique qui faciliterait le fusionnement, par exemple, la population et la densité de la population pour un secteur ou une région. L’infrastructure qui ressemble le plus à ce modèle est le district de recensement qui est fréquemment un domaine très abstrait pour la plupart des utilisateurs. Ils s’intéressent davantage aux ensembles de données au niveau des communautés ou des villes. Des utilisateurs de tous les secteurs ont mentionné à plusieurs reprises qu’il y aurait lieu d’aider le gouvernement à définir certains critères géographiques communs qui rendraient ses données plus accessibles et interopérables.
    • Les utilisateurs ont noté qu’un projet de ce type – qui serait utile au sein de la structure du gouvernement fédéral– pourrait également être utile au-delà du gouvernement fédéral. De nombreux ensembles de données pertinents, par exemple, les autorités sanitaires, les districts scolaires, etc… se trouvent au niveau provincial ou même local. Le gouvernement fédéral pourrait assumer un rôle d’organisateur en vue d’établir des normes pour ce domaine.
  3. Données longitudinales
    • Outre l’organisation des données selon des critères géographiques, il y avait un intérêt marqué pour les données longitudinales. Ce sont les secteurs à but non lucratif, gouvernementaux, universitaires et stratégiques qui ont exprimé l’intérêt le plus marqué à cet égard. Pour de nombreux intervenants, la démarcation entre des données « courantes » et « archivées » n’était pas toujours évidente. Pour eux, il serait fortement souhaitable de pouvoir accéder à n’importe quelle plage de dates.
  4. Données sur les données
    • Presque tous les intervenants ont convenu qu’il y aurait lieu de prévoir un autre ensemble utile de données, à savoir, un fichier des données de base au sujet de toutes les données que le gouvernement recueille. Il existe actuellement trois types de données :
      1. Données que le gouvernement peut partager;
      2. Données que le gouvernement ne peut pas partager pour des raisons de confidentialité ou de sécurité;
      3. Données que le gouvernement ne divulguera pas qu’il possède pour des raisons de sécurité.
    • Les intervenants souhaitaient obtenir une liste des deux premiers types de données. Ils ont déclaré de façon sans équivoque qu’ils comprenaient que ces listes contenaient des données auxquelles ils n’auraient pas accès en temps normal (pour des raisons de confidentialité ou de sécurité), mais le fait d’être conscients de leur existence leur permettrait de prioriser les demandes de renseignements et réduirait la possibilité de multiplier les demandes pour des ensembles de données qui ne peuvent pas être divulgués. En outre, les intervenants intéressés aux questions de confidentialité étaient particulièrement intéressés par les métadonnées sur les ensembles de données que l’on ne pourrait pas inclure dans une initiative d’ouverture, puisqu’ils veulent connaître le type de données que les gouvernements recueillent, même s’ils ne veulent pas voir les données elles-mêmes, c.-à-d. ils veulent savoir ce qui est recueilli pour comprendre comment le gouvernement gère la confidentialité.
    • En fin de compte, certains développeurs se sont dits intéressés par une API pour un ensemble de données sur le contenu du catalogue. Cela permettrait la création de portails ou de moteurs de recherche de rechange. Tout au moins, les utilisateurs experts pourraient examiner les données plus efficacement.
  5. Plus les données sont précises, plus elles seront utiles.
    • Tous les intervenants se préoccupaient de protéger la confidentialité des individus et pourvu que cet élément pouvait être assuré, ils souhaitaient que les données soient les plus précises possible. Pour de nombreux ensembles de données, il n’existe aucun dilemme concernant la confidentialité ou la sécurité; par conséquent ils se sont dits très frustrés concernant le manque de précision disponible. Par exemple, dans un domaine tel que la production du blé, il est moins intéressant de savoir combien de boisseaux sont produits tous les ans au Canada que de connaître les quantités produites par chaque province, mais il est bien plus intéressant de connaître la production par région et encore plus par sous-région, zone tempérée, etc….Trop souvent, un « ensemble de données » est simplement un regroupement de données plus détaillées, et c’est là où se trouvent les possibilités d’analyse approfondie et de développement d’applications.

6. Recommandations supplémentaires

  • Les intervenants se sont prononcés fortement en faveur d’une licence commune pancanadienne. Tous les intervenants ont convenu que si les municipalités, les provinces et le gouvernement fédéral utilisaient la même licence, il serait plus facile de réutiliser les données.
  • Envisager de développer un ensemble de base de types ou de « profils » d’utilisateurs – développeurs, chercheurs et le citoyen moyen. Mettre l’accent sur les trois premiers – élaborer des stratégies et des modes de conception qui leur permettraient d’atteindre rapidement leurs objectifs.
  • Si l’on souhaite attirer des utilisateurs non spécialistes, il faudrait effectuer un examen rigoureux du site et des ensembles d’acronymes, ce qui crée des obstacles à l’apprentissage. Pour ce faire, il y aurait lieu de s’inspirer des travaux du SMD du R.-U.
  • Le gouvernement doit envisager de quelle façon il compte traiter des ensembles de données très vastes. En particulier, ceux qui changent fréquemment. Un intervenant a raconté qu’une autorité gouvernementale lui envoie fréquemment des CD-ROM d’ensembles de données puisqu’il s’agit d’un moyen plus facile ou plus désirable de partager les données que de les rendre disponibles en ligne.
  • Le gouvernement fédéral pourrait favoriser et soutenir diverses normes de données tandis que ce type de programme pourrait être plus complet que de simples outils sur un site Web, ce type de trousse d’outils pourrait inciter les vendeurs, les responsables gouvernementaux et autres intervenants à proposer et à promouvoir des normes qui ferraient en sorte que les collectivités seraient mieux servies.
  • La demande d’API était très mitigée. Certains développeurs et chercheurs ont exprimé un désir très fort à cet égard, tandis que d’autres préféraient un téléchargement de données en vrac. Toutefois, de nombreux intervenants ont convenu que puisque le gouvernement donne librement des données, il devient de plus en plus difficile de savoir qui les utilise et à quelles fins. Ce n’est donc pas facile de mettre en commun des expériences de réussite et d’offrir des exemples. Les API pourraient constituer un moyen d’identifier les utilisateurs et, avec permission, de mieux comprendre les cas d’utilisation et de faire part des réussites.
  • Certaines initiatives courantes menées par les gouvernements et les organismes ont été la source d’inquiétudes de la part de tous les intervenants lors de toutes les réunions. En voici une liste non exhaustive :
    • La poursuite judiciaire intentée par Postes Canada au sujet des données sur les codes postaux. En plus d’être une source de frustration et de préoccupation pour les chercheurs, de nombreux développeurs et l’industrie privée ont soulevé des préoccupations concernant l’ « effet paralysant » de la poursuite sur leur désir d’innover en utilisant les données ouvertes du GC
    • Lors de quatre des cinq réunions de nombreux intervenants ont soulevé des préoccupations au sujet de l’élimination du formulaire complet de recensement obligatoire.

Annexe A : Questions posées par chaque groupe

Nous n’avons pas posé toutes les questions à chaque groupe, car lors de certaines consultations, ne temps nous a manqué.

  1. Le gouvernement du Canada publiera la prochaine génération du portail de données ouvertes ce printemps. Selon la perspective de l’utilisateur, quelles sont certaines des caractéristiques précises qui devraient être offertes au moyen du portail?
  2. Qui a utilisé des données de Données.gc.ca et qu’en avez-vous fait?
    1. Quelles données précises, soit déjà disponibles ou pas encore disponibles, vous intéressent le plus?
    2. Selon vous, quels critères d’ensembles de données ouvertes seraient très utiles?
  3. Outre l’ajout d’ensembles de données et l’intégration de caractéristiques interactives sur le portail de données ouvertes, qu’est-ce que le gouvernement fédéral pourrait faire d’autre dans le cadre de la prestation de données ouvertes qui faciliterait le développement des applications et d’analyses utilisables?
  4. Quels outils de médias sociaux le gouvernement du Canada devrait-il utiliser pour joindre les utilisateurs de données ouvertes?
  5. Les travaux sont en cours en vue de finaliser une licence gouvernementale ouverte commune pour les données municipales, provinciales, territoriales et fédérales. Quelles sont vos pensées ou suggestions concernant l’importance de l’attribution de licences efficaces pour les activités liées aux données ouvertes?
    1. Êtes-vous familier avec la licence proposée? Dans quelle mesure pensez-vous qu’elle sera efficace pour appuyer l’utilisation d’ensembles de données? (Suivi effectué auprès de multiples gouvernements.)
  6. Existe-t-il d’autres normes de données ouvertes qui devraient être priorisées afin de vous faciliter la tâche en tant qu’utilisateur de données et développeur d’applications?

Annexe B : Ensembles de données demandés

Ce qui suit est une liste non filtrée d’ensembles de données demandés :

Thèmes

  • Systèmes sur les familles et les individus sans abri
  • Données sur l’utilisation des terres
  • Comment les habitudes de circulation ont-elles changé – les responsables fédéraux recueilleront les données régionales
  • Les données sur les forêts
  • Données sur la santé 
  • Enjeu critique concernant l’accès aux données
  • Changements générationnels
  • Les moyens de transport utilisés pour le  déplacement des marchandises au Canada – on aimerait voir ces données que Transport a achetées de Statistique Canada
  • L’environnement
  • Secteur bénévole
  • Ensemble de données administratives ... aide pour les personnes âgées
  • Transport
  • Données sur l’immigration
  • Énergie
  • Données sur les ressources naturelles
    • Tous les ensembles de données sur les ressources naturelles – il n’y a aucune loi qui nous oblige à archiver nos données.
  • Bâtiment et construction – activités de construction

Ensembles de données précises

  • Sondage sur la population active – il faudrait l’effectuer plus souvent que tous les cinq ans
  • Données de CIC sur le nombre d’immigrants reçus
  • Données sur les codes postaux
  • Les habitudes de circulation des piétons pour les itinéraires de livraison postale – c.-à-d. les itinéraires les plus efficaces peuvent être utiles pour les politiciens, les Guides qui vendent des biscuits, etc…
  • Le nombre de transactions financières fédérales sur 48 transactions effectuées
  • Des ensembles de données sur tous les ensembles de données (y compris les ensembles non disponibles pour diffusion sur le site de données ouvertes pour des raisons de confidentialité ou de sécurité – le fait de savoir qu’ils existent pourrait réduire le nombre de demandes inutiles)
  • Le crime
  • Les données sur le logement de la SCHL
  • Données sur l’immigration – le lieu, l’âge, le pays d’origine des immigrants – où ils vont, quel style de vie ils ont adopté
  • Où les gens déménagent-ils dans le pays
  • Transition de la ville à la campagne – changements de styles de vie
  • Carte de base du Canada – cibler les données sur les voisinages
  • Données sur les subventions fédérales 
  • Classification des terres – en provenance d’AG, l’exploitation forestière, etc. – les réunir.
  • API pour le catalogue de données – il serait très utile de faire ceci pour toutes les administrations.
  • Données de l’ARC  – les ramener au niveau des secteurs de recensement
  • Données sur les budgets
  • Données du registre des entreprises
  • Données sur les élections – participation par bureau de vote, SIG par bureau de vote, contributions aux campagnes électorales
  • Taux d’abandon des études secondaires
  • Circuits cyclables en ville
  • Infrastructures (chemins, rues propices à la marche, voies navigables, etc.)

Note additionelle

Le Rapport sommaire sur les discussions en table ronde sur les données ouvertes a été rédigé par David Eaves.