Coin des ressources techniques en matière d’AIPRP - Introduction au Service de demande d’AIPRP en ligne et à l’utilisation de l’intelligence artificielle

Suivre :

  • RSS
  • Citer

Contexte/introduction

Bienvenue au Coin des ressources techniques pour l’AIPRP, l’endroit où vous pouvez consulter l’information et les mises à jour sur le nouveau Service de demande d’AIPRP en ligne (SDAL).

Le SDAL est un site Web simple et centralisé qui permet aux utilisateurs de remplir des demandes d’accès à l’information et de renseignements personnels et de les soumettre à l’une des institutions assujetties à la Loi sur l’accès à l’information et à la Loi sur la protection des renseignements personnels du gouvernement du Canada.

Intégration des institutions

Le SDAL a été mis en ligne en octobre 2018 avec 6 institutions. Toutes les institutions assujetties à la Loi sur l’accès à l’information et à la Loi sur la protection des renseignements personnels continueront d’être intégrées à l’application.

En quoi consiste l’« intégration »?

Dans ce contexte, l’« intégration » signifie que les institutions seront en mesure de tirer parti de toutes les fonctionnalités de l’application et que les utilisateurs pourront leur transmettre des demandes initiales d’accès à l’information et de renseignements personnels au moyen de l’application.

Données d’intégration Service de demande d’AIPRP en ligne (SDAL) d’AIPRP

Voici une mise à jour de l’état de l’intégration

Données d’intégration Service de demande d’AIPRP en ligne (SDAL) d’AIPRP
Numéro cible d’institutions intégrées : 265
Nombre d’institutions intégrées à ce jour : 194
Nombre d’institutions en cours d’intégration : 71
Voici la liste détaillée des institutions intégrés jusqu'à présent
  1. Administration de pilotage de l'Atlantique Canada
  2. Administration de pilotage du Pacifique Canada
  3. Administration du pipe-line du Nord Canada
  4. Administration du Régime de soins de santé de la fonction publique fédérale
  5. Administration portuaire de Halifax
  6. Administration portuaire de Hamilton
  7. Administration portuaire de Nanaïmo
  8. Administration portuaire de Port-Alberni
  9. Administration portuaire de Sept-Îles
  10. Administration portuaire de St. John’s
  11. Administration portuaire de Thunder Bay
  12. Administration portuaire de Toronto
  13. Administration portuaire de Vancouver Fraser
  14. Administration portuaire de Windsor
  15. Administration portuaire du Saguenay
  16. Affaires mondiales Canada
  17. Agence canadienne de développement économique du Nord
  18. Agence canadienne d'évaluation environnementale
  19. Agence canadienne d'inspection des aliments
  20. Agence de la consommation en matière financière du Canada
  21. Agence de la santé publique du Canada
  22. Agence de promotion économique du Canada atlantique
  23. Agence fédérale de développement économique pour le Sud de l'Ontario
  24. Agence spatiale canadienne
  25. Agriculture et Agroalimentaire Canada
  26. Anciens Combattants Canada
  27. Autorité du pont Windsor-Détroit
  28. Bureau de l’ombudsman des vétérans
  29. Bureau de la sécurité des transports du Canada
  30. Bureau du Conseil privé
  31. Bureau du surintendant des institutions financières Canada
  32. Caisse d’indemnisation pour les accidents ferroviaires impliquant des marchandises désignées
  33. Caisse d'indemnisation des dommages dus à la pollution par les hydrocarbures causée par les navires
  34. Canada Development Investment Corporation
    • Canada Eldor Inc.
    • Société de gestion Canada Hibernia
  35. Centre canadien d’hygiène et de sécurité au travail
  36. Centre d'analyse des opérations et déclarations financières du Canada
  37. Centre de la sécurité des télécommunications
  38. Comité de surveillance des activités de renseignement de sécurité
  39. Comité externe d'examen de la GRC
  40. Comité externe d'examen des griefs militaires
  41. Commissariat à la protection de la vie privée du Canada
  42. Commissariat à l'information du Canada
  43. Commissariat à l'intégrité du secteur public du Canada
  44. Commissariat au lobbying du Canada
  45. Commissariat aux langues officielles
  46. Commission canadienne de sûreté nucléaire
  47. Commission canadienne des droits de la personne
  48. Commission canadienne des grains
  49. Commission civile d’examen et de traitement des plaintes relatives à la GRC
  50. Commission de la fiscalité des premières nations
  51. Commission de la fonction publique du Canada
  52. Commission de l'immigration et du statut de réfugié du Canada
  53. Commission des champs de bataille nationaux
  54. Commission des libérations conditionnelles du Canada
  55. Commission des lieux et monuments historiques du Canada
  56. Commission des Traités de la Colombie-Britannique
  57. Commission d'examen des plaintes concernant la police militaire du Canada
  58. Commission du droit d'auteur Canada
  59. Conseil de l’aménagement du territoire du Sahtu
  60. Conseil de la radiodiffusion et des télécommunications canadiennes
  61. Conseil de recherches en sciences humaines du Canada
  62. Conseil de recherches en sciences naturelles et en génie du Canada
  63. Conseil des Arts du Canada
  64. Conseil des produits agricoles du Canada
  65. Conseil d'examen du prix des médicaments brevetés
  66. Conseil national de recherches Canada
  67. Corporation de développement des investissements du Canada
  68. Développement économique Canada pour les régions du Québec
  69. Diversification de l'économie de l'Ouest Canada
  70. École de la fonction publique du Canada
  71. Elections Canada
  72. Environnement et Changement climatique Canada
  73. Femmes et Égalité des genres Canada
  74. Fondation Asie-Pacifique du Canada.
  75. Fondation canadienne des relations raciales
  76. Fondation canadienne pour l’innovation
  77. Fondation Pierre Elliott Trudeau, La
  78. Infrastructure Canada
  79. Ingenium – Musée des sciences et de l'Innovation du Canada
  80. Innovation, Sciences et Développement économique Canada
  81. Instituts de recherche en santé du Canada
  82. l’Office des Eaux du Nunavut
  83. La Commission du Nunavut chargée de l’examen des répercussions
  84. L'Enquêteur correctionnel Canada
  85. Ministère de la Justice Canada
  86. Ministère des Finances Canada
  87. Monnaie royale canadienne
  88. Musée canadien de l'histoire
  89. Office Canada-Nouvelle-Écosse des hydrocarbures extracôtiers
  90. Office des droits de surface du Yukon
  91. Office des terres et des eaux de la vallée du Mackenzie Valley
  92. Office des terres et des eaux du Sahtu
  93. Office des transports du Canada
  94. Office d'investissement des regimes de pensions du secteur public
    • 3Net Indy Holdings
    • 3Net Indy Investments Inc.
    • 7986386 Canada Inc.
    • 8599963 Canada Inc.
    • Argentia Private Investments Inc.
    • AviAlliance Terminal Management Inc.
    • Indo-Infra Inc.
    • Infra H20 GP Partners Inc.
    • Infra H20 LP Partners Inc.
    • Infra TM Investments Inc.
    • Infra-PSP Canada Inc.
    • Infra-PSP Credit Inc.
    • Infra-PSP ECEF Inc.
    • Infra-PSP Partners Inc.
    • Ivory Private Investments Inc.
    • Kings Island Private Investments Inc.
    • Northern Fjord Holdings Inc.
    • Port-aux-Choix Private Investments Inc.
    • Potton Holdings Inc.
    • PSP Capital Inc.
    • PSP Finco Inc.
    • PSP H2O FL GP INC.
    • PSP Public Credit I Inc.
    • PSP Public Credit Opportunities Inc.
    • PSP Public Markets Inc.
    • PSPIB Baltimore G.P. Inc.
    • PSPIB Bromont Investments Inc.
    • PSPIB Deep South Inc.
    • PSPIB DevCol Inc.
    • PSPIB Emerald Inc.
    • PSPIB G.P. Finance Inc.
    • PSPIB G.P. Inc.
    • PSPIB G.P. Partners Inc.
    • PSPIB Golden Range Cattle II Inc.
    • PSPIB Golden Range Cattle Inc.
    • PSPIB Homes Inc.
    • PSPIB IRP60 Inc.
    • PSPIB Michigan G.P. Inc.
    • PSPIB Orchid Inc.
    • PSPIB Paisas Inc.
    • PSPIB Pennsylvania Investments Inc.
    • PSPIB WEXFORD INVESTMENTS INC.
    • PSPIB-Andes Inc.
    • PSPIB-CCR Inc.
    • PSPIB-Condor Inc.
    • PSPIB-Eldorado Inc.
    • PSPIB-LSF Inc.
    • PSPIB-Newbury G.P. Inc.
    • PSPIB-RE Finance Inc.
    • PSPIB-RE Finance Partners II Inc.
    • PSPIB-RE Finance Partners Inc.
    • PSPIB-RE MANCHESTER INC.
    • PSPIB-RE Partners II Inc.
    • PSPIB-RE Partners Inc.
    • PSPIB-RE UK Inc.
    • PSPIB-SDL Inc.
    • PSPIB-Star Inc.
    • Red Isle Private Investments Inc.
    • Revera Inc.
    • Trinity Bay Private Investments Inc.
    • VOP Investments Inc.
  95. Office Gwich’in des terres et des eaux
  96. Office national du film
  97. Parcs Canada
  98. Parent Institution
  99. Patrimoine canadien
  100. Pêches et Océans Canada
  101. Poste Canada
    • 2875039 Canada Limited
    • 3906949 Canada Inc
  102. Régie de l'énergie du Canada
  103. Relations Couronne-Autochtones et Affaires du Nord Canada
  104. Ressources naturelles Canada
    • Energy Supplies Allocation Board
  105. Santé Canada
  106. Savoir polaire Canada
  107. Secrétariat du Conseil du Trésor du Canada
  108. Sécurité Publique
  109. Service Canadien d'appui aux tribunaux administratifs
    • Commission canadienne d’examen des exportations de biens culturels
    • Commission de révision agricole du Canada
    • Commission des relations de travail et de l’emploi dans la fonction publique
    • Conseil canadien des relations industrielles
    • Greffe du Tribunal des revendications particulières du Canada
    • Tribunal canadien du commerce extérieur
    • Tribunal d’appel des transports du Canada
    • Tribunal de la concurrence
    • Tribunal de la protection des fonctionnaires divulgateurs
    • Tribunal de la sécurité sociale du Canada
    • Tribunal des droits de la personne du Canada
  110. Service des poursuites pénales du Canada
  111. Services aux Autochtones Canada
  112. Services partagés Canada
  113. Services publics et Approvisionnement Canada
  114. Société d'assurance-dépôts du Canada
  115. Société des ponts fédéraux
    • Corporation du Pont international de la Voie maritime limitée
  116. Statistique Canada
  117. Technologies du Développement Durable Canada
  118. Téléfilm Canada
  119. Tribunal des anciens combattants (révision et appel)

Institutions intégrées dans le cadre du projet pilote d’AIPRP d’IRCC en ligne

Le transfert au SDAL des institutions qui ont fait partie du projet pilote d’AIPRP d’IRCC est en cours de réalisation.

Institutions intégrées à l’aide du projet pilote d’AIPRP en ligne exécuté par Immigration, Réfugiés et Citoyenneté Canada (IRCC)
Nombre total d’institutions déjà disponibles dans le cadre du projet pilote : 33
Nombre total d’institutions intégrées sur le SDAL à l’aide du projet pilote : 27
Nombre d’institutions en cours d’intégration : 6

Intelligence artificielle

Dans cette mise à jour, nous expliquerons comment le Service de demande d’AIPRP en ligne utilise l’intelligence artificielle (IA).

Nous en sommes à nos premiers efforts pour expliquer l’utilisation d’IA au gouvernement. Nous vous prions de nous faire part de vos commentaires en communiquant avec open.ouvert@tbs-sct.gc.ca.

Quel est l’incidence de notre utilisation de l’intelligence artificielle

Afin de déterminer l’incidence de notre utilisation de l’intelligence artificielle, nous avons utilisé l’outil d’évaluation de l’incidence algorithmique.

Les résultats de cette évaluation démontrent que notre utilisation de l’IA a une incidence socio-économique minime sur les citoyens ainsi que sur les activités du gouvernement.

Utilisation de l’intelligence artificielle

La fonction de recherche offerte dans le cadre du présent site Web utilise l’intelligence artificielle (IA) pour améliorer l’expérience utilisateur.

La première intervention de l’IA s’effectue lorsqu’on recherche de l’information qui a peut-être déjà été divulguée en réponse à une autre demande. Les résultats de la recherche sont fondés sur des renseignements facilement accessibles à partir du site Web du gouvernement ouvert.

La deuxième intervention s’effectue pour aider à déterminer quelle institution peut détenir l’information relative à la demande. La recherche recommandera les institutions qui conviennent le mieux au type de demande. Le moteur de recherche se base sur les données provenant des sources suivantes :

  • Sommaires disponibles sur le gouvernement ouvert
  • Rapports ministériels
  • Grattage des sites web du gouvernement
  • Pages AIPRP des institutions
  • Taxonomies du gouvernement
  • Données maîtres unifiées – schéma organisationnel
  • 2016-17 Partie III – Rapport sur les résultats ministériels

Comment utilisons-nous l’IA?

Il peut être difficile de veiller à ce qu’une recherche Web renvoie tous les bons documents. Le système de recherche tire parti de l’apprentissage automatique pour déterminer les relations contextuelles et latentes qui sont plus fondamentales que les mots-clés. La recherche porte plutôt sur les concepts et la relation entre les recherches antérieures afin d’améliorer la qualité des résultats.

Le système de recherche mis au point utilise des techniques avancées de traitement du langage naturel (TLN) et d’apprentissage automatique pour améliorer la recherche à partir de multiples sources. Cette solution de recherche dépouille des sites Web, des forums ou n’importe quel endroit accessible au public. En allant au-delà de la simple similitude des mots et en privilégiant la « compréhension de la signification » des termes de recherche, cette solution peut comparer les besoins de recherche d’un utilisateur au corpus de documents en temps quasi réel, et revenir avec une liste de tous les documents pertinents ou toutes les composantes de documents qui se rapportent à une recherche donnée ou à un document comparable.

Les synonymes, les abréviations et les coquilles font souvent en sorte que des documents importants sont négligés. En utilisant l’apprentissage automatique avancé et le traitement du langage naturel (TLN), l’algorithme est capable de lire un corpus complet de documents (un site Web organisationnel, un programme de cours et les manuels et activités, etc.). Après avoir lu les documents, le système de recherche fondé sur l’IA est capable de « comprendre » sémantiquement les phrases et les idées; plus que dans le cadre d’un appariement par mot-clé.

Algorithme d’IA

Ce qui suit donnera un aperçu technique de l’algorithme utilisé.

  • Catégorie d’algorithme utilisé : Traitement du langage naturel.
  • Modèles utilisés : Tf-idf qui signifie Term frequency-inverse document (fréquence inversée du terme dans les documents) et modèles de similarité cosinus.

Améliorations de l’algorithme Tf-idf

L’algorithme tf-idf est une méthode de pondération de la relation entre deux textes. Le texte d’entrée de l’utilisateur sera comparé à tous les documents déjà publiés en vertu des lois sur l’AIPRP. Les documents publics ayant obtenu les pondérations les plus élevées seront proposés à l’utilisateur.

L’algorithme tf-idf commence par compter le nombre de mots dans la demande qui sont également présents dans chaque document public. Ce nombre est ensuite divisé par la fréquence de chacun des mots appariés. Cette répartition réduit le bruit et tient compte du fait que des mots courants comme « Canada » sont susceptibles de correspondre à de nombreux documents, peu importe la demande d’AIPRP et, par conséquent, que la correspondance n’est pas aussi importante. Il est plus utile de savoir qu’un mot moins courant se trouve à la fois dans la requête de l’utilisateur et dans le document accessible au public.

Tf-idf est essentiellement un algorithme d’appariement de mots. Les mots semblables (inexacts) à la fois dans la requête et dans les documents ne s’inscriront pas comme un appariement si seul l’algorithme Tf-idf intervient. En fait, l’algorithme Tf-idf est à la base de nombreuses plateformes de recherche disponibles sur le marché, dont Apache Solr, qui, aux fins de l’AIPRP, ne produirait pas de résultats pertinents. Ainsi, un certain nombre d’améliorations à l’algorithme Tf-idf ont été apportées

Racinisation

La façon la plus courante d’améliorer l’algorithme Tf-idf est d’utiliser une technique appelée la racinisation. La racinisation est le processus qui consiste à réduire un mot à sa « racine ». Par exemple, la racine du mot « racinisation » est le mot « racine ». Si nous réduisons tous les mots à leur base et que nous cherchons des correspondances, les deux mots « pêche » et « pêcheur » seront proposés comme un appariement. Cette technique fonctionnera de la même façon en anglais et en français.

Mots vides

À mesure que nous dépouillons le contenu pour réduire les mots à leur racine, nous pouvons aussi supprimer les mots vides. Un mot vide est un mot courant qui ne contribue pas à accorder un sens à la phase. Par exemple, si on enlève les mots « le », « la », « les », « un », « une » et « des »  de toute phrase, on peut quand même en déduire le sens général. La suppression des mots d’arrêt améliore la vitesse de traitement de notre algorithme et réduit les fausses correspondances.

Plongement lexical

La racinisation est utile lorsque deux mots partagent la même racine. Souvent, certains mots sont pratiquement les mêmes, mais ne partagent pas une racine commune. Par exemple, « Accès à l’information et protection des renseignements personnels » et « AIPRP » ont exactement le même sens, mais ne partagent aucun mot en commun. Pour que l’algorithme tf-idf enregistre les correspondances pour des mots semblables, il faut une façon de mesurer la proximité, ou la distance, entre deux mots. Par exemple, les mots « enfants » et « tout-petits » devraient être proches, et les mots « moutons » et « lion » devraient être distants. Pour mesurer la distance entre les mots, on peut utiliser un outil qu’on appelle le plongement lexical.

Le plongement lexical est un outil qui convertit un mot en vecteur. Ce vecteur comporte habituellement des centaines de dimensions. Nous avons tendance à utiliser des plongements verticaux qui ont de 100 à 300 dimensions. Même si nous avons un grand nombre de dimensions, nous pouvons calculer la distance entre deux mots de la même façon que nous calculons la distance dans un plus petit nombre de dimensions.

Pour combiner l’algorithme tf-idf et les plongements lexicaux, nous convertissons chaque mot en vecteur par plongement. Nous mesurons ensuite la distance entre chaque mot de l’activité (source) et chaque mot dans le fragment de contenu (cible). Les mots qui sont très proches l’un de l’autre reçoivent une pondération proche de 1 (ou exactement 1 s’il s’agit du même mot) et les mots qui sont très éloignés l’un de l’autre reçoivent une pondération de 0. De cette façon, un mot sera considéré comme un appariement si le sens du mot est semblable.

Réduction de la dimensionnalité

Un plongement lexical convertit un même mot en un vecteur de centaines de chiffres. Cette opération est effectuée pour tous les mots dans tous les documents gouvernementaux accessibles au public. En fin de compte, cette opération génère une énorme quantité de données et ces données doivent être dépouillées et analysées avec chaque demande d’AIPRP. Nous pouvons réduire la quantité de calculs (et par conséquent augmenter le rendement de la recherche) en utilisant un algorithme appelé Singular Value Decomposition (SVD) (Décomposition en valeurs singulières). En bref, le SVD peut être utilisé pour comprimer l’information dans chaque document (et le total des données générées) tout en conservant l’information et préservant l’exactitude de la recherche.

Date de modification :