Contexte/introduction
Bienvenue au Coin des ressources techniques pour l’AIPRP, l’endroit où vous pouvez consulter l’information et les mises à jour sur le nouveau Service de demande d’AIPRP en ligne (SDAL).
Le SDAL est un site Web simple et centralisé qui permet aux utilisateurs de remplir des demandes d’accès à l’information et de renseignements personnels et de les soumettre à l’une des institutions assujetties à la Loi sur l’accès à l’information et à la Loi sur la protection des renseignements personnels du gouvernement du Canada.
Intégration des institutions
Le SDAL a été mis en ligne en octobre 2018 avec 6 institutions. Toutes les institutions assujetties à la Loi sur l’accès à l’information et à la Loi sur la protection des renseignements personnels continueront d’être intégrées à l’application.
En quoi consiste l’« intégration »?
Dans ce contexte, l’« intégration » signifie que les institutions seront en mesure de tirer parti de toutes les fonctionnalités de l’application et que les utilisateurs pourront leur transmettre des demandes initiales d’accès à l’information et de renseignements personnels au moyen de l’application.
Données d’intégration Service de demande d’AIPRP en ligne (SDAL) d’AIPRP
Voici une mise à jour de l’état de l’intégration
Numéro cible d’institutions intégrées : | 265 |
Nombre d’institutions intégrées à ce jour : | 198 |
Nombre d’institutions en cours d’intégration : | 67 |
Voici la liste détaillée des institutions intégrés jusqu'à présent
- Administration de pilotage de l'Atlantique Canada
- Administration de pilotage du Pacifique Canada
- Administration du pipe-line du Nord Canada
- Administration du Régime de soins de santé de la fonction publique fédérale
- Administration portuaire de Halifax
- Administration portuaire de Hamilton
- Administration portuaire de Nanaïmo
- Administration portuaire de Port-Alberni
- Administration portuaire de Sept-Îles
- Administration portuaire de St. John’s
- Administration portuaire de Thunder Bay
- Administration portuaire de Toronto
- Administration portuaire de Vancouver Fraser
- Administration portuaire de Windsor
- Administration portuaire du Saguenay
- Affaires mondiales Canada
- Agence canadienne de développement économique du Nord
- Agence canadienne d'évaluation environnementale
- Agence canadienne d'inspection des aliments
- Agence de la consommation en matière financière du Canada
- Agence de la santé publique du Canada
- Agence de promotion économique du Canada atlantique
- Agence fédérale de développement économique pour le Sud de l'Ontario
- Agence spatiale canadienne
- Agriculture et Agroalimentaire Canada
- Anciens Combattants Canada
- Autorité du pont Windsor-Détroit
- Bureau de l’ombudsman des vétérans
- Bureau de la sécurité des transports du Canada
- Bureau du Conseil privé
- Bureau du surintendant des institutions financières Canada
- Caisse d’indemnisation pour les accidents ferroviaires impliquant des marchandises désignées
- Caisse d'indemnisation des dommages dus à la pollution par les hydrocarbures causée par les navires
- Corporation de développement des investissements du Canada
- Canada Eldor Inc.
- Société de gestion Canada Hibernia
- Centre canadien d’hygiène et de sécurité au travail
- Centre d'analyse des opérations et déclarations financières du Canada
- Centre de la sécurité des télécommunications
- Comité de surveillance des activités de renseignement de sécurité
- Comité externe d'examen de la GRC
- Comité externe d'examen des griefs militaires
- Commissariat à la protection de la vie privée du Canada
- Commissariat à l'information du Canada
- Commissariat à l'intégrité du secteur public du Canada
- Commissariat au lobbying du Canada
- Commissariat aux langues officielles
- Commission canadienne de sûreté nucléaire
- Commission canadienne des droits de la personne
- Commission canadienne des grains
- Commission canadienne du lait
- Commission civile d’examen et de traitement des plaintes relatives à la GRC
- Commission de la fiscalité des premières nations
- Commission de la fonction publique du Canada
- Commission de l'immigration et du statut de réfugié du Canada
- Commission des champs de bataille nationaux
- Commission des libérations conditionnelles du Canada
- Commission des lieux et monuments historiques du Canada
- Commission des Traités de la Colombie-Britannique
- Commission d'examen des plaintes concernant la police militaire du Canada
- Commission du droit d'auteur Canada
- Conseil de l’aménagement du territoire du Sahtu
- Conseil de la radiodiffusion et des télécommunications canadiennes
- Conseil de recherches en sciences humaines du Canada
- Conseil de recherches en sciences naturelles et en génie du Canada
- Conseil des Arts du Canada
- Conseil des produits agricoles du Canada
- Conseil d'examen du prix des médicaments brevetés
- Conseil national de recherches Canada
- Développement économique Canada pour les régions du Québec
- Diversification de l'économie de l'Ouest Canada
- École de la fonction publique du Canada
- Elections Canada
- Environnement et Changement climatique Canada
- Femmes et Égalité des genres Canada
- Fondation Asie-Pacifique du Canada.
- Fondation canadienne des relations raciales
- Fondation canadienne pour l’innovation
- Fondation Pierre Elliott Trudeau, La
- Infrastructure Canada
- Ingenium – Musée des sciences et de l'Innovation du Canada
- Innovation, Sciences et Développement économique Canada
- Instituts de recherche en santé du Canada
- l’Office des Eaux du Nunavut
- La Commission du Nunavut chargée de l’examen des répercussions
- L'Enquêteur correctionnel Canada
- Ministère de la Justice Canada
- Ministère des Finances Canada
- Monnaie royale canadienne
- Musée canadien de l'histoire
- Office Canada-Nouvelle-Écosse des hydrocarbures extracôtiers
- Office des droits de surface du Yukon
- Office des terres et des eaux de la vallée du Mackenzie Valley
- Office des terres et des eaux du Sahtu
- Office des transports du Canada
- Office d'investissement des regimes de pensions du secteur public
- 3Net Indy Holdings
- 3Net Indy Investments Inc.
- 7986386 Canada Inc.
- 8599963 Canada Inc.
- Argentia Private Investments Inc.
- AviAlliance Terminal Management Inc.
- Indo-Infra Inc.
- Infra H20 GP Partners Inc.
- Infra H20 LP Partners Inc.
- Infra TM Investments Inc.
- Infra-PSP Canada Inc.
- Infra-PSP Credit Inc.
- Infra-PSP ECEF Inc.
- Infra-PSP Partners Inc.
- Ivory Private Investments Inc.
- Kings Island Private Investments Inc.
- Northern Fjord Holdings Inc.
- Port-aux-Choix Private Investments Inc.
- Potton Holdings Inc.
- PSP Capital Inc.
- PSP Finco Inc.
- PSP H2O FL GP INC.
- PSP Public Credit I Inc.
- PSP Public Credit Opportunities Inc.
- PSP Public Markets Inc.
- PSPIB Baltimore G.P. Inc.
- PSPIB Bromont Investments Inc.
- PSPIB Deep South Inc.
- PSPIB DevCol Inc.
- PSPIB Emerald Inc.
- PSPIB G.P. Finance Inc.
- PSPIB G.P. Inc.
- PSPIB G.P. Partners Inc.
- PSPIB Golden Range Cattle II Inc.
- PSPIB Golden Range Cattle Inc.
- PSPIB Homes Inc.
- PSPIB IRP60 Inc.
- PSPIB Michigan G.P. Inc.
- PSPIB Orchid Inc.
- PSPIB Paisas Inc.
- PSPIB Pennsylvania Investments Inc.
- PSPIB WEXFORD INVESTMENTS INC.
- PSPIB-Andes Inc.
- PSPIB-CCR Inc.
- PSPIB-Condor Inc.
- PSPIB-Eldorado Inc.
- PSPIB-LSF Inc.
- PSPIB-Newbury G.P. Inc.
- PSPIB-RE Finance Inc.
- PSPIB-RE Finance Partners II Inc.
- PSPIB-RE Finance Partners Inc.
- PSPIB-RE MANCHESTER INC.
- PSPIB-RE Partners II Inc.
- PSPIB-RE Partners Inc.
- PSPIB-RE UK Inc.
- PSPIB-SDL Inc.
- PSPIB-Star Inc.
- Red Isle Private Investments Inc.
- Revera Inc.
- Trinity Bay Private Investments Inc.
- VOP Investments Inc.
- Office Gwich’in des terres et des eaux
- Office national du film
- Parcs Canada
- Patrimoine canadien
- Pêches et Océans Canada
- Poste Canada
- 2875039 Canada Limited
- 3906949 Canada Inc
- Régie de l'énergie du Canada
- Relations Couronne-Autochtones et Affaires du Nord Canada
- Ressources naturelles Canada
- Energy Supplies Allocation Board
- Santé Canada
- Savoir polaire Canada
- Secrétariat du Conseil du Trésor du Canada
- Sécurité Publique
- Service Canadien d'appui aux tribunaux administratifs
- Commission canadienne d’examen des exportations de biens culturels
- Commission de révision agricole du Canada
- Commission des relations de travail et de l’emploi dans la fonction publique
- Conseil canadien des relations industrielles
- Greffe du Tribunal des revendications particulières du Canada
- Tribunal canadien du commerce extérieur
- Tribunal d’appel des transports du Canada
- Tribunal de la concurrence
- Tribunal de la protection des fonctionnaires divulgateurs
- Tribunal de la sécurité sociale du Canada
- Tribunal des droits de la personne du Canada
- Service des poursuites pénales du Canada
- Services aux Autochtones Canada
- Services partagés Canada
- Services publics et Approvisionnement Canada
- Société canadienne d'hypothèques et de logement
- Fiducie du Canada pour l'habitation
- Société d'assurance-dépôts du Canada
- Société des ponts fédéraux
- Corporation du Pont international de la Voie maritime limitée
- Statistique Canada
- Technologies du Développement Durable Canada
- Téléfilm Canada
- Transports Canada
- Tribunal des anciens combattants (révision et appel)
Institutions intégrées dans le cadre du projet pilote d’AIPRP d’IRCC en ligne
Le transfert au SDAL des institutions qui ont fait partie du projet pilote d’AIPRP d’IRCC est en cours de réalisation.
Nombre total d’institutions déjà disponibles dans le cadre du projet pilote : | 33 |
Nombre total d’institutions intégrées sur le SDAL à l’aide du projet pilote : | 27 |
Nombre d’institutions en cours d’intégration : | 6 |
Intelligence artificielle
Dans cette mise à jour, nous expliquerons comment le Service de demande d’AIPRP en ligne utilise l’intelligence artificielle (IA).
Nous en sommes à nos premiers efforts pour expliquer l’utilisation d’IA au gouvernement. Nous vous prions de nous faire part de vos commentaires en communiquant avec open.ouvert@tbs-sct.gc.ca.
Quel est l’incidence de notre utilisation de l’intelligence artificielle
Afin de déterminer l’incidence de notre utilisation de l’intelligence artificielle, nous avons utilisé l’outil d’évaluation de l’incidence algorithmique.
Les résultats de cette évaluation démontrent que notre utilisation de l’IA a une incidence socio-économique minime sur les citoyens ainsi que sur les activités du gouvernement.
Utilisation de l’intelligence artificielle
La fonction de recherche offerte dans le cadre du présent site Web utilise l’intelligence artificielle (IA) pour améliorer l’expérience utilisateur.
La première intervention de l’IA s’effectue lorsqu’on recherche de l’information qui a peut-être déjà été divulguée en réponse à une autre demande. Les résultats de la recherche sont fondés sur des renseignements facilement accessibles à partir du site Web du gouvernement ouvert.
La deuxième intervention s’effectue pour aider à déterminer quelle institution peut détenir l’information relative à la demande. La recherche recommandera les institutions qui conviennent le mieux au type de demande. Le moteur de recherche se base sur les données provenant des sources suivantes :
- Sommaires disponibles sur le gouvernement ouvert
- Rapports ministériels
- Grattage des sites web du gouvernement
- Pages AIPRP des institutions
- Taxonomies du gouvernement
- Données maîtres unifiées – schéma organisationnel
- 2016-17 Partie III – Rapport sur les résultats ministériels
Comment utilisons-nous l’IA?
Il peut être difficile de veiller à ce qu’une recherche Web renvoie tous les bons documents. Le système de recherche tire parti de l’apprentissage automatique pour déterminer les relations contextuelles et latentes qui sont plus fondamentales que les mots-clés. La recherche porte plutôt sur les concepts et la relation entre les recherches antérieures afin d’améliorer la qualité des résultats.
Le système de recherche mis au point utilise des techniques avancées de traitement du langage naturel (TLN) et d’apprentissage automatique pour améliorer la recherche à partir de multiples sources. Cette solution de recherche dépouille des sites Web, des forums ou n’importe quel endroit accessible au public. En allant au-delà de la simple similitude des mots et en privilégiant la « compréhension de la signification » des termes de recherche, cette solution peut comparer les besoins de recherche d’un utilisateur au corpus de documents en temps quasi réel, et revenir avec une liste de tous les documents pertinents ou toutes les composantes de documents qui se rapportent à une recherche donnée ou à un document comparable.
Les synonymes, les abréviations et les coquilles font souvent en sorte que des documents importants sont négligés. En utilisant l’apprentissage automatique avancé et le traitement du langage naturel (TLN), l’algorithme est capable de lire un corpus complet de documents (un site Web organisationnel, un programme de cours et les manuels et activités, etc.). Après avoir lu les documents, le système de recherche fondé sur l’IA est capable de « comprendre » sémantiquement les phrases et les idées; plus que dans le cadre d’un appariement par mot-clé.
Algorithme d’IA
Ce qui suit donnera un aperçu technique de l’algorithme utilisé.
- Catégorie d’algorithme utilisé : Traitement du langage naturel.
- Modèles utilisés : Tf-idf qui signifie Term frequency-inverse document (fréquence inversée du terme dans les documents) et modèles de similarité cosinus.
Améliorations de l’algorithme Tf-idf
L’algorithme tf-idf est une méthode de pondération de la relation entre deux textes. Le texte d’entrée de l’utilisateur sera comparé à tous les documents déjà publiés en vertu des lois sur l’AIPRP. Les documents publics ayant obtenu les pondérations les plus élevées seront proposés à l’utilisateur.
L’algorithme tf-idf commence par compter le nombre de mots dans la demande qui sont également présents dans chaque document public. Ce nombre est ensuite divisé par la fréquence de chacun des mots appariés. Cette répartition réduit le bruit et tient compte du fait que des mots courants comme « Canada » sont susceptibles de correspondre à de nombreux documents, peu importe la demande d’AIPRP et, par conséquent, que la correspondance n’est pas aussi importante. Il est plus utile de savoir qu’un mot moins courant se trouve à la fois dans la requête de l’utilisateur et dans le document accessible au public.
Tf-idf est essentiellement un algorithme d’appariement de mots. Les mots semblables (inexacts) à la fois dans la requête et dans les documents ne s’inscriront pas comme un appariement si seul l’algorithme Tf-idf intervient. En fait, l’algorithme Tf-idf est à la base de nombreuses plateformes de recherche disponibles sur le marché, dont Apache Solr, qui, aux fins de l’AIPRP, ne produirait pas de résultats pertinents. Ainsi, un certain nombre d’améliorations à l’algorithme Tf-idf ont été apportées
Racinisation
La façon la plus courante d’améliorer l’algorithme Tf-idf est d’utiliser une technique appelée la racinisation. La racinisation est le processus qui consiste à réduire un mot à sa « racine ». Par exemple, la racine du mot « racinisation » est le mot « racine ». Si nous réduisons tous les mots à leur base et que nous cherchons des correspondances, les deux mots « pêche » et « pêcheur » seront proposés comme un appariement. Cette technique fonctionnera de la même façon en anglais et en français.
Mots vides
À mesure que nous dépouillons le contenu pour réduire les mots à leur racine, nous pouvons aussi supprimer les mots vides. Un mot vide est un mot courant qui ne contribue pas à accorder un sens à la phase. Par exemple, si on enlève les mots « le », « la », « les », « un », « une » et « des » de toute phrase, on peut quand même en déduire le sens général. La suppression des mots d’arrêt améliore la vitesse de traitement de notre algorithme et réduit les fausses correspondances.
Plongement lexical
La racinisation est utile lorsque deux mots partagent la même racine. Souvent, certains mots sont pratiquement les mêmes, mais ne partagent pas une racine commune. Par exemple, « Accès à l’information et protection des renseignements personnels » et « AIPRP » ont exactement le même sens, mais ne partagent aucun mot en commun. Pour que l’algorithme tf-idf enregistre les correspondances pour des mots semblables, il faut une façon de mesurer la proximité, ou la distance, entre deux mots. Par exemple, les mots « enfants » et « tout-petits » devraient être proches, et les mots « moutons » et « lion » devraient être distants. Pour mesurer la distance entre les mots, on peut utiliser un outil qu’on appelle le plongement lexical.
Le plongement lexical est un outil qui convertit un mot en vecteur. Ce vecteur comporte habituellement des centaines de dimensions. Nous avons tendance à utiliser des plongements verticaux qui ont de 100 à 300 dimensions. Même si nous avons un grand nombre de dimensions, nous pouvons calculer la distance entre deux mots de la même façon que nous calculons la distance dans un plus petit nombre de dimensions.
Pour combiner l’algorithme tf-idf et les plongements lexicaux, nous convertissons chaque mot en vecteur par plongement. Nous mesurons ensuite la distance entre chaque mot de l’activité (source) et chaque mot dans le fragment de contenu (cible). Les mots qui sont très proches l’un de l’autre reçoivent une pondération proche de 1 (ou exactement 1 s’il s’agit du même mot) et les mots qui sont très éloignés l’un de l’autre reçoivent une pondération de 0. De cette façon, un mot sera considéré comme un appariement si le sens du mot est semblable.
Réduction de la dimensionnalité
Un plongement lexical convertit un même mot en un vecteur de centaines de chiffres. Cette opération est effectuée pour tous les mots dans tous les documents gouvernementaux accessibles au public. En fin de compte, cette opération génère une énorme quantité de données et ces données doivent être dépouillées et analysées avec chaque demande d’AIPRP. Nous pouvons réduire la quantité de calculs (et par conséquent augmenter le rendement de la recherche) en utilisant un algorithme appelé Singular Value Decomposition (SVD) (Décomposition en valeurs singulières). En bref, le SVD peut être utilisé pour comprimer l’information dans chaque document (et le total des données générées) tout en conservant l’information et préservant l’exactitude de la recherche.