Par Heather Bussing
Dans cette série d’articles sur l’éthique de l’intelligence artificielle (IA) et des données, nous abordons les principes éthiques d’ADP de responsabilisation et de transparence, d’explicabilité, de confidentialité, d’utilisation éthique des données et de gouvernance des données.
Nous avons réuni une équipe de spécialistes d’ADP pour discuter de la gouvernance des données : Xiaojing Wang et Vibhor Shukla, scientifiques des données et directeurs principaux; Zaf Babin, vice-président, Développement de produit, et Kristin Hlavinka, analyste en chef des systèmes d’entreprise. Il s’agit d’un certain nombre de personnes qui travaillent dans l’équipe de la solution InfoNuage ADP.
Pour ceux et celles qui ne sont pas familiers avec le concept, qu’est-ce que la gouvernance des données?
Z. Babin : La gouvernance des données consiste à déterminer qui peut accéder aux données, qui peut les voir, les utiliser et les transférer, et à faire respecter cette décision. Cela implique aussi l’endroit et la province où les données devraient être stockées. Nous posons des questions comme : peuvent-elles être transférées? Devraient-elles être cryptées?
La gouvernance est importante pour garantir que les personnes manipulant les données respectent les règles sur la façon dont elles doivent être manipulées. Nous examinons la source des données, les règles pour la zone, la région, le pays ou la province. Par exemple, si nous voulons transférer certaines données, nous devons savoir si des permissions sont nécessaires et si d’autres exigences de confidentialité s’appliquent.
V. Shukla : Nous examinons aussi les différents types d’utilisateurs qui accèdent aux données et la façon dont ils veulent utiliser ces dernières. Est-ce pour de la recherche ou de l’analyse? Utiliseront-ils ces données pour créer un modèle d’apprentissage machine? Nous tenons compte aussi de la façon dont les droits d’accès seront utilisés et attribués. Nous déterminons le contenu qui peut être vu par certaines personnes et nous nous assurons que l’utilisation des données se fait correctement.
K. Hlavinka : Pour ma part, je définis la gouvernance des données comme une méthode structurée de conception, de création et d’exploitation de processus formels d’affaires et de responsabilités de gestion des données d’entreprise tout au long du cycle de vie des données. Ce cycle commence par l’acquisition de données et suit les étapes ci-après : stockage, synthèse, utilisation, publication (au moyen de l’analyse et des produits), archivage et élimination.
Pouvez-vous nous expliquer comment vous organisez et traitez les données pour ce faire?
V. Shukla : À l’aide d’InfoNuage ADP, nous stockons les données dans un bassin, et il s’agit généralement des données que nous voulons organiser à notre façon. Le bassin de données comporte diverses zones selon le type de données stockées, avec des paramètres d’autorisation comparables basés sur le type de données.
Chez ADP, nous classons les données en fonction de leur contenu et de la façon dont elles seront utilisées. Pour InfoNuage ADP, nous utilisons des données agrégées qui ont été anonymisées afin de retirer tout élément qui pourrait mener à l’identification d’une personne. Dans d’autres produits comme les solutions de paie, nous avons besoin de cette information pour garantir l’exactitude des chèques de paie.
Si une personne veut accéder à des données sensibles, les conditions sont très strictes avant de pouvoir obtenir les autorisations. Il faut obtenir plusieurs approbations pour passer en revue le but, garantir que les données demeureront sécurisées et protéger la confidentialité.
Il est un peu plus facile d’obtenir l’accès à des données désensibilisées, mais nous nous assurons tout de même que le but est approprié et que la sécurité et la confidentialité sont maintenues à toutes les étapes.
Lorsque nous utilisons des données à des fins d’analyse ou de comparaison, nous veillons aussi à disposer de tailles d’échantillons appropriées en ce qui concerne la confidentialité et l’exactitude.
Z. Babin : L’exactitude est essentielle. Nous voulons être certains de la bonne qualité des données, et que ces dernières soient nettoyées et triées afin que l’utilisateur ait la bonne information pour l’usage qu’il veut en faire. Puis, nous nous demandons s’il n’y a pas des données imprécises. Y a-t-il quelque chose dont nous avons besoin, mais qui est manquant? Les données sont-elles toutes dans le bon format?
Quel est le processus pour que les gens se voient accorder l’accès aux données?
Z. Babin : Nous créons et utilisons des outils de transfert de droits qui peuvent accorder un accès aux données basé sur le profil utilisateur d’une personne et restreindre l’accès aux données dont la personne n’a pas les droits.
V. Shukla : Nous déterminons l’accès requis aux zones, puis nous isolons les données dans chaque zone ainsi que les titres ou les statistiques, puis nous accordons les autorisations en fonction du cas d’utilisation. Ces autorisations sont intégrées dans la base de code. Nous pouvons contrôler ce que les gens voient et nous pouvons vérifier l’historique et l’utilisation.
Pourquoi la gouvernance des données représente-t-elle un enjeu sur le plan éthique?
Z. Babin : La gouvernance des données représente un enjeu sur le plan éthique, car nous traitons les renseignements personnels et confidentiels des gens. Nous devons manipuler et utiliser correctement les données personnelles d’une façon qui est juste et qui protège la vie privée des gens.
V. Shukla : Nous devons aussi nous assurer qu’il est impossible pour une personne d’appliquer des filtres et de faire des zooms avant dans les ensembles de données pour identifier une personne ou une entreprise en particulier.
Nous examinons régulièrement cet aspect. Nous voulons être certains que les bonnes personnes utilisent les données pour les bonnes raisons.
Z. Babin : On retrouve également des problèmes éthiques concernant la qualité et l’exploitation des données. Nous fournissons aux gens des renseignements, des prédictions ou des comparaisons à partir de données. Les clients prennent des décisions en utilisant l’information que nous leur fournissons. Si nous n’exploitons pas correctement les données, toute personne qui utilise l’information peut prendre une mauvaise décision.
K. Hlavinka : Il s’agit véritablement de protéger la vie privée et de s’assurer de l’utilisation appropriée des données dans chaque cas, et aussi du fait que nous respectons la législation locale sur la confidentialité.
En savoir plus
Alerte rouge! Alerte rouge! Alerte maximale! Avec le télétravail comme nouvelle norme, nous sommes plus susceptibles que jamais de subir des cyberattaques. Le cybercriminel d’aujourd’hui est hyper sophistiqué, et en ce qui concerne les brèches de sécurité, il n’est plus question de savoir si elles se produiront, mais plutôt quand elles auront lieu. Écoutez ce conférencier Ted Talk, Andre Boysen, éminent spécialiste mondial en sécurité informatique, parler de la prévention des brèches de cybersécurité, des vulnérabilités de votre système informatique, de la protection des données sensibles et de ses principales prévisions en matière de cybersécurité pour 2021. Écoutez ce balado (en tout temps disponible en anglais) : Cybersecurity in the Workplace.
Apprenez-en plus sur l’engagement d’ADP envers la vie privée et lisez notre document de position (en anglais seulement) ADP: Ethics in Artificial Intelligence, que l’on retrouve sous la section Intelligence artificielle, données et éthique de la page Confidentialité chez ADP.
Cet article est paru à l’origine dans SPARK parrainé par ADP.