Intelligence artificielle, doit-on en avoir peur ?

Intelligence artificielle, doit-on en avoir peur ?

24 mai 2020

– 8 minutes de lecture

Jean-Baptiste Piccirillo

Manager Transformation Data

Avec l’avènement, la démocratisation de l’intelligence artificielle dans toujours plus de secteurs, certaines questions sont posées :

Les machines vont-elles vous remplacer, allez vous perdre votre travail ? Ce progrès technologique nous rend-il de plus en plus vulnérable ? Le rôle de l’éducation dans ce contexte de transition technologique ? Les machines vont-elles devenir plus intelligentes que vous ? Comment faire confiance à des systèmes de décision parfois complexes voire boîtes noire ?

Pour y répondre, développons quelques points :

  1. Rappelons la place de cette intelligence dans nos vies aujourd’hui.
  2. Rappelons que nous contrôlons bien toujours la machine…
  3. N’exagérons pas les impacts sur le monde du travail, regardons un peu an arrière
  4. Oui, une petite mise à jour du système éducatif français ne serait pas un luxe pour s’adapter plus rapidement aux transitions technologiques de demain
  5. L’IA, il y a quand même des risques : Un grand pouvoir implique de grandes responsabilités. Comme souvent, le risque c’est nous même…
  6. Non, cette forme d’intelligence n’a rien a voir avec l’intelligence humaine, elle ne peut donc pas la « dépasser »
  7. Toutefois, Vous ne pouvez pas faire confiance à n’importe qui, et pour l’IA, c’est pareil… Alors comment fait-on ?

1 – Rappelons la place de cette intelligence dans nos vies aujourd’hui

« Mais comment il s’appelle déjà cet acteur, tu sais celui qui joue dans ce James Bond ? Attends je regarde ! » Aujourd’hui, le « Attend je regarde » a maintenant depuis plusieurs années remplacé le « Attends je réfléchis ça va me revenir !  » (Vous souvenez vous avoir dit cette phrase récemment ?).

Google comprend très bien ce que vous cherchez, mieux que vous parfois… Le web ne se repose pas, disponible 24/24. Comme un nouvel organe qui étend votre cerveau, il vous offre une extension de mémoire extraordinaire, que vous pouvez utiliser quand vous voulez, avec des interfaces toujours plus simples.

Les Smart Phones, les moteurs de recherche qui savent mieux que vous ce que vous cherchez, les nouveaux robots intelligents, les véhicules autonomes, … l’avènement de IA, n’est-elle tout simplement pas comparable à l’avènement de l’électricité et de son usage qui a explosé au 20eme siècle ? On a appris à produire et à distribuer de l’énergie. Maintenant on crée et on distribue une forme d’intelligence.

Quelle est-elle exactement, cette intelligence ?

2 – Rappelons que nous contrôlons bien toujours la machine…

Pour ceux qui l’ignorent et qui peut être craignent ces nouvelles technologies, la plupart des algorithmes qui révolutionnent le monde actuel sont fondés sur des théories (pas si récentes) issues par exemple des statistiques, de la probabilité, l’optimisation et la recherche opérationnelle. Je vais peut être estomper les fantasmes de certains, mais aujourd’hui une machine ne peut pas apprendre sans avoir :

  1. Une question précise à laquelle répondre
  2. Un volume et un périmètre de données (d’observations) suffisamment conséquents pour pouvoir modéliser le phénomène sous-jacent et répondre à la question
  3. Des capacités de traitement, et l’énergie qui alimente ces capacités

Et vous savez quoi ? Ces trois prérequis nécessitent aujourd’hui notre intervention humaine. Nous choisissons les problèmes auxquels nous voulons que les machines répondent, nous sélectionnons les sources de données qui permettent à la machine d’apprendre une façon d’y répondre, nous fournissons les capacités de traitement et l’énergie nécessaire. Alors de quoi avez-vous peur ?

Comme souvent, le seul danger, c’est nous même… Nous en reparlerons tout à l’heure.

3- N’exagérons pas les impacts sur le monde du travail, et rappelons nous du passé…

Pour rafraîchir la mémoire de certains, posons nous 5 minutes sur 3 emplois, au hasard, qui n’existent plus aujourd’hui, et ça ne choque plus personne … :

Le Poinçonneur : Vous savez c’était le monsieur qui faisait « des petits trous, toujours des petits trous » sur vos billets de métro il y a bien longtemps…Maintenant, vous avez un Pass Navigo…

Le Télégraphiste : Ils transmettaient les télégrammes ! Et vous savez quoi ? Il n’y a plus de télégraphes aujourd’hui…Maintenant vous utilisez internet…

Le Laitier : « Le quoi ? » Lui était chargé de transporter le lait frais au plus vite avant qu’il ne périsse pour être consommé. Aujourd’hui, vous allez au rayon frais dans votre épicerie la plus proche…

Alors ? Devons nous réembaucher des Poinçonneurs sur les lignes du métro parisien ? Devons nous réinstaurer les télégraphes pour remplacer progressivement internet, parce que quand même ça créerait de l’emploi ! Devons nous revoir notre gestion de la chaîne du froid et simplifier tout ça spécifiquement pour le lait en embauchant quelques laitiers ? Je vous laisse le choix des réponses à chacune de ces questions.

Certains métiers vont évoluer. Certaines tâches seront automatisées ce qui permettra d’approfondir les aspects les plus important du métier, les plus « Humains » ?

Prenons l’exemple du Responsable RH :

Aujourd’hui, il passe des heures sur son LinkedIn pour trouver le profil miracle, lisant des tonnes et des tonnes de profils, sans trop savoir auquel se fier et lequel a vraiment une chance de lui répondre…

Demain (et aujourd’hui ça commence déjà) un algorithme pourra lui proposer les profils qui ont le plus de chance d’exceller (et de répondre) pour un poste donné. Les responsables RH passeront plus de temps à préparer un entretien personnalisé avec la personne, en creusant les bons aspects, pour être sûr de prendre la bonne décision. Un partenaire qui deviendra indispensable ?

Il y aura peut être moins de responsables de recrutement alors ? Peut être, mais pas du jour au lendemain. Les choses ne se font pas d’un coup. Il faut du temps pour transformer les entreprises mastodontes… Il faudra du temps pour prendre conscience qu’il faut moins de responsables de recrutement et plus de Data Science, et trouver les bonnes ressources formées, et surtout pour mettre au point les bonnes solutions…

D’ailleurs, nos petits seront-ils formés sur ces sujets ? Nos grands pères à 5 ou 10 ans de la retraites pourront-ils se reconvertir ?

4- Une petite mise à jour du système éducatif français ne serait pas un luxe pour s’adapter plus rapidement aux transitions technologiques de demain

De manière plus générale, concernant ces périodes de rupture / transition technologiques, le système éducatif (français) manque surement de flexibilité. Il est pensé pour être globalement adapté à tous, alors qu’il devrait l’être, de plus en plus, pour pouvoir s’adapter à chacun, et au monde du travail. Je ne dis pas que c’est simple…

Mais par exemple, aujourd’hui, l’outil informatique devrait être porteur de flexibilité dans le système éducatif, mon avis est qu’il n’est pas assez utilisé (au risque d’offusquer certaines personnes…) . Formations en ligne et/ou en autonomie ? Oui, il est possible d’apprendre seul devant son PC aujourd’hui; Il existe des outils totalement adaptés pour les professionnels et pourquoi pas pour les collégiens et les lycéens ? Attention : Je dis bien, A défaut de professeurs spécialisés sur un sujet nouveau par exemple comme l’intelligence artificielle, l’élève devrait pouvoir s’auto-former et passer un examen type Bac spécialisé dans les nouvelles technologies de l’information, sur la base de cet enseignement, s’il est motivé, pourquoi pas ? Il réussira.

De même, pour toutes personnes dans la vie active qui sont tout à fait aptes à se former rapidement sur un nouveau domaine innovant, pourquoi ne seraient-ils pas aussi brillants dans ces nouveaux domaines que des petits jeunes sortis d’école ? si on leur donne aussi les moyens de s’auto-former et de passer des examens spécialisés plus simplement.

Plus globalement : « C’est en forgeant, que l’on devient forgeron ». Dans ces périodes de transitions technologiques, cette phrase devrait inspirer les recruteurs, qui devraient plus prendre en compte la capacité d’un candidat à apprendre rapidement, à s’adapter à des situations différentes / nouvelles, plutôt que de s’obstiner sur les petites lignes de diplômes du CV.

5- L’IA, il y a quand même des risques: un grand pouvoir implique de grandes responsabilités. Comme souvent, le risque c’est nous même

Plus il y aura d’actions automatisés, et connectées, plus la société sera vulnérable à la cyber-attaque, et plus les exigences de sécurité seront élevées.

Les données peuvent être utilisées à bon escient pour améliorer notre manière de vivre, se re-concentrer sur l’essentiel dans un monde que nous avons nous même rendu plus complexe qu’il ne l’était… Malheureusement, il peut être utilisé à mauvais escient.

Comme on dit, un grand pouvoir implique de grandes responsabilités… Les fournisseurs Cloud par exemple ont une grande responsabilité. Une grande ressource de calcul ne devrait plus demain être vendu au premier venu, car elle peut être une arme.

L’IA peut en exemple être utilisé pour élaborer des attaques plus intelligentes. Il faudra alors aussi prévoir des systèmes de défense plus intelligents. Vient la course aux armements version IA… L’actualité nous fait déjà entrevoir ces cyber-guerres (la potentielle intervention de la Russie dans l’élection de monsieur Trump en est un exemple). Les hackers commencent déjà à utiliser le Machine Learning comme levier d’attaque. Vous trouverez par exemple, cet article qui traite du sujet.

6- Non, cette forme d’intelligence n’a rien à voir avec l’intelligence humaine, elle ne peut donc pas la « dépasser »

Si cela vous inquiète vraiment, c’est que vous manquez simplement d’informations sur le sujet. Comme discuté au point 2 de cet article, il n’y a absolument aucune technologie ni même aucune démarche scientifique aboutie qui permette à une machine d’égaler l’intelligence Humaine. La forme d’intelligence produite par les algorithmes actuels et la forme d’intelligence qui habite votre cerveau n’ont absolument rien à voir : L’un est fait pour répondre à un problème bien précis, l’autre est capable de penser, d’inventer, de créer, d’aimer, et ce depuis 200 000 ans…(et de répondre aussi à plein de problèmes, bien précis…)

7- Toutefois, vous ne pouvez pas faire confiance à n’importe qui, et pour l’IA, c’est pareil… Alors comment fait-on maintenant ?

Cette nouvelle forme d’intelligence se diffuse peu à peu pour offrir toujours plus d’efficacité. Elle permet à l’entreprise de prendre certaines décisions de manière moins intuitive et plus mathématique/statistique, lorsque le sujet et les données le permettent.

Reste toutefois à poser un cadre claire de ce que nous souhaitons vraiment faire de ces nouvelles capacités et de ce que nous nous interdisons d’en faire. C’est une question que chacun doit se poser aujourd’hui. Certaines décisions ne devraient-elles pas être prises que par l’homme ? Une machine doit-elle avoir le choix de vie ou de mort ? Demain, la voiture autonome doit-elle avoir à choisir entre percuter la vieille dame ou l’enfant ? Il s’agit de maîtriser le risque et l’éthique.

Reste également, et c’est crucial, à se donner les moyens de mieux comprendre comment décident les algorithmes les plus complexes (exemple : Réseaux de neurones, Deep Learning) qui sont souvent trop opaques. Sinon nous pouvons valider un modèle alors que, par exemple, sa manière de décider n’est en fait pas éthique du tout (ex : Discriminations raciales, etc…). Pour ceux que ça intéressent, une méthode comme LIME vise à innover dans ce domaine : Why Should I Trust You ? Il existe d’ailleurs déjà des librairies de développement dans ce domaine.

Une image pour finir : Dans chaque décision humaine se cache une motivation. Par exemple, si quelqu’un vous donne un bon conseil, que vous le suivez, et que vous vous rendez compte qu’il en a en fait plus profité que vous, vous n’aurez plus confiance en cette personne ? Non ? Si par contre, ce même conseil vous est donné de bon cœur avec bienveillance, alors vous ferez confiance en cette personne ? un nouvel ami ? La motivation est tout aussi importante que la décision en elle même, aussi juste puisse-t-elle paraître a priori (donner un bon conseil…). C’est la même chose avec l’IA. Si nous ne savons pas justifier/comprendre les décisions (conseils…) qu’elle nous donne, alors ça ne peut pas être notre partenaire, ou du moins c’est risqué.

data-un-actif-essentiel

La data : d’un actif stratégique à un actif essentiel

La data : d’un actif stratégique à un actif essentiel

20 mai 2020

– 4 min de lecture

Thomas Lautrette

Vers un darwinisme orienté par la data ? oui, mais pas seulement…

Nous pourrions penser que les évènements récents liés à la crise sanitaire Covid-19 vont ralentir les parcours de transformations culturelles et technologiques déjà engagés par les entreprises et organisations.

Il n’en est rien : ils vont les accélérer.

Nous assistions à des tendances : celles-ci vont se confirmer.

Nous partagions encore quelques doutes : ceux-ci vont s’effacer.

La rupture soudaine de la linéarité confortable de notre monde nous enseigne qu’il nous faut tout de suite prendre conscience de notre fragilité relative, et revenir à des principes fondamentaux déjà établis : s’adapter, au sens évoluer, pour ne pas disparaître.

Le patrimoine de données : un actif essentiel plutôt que stratégique

Pour lesdites entreprises et plus globalement, les organisations, les données formant leur patrimoine informationnel étaient considérées depuis quelques années comme un actif au service de la stratégie : c’est-à-dire qu’elles étaient le moyen d’une tactique d’entreprise orientée vers son développement (conquête d’un nouveau marché, amélioration des performances économiques intrinsèques par l’établissement de reporting plus précis, émergence d’une connaissance client augmentée, etc.). L’essor du Chief Data Officer, ou Directeur des Données, en est une illustration concrète.

Demain, et cela commence en réalité aujourd’hui, ledit patrimoine de données sera considéré comme essentiel, et non plus seulement stratégique.

Essentiel signifie indispensable pour que quelque chose existe.

Comprenons-nous bien : il ne s’agit plus de voir la Data comme un élément vecteur de développement, mais comme l’élément principal de l’existence même d’une organisation et de la réalisation de sa mission. Demain, aujourd’hui en réalité, une entreprise ne pourra survivre à des lacunes dans l’organisation qu’elle aura déployé autour de son actif Data.

L’urgence de mettre en œuvre une data governance et de l’incarner par des valeurs fortes

La gestion transverse de l’actif Data se matérialise et se construit en premier lieu autour de la gouvernance des données. Celle-ci devrait être vue comme une association de deux dimensions génériques adaptées aux spécificités de la Data : l’Asset Management et le Risk Management. Cette dualité s’emploie à garantir une gouvernance des données qui repose sur des fondamentaux solides et pérennes, préparant le triple pivot organisationnel, culturel et technologique autour de la Data.

Pour entamer les programmes de transformation, les leaders des entreprises peuvent s’appuyer sur des cadres de référence déjà construits et établis : certaines grandes organisations ont déjà une maturité Data-driven reconnue. Nous le constaterons dès demain : elles sont aptes au nouveau monde grâce à l’agilité et à la résilience acquises des transformations qu’elles ont engagées ces dernières années.

Un autre aspect qui m’est cher à la mise en place réussie d’une gouvernance des données est l’établissement de nouvelles valeurs, mais aussi des principes fondateurs, au sein de l’organisation : des valeurs de partage, de qualité, d’efficacité, de collaboration avancée.

Ouvrir, partager et protéger la Data est en réalité bien plus que de la gouverner, c’est aller vers de nouvelles pratiques et donner un sens nouveau au travail.

Encore trop peu de data literacy dans les organisations

Dans mon précédent article sur la gouvernance des données, nous évoquions le défi que représente la nomination des bons ambassadeurs de la transformation et de la nécessité de les accompagner. L’aspect humain de cette transformation centrée sur la Data est effectivement crucial et conditionne la réussite de ce chemin forcément complexe, comme tout changement structurant.

Mais il est un autre aspect définitivement essentiel : la démocratisation de la Data. Cela consiste là aussi en un changement de paradigme : la Data n’est plus réservée qu’à quelques spécialistes au sein de l’entreprise. La Data est accessible à tous.

Savoir lire, interpréter et partager des données en interne comme à l’externe est aujourd’hui un facteur clef de réussite des organisations car il s’agit de la capacité à prendre des décisions rapidement, de façon éclairée et en conscience, dans un monde toujours plus complexe. Et ceci à tous les niveaux de l’entreprise, opérationnels comme stratégiques.

Or aujourd’hui encore, les études sur ce sujet montrent qu’une large majorité des collaborateurs des entreprises se sent dépassée par la Data : il s’agit pour eux d’un motif de stress, de baisse de productivité quand ils se retrouvent face à un outil inadapté ou pour lequel ils n’ont pas été accompagnés… à tel point que s’ils trouvent une alternative à la Data pour réaliser et prendre leurs décisions, ils le font.

Adapter les organisations au monde de demain : une leçon de darwinisme orientée par la data, et par une nouvelle collaboration

Les entreprises et plus globalement les organisations n’en ont pas fini de leur évolution et de leur adaptation.

De cette épreuve que nous traversons, qui bouleverse notre organisation du travail, il restera des cicatrices. Nous nous en relèverons. Nous progresserons. Ce qui est était nos suggestions d’hier devient nos priorités de demain.

Si l’on s’en tient aux organisations il apparaît vital pour elles de poursuivre la route de l’entreprise Intelligente, qui reconnait et valorise ses données, vers l’entreprise Résiliente et Agile, qui se construit autour de nouveaux principes collectifs et organisationnels mettant au centre la valeur de son patrimoine Data.



Pour aller plus loin :

comment-choisir-son-prestataire-data

Comment choisir mon prestataire data ?

Comment choisir mon prestataire data ?

8 janvier 2020

– 4 min de lecture

Maureen Delaloi

Manager Transformation Data

La question n’est pas anodine et la réponse n’est pas aisée. Il existe une multitude de « prestataires data » sur le marché. Mais déjà qu’entend-on par prestataire data ? On peut retrouver dans cette catégorie les éditeurs de solutions technologiques, les fournisseurs de données (ou data providers), les cabinets de conseil qui accompagnent les clients pour tirer profit de leurs données, etc. La liste est longue…
Dans un projet data, la sélection de son prestataire est un élément clef, mais peut souvent s’avérer être un véritable casse-tête. C’est un choix parfois cornélien, tant le nombre d’acteurs sur le marché est important.  
Comment réussir à choisir son prestataire data ? Je vous propose ci-dessous des critères principaux pour guider votre choix et quelques conseils pour y arriver. 

1/ Commencez par définir précisément vos objectifs et vos besoins

La data est une ressource de grande valeur qu’il faut savoir exploiter.  Chaque entreprise doit inscrire la data dans sa stratégie métier. Cette étape est un préalable essentiel pour bien cadrer votre projet et ainsi bien choisir votre prestataire data. Cela doit permettre de définir les sujets que vous voulez voir traiter, les problèmes à résoudre, les objectifs à atteindre et l’amélioration espérée. Cela passe par la création d’un plan d’action qui doit répondre à quelques questions clefs : quels sont mes enjeux métiers ? Quelle cible client je veux adresser ? Cet outil est-il utile pour mon business ? Est-ce le bon timing pour me lancer ? Cette stratégie est-elle compatible avec mon écosystème outil actuel ? Liste non exhaustive.  
Ce cadrage du projet doit permettre de préciser le contexte de la prestation, de définir un périmètre précis et ainsi d’aiguiller vos recherches pour choisir en toute connaissance de cause un prestataire de qualité.  

2/ Valorisez la spécialisation et la compétence 

Au moment de la recherche du prestataire, il est nécessaire de s’assurer que ses compétences s’alignent sur les technologies ou les problématiques clefs de votre entreprise. Il peut être utile de chercher des solutions qui répondent à des verticaux métiers pour être sûrs d’avoir une adaptation de la solution proposée au marché de votre entreprise. L’offre n’en sera que plus pertinente. 
Le facteur humain n’est pas à négliger non plus dans un projet data. A l’heure des grands projets de transformation digitale, il faut miser sur l’humain. Rencontrez les équipes qui vont intervenir sur votre projet, prenez le temps de vous assurer que vous aurez des facilités à travailler avec votre prestataire.
De plus, les technologies évoluent sans cesse. Il est important que vos collaborateurs ou les équipes qui vous accompagnent soient formés aux outils et/ou certifiés. Cela vous apportera de la sérénité sur le bon déroulé du projet. 

3/ Appuyez-vous sur des références 

Une société qui possède une longue expérience s’est confrontée à de nombreuses problématiques clients dans différents secteurs d’activité. Problématiques auxquelles elle a forcément apporté des réponses satisfaisantes pour perdurer. Elle aura aussi connaissance de vos obligations métiers ; ses interventions et conseils n’en seront que plus adaptés. On peut donc estimer qu’elle soit plus à même de proposer les solutions les plus adaptées et de les faire évoluer au fil du temps. 

4/ Respectez la conformité au règlement européen général sur la protection des données (RGPD)

Vous l’avez remarqué depuis deux ans il est impossible de passer à côté du Règlement européen Général sur la Protection des Données dans la presse. Des thématiques clefs du RGPD bouscule le monde de l’entreprise : la liberté fondamentale des citoyens de choisir à qui confier leurs données personnelles, un consentement utilisateur renforcé, une gouvernance des données obligatoire, un travail d’inventaire lourd sur les partenaires et les sous-traitants ou encore une nécessaire capacité des entreprises à prouver leur conformité. Le RGPD est un véritable challenge car il demande aux entreprises de revoir l’organisation et les processus internes afin de garantir la protection des données personnelles. Ce Règlement aide les utilisateurs à reprendre du pouvoir sur leurs données et les entreprises à travailler sur les sujets de confiance utilisateur et de protection des données. En choisissant un prestataire data vous devez vous assurer qu’il s’implique dans cette démarche de conformité RGPD. 

5/ Faites-vous accompagner si nécessaire

Définir une stratégie d’après ses données est un sujet majeur pour les entreprises. La stratégie doit embarquer toutes les parties prenantes de l’entreprise, répondre aux besoins des métiers et ne pas être guidée uniquement par la technologie.
Mais comment démarrer ce type de projet data en interne ? Quels sont les départements concernés ? Qui est le meilleur porteur de ce type de projet dans votre entreprise : le département CRM ? Le Marketing ? La DSI ? Le Chief Data Officer s’il y en a un ? Qui en a la responsabilité ? Dois-je sélectionner dès à présent des outils data digitaux et les tester ? (Data Hub, Data Management Platform, Tag Management System, Consent Management Platform,…).
Toutes ces questions peuvent être sources d’inquiétudes pour votre projet. C’est pour cela qu’il peut être nécessaire de se faire accompagner par une agence, un cabinet de conseil, l’entité professional service d’un éditeur technologique…. L’important est d’aller chercher un accompagnement et un conseil de qualité pour répondre à vos enjeux métiers. 
En résumé le choix d’un prestataire data est une analyse pour définir précisément vos besoins et vos enjeux. Bien sûr que tous les éléments listés ci-dessus ne garantissent pas le succès à 100%. Mais cela augmente vos chances de faire le bon choix en vous posant des questions pertinentes et de démarrer votre projet sur de bons rails.

algorithmes-biaises

Des algorithmes biaisés

Des algorithmes biaisés

Algorithmes racistes, sexistes… les biais algorithmiques sont un risque pour la confiance envers le recours à l’intelligence artificielle. En quoi consistent-ils ?

28 novembre 2019

– 6 min

Valentin Defour

Consultant Senior Transformation Data

Le 8 Avril dernier, le ‘High Level Expert Group on AI’, sorte d’Avengers de l’Intelligence Artificielle dépêchés par la commission Européenne, présentait ses recommandations en matière d’éthique de l’IA. Basé sur une consultation publique ayant recueilli plus de 500 commentaires, ce rapport pointe, entre autres, le sujet du biais algorithmique et met en garde les acteurs de l’IA sur les conséquences négatives que ce dernier peut entraîner, de la marginalisation des minorités vulnérables à l’exacerbation des préjugés et des discriminations. Il présente ainsi les systèmes d’IA comme devant être de véritables acteurs de la diversité en impliquant dans leur développement la totalité des parties prenantes.

Des algorithmes racistes ?

Il y a aujourd’hui quelques années, Propublica, média indépendant d’investigation américain, publiait une étude simplement intitulée “Machine Bias”. Son message : C.O.M.P.A.S. (pour Correctional Offender Management Profiling for Alternative Sanctions), un algorithme largement utilisé dans les cours de justice américaines, serait racialement biaisé, avec pour effet de désigner comme potentiels récidivistes un trop grand nombre de personnes noires. Par la suite, l’expérience a démontré que le nombre de faux positifs chez la population noire était bien plus élevé que celui constaté du côté de la population blanche, comme relaté ci-dessous :

Tim Brennan, professeur de statistiques à l’université et co-fondateur de l’algorithme C.O.M.P.A.S., expliquait déjà que le concept de ‘race’ était selon lui difficile à complètement exclure du calcul de score, car également corrélé à des indicateurs indispensables pour l’algorithme tels que le niveau de pauvreté du prévenu, le taux de chômage constaté dans son quartier, … Retirer également ce type de données du calcul de score entraînerait selon lui une chute de la précision du prédicteur, précision alors quantifiée à 68% (précision : nombre de véritables récidivistes / nombre de récidivistes désignés). En aparté, on s’interroge déjà sur cette valeur qui, en pratique, image le fait qu’une personne analysée sur 3 serait désignée comme récidiviste, à tort. Même si les cours pénales américaines n’appliquent pas à la lettre le résultat de l’algorithme, on imagine bien l’influence de ce dernier concernant la décision finale…

L’étude de Propublica, complétée des datasets utilisés

Quelques définitions…

Une manière simplifiée d’expliciter un algorithme serait de le décrire comme une liste finie d’instructions s’enchaînant selon des conditions logiques, produisant potentiellement une sortie en fonction d’aucune, une ou plusieurs entrées. Ainsi, peuvent être considérés comme algorithmes une recette de cuisine, un itinéraire GPS ou un ensemble d’instructions médicales. Appliqués au monde informatique, on peut les qualifier d’algorithmes numériques, transformant une ou plusieurs données d’entrée en une ou plusieurs sorties numériques. Ainsi, une simple formule qui, en considérant l’âge, le statut de fumeur, la pression artérielle et quelques autres caractéristiques d’un individu afin de prédire un risque d’AVC est un algorithme.

De manière plus précise, les algorithmes que nous adresserons dans cette suite d’articles sont ceux relatifs au machine learning, littéralement « apprentissage machine ». Soit la capacité pour un programme d’apprendre d’expériences passées pour anticiper des événements futurs. Nous nous focaliserons sur les algorithmes supervisés : ils ont besoin d’un grand nombre d’exemples en entrée pour pouvoir exercer sur une nouvelle situation ou événement à prédire. On retrouve tout un ensemble de situations où l’apprentissage supervisé est utile : reconnaître des personnes sur une photo, filtrer des spams dans une messagerie ou encore prévenir d’un risque de défaut de remboursement de crédit.

Le phénomène de biais, quant à lui, peut prendre plusieurs significations selon le contexte dans lequel il est nommé. Nous nous concentrerons ici sur les définitions englobées dans le spectre “statistiques appliquées”, mais il faut savoir que ce terme, en plus d’être le nom de bourgades du Lot-Et-Garonne et de la Virginie Occidentale, est applicable à de nombreux domaines (électronique, psychologie, …).

De manière non exhaustive, en statistiques appliquées, ce biais peut être de plusieurs types :

Quel rapport avec les systèmes d’IA ? Eh bien ce sont ces biais statistiques qui se trouveront exprimés dans les modèles, du fait de la sélection des données d’entrée, de l’expression plus ou moins marquée de certains features du modèle ou encore de l’interprétation des résultats. C’est ainsi que, fonctionnellement, des algorithmes peuvent “accoucher” de résultats fonctionnellement biaisés : biais raciaux, de genre, d’âge, …

Le risque ?

De plus en plus de décisions sont aujourd’hui prises par des algorithmes. De l’analyse automatique des CV à celle des dossiers de demande de prêts, de l’ordre des publications sur un réseau social à la liste de publicités affichées sur le net, ces algorithmes prennent une place de plus en plus importante dans nos vies quotidiennes. C’est pourquoi y inclure, volontairement ou non, des biais de toute sorte représente un danger important. Il est certain que ces décisions, autrefois prises par des humains, étaient déjà sujettes aux différents biais cognitifs. Mais c’est bien l’industrialisation de ces biais qui pose le problème.

Big data doesn’t eliminate bias, we’re just camouflaging it with technology

Cathy O’ Neil

En considérant un algorithme, régi par des préceptes mathématiques, on pourrait penser que ce dernier est objectif par définition et dénué des biais qui peuvent affecter les décisions humaines. C’est le principe du MATHWASHING, derrière lequel beaucoup de décisions algorithmiques ont été dissimulées.

Mais alors pourquoi cette objectivité algorithmique et mathématique serait-elle une illusion ?

Les algorithmes sont conçus par des humains

Leurs créateurs sont en charge de décisions structurantes telles que le périmètre de données à utiliser, les éventuels poids attribués à ces données, … Et, par définition, les décisions humaines sont biaisées, volontairement ou non. Par exemple, utiliser des données de genre pour déterminer quelles annonces d’emploi mettre en avant sur la page LinkedIn d’un individu a eu pour effet de recommander, en moyenne, des offres moins rémunérées pour les utilisatrices.

Les données en entrée sont également subjectives

Les algorithmes traitent les données qu’on leur présente en entrée. Ni plus, ni moins, sans avoir la possibilité d’évaluer leur caractère biaisé. En effet, les données reflètent toutes sortes de biais sociétaux bien ancrés, en plus d’en perpétrer des anciens. Quid de l’utilisation de données raciales dans un pays qui prônait la ségrégation raciale un demi-siècle plus tôt ? Quid de l’éradication du pay gap quand la plupart des données utilisées pour entraîner les algorithmes reflètent ce problème majeur de société comme une situation normale, ou au moins nominale.

Ainsi, cette amplification du biais peut être accidentelle (utilisation involontaire de données biaisées) mais également réalisée en toute connaissance de cause et d’effet, soit dans un but de manipulation de la décision algorithmique (ex : design de la ‘Gerrymandering map’ optimale), soit encore dans une optique de dé-responsabilisation : l’algorithme encaisse ainsi la responsabilité des décisions biaisées prises par les humains sur son bon conseil.

En résumé,


Ces considérations viennent alimenter un spectre plus large de problématiques relatives à l’éthique de l’IA. Il va sans dire que l’explicabilité de l’IA est un défi pour la suite de l’ère IA dans laquelle nous sommes entrés depuis quelques années. On connaissait le problème classique d’éthique de l’IA imagé par le MIT sur son site ‘Moral Machine’. Celui-ci permet, à l’aide d’une mise en situation, de sensibiliser les utilisateurs aux choix difficiles effectués par les IA embarquées dans les voitures autonomes. Dans le même esprit, myGoodness interroge sur l’attribution de sommes d’argent à des causes humanitaires ou avec objectif d’enrichissement personnel.

L’utilisation d’algorithmes d’intelligence artificielle est une forte opportunité de progrès technologique, et ce de manière très transverse. Toutefois, une perte globale de confiance en leurs résultats pourraient entraîner ce pan important de la recherche dans un nouvel hiver de l’IA si jamais leur caractère objectif venait à être décrié et leurs biais prouvés. Il en va donc de la responsabilité de leurs créateurs d’en faciliter la transparence, de leurs utilisateurs d’en vérifier l’accord avec les lois et de la totalité de la population d’exercer une pensée critique vis à vis des résultats obtenus.

Comprendre la limite des algorithmes aidera à juger leurs recommandations. De par leur définition, données et algorithmes réduisent une réalité complexe à une vision plus simple du monde. Seules les parties mesurables de cette vision devraient être utilisées. Il convient ainsi d’éviter la religion de l’algorithme et la vision réductrice inhérente, en gardant des décideurs humains dans la boucle du choix.

Dans une seconde partie, nous nous concentrerons sur les différentes approches existantes permettant de réduire voire d’éradiquer ces biais algorithmiques, pour des systèmes aux décisions plus justes et peut-être un jour réellement objectives…

Note : l’étude menée par Propublica sera par la suite fortement contestée par une étude gouvernementale. Indépendamment de la véracité des résultats, Propublica aura mis sur la table le sujet du biais algorithmique et l’aura rendu compréhensible (à minima accessible) au plus grand nombre.

Mesurez et Augmentez la Valeur de vos Données

Mesurez et Augmentez la Valeur de vos Données

4 octobre 2019

– 1 min de lecture

Albert Bendayan

Directeur Architecture, Data & Transformation

Vous souhaitez développer les usages de vos données ?

Vous souhaitez augmenter le potentiel de vos données ?

Nous avons synthétisé pour vous les 5 étapes pour mesurer et augmenter la valeur de vos données !

Si cette infographie vous a intéressé, vous pouvez approfondir le sujet en téléchargeant notre livre blanc : Augmentez la valeur de vos données.

communication-connection-contemporary-261706

Lettre pour un CDO

Lettre pour un CDO

15 mai 2019

– 2 min de lecture

Jean-Baptiste Piccirillo

Manager Transformation Data

Cher/Chère CDO,

Vous êtes probablement en train de mettre en place votre « Data Lake », « Data Hub » et autres « Data Labs ». A cet instant, nombreux sont les vendeurs autour de vous, briguant une place dans votre cœur…Ils peuvent tout changer ! Ils peuvent faire de vous un brillant Chief Data Officer…

« D’abord, Migrez toutes vos données dans le Cloud sans inquiétude, c’est là que vous trouverez nos outils magiques qui tirerons toute la valeur de vos données ! » Allez, avouez qu’il ne le disent pas comme ça, mais que ce n’est qu’à peine caricaturale. Une variante ? : « Si vous voulez être THE Data Driven Company, notre outil est fait pour vous. Et, il est justement tout à fait adapté et pensé pour votre métier et vos données. Alors Essayez-le. Nous avons même ce qu’il faut pour vos Data Scientist. Tout en un ! ». En changeant quelques mots de leur beau scénario, on ne serait pas si loin d’une pub pour dentifrice…

Je vous prie de ne pas répondre trop vite à ces « experts » de la donnée. De même, n’embauchez pas trop hâtivement une armée de jeunes « Data Scientists ». Ne leur dites pas qu’ils sont l’avenir et qu’ils vont construire des algorithmes des plus innovants, quand au final ils deviendront les rois des Dashboards à faire pour hier.

Votre seul objectif en tant que CDO est de mesurer et d’augmenter la valeur des données de votre Organisation. Et avant d’embaucher qui que ce soit, ou d’avoir le plus gros Data Lake avec le plus de données possible pour justifier l’existence de votre équipe, si vous commenciez par structurer deux approches : L’une par la valeur « Potentielle » de vos données, l’autre par sa valeur « Effective » :

Appréciez et faites comprendre aux acteurs de votre entreprise la valeur de son patrimoine data. Peut être, allez-vous à la salle de sport tous les jours, ou peut être faites vous votre petit jogging quotidien ? Les gens vous disent : « Tu as l’air en forme, tu es en bonne santé ! ». Et vos données sont-elles en bonne santé ? Qualité ? Disponibilité ? Sécurité ? Travaillez sur vos assets transversaux (Client, Produit, …), assurez-vous qu’a minima leur santé est assurée par une gouvernance adaptée. Sécurisez ce potentiel minimal. Documentez, explorez, améliorez la valeur intrinsèque de vos données clés, mettez à disposition des données à potentiel à vos analystes (via une plateforme adaptée : « Data Lake » ou autre !). Mais ne faites pas que ça, ou c’est la gueule de bois assurée.

Parce que ce sont les usages de la donnée qui concrétisent réellement sa valeur, dans le même temps, travaillez continuellement avec les métiers pour comprendre et répondre à leurs usages concrets des données, et améliorez les usages existants !

Et pas seulement les usages qui rendent heureux vos Data Scientists et vos vendeurs de dentifrices préférés. Vous devriez précisément connaître les usages actuels des données pour lesquels certains collaborateurs bondissent : « Cette donnée ne sert à rien ! Je ne peux pas faire mon travail ! Je perds un temps fou, tout est faux 🙁 » Et s’il vous plaît, faites quelque chose pour eux en priorité, rentrez dans leur quotidien et leurs moultes fichiers excel, et changez les choses car vous êtes responsable. Améliorez la valeur d’usage de vos données.

Cher CDO, acheter une belle plateforme dans le Cloud et embaucher quelques Data Scientists ne suffira malheureusement pas à améliorer la valeur de vos données. Avant toute chose, assurez-vous que votre organisation est bien fondée sur l’équilibrage de deux axes clés :

1/ transformez des usages à valeur ajoutée grâce aux données

2/ développez le potentiel de votre patrimoine data pourrait bien vous faire gagner du temps et de l’argent.

Cordialement,



N’hésitez pas à lire notre livre blanc qui approfondit ce sujet.