Algorithme, je t’aime moi non plus

Alors que le débat est relancé sur le tracking, se pose la question de l’algorithme, mais aussi de notre niveau collectif d’acceptation de son intrusion dans notre vie quotidienne.

Les algorithmes ne peuvent pas exister sans les données qui les nourrissent, de telle sorte que le couple données-algorithme devient indissociable. Bien qu’anonymisées, souvent agrégées, et soumises aux filtres de la RGPD, les données qui nourrissent ces algorithmes sont utilisées autant pour des intérêts sanitaires que des intérêts politiques ou économiques.

La question posée ici est de savoir si nous consentons individuellement et collectivement à la collecte de nos informations personnelles en vue d’un intérêt supérieur (A greater good..). Quand le sage montre la lune, l’idiot regarde le doigt… pourquoi regarder les algorithmes quand il s’agirait plutôt de regarder la donnée et ceux qui la collectent sans consentement, l’utilisant pour une finalité contestable ? L'algorithme doit être un outil au service des hommes, mais comment s’en assurer ?

Quelques conseils pour approfondir le sujet

J'ai lu De l'autre côté de la Machine d'Aurélie JEAN (éditions de l'observatoire) qui parcourt le monde des algorithmes avec le prisme académique. On y apprend notamment pourquoi algorithme ne prend pas de “y”:-). Mais on comprend surtout que l'algorithmique est devenue une science mathématique à part entière, se nourrissant de l'interdisciplinarité. Autrement dit, elle n’existe que par ou pour les autres disciplines. Au vu de son impact sur notre civilisation, elle devrait cependant pouvoir être davantage reconnue pour sa valeur ajoutée dans la construction du monde à venir, en admettant toutefois qu’aucune science n’est exacte, surtout pas celle des algorithmes.

J’ai vu aussi Au secours mon patron est un algorithme de Cash Investigation (France 2) qui tente de comprendre l’avenir que proposent à notre société certains acteurs économiques utilisant les algorithmes. L’émission questionne la vie des invisibles payés à la tâche sans couverture sociale, de cette nouvelle classe de prolétaires pilotée par les algorithmes, au détriment de la vision humaniste d’une société égalitaire. On se rend compte alors que les algorithmes sont bien sortis du monde académique pour impacter l’économie réelle.

Enfin, j’ai écouté le podcast Internet a-t-il réinventé les règles du jeu politique ? (France Culture) qui analyse l’impact des algorithmes sur le monde politique. Giuliano Da Empoli, directeur du think tank Volta à Milan, ancien conseiller politique de Matteo Renzi explique dans son livre Les ingénieurs du chaos comment les big data permettent d’organiser le “carnaval politique”.

Les algorithmes, aussi appelés “machine learning”, s’invitent dans tous les domaines de la société : économie, recherche, santé, politique ou encore dans les réseaux sociaux. En lisant, en voyant ou en écoutant, on se rend compte qu’ils deviennent le bouc émissaire facile face à des situations professionnelles ou personnelles vécues comme injustes.

Alors, en tant que professionnels de la donnée, comment utiliser notre compréhension du monde pour expliquer et vulgariser ?

Oui, les algorithmes sont biaisés

Le débat actuel sur les algorithmes qui gouvernent le monde nous impose de comprendre pourquoi nous leur accordons autant de valeur, alors que nous savons qu’ils sont biaisés. Par ailleurs, de quoi avons-nous peur ?

Un algorithme est neutre par nature car il n’est pas doué de conscience d’exister, ni de libre arbitre. En revanche la personne qui l’a réalisé a reproduit son propre miroir déformant de la réalité. Et oui les algorithmes déforment la réalité pour la rendre compatible avec une exigence mathématique.

Deux écueils nous sont proposés pour comprendre les biais algorithmiques :

Quand on ne différencie pas corrélation et causalité, illustré par l’exemple suivant :“il ne faut surtout pas aller à l'hôpital quand on est malade : la probabilité de mourir dans un lit d'hôpital est 10 fois plus grande que dans son lit à la maison”.
Quand on a tendance à transformer la représentativité statistique en condition systématique. “90% des hommes marseillais aiment l’Olympique de Marseille , donc tous les hommes français aiment l’Olympique de Marseille. “

L’algorithme est le reflet de ses auteurs, donc incomplets (au sens cognitif) ou partiels (au sens culturel). Ces biais représentent nos différences en tant que peuples, nations ou ethnies. L’exemple le plus connu étant celui de Google, dont l’algorithme confondait afro-américains et gorilles, ou encore d’Amazon dont l’algorithme des CV discriminait les candidates.

Cependant il arrive parfois que les biais algorithmiques soient introduits sciemment pour simplifier les calculs car la capacité des machines peut ne pas être suffisante ou trop coûteuse. L’auteur va sciemment retirer ou ne pas prendre en compte certains critères qu’il va estimer pas ou peu impactants, permettant ainsi à la machine de calculer en économisant du temps et de l’argent. Dans ce dernier cas, l’algorithme est soumis à des hypothèses de travail qu’il faudra savoir remettre en cause.

Ces biais rendent les algorithmes imparfaits, et parfois défaillants. ll s’agit donc d’être attentif à ces biais, de les identifier et de les comprendre pour nous permettre d’utiliser notre esprit critique, ce qu’Aurélie Jean appelle l’auto-défense intellectuelle. Nous vivons dans un monde biaisé, ne l’oublions pas. Nul n’est infaillible, pas même la machine. Un algorithme doit nécessairement être assisté par un humain pour rétablir l’équilibre. Sommes-nous pour autant condamnés à devenir des assistants d’algorithmes ?

Non le machine learning (ou IA) n’est pas un gros mot

Machine learning et IA, deux mots qui font peur.

On a lu beaucoup de littérature sur l’Intelligence Artificielle, trop sans doute car le concept est simple : l’IA, c’est du machine learning avec une nouvelle puissance de calcul permettant de digérer davantage de données (big data).

Le machine learning (ou apprentissage automatique), ce sont des algorithmes combinés permettant à un système de s’améliorer de façon automatisée. L'algorithme, lui, est un ensemble d’opérations ordonné et fini devant être suivi dans l’ordre pour résoudre un problème.

Dans le machine learning, on distingue :

L’apprentissage supervisé, fondés sur des critères explicites “humains”. On va indiquer à la machine les éléments constitutifs d’un kangourou : il a deux pattes avant, deux pattes arrières et une poche sur le ventre. On va aussi dire à la machine ce que n’est pas un kangourou, “un kangourou n’est pas vert”. En revanche saura-t-il le distinguer avec un humain déguisé en kangourou ?
L’apprentissage non supervisé ou auto-apprenant. La machine cherche à trouver des réponses (des modèles) elle-même. Elle se nourrit de critères d'expérience, formant ainsi un réseau neuronal. Elle va regrouper et catégoriser les informations en fonction de sa propre logique.

Afin de la rendre performante, il s’agit donc de proposer le plus de données possibles à la machine pour améliorer l’algorithme. Dès lors, on comprend bien l’intérêt de favoriser la collecte de données des internautes, car plus on a de données, plus le résultat présenté par l’algorithme aura des chances d’être pertinent. On peut le résumer ainsi : “Quand c’est gratuit, le produit c’est toi, quand c’est pas cher, c’est aussi toi mais un peu moins”.

Les algorithmes nouvelle police de la pensée ?

Après avoir refaçonné l’économie et dynamité des modèle économiques historiques, les algorithmes sont entrés dans le champ politique sans y être invité, créant de longs débats et des polémiques. Cela a notamment porté un coup de projecteur sur le modèle de la collecte de données des réseaux sociaux. L’effet immédiat a été l'ouverture d'enquête afin de mieux contrôler les entreprises qui semblaient ne pas respecter la loi. Depuis, elles se sont excusées 😉

Derrière ces craintes, on entrevoit la manipulation des citoyens, la difficile lutte contre les fake news, et l'impossibilité de discerner la frontière entre la censure et la modération. Autant de sujets liés les uns aux autres.

Laisser le champ libre à la machine ne semble pas tout à fait satisfaisant, encore un exemple récent avec le blocage du discours du président de la République “par erreur”. Mais pour autant, la croissance exponentielle du contenu publié par les internautes oblige à une gestion automatisée de la modération car il n’est pas humainement possible de tout filtrer en permanence. Les algorithmes répondent partiellement au problème, car il ne sont pas en mesure de toujours faire preuve de bon sens. N’étant pas au niveau pour décrypter toutes les images ou les vidéos, la modération algorithmique se doit d’être supervisée par les humains. On assiste donc à l'émergence de la modération algorithmique supervisée, avec les impact destructeurs soulignés par l’émission de Cash investigation (burn-out psychologique des modérateurs).

Algorithme, miroir de notre quête d’absolu ?

L'algorithme est à l’image de l’homme, capable du meilleur comme du pire. Souvent utile, parfois imparfait. Les algorithmes, on les aime, on aime les détester mais on est tout de même en train de transformer nos habitudes pour ne plus pouvoir s’en passer.

Ces nouveaux génies immatériels nous séduisent au quotidien avec la promesse du gratuit, ou du pas cher. Chacun pourra réfléchir à la place qu’il souhaite donner aux algorithmes dans sa vie : ni connivence, ni complaisance, ni rejet complet, comment se positionner face aux progrès technologiques ? Faut-il regarder passer le train, faut-il monter dedans ? Faut-il changer le train ? Existe-t-il un autre chemin qui permettrait de respecter la liberté de l’humain ?

Une réponse se trouve sans doute dans les mouvements d’éthique de la donnée qui fleurissent depuis quelques mois, cherchant à introduire une forme de moralité et à rappeler que “Great power implies great responsabilities”, certains l’ont peut-être oublié.

Écrit par Ghislain Gridel

Directeur Conseil Data & CRM