Visuel
laptop
Atelier EMI : influence des algorithmes
Objectif détaillé
  • Poser un regard critique sur les recherches d’information que nous effectuons sur le net.
  • Prendre conscience de l’influence des données que nous publions.
Matériel

Atelier 1 :

  • Ordinateur pour animateur ;
  • Vidéoprojecteur ;
  • Smartphone des participants.

 

Atelier 2 :

  • Mur ou grand tableau ;
  • Vidéoprojecteur ;
  • Ordinateur avec connexion à Internet ;
  • Post-it ;
  • Fils de laine ;
  • Punaises.
Moyens humains

1 médiateur pour 10 participants

Durée
1h30
Auteur
Marie-Laure de Capella; Agnès Defrance
Compétences mises en œuvre
  • Comprendre le fonctionnement de l’Internet, du web, des réseaux sociaux et d’autres plateformes numériques ;
  • Savoir rechercher, sélectionner, évaluer, organiser, l’information et qualifier ses sources : leur fiabilité et leur pertinence ;
  • Savoir sélectionner les médias en fonction de leur source et pertinence ;
  • Connaître le paysage médiatique contemporain et son organisation : algorithmes, influences, structure.
  • Savoir identifier et maîtriser les infrastructures des systèmes informationnels ;
  • Comprendre et gérer les enjeux de son identité numérique.
Description

ATELIER 1 : Autorité de l’information

  •  
    • séquence 1 (25’): définir l’algorithme
      • Le médiateur se présente, définit de manière théorique l’algorithme ;
      • Il organise des groupes de deux ;
      • Reprenant l’image comparant un algorithme à une recette de cuisine, il propose aux différents groupes de créer un algorithme à la manière d’une recette de cuisine : faire une succession d’actions ordonnées pour arriver à un résultat ;
      • Commencer par inscrire “début” avant une action nouvelle, terminer par “fin” ;
      • Employez le “si” (condition), “alors” (si la condition est remplie), “sinon” (si la condition n’est pas remplie) ;
      • S’il manque une indication, l’algorithme ne trouvera pas le chemin, la recette sera ratée. Pour s’aider voir sur le site d’interstice : https://interstices.info/les-ingredients-des-algorithmes/
  •  
    • séquence 2 (15’) : Recherche sur un moteur de recherche

Pour cette séquence, on utilise les smartphones des participants

  •  
    •  
      • Avant de lancer les participants sur le moteur de recherche Google, il leur demande d’effectuer une même recherche sur des moteurs de recherche différents (Lilo, Ecosia, Qwant, Exalead, etc.).
        • Les résultats sont différents ;
        • Échange autour de ces résultats. Qu’est-ce que cela traduit ?
        • Chaque moteur a un algorithme de tri et de classement de l’information différent, une capacité technique également différente.
  •  
    • Séquence 3 : (35’) : Recherche avec le moteur Google

A la fin de la séquence 2, les participants auront été interrogés sur le moteur qu’ils utilisent le plus. Plus de 80 % des requêtes effectuées dans le monde le sont sur le moteur de recherche Google.

  1.  
    •  
      • Chaque participant fait la même recherche exclusivement sur le moteur de recherche Google. Chacun montre ses résultats à son binôme, ils comparent l’affichage des résultats. Le médiateur projette également ses résultats sur écran.
        • Les pages de résultats sont différentes. Question : d’après vous, pourquoi une même recherche, sur un même moteur, ne donne-t-elle pas les mêmes résultats sur vos smartphones ?
        • Comment Google fonctionne-t-il ?
        • Projection de la chaîne 1, 2, 3 pensez ! https://www.youtube.com/watch?v=sqfgPFJ7T2k : expliquant le PageRank de Google.
    • Séquence 4 (15’) : Évaluer sa recherche d’information
      • Le médiateur rappelle les principaux critères de l’algorithme de Google (il en existe plus de 200)* afin de permettre aux participants d’exercer leur esprit critique, de prendre du recul sur la recherche qu’ils viennent de faire.
  2. Que pensez-vous de ces critères ?
  3. Quels sont ceux qui vous paraissent susceptibles de fournir les meilleurs résultats et pourquoi ?
  4. Quels sont ceux qui vous paraissent constituer des biais susceptibles d’orienter l’internaute ?
  5. Quels autres critères pourrions-nous ajouter qui nous renseigneraient sur la pertinence de l’information trouvée ?

*cf encadré : Principaux critères d’affichage des résultats du moteur Google d’après Guillaume Sire (2016)

[Point de vigilance] : les questions 2 et 3 sont destinées aux étudiants. Le médiateur poussera les échanges en décryptant avec eux les résultats obtenus sur Google Scholar. Le temps de l’atelier est à augmenter de 15’.

ATELIER 2 : Algorithme et data

  • Durée : L’atelier complet en quatre séquences dure 3 heures mais peut être mis en œuvre de façon non linéaire, par exemple :
    • Séquences 1 et 2 : 1h ;
    • Séquence 3 et 4 : 1h ;
    • Séquence 1, 2 et 4 : 2h.
  • Déroulé : 
    • séquence 1 (15 min.): introduction

Le médiateur se présente et présente l’atelier. Le médiateur définit ce qu’est un algorithme : une suite ordonnée d’opérations visant à résoudre un problème. Aujourd’hui, toutes nos actions sur le web créent des données qui sont mélangées et analysées par des algorithmes.

  •  
    • séquence 2 (45 min.) : Mur de datas, création de nos liens
      • Chaque participant, à partir d’une fiche profil donnée par l’animateur, note sur des post-it de couleurs différentes : prénom, sexe, lieu d’habitation, style de musique écoutée, caractère, passion, cursus, diplôme, animal préféré, émission de TV préférée, pays d’origine...

L’animateur selon le niveau des participants choisira les items adaptés.

  •  
    •  
      • Sur un grand tableau ou sur un mur, les participants viennent disposer leurs post-it.
      • Avec des fils de laine et des punaises, relier les différents caractères, passions, cursus, diplômes, animaux préférés, plateformes préférée, etc. afin de créer des liens entre individus.
      • A nouveau par groupe de deux : essayer de mettre en évidence des corrélations entre les différents participants :

Exemple : si Y et X sont tous les deux au lycée et aiment regarder Netflix et si Y aime les chats alors probablement X aime les chats.

Lire les différentes corrélations.

A la suite des lectures et en laissant réagir les participants, l’animateur aborde la corrélation. Il pourra s’aider en projetant sur un écran des cartes réalisées par les décodeurs du Monde. https://www.lemonde.fr/les-decodeurs/article/2019/03/01/correlations-ou-causalite-generez-vos-propres-cartes-pour-ne-rien-demontrer-du-tout_5430063_4355770.html

Il replace la notion dans le cadre de l’atelier : l’algorithme calcule à partir des données ou des traces laissées lors de nos différentes navigations - sur notre ordinateur, tablette, smartphone et par l’usage d’objets connectés - les actions et les choix que nous sommes susceptibles de faire.

  •  
    • séquence 3 (45 min.) : données et algorithmes

Visionnage d’une vidéo par groupes de deux.

  •  
  • Relever les informations importantes
  • Identifier les liens entre données et algorithme.

                        Échanges autour de ce que chaque groupe aura relevé.

  • Séquence 4 (15 min.) : Suppression de données

Si certains post-it n’étaient pas visibles, les liens seraient-ils différents ? Enlever tous les post-it d’une couleur et relire le mur.

Introduire l’influence des algorithmes sur les informations que nous recevons. Par le jeu des recommandations notamment, par les données que nous choisissons de publier, notre profil se construit avec les liens qui se créent. Les informations choisies par les moteurs de recherche ou par les plateformes s’orientent en fonction de ce profil : une partie des informations ne vient plus à nous.

Proposer un moment d’échange sur les données que l'on publie et celles que l'on ne publie pas et qui vont non seulement créer notre profil mais également l’accentuer en le liant à d’autres profils.
 

Références bibliographiques

< https://www.ted.com/talks/eli_pariser_beware_online_filter_bubbles?language=fr >

ENCADRÉS

  1. Principaux critères d’affichage des résultats du moteur Google

            d’après Guillaume Sire (2016) :

  • Contenu : adéquation entre les mots choisis par l'internaute lors de sa requête et les mots choisis par l'éditeur du contenu. La place du mot dans l’URL, dans le titre et dans le texte joue un rôle important dans le critère de pertinence.
  • Centralité : rôle du Page Rank de Google qui considère chaque lien pointant vers un document comme un indicateur de pertinence
  • Source : historique des visites sur le site web, temps passé en moyenne par chaque visiteur.
  • Autorité : l’autorité de l’auteur (AuthorRank), soit la popularité et la pertinence d’un auteur. Nombre de pages signées, activité sur les réseaux sociaux, présence sur Wikipédia, Google Books et Google Scholar.
  • Performance : qualité de l’infrastructure et notamment le temps de chargement d’une page.
  • Signaux Sociaux : les commentaires et posts sur les réseaux sociaux
  • Interventions manuelles : système de notation, de hiérarchisation des documents effectués par des salariés.
  • Personnalisation : en fonction de ce que sait l’internaute en utilisant les données ou traces laissées par l’internaute.
  1. Do not track

https://donottrack-doc.com/fr/

Série documentaire qui traite en 7 épisodes de la vie privée et de l’économie du web.

Episode 5 : “Big Data un monde d’algorithme”

« Découvrez par vous-même les règles de l’interprétation algorithmique et ses absurdités »

Vidéo interactive qui fait l’expérience du tracking et livre au lecteur des éléments révélateurs de sa personnalité en fin de lecture.