Prédire l’Avenir des Enfants : Les Limites des Modèles Informatiques
Introduction à la Prédiction des Résultats Scolaires
Peut-on anticiper le parcours d’un enfant, y compris son futur indice de réussite académique, à l’aide de modèles informatiques ? Bien que cela puisse sembler farfelu, cette idée trouve un écho dans notre ère numérique. Les algorithmes sont déjà utilisés pour prédire des résultats de santé ou la probabilité de remboursement de prêts. Une équipe de chercheurs s’est donc interrogée sur la possibilité d’appliquer une telle analyse pour prévoir et atténuer les difficultés futures des enfants, en particulier ceux issus de milieux défavorisés.
Analyse des Données Familiales
Pour explorer cette question, les scientifiques ont examiné les données de plus de 4 000 familles américaines recueillies sur une période de 15 ans, depuis la naissance de l’enfant. Ces données comprenaient des informations sur les enfants, leurs parents, leurs établissements scolaires et la stabilité de leur environnement. En se basant sur les neuf premières années de vie, les chercheurs ont tenté de prédire six résultats académiques et personnels clés lorsque les enfants atteindraient l’âge de 15 ans.
Les Résultats Surprenants de l’Étude
Cependant, les résultats ont révélé que des éléments tels que le succès académique et les difficultés familiales sont plus imprévisibles que d’autres prédictions basées sur des algorithmes. En 2020, l’équipe a publié ses conclusions, et Ian Lundberg, sociologue à l’Université de Californie à Los Angeles et co-auteur de l’étude, a déclaré : « À notre grande surprise, les prédictions n’étaient pas très précises. Cela nous a amenés à nous interroger : pourquoi ? »
Une Nouvelle Approche pour Comprendre les Échecs de Prédiction
Dans une étude récente, Lundberg et ses collègues ont approfondi les raisons pour lesquelles l’étude précédente n’avait pas réussi à prévoir avec précision les résultats des enfants, en se concentrant sur l’indice de réussite académique. Ils ont recontacté 40 familles suivies dans l’ensemble de données et les ont interviewées en profondeur pour découvrir des nuances de leur vie qui avaient échappé aux chiffres. Les résultats, publiés cette année dans les Actes de l’Académie nationale des sciences, suggèrent que les limites de la prédiction ne sont pas seulement dues à un manque de données ou à des limites computationnelles, mais qu’il existe une limite fondamentale à notre capacité à anticiper les complexités de la vie.
Les Sources de l’Erreur de Prédiction
Les auteurs de l’étude identifient deux principales sources d’erreur dans la prédiction. La première est ce qu’on appelle l’erreur irréductible. Par exemple, un événement imprévu, comme le décès d’un parent, peut survenir durant l’adolescence d’un enfant et ne peut pas être anticipé par des facteurs tels que le revenu. Lundberg souligne qu’« il n’existe vraiment aucune méthode d’apprentissage automatique qui puisse améliorer cette prédiction. »
La seconde source est l’erreur d’apprentissage, qui se produit au sein du processus d’apprentissage d’un algorithme. Les résultats que les scientifiques cherchaient à mesurer, tels que les notes, la résilience, les expulsions et les difficultés familiales, sont influencés par de nombreux facteurs. Lorsque trop de variables sont présentes, les algorithmes peuvent parfois apprendre des schémas erronés. Bien que l’augmentation du nombre de participants puisse réduire ce type d’erreur, il est difficile d’obtenir plus de quelques milliers de personnes pour des études longitudinales à long terme. « C’est un problème fondamental de l’étude de la complexité », explique Sotoudeh.
L’Importance de la Recherche Qualitative
Les nouvelles découvertes soulignent également la valeur de la recherche qualitative. Les entretiens et les échanges avec des individus peuvent fournir des informations que les approches quantitatives ne peuvent pas offrir. Certaines observations qualitatives, comme la manière dont les gens interagissent et établissent des relations, sont difficiles à quantifier, mais peuvent influencer les résultats.
Pour Lundberg, explorer cet aspect qualitatif de la recherche a été révélateur, même s’il avait déjà passé beaucoup de temps à étudier l’ensemble de données initial. Par exemple, l’étude met en lumière le cas de « Bella » (un pseudonyme). Bien qu’elle ait eu une enfance stable et semblait destinée à obtenir un bon indice de réussite académique, la mort inattendue de son père et la dépression de sa mère entre 9 et 15 ans ont eu un impact significatif sur ses performances scolaires et sociales, des facteurs non capturés par les données.
Conclusion : Accepter l’Imprévisibilité des Résultats Sociaux
Il existe un fort désir d’anticiper l’avenir, que ce soit pour soi-même ou pour ses proches. Lundberg note qu’« il y a un intérêt croissant pour l’idée que les ordinateurs pourraient nous aider à le faire de manière plus précise. Cependant, l’implication la plus importante de notre étude est que nous ne devrions pas supposer que tous les résultats deviendront prévisibles avec l’augmentation de la puissance computationnelle. »
« La réponse n’est pas toujours plus de données », renchérit Sotoudeh. « Les résultats sociaux sont imprévisibles et complexes. Nous devons simplement accepter cette imprévisibilité. »