Actuellement, le modèle de prévision météorologique le plus performant au monde est un Modèle de Circulation Générale (MCG), développé par le Centre Européen pour les Prévisions Météorologiques à Moyen Terme. Un MCG repose en partie sur des algorithmes qui modélisent les processus physiques de l’atmosphère que nous comprenons bien. Pour d’autres aspects, les MCG s’appuient sur ce qu’on appelle la « paramétrisation », qui utilise des relations empiriques pour estimer des processus dont la physique n’est pas entièrement comprise.
Récemment, les MCG ont commencé à être concurrencés par des techniques d’apprentissage automatique, qui entraînent des systèmes d’IA à identifier des motifs dans les données météorologiques pour prédire les conditions des jours suivants. Cependant, leurs prévisions deviennent souvent floues au-delà de quelques jours et ne peuvent pas prendre en compte les facteurs à long terme nécessaires pour étudier le changement climatique.
Ce lundi, une équipe du groupe d’IA de Google et du Centre Européen pour les Prévisions Météorologiques à Moyen Terme a présenté NeuralGCM, un système qui combine la circulation atmosphérique basée sur la physique avec une paramétrisation par IA d’autres influences météorologiques. NeuralGCM est efficace sur le plan computationnel et se distingue par ses performances dans les benchmarks de prévisions météorologiques. Fait remarquable, il peut également produire des résultats cohérents pour des simulations s’étalant sur des décennies, ce qui pourrait lui permettre d’aborder certaines questions climatiques pertinentes. Bien qu’il ne puisse pas traiter tous les aspects pour lesquels nous utilisons des modèles climatiques, des pistes d’amélioration sont évidentes.
Présentation de NeuralGCM
NeuralGCM se compose de deux parties. La première, qualifiée de « noyau dynamique » par les chercheurs, gère la physique de la convection atmosphérique à grande échelle, prenant en compte des principes fondamentaux tels que la gravité et la thermodynamique. Tout le reste est pris en charge par la partie IA. « Il s’agit de tout ce qui n’est pas inclus dans les équations de la dynamique des fluides, » explique Stephan Hoyer de Google. « Cela inclut les nuages, les précipitations, le rayonnement solaire, la résistance à la surface de la Terre, ainsi que tous les termes résiduels dans les équations qui se produisent en dessous de l’échelle de grille d’environ 100 kilomètres. » Ce système peut être considéré comme une IA monolithique. Plutôt que d’entraîner des modules individuels pour chaque processus, comme la formation des nuages, la partie IA est formée pour gérer l’ensemble simultanément.
Un aspect crucial est que l’ensemble du système est entraîné de manière conjointe, plutôt que de former l’IA séparément du noyau physique. Au départ, les évaluations de performance et les mises à jour du réseau neuronal étaient effectuées toutes les six heures, car le système n’est pas très stable tant qu’il n’est pas partiellement entraîné. Avec le temps, ces intervalles ont été étendus à cinq jours.
Le résultat est un système qui rivalise avec les meilleures prévisions disponibles pour des prévisions allant jusqu’à 10 jours, dépassant souvent la concurrence selon les critères précis utilisés (en plus des benchmarks de prévisions météorologiques, les chercheurs ont examiné des caractéristiques telles que les cyclones tropicaux, les rivières atmosphériques et la Zone de Convergence Intertropicale). Pour les prévisions à long terme, il a tendance à produire des caractéristiques moins floues que celles générées par des prévisionnistes basés uniquement sur l’IA, même s’il fonctionne à une résolution inférieure. Cette résolution plus basse signifie des carrés de grille plus grands — la surface de la Terre est divisée en carrés individuels à des fins de calcul — ce qui réduit considérablement ses exigences informatiques.
Malgré son succès en matière de prévisions météorologiques, deux limitations majeures subsistent. La première est que NeuralGCM a tendance à sous-estimer les événements extrêmes dans les tropiques. La seconde est qu’il ne modélise pas réellement les précipitations ; il calcule plutôt l’équilibre entre l’évaporation et les précipitations.
Cependant, il présente également des avantages spécifiques par rapport à d’autres modèles de prévision à court terme, notamment le fait qu’il n’est pas limité à des simulations à court terme. Les chercheurs l’ont laissé fonctionner pendant jusqu’à deux ans, et il a réussi à reproduire un cycle saisonnier cohérent, y compris des caractéristiques à grande échelle de la circulation atmosphérique. D’autres simulations de longue durée montrent qu’il peut produire des comptages appropriés de cyclones tropicaux, qui suivent ensuite des trajectoires reflétant des motifs observés dans le monde réel.