Imaginez cette scène.
Loïc casse les oreilles de toute la classe depuis des semaines à propos du nouveau jeu de Pokémon. Il ramène tout à ça. Tellement que c’en est devenu une blague récurrente dans la classe. Les Olympiques approchent, et vous avez envie d’intégrer cette actualité à vos leçons de 6e année. En même temps, vous voulez commencer à familiariser vos élèves avec le diagramme de Venn pour les préparer à leur arrivée au secondaire.
Vous ouvrez Google Gemini. Vous lui demandez de créer un diagramme de Venn simplement en y dictant ce petit scénario.
Je veux créer un diagramme de Venn pour commencer à familiariser mes élèves à cette notion mathématique, comme je veux attirer leur attention, j’utilise des sujets qui leur tiennent à cœur. Par exemple, dans ce cas-ci, ce que je voudrais, c’est un diagramme de Venn avec le jeu Pokémon dans un cercle et les Jeux olympiques dans l’autre cercle. Donc je te laisse chercher pour trouver ce qui concerne le jeu Pokémon, les Jeux olympiques et ce qu’il y a de points en commun. Style : comme si je l’avais fait à la craie, au tableau.
Le diagramme doit être simple et drôle dans le but que mes élèves comprennent intuitivement le concept du diagramme de Venn simplement en l’observant.
Voici un exemple de ce que vous pourriez obtenir. (C’est toujours un résultat imprévisible avec l’IA)

Voilà une nouvelle notion, ancrée dans les intérêts de vos élèves, générée en trente secondes. Jamais, auparavant, vous n’auriez pris le temps d’élaborer ce genre d’image. On serait allé directement à la matière.
Et si Gemini te montrait ce que tu veux dire?
Trouver des images a longtemps été compliqué, surtout si on a à cœur d’utiliser des images libres de droit. On peut maintenant créer exactement ce dont on a besoin. Le principal obstacle, c’est d’y penser; d’avoir de bonnes idées. Comme on s’en est toujours passé, on n’a pas développé le réflexe de demander ce genre de chose.
C’est encore plus pertinent si on doit illustrer un concept abstrait : l’IA excelle dans ce genre de tâche. Elle est à l’aise dans le flou, quoi. Vous voulez illustrer le zéro à vos jeunes élèves? Demandez une image à Gemini. Elle ne convient pas? Redemandez.
Le zéro, illustré pour des élèves de 1er cycle.

Les images créées par l’IA sont libres de droits. Comme elles n’ont pas d’auteur, elles n’ont pas, non plus, de droits d’auteur. On pourrait argumenter que l’humanité entière en est l’autrice, vu la manière dont les IA gobent tout ce que les humains ont créé. Mais c’est un débat pour une autre fois (je suis moi-même un illustrateur qui a payé une partie de ses études avec mes dessins – cette question est loin d’être réglée pour moi).
Il est assez facile d’améliorer rapidement ce qu’on présente aux élèves. D’adapter nos notions aux intérêts des élèves (qui évoluent constamment) ou à l’actualité ou à la culture ambiante (qui évolue tout autant). Et ce n’est pas juste une intuition — la recherche le confirme.
Au-delà de la décoration, le double codage
Le cerveau encode mieux l’information quand elle passe par deux canaux en même temps — le verbal et le visuel. C’est ce que la recherche appelle le double codage (Paivio, 1971). Et contrairement aux « styles d’apprentissage » (qui n’ont jamais été validés par la recherche), le double codage fonctionne pour tout le monde. Une étude de Cuevas et Dawson (2018) l’a confirmé : les participants qui recevaient un support visuel en plus de l’information verbale retenaient deux fois plus d’information, peu importe leur préférence déclarée.
Attention, par contre : pour que le double codage fonctionne, l’image doit compléter ce qui est dit, pas simplement le répéter. Une image de chat dans une diapo sur les chats, c’est décoratif. Une image qui montre la structure du squelette du chat quand on parle de l’adaptation des félins, c’est du double codage. La différence, c’est que l’image apporte quelque chose que les mots seuls n’arrivent pas à transmettre.
Quand une image ne fait que répéter ce qui est déjà dit verbalement, elle n’aide pas — elle peut même nuire à l’apprentissage. Le cerveau gaspille de la capacité cognitive à coordonner deux sources qui disent la même chose, au lieu de construire un modèle mental plus riche. L’image et le discours doivent converger : chacun éclaire ce que l’autre ne peut pas montrer seul. À l’inverse, une image trop complexe place l’apprenant en surcharge cognitive. Il s’agit de trouver le juste milieu où le visuel et le verbal se complètent.
Détails techniques
Avant d’aller plus loin, il faut s’attarder à quelques détails techniques. C’est la partie de cet article qui vieillira le plus rapidement. Mais ça vaut la peine d’en prendre connaissance parce qu’on aura immédiatement de meilleurs résultats (alors pourquoi pas?).
Le modèle qui crée les images dans Google Gemini s’appelle délicieusement Nano Banana. Si on demande une image ou si on clique sur le bouton « Créer des images » dans les outils, le grand modèle de langage qu’on appelle Gemini utilise l’outil Nano Banana pour la créer. Jusqu’à maintenant, ça ne pourrait pas être plus simple : on clique sur un bouton, on demande ce qu’on veut, et on obtient une image. Mais comme il existe maintenant une version pro de Nano Banana et qu’elle n’est pas utilisée automatiquement, il faut donc savoir comment aller la chercher si on veut le meilleur résultat possible.
Pour aller chercher Nano Banana Pro, il suffit d’être en mode réflexion (au lieu d’être en mode rapide, qui est le mode par défaut). Alors voilà la grosse nuance technique : il faut cliquer sur un bouton de plus… Si on oublie de le faire, ce n’est vraiment pas très grave. On obtient quand même de très bons résultats.


Nano Banana Pro nous donnera une image de meilleure qualité qui gère beaucoup mieux la présence de texte dans l’image, c’est-à-dire que le texte y sera mieux structuré et comportera moins d’erreurs. Au besoin, ce modèle peut même faire des recherches sur le web, pour aller chercher de l’information avant de créer l’image.
Ce qui est dommage, c’est qu’en éducation, la limite d’images pro est très basse — quelques images par jour, rarement plus. Google ne publie pas de chiffre exact et la limite fluctue selon la demande sur les serveurs. Alors, si vous prévoyez passer la prochaine journée pédagogique à créer des images pro pour vos présentations, soyez avertis que ça risque de ne pas fonctionner longtemps pour ce qui est des images de la meilleure qualité. Vous serez rapidement ramené, sans être prévenu, à Nano Banana « normal ».
Quatre angles d’action
Ce n’est vraiment pas difficile de faire des images avec l’intelligence artificielle; il suffit de demander. Ce qui est difficile, c’est d’avoir la bonne idée et de savoir la traduire en requête. Je vous suggère quatre approches pour vous inspirer.
Illustrer l’abstrait
Souvent, les mots de vocabulaire les plus difficiles pour les élèves sont ceux qui illustrent des concepts. Quoi de mieux qu’une image pour déclencher une discussion qui mènera à une définition.
Je veux illustrer le concept de l’entropie. L’image ne doit contenir aucun mot

Illustre le concept d’appartenance. L’image ne doit contenir aucun mot. Il faut éviter les clichés comme un groupe de personnes qui se tiennent en cercle en se tenant par la main. C’est pour illustrer et compléter une explication que je donnerai à mes élèves adolescents

Crée une image qui illustre la différence entre justice et égalité pour des jeunes de 10 ans. Utilise une métaphore visuelle simple.

Vous aurez remarqué un fil conducteur dans la plupart de ces requêtes : elles précisent « pas de texte » ou « aucun mot dans l’image ». C’est parce qu’on veut éviter de surcharger la capacité d’attention des élèves. L’image doit compléter ce qu’on dit. Je demande souvent d’éviter les clichés. C’est un réflexe à développer. Sans cette précision, Gemini aura tendance à écrire du texte dans l’image (souvent avec des erreurs) et à aller vers les représentations les plus convenues. Dire ce qu’on ne veut pas est souvent aussi important que dire ce qu’on veut.
Sachez-le, Gemini n’écoutera pas tout le temps la requête. Ce qui fonctionne encore mieux, c’est de lui demander (sans activer l’outil image) d’énumérer une dizaine de clichés qu’on retrouve dans ce genre d’image. Puis, de lui demander d’en créer une en évitant tous ces clichés. Le fait de procéder ainsi, en deux temps, donne souvent de bons résultats. Mais ne m’en tenez pas rigueur si ça fonctionne pas du premier coup. L’IA a la fâcheuse tendance à être imprévisible.


Capter l’attention
On l’a vu avec le diagramme de Venn de l’introduction : quand une image est ancrée dans ce qui intéresse les élèves, elle capte l’attention immédiatement. Ce n’est pas un hasard. C’est le même mécanisme utilisé par une enseignante qui glisse une référence à Fortnite dans son problème de maths — sauf qu’ici, l’image le fait visuellement, en une fraction de seconde.
L’idée, c’est de créer un décalage. Quelque chose que les élèves ne s’attendent pas à voir sur le tableau. Un personnage de leur univers dans un contexte scolaire. Un mème qui introduit une notion. Une image absurde qui force la question : « de quoi on parle, là? ». Ce décalage, c’est une porte d’entrée. On ne demande pas aux élèves d’être attentifs — on leur donne une raison de l’être.
Et c’est là que l’IA change la donne. Avant, créer ce genre de visuel sur mesure aurait pris un temps fou. Maintenant, on décrit ce qu’on veut et on l’obtient. On peut suivre l’actualité, les tendances, les intérêts du moment — et les intégrer dans nos images du jour au lendemain.
Crée un mème éducatif où un chat perplexe regarde un tableau noir rempli d’équations. Style humour internet. En haut : « Quand le prof dit que c’est facile ». En bas : rien.

Crée une image de style affiche de film d’action, mais le sujet c’est la photosynthèse. Titre : « LA PHOTOSYNTHÈSE ». Ambiance dramatique, épique. Pour des élèves de 11 ans.

Crée un diagramme de Venn entre le hockey et les mathématiques. Trouve des éléments amusants et surprenants pour chaque section. Pour des élèves de 6e année.

Ces requêtes jouent sur des formats que les élèves connaissent déjà — le mème, l’affiche de film, le diagramme de Venn improbable. C’est ce qui crée le décalage. Le contenu scolaire se retrouve dans un emballage inattendu, et c’est ça qui accroche.
Crée une mascotte pour ma classe d’anglais. Les élèves sont adolescents et un peu cyniques. Il faudrait que la mascotte soit comme eux.

Imagine le même personnage, qui se prépare pour la St-Valentin.

Même idée, pour les plus jeunes.


Personnaliser le matériel
Les banques d’images regorgent de photos beiges. On tape un mot-clé, on obtient des photos génériques d’enfants souriants dans des classes qui n’existent pas. Des paysages qui pourraient être n’importe où. Des situations tellement aseptisées qu’elles n’évoquent rien.
Avec la génération d’images, on peut créer exactement ce dont on a besoin. Un paysage des Laurentides pour un cours de géographie. Une scène d’hiver québécois pour un texte narratif. Des personnages qui ressemblent aux réalités de nos élèves. On n’est plus limité à ce que quelqu’un d’autre a photographié quelque part dans le monde — on crée l’image qui correspond à notre contexte.
C’est particulièrement utile quand on enseigne dans un contexte culturel précis. En univers social, par exemple, au lieu de montrer une image générique de « commerce au 18e siècle », on peut demander une scène de traite des fourrures en Nouvelle-France. En français, au lieu d’une illustration passe-partout pour un conte, on peut demander un village québécois en hiver avec l’ambiance qu’on veut. L’image devient un prolongement naturel de ce qu’on enseigne, pas un ajout décoratif plaqué par-dessus.
Crée l’illustration d’un conte pour enfants qui se déroule dans un village québécois en hiver. On voit une petite maison avec de la fumée qui sort de la cheminée, beaucoup de neige, une forêt de conifères. Style aquarelle chaleureux.

Illustre un paysage des Laurentides en automne avec un lac, pour accompagner un texte descriptif en français. Style photo réaliste. Pas de texte.

Illustre une scène de la vie quotidienne en Nouvelle-France au 17e siècle. On voit un poste de traite des fourrures en hiver, avec la forêt boréale en arrière-plan. Style réaliste, pour des élèves de 9-10 ans.

En passant, ce genre de demande est aussi excellent pour développer le sens critique des élèves. Les images auront souvent des biais qu’il est vraiment intéressant de débusquer. Pas besoin d’attendre des images « parfaites ». On peut saisir l’occasion d’enseigner au élèves à filtrer chaque image pour remettre en doute ce qui est représenté.
Ce qui fait la force de ces requêtes, c’est leur spécificité. « Un village en hiver » donnerait un résultat générique. Plus la description est précise, plus l’image correspondra à ce qu’on a en tête.
Crée une carte du Québec où chaque région administrative est faite de son produit le plus typique et connu (la région doit avoir l’air d’être faite de ce produit). Vérifie attentivement que chaque région est faite correctement.

Créer rapidement
Chercher la bonne image pour une diapo peut être étonnamment difficile et gruger beaucoup de temps. Même chose pour élaborer un aide-mémoire dans Canva. On est nombreux à avoir renoncé à faire une affiche parce que ça ne valait pas le temps que ça prendrait. Avec la génération d’images, cette équation change. Ce qui prenait vingt minutes en prend une. Et ce qu’on n’aurait jamais fait devient faisable.
Quelques exemples concrets :
- Un aide-mémoire visuel pour les étapes de la démarche scientifique
- Une affiche des règles de la classe, illustrée pour les plus jeunes
- Les consignes d’un laboratoire en images plutôt qu’en texte
- Une illustration pour accompagner un problème mathématique écrit
- Un visuel rapide pour une situation d’écriture (le lieu, l’ambiance, un personnage)
Ce qui est libérateur, c’est que ces images peuvent être jetables. On crée un visuel pour un seul cours, une seule activité, et ce n’est pas grave s’il ne resservira jamais. On ne cherche pas la perfection — on cherche l’utilité immédiate. C’est un brouillon visuel, et c’est exactement ce qu’il faut.
Crée une affiche simple des règles de la classe : lever la main, écouter, respecter les autres, ranger son matériel. Avec des illustrations claires pour chaque règle. Pour des élèves de 1er cycle du primaire.

Crée un aide-mémoire visuel des 5 étapes de la démarche scientifique pour des élèves de 10 ans. Chaque étape a une petite icône. Texte en français. Basé sur le PFEQ
(Exemple de regard critique sur une image : Le PFEQ insiste sur le fait que c’est un aller-retour entre des moments de questionnement, de réflexion, d’expérimentation et de bilan, et non une recette à suivre étape par étape. Ce que l’image n’illustre pas du tout…)

Crée un visuel qui montre les consignes de sécurité pour un laboratoire de sciences au secondaire : lunettes, pas de nourriture, cheveux attachés, signaler les bris. Style pictogrammes clairs.

J’ai besoin d’un visuel de type infographie qui montre un exemple de guide de correction en français pour des élèves du premier cycle du secondaire.

Remarquez que les requêtes de cette section sont les plus directes : on décrit exactement ce qu’on veut, sans détour. C’est normal — ici, on ne cherche pas à évoquer un concept ou à surprendre. On veut un outil fonctionnel, point. Pas besoin de peaufiner la requête pendant dix minutes. Si le résultat n’est pas parfait, on redemande ou on ajuste un détail. L’important, c’est que ça existe et que ça serve.
Ce que ça ne fait pas bien
La génération d’images a encore beaucoup de limites.
Les chiffres et les graphiques ne sont pas fiables. Si vous demandez un diagramme à bandes ou un graphique circulaire avec des données précises, les proportions seront approximatives au mieux, inventées au pire. L’IA ne « calcule » pas — elle dessine quelque chose qui ressemble à un graphique. Pour tout ce qui touche aux mathématiques, aux statistiques ou aux données chiffrées, mieux vaut créer le graphique soi-même et utiliser l’IA pour le reste de la présentation.
Le texte dans les images reste fragile. On en a parlé dans les détails techniques : Nano Banana Pro gère mieux le texte que la version standard, mais même elle produit parfois des fautes d’orthographe, des mots inventés ou du charabia. C’est particulièrement embêtant pour les aide-mémoire et les affiches. Le réflexe : vérifier tout ce qui est écrit dans une image générée, ou demander une image sans texte et l’ajouter soi-même ensuite. Dans un prochain texte sur la création de présentations, je développerai une manière d’éditer le texte d’une infographie dans le site Canva (à suivre…).
Les biais visuels sont omniprésents. Demandez une image de « scientifique » et vous obtiendrez probablement un homme blanc en sarrau. L’IA reproduit les biais présents dans les images sur lesquelles elle a été entraînée. Mais, à mon avis, ces biais sont une occasion pédagogique. Montrer l’image à vos élèves et leur demander ce qu’ils remarquent, c’est déjà un exercice de pensée critique. On l’a évoqué dans la section sur la personnalisation : pas besoin d’attendre des images parfaites pour les utiliser si on laisse un espace pour la critique.
Google bloque certaines requêtes. On ne peut pas générer d’images de personnes réelles identifiables, de contenu violent ou sexuellement explicite. Dans un contexte scolaire, ces restrictions sont rarement un problème — mais si vous voulez illustrer un personnage historique précis, il faudra parfois décrire une scène plutôt que demander un portrait, ou fournir une image de référence.
Et l’empreinte environnementale?
C’est une question légitime. Générer une image consomme de l’énergie, et les centres de données qui alimentent ces modèles ont un coût environnemental réel. Mais je ne crois pas que la réponse soit de se priver individuellement d’un outil qui profite à nos élèves. La responsabilité de l’empreinte carbone de l’IA relève des entreprises qui la développent et des gouvernements qui la réglementent — pas des enseignants qui l’utilisent pour illustrer une notion de géographie. Se priver de l’avantage ne changera pas l’empreinte.
On a beaucoup insisté sur l’image de la bouteille d’eau consommée à chaque image. C’est une vieille donnée, qui a toujours été approximative et qui ne tient plus la route aujourd’hui. Les IA sont beaucoup plus efficaces de mois en mois. Selon la plupart des estimations, une image demande autant d’énergie à créer qu’une requête textuelle équivalente.
À retenir
Si vous ne retenez qu’une chose de cet article, que ce soit celle-ci : vous avez maintenant accès à un outil qui crée des images sur mesure en quelques secondes, et cet outil est déjà dans Gemini. Le principal obstacle, ce n’est pas la technique — c’est le réflexe. On n’a pas l’habitude de se dire « tiens, une image aiderait ici ».
La prochaine fois que vous préparez une leçon, posez-vous la question : est-ce qu’une image rendrait cette notion plus concrète? Est-ce qu’un visuel ancré dans les intérêts de vos élèves capterait mieux leur attention? Si la réponse est oui, ouvrez Gemini et décrivez ce que vous avez en tête. Le pire qui puisse arriver, c’est que le résultat ne convienne pas — et dans ce cas, il suffit de redemander.
P.S.
Après avoir publié cet article, je me suis amusé à demander à Gemini (Nano Banana Pro) de créer une BD pour promouvoir ce texte. J’ai donné tout le texte dans ma requête et je lui ai dis que je voulais une BD qui donnerait le goût aux profs de le lire. Ça a donné ceci :

Sources :
- Paivio, A. (1971). Imagery and Verbal Processes. New York: Holt, Rinehart & Winston.
- https://journals.sagepub.com/doi/abs/10.1177/1477878517731450
- https://en.wikipedia.org/wiki/Dual-coding_theory
- https://www.learningscientists.org/blog/2019/6/6-1
- https://my.chartered.college/research-hub/learning-styles-versus-dual-coding-which-is-better-for-retention/
- https://pmc.ncbi.nlm.nih.gov/articles/PMC10192876/
- https://www.cambridge.org/core/books/abs/cambridge-handbook-of-multimedia-learning/redundancy-principle-in-multimedia-learning/448A5532008EB4B4BA17DBEB5A421920
- https://www.digitallearninginstitute.com/blog/mayers-principles-multimedia-learning
- https://daviddidau.substack.com/p/the-dual-coding-delusion