SESSION 3 – MODÈLES GÉNÉRATIFS & DEEP REINFORCEMENT LEARNING (2h)

Objectifs : comprendre les grands types de modèles génératifs (AE, VAE, GAN, Diffusion Models) et découvrir les fondamentaux du Deep Reinforcement Learning.

1. Introduction (5 min)

Script professeur :
« Cette dernière session va vous faire entrer dans ce qui est aujourd’hui au cœur de nombreuses avancées en IA : ✦ les modèles génératifs (GAN, VAE, Diffusion), ✦ le Deep Reinforcement Learning (qui a permis à l’IA de battre des humains à Go, StarCraft, etc.). L’objectif est de vous montrer les principes fondamentaux, sans entrer dans les maths lourdes. »

2. Modèles génératifs (45 min)

Objectif : comprendre comment on peut générer des images, du texte, des données synthétiques grâce au Deep Learning.

2.1 Autoencoders (AE)

Vulgarisation :
« Un autoencoder, c’est comme compresser une photo, puis la décompresser, mais en laissant le modèle apprendre la meilleure façon de compresser. »

2.2 Variational Autoencoders (VAE)

2.3 GAN (Generative Adversarial Networks)

Vulgarisation :
« Imaginez un faussaire (G) qui essaie d’imiter des billets, et un policier (D) qui essaie de repérer les faux. Les deux s’améliorent en même temps. »

Limites des GAN :

2.4 Diffusion Models (Stable Diffusion, DALLE, etc.)

Analogie :
« On prend une image nette, on la dégrade avec du bruit au maximum. Le modèle apprend à remonter le temps, pas à pas, pour retrouver l’image originale. Une fois entraîné, il peut “imaginer” des images qui n’existent pas. »

À retenir :

3. Introduction au Deep Reinforcement Learning (45 min)

Objectif : comprendre les bases du RL, du Q-learning au DQN et à PPO.

Script professeur :
« Le RL, ce n’est pas de la prédiction. C’est apprendre à un agent à agir dans un environnement pour maximiser une récompense. Le Deep RL, c’est simplement du RL avec des réseaux de neurones. »

3.1 Rappels RL :

3.2 Q-Learning :

3.3 Deep Q-Network (DQN) :

3.4 Policy Gradient & PPO :

Vulgarisation :
« Un agent de RL, c’est un apprenti qui fait des essais-erreurs, reçoit des récompenses, et apprend une stratégie qui maximise ses chances de réussite. »

3.5 Applications :

À retenir :

4. Conclusion générale du module (10 min)

Script professeur :
« Vous avez maintenant les fondations : – Vision (CNN, ViT), – Séquences & NLP (LSTM, Transformers, LLM), – Génération (VAE, GAN, Diffusion), – Décision (Deep RL). Vous pouvez désormais lire la plupart des articles modernes en Deep Learning. Et surtout, vous avez un panorama complet du domaine pour devenir acteurs de la prochaine vague IA. »

Questions à poser :