← Missions Retour au départ
AI Exhibits
Designed and developed by Dr. Erika Roldán Roa · MPI MiS · 2026

AI-Exhibits : Apprentissage par Renforcement (Q-learning)

Puzzle à Glissement 2×3 · États accessibles (composante de l'objectif) : 360

AI-Exhibits : Apprentissage par Renforcement : Puzzle à Glissement 2×3

États accessibles (la composante connexe contenant l'objectif) : 360.
Objectif : [1 2 3 / 4 5 _]

Puzzle actuel

Références Active : —

Chargez un état de départ fixe, puis cliquez sur Résoudre (glouton). Nous enregistrons votre meilleur nombre de coups par référence dans ce navigateur.

Coups minimum théoriques : B1 : 1 | B2 : 3 | B3 : 6 | B4 : 9 | B5 : 21 (Nombre de Dieu !)

Meilleurs scores
B1 : — · B2 : — · B3 : — · B4 : — · B5 : —
État actuel
Coups (dernière résolution)
États visités
Mises à jour Q

Paramètres d'entraînement

Épisodesi
Étapes max / épisodei
α (taux d'apprentissage)i
γ (escompte)i
ε (exploration)i
Pénalité par pasi
Récompense objectifi
Vitesse d'animation (ms)i