← Missions Retour au départ
AI Exhibits
Designed and developed by Dr. Erika Roldán Roa · MPI MiS · 2026

AI-Exhibits : Apprentissage par Renforcement (Q-learning)

Puzzle à Glissement 3×3 · États accessibles (composante de l'objectif) : 181 440

Apprentissage par Renforcement : Puzzle à Glissement 3×3

États accessibles (la composante connexe contenant l'objectif) : 181 440.
Objectif : [1 2 3 / 4 5 6 / 7 8 _]

Puzzle actuel

Références Active : —

Chargez un état de départ fixe, puis cliquez sur Résoudre (glouton). Nous enregistrons votre meilleur nombre de coups par référence dans ce navigateur.

Coups minimum théoriques : B1 : 1 | B2 : 10 | B3 : 18 | B4 : 26 | B5 : 31 (Nombre de Dieu !)

Meilleurs scores
B1 : — · B2 : — · B3 : — · B4 : — · B5 : —
État actuel
Coups (dernière résolution)
États visités
Mises à jour Q

Paramètres d'entraînement

Épisodesi
Étapes max / épisodei
α (taux d'apprentissage)i
γ (escompte)i
ε (exploration)i
Pénalité par pasi
Récompense objectifi
Vitesse d'animation (ms)i