📡 Note du Commandement : Voici le vocabulaire essentiel pour piloter le vaisseau : les trois paramètres à régler, les boutons de l'interface, et les termes techniques que vous rencontrerez. Les mots anglais sont ceux utilisés en recherche et dans l'industrie — les connaître vous sera utile au-delà de cet atelier.
| ANGLAIS | FRANÇAIS | CE QUE ÇA FAIT |
|---|---|---|
| Launch Training | Lancer l'Entraînement | Entrer dans une mission |
| Shuffle | Mélanger | Mélanger le puzzle au hasard |
| Goal | Objectif | Voir la solution à atteindre |
| Train 100 | Entraîner 100 fois | Faire apprendre l'agente 100 fois |
| Solve (greedy) | Résoudre | L'agente essaie de résoudre |
| Reset | Réinitialiser | Tout remettre à zéro |
| Step | Un pas | Faire un seul mouvement |
| Play / Pause | Jouer / Pause | Démarrer / Arrêter |
| ANGLAIS | FRANÇAIS | EXPLICATION SIMPLE |
|---|---|---|
| State | État | Position actuelle des tuiles |
| Action | Action | Un mouvement (glisser une tuile) |
| Reward | Récompense | Signal reçu (+1 quand l'état suivant est l'objectif, 0 sinon) |
| Episode | Épisode | Une tentative complète |
| Q-value | Valeur Q | Ce que l'agente a appris sur une action |
| Q-table | Table Q | La "mémoire" de l'agente |
| Total steps | Étapes totales |
| Current state | État actuel |
| Last solve | Dernière résolution |
| Best solve | Meilleur score |
| Best scores | Meilleurs scores |
| Solved! | Résolu ! |
| New best! | Nouveau record ! |
| Goal reached | Objectif atteint |
| Training complete | Entraînement fini |
| Max steps reached | Limite atteinte |
| God's Number = Nombre de Dieu | Le minimum de mouvements pour le puzzle le plus dur |
| Benchmark = Point de contrôle | Un test standard (B1, B2, B3…) |
| Greedy = Glouton | L'agente choisit toujours ce qui semble le mieux |