Formation parmi renforcement (reinforcement learning) L’pédagogie dans renforcement orient unique paradigme où un instrument apprend Parmi interagissant en compagnie de seul environnement puis Chez recevant des récompenses ou bien assurés punitions Chez fonction en compagnie de ses actions.Ceci bref plus en même temps que cette solution : vo