pysted.base.TemporalExperiment.play_action
- TemporalExperiment.play_action(pdt, p_ex, p_sted)
l’idée va comme ça fait une loop sur X épisodes
quand un épisode commence on crée un objet TemporalExperimentV2p1 avec un certain exp_runtime
- l’agent choisit une action et la joue
dans la méthode de jouer l’action (ici) on fait toute la gestion des updates de flash mid acq si c’est le cas, finir l’action early si on run out de temps, …
* pdt can be a float value, I will convert it into an array filled with that value if this is the case *