[Final experiments - REINFORCE] experiment #3 with seed 190421 #53

ziritrion · 2021-04-13T10:46:11Z

Final experiment with our REINFORCE algorithm implementation. showing a final reward of -11.7 with a preset seed of value 190421.

The Learning Rate hyperparameter for REINFORCE was 1*10^-5, since this was the value that showed best results for training in our experiments.

The action set chosen for all experiments is the following:
[0.0, 0.3, 0.0], # throttle
[0.0, 0.1, 0.0], # throttle
[0.0, 0.0, 0.0], # throttle
[0.0, 0.0, 0.7], # break
[0.0, 0.0, 0.5], # break
[0.0, 0.0, 0.2], # break
[-1.0, 0.0, 0.05], # left
[-0.5, 0.0, 0.05], # left
[-0.2, 0.0, 0.05], # left
[1.0, 0.0, 0.05], # right
[0.5, 0.0, 0.05], # right
[0.2, 0.0, 0.05], # right

TensorBoard screenshots below:

Sample video below:
https://user-images.githubusercontent.com/1465235/114540755-35488e00-9c56-11eb-83c2-0e3f7f20f7a4.mp4

…opy collapse..

…king

jaimepedretp and others added 21 commits March 27, 2021 19:54

reinforce experiments with different learning rates

dca5ec5

Adding runs up to 30.8k episodes

5d9bcd6

Runs up to 30.8k - deleted old runs

80d9ea0

video with 810 reward - nice burnout save

993ee5a

runs up to 67.8k episodes / best=~800 final=~300

bcb5363

runs up to 67.8k episodes / best=~800 final=~300

383ad40

reinforcement 71k / different set of actions test

19187d4

75.5k actions with 0.05 brake when turning left/right - best average 889

ab0cfdd

added video using eval mode

1c48480

Run from scratch on reinforce-learningrate-act3 using lr 1e-05 / Entr…

d54ad15

…opy collapse..

Adding seeds

b3875a5

Fresh start

a19624d

Changes for experiment #2 of the final experiments

d9b1ee6

Added changes for experiment #3 of final experiments

11acd17

Added some needed additional code to fix some issues due to cherrypic…

2ec8c64

…king

Merge branch 'reinforce-final-2' into reinforce-final-3

5be3ebe

Fixing even more stuff part 2: Electric Boogaloo

3fa67ed

Merge branch 'reinforce-final-2' into reinforce-final-3

fba7b27

Changing experiment name

d18ee23

REINFORCE efinal experiment #3, seed 190421, running reward -10

ecfeeff

REINFORCE experiment #3 with seed 190421, final running reward 11

17c7405

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Final experiments - REINFORCE] experiment #3 with seed 190421 #53

[Final experiments - REINFORCE] experiment #3 with seed 190421 #53

ziritrion commented Apr 13, 2021

[Final experiments - REINFORCE] experiment #3 with seed 190421 #53

Are you sure you want to change the base?

[Final experiments - REINFORCE] experiment #3 with seed 190421 #53

Conversation

ziritrion commented Apr 13, 2021