Name		Name	Last commit message	Last commit date
parent directory ..
images		images
README.md		README.md
RL_agent.py		RL_agent.py
app.py		app.py
maze_env.py		maze_env.py
rewards_movements_q_learn.png		rewards_movements_q_learn.png

README.md

Maze problem with Reinforcement Learning

The environment can be represented as:

After 50 episodes, the number of movements get converged to the optimal. The reward also goes to 1.