automl
diff --git a/‎example.py
Lines changed: 13 additions & 6 deletions b/‎example.py
Lines changed: 13 additions & 6 deletions
diff --git a/‎experiments/a3c_beam_rider_del.py
Lines changed: 3 additions & 2 deletions b/‎experiments/a3c_beam_rider_del.py
Lines changed: 3 additions & 2 deletions
diff --git a/‎experiments/a3c_beam_rider_image_transforms_42.py
Lines changed: 1 addition & 0 deletions b/‎experiments/a3c_beam_rider_image_transforms_42.py
Lines changed: 1 addition & 0 deletions
diff --git a/‎experiments/a3c_beam_rider_image_transforms_42_sh_quant.py
Lines changed: 1 addition & 0 deletions b/‎experiments/a3c_beam_rider_image_transforms_42_sh_quant.py
Lines changed: 1 addition & 0 deletions
diff --git a/‎experiments/a3c_beam_rider_p_noise.py
Lines changed: 3 additions & 2 deletions b/‎experiments/a3c_beam_rider_p_noise.py
Lines changed: 3 additions & 2 deletions
diff --git a/‎experiments/a3c_beam_rider_r_noise.py
Lines changed: 3 additions & 2 deletions b/‎experiments/a3c_beam_rider_r_noise.py
Lines changed: 3 additions & 2 deletions
diff --git a/‎experiments/a3c_breakout_del.py
Lines changed: 3 additions & 2 deletions b/‎experiments/a3c_breakout_del.py
Lines changed: 3 additions & 2 deletions
diff --git a/‎experiments/a3c_breakout_image_transforms_42.py
Lines changed: 1 addition & 0 deletions b/‎experiments/a3c_breakout_image_transforms_42.py
Lines changed: 1 addition & 0 deletions
diff --git a/‎experiments/a3c_breakout_image_transforms_42_sh_quant.py
Lines changed: 1 addition & 0 deletions b/‎experiments/a3c_breakout_image_transforms_42_sh_quant.py
Lines changed: 1 addition & 0 deletions
diff --git a/‎experiments/a3c_breakout_p_noise.py
Lines changed: 3 additions & 2 deletions b/‎experiments/a3c_breakout_p_noise.py
Lines changed: 3 additions & 2 deletions
@@ -34,6 +34,7 @@ def display_image(obs, mode="RGB"):
     # to be 3-D.
     img1.show()
 
+
 def discrete_environment_example():
 
     config = {}
@@ -245,7 +246,6 @@ def grid_environment_image_representations_example():
     display_image(next_obs)
 
 
-
 def atari_wrapper_example():
 
     config = {
@@ -304,6 +304,7 @@ def mujoco_wrapper_example():
     try:
         from mdp_playground.envs import get_mujoco_wrapper
         from gym.envs.mujoco.half_cheetah_v3 import HalfCheetahEnv
+
         wrapped_mujoco_env = get_mujoco_wrapper(HalfCheetahEnv)
 
         env = wrapped_mujoco_env(**config)
@@ -319,7 +320,12 @@ def mujoco_wrapper_example():
         env.close()
 
     except ImportError as e:
-        print("Exception:", type(e), e, "caught. You may need to install mujoco-py. NOT running mujoco_wrapper_example.")
+        print(
+            "Exception:",
+            type(e),
+            e,
+            "caught. You may need to install mujoco-py. NOT running mujoco_wrapper_example.",
+        )
         return
 
 
@@ -337,12 +343,13 @@ def minigrid_wrapper_example():
     import gym
 
     from gym_minigrid.wrappers import RGBImgPartialObsWrapper, ImgObsWrapper
-    env = gym.make('MiniGrid-Empty-8x8-v0')
-    env = RGBImgPartialObsWrapper(env) # Get pixel observations
-    env = ImgObsWrapper(env) # Get rid of the 'mission' field
+
+    env = gym.make("MiniGrid-Empty-8x8-v0")
+    env = RGBImgPartialObsWrapper(env)  # Get pixel observations
+    env = ImgObsWrapper(env)  # Get rid of the 'mission' field
 
     env = GymEnvWrapper(env, **config)
-    obs = env.reset() # This now produces an RGB tensor only
+    obs = env.reset()  # This now produces an RGB tensor only
 
     print(
         "Taking a step in the environment with a random action and printing the transition:"
 
@@ -1,6 +1,7 @@
 import itertools
 from ray import tune
 from collections import OrderedDict
+
 num_seeds = 5
 timesteps_total = 10_000_000
 
@@ -103,8 +104,8 @@
 value_tuples = []
 for config_type, config_dict in var_configs.items():
     for key in config_dict:
-        assert (
-            isinstance(var_configs[config_type][key], list)
+        assert isinstance(
+            var_configs[config_type][key], list
         ), "var_config should be a dict of dicts with lists as the leaf values to allow each configuration option to take multiple possible values"
         value_tuples.append(var_configs[config_type][key])
 
 
@@ -1,6 +1,7 @@
 import itertools
 from ray import tune
 from collections import OrderedDict
+
 num_seeds = 5
 timesteps_total = 10_000_000
 
 
@@ -1,6 +1,7 @@
 import itertools
 from ray import tune
 from collections import OrderedDict
+
 num_seeds = 5
 timesteps_total = 10_000_000
 
 
@@ -1,6 +1,7 @@
 import itertools
 from ray import tune
 from collections import OrderedDict
+
 num_seeds = 5
 timesteps_total = 10_000_000
 
@@ -103,8 +104,8 @@
 value_tuples = []
 for config_type, config_dict in var_configs.items():
     for key in config_dict:
-        assert (
-            isinstance(var_configs[config_type][key], list)
+        assert isinstance(
+            var_configs[config_type][key], list
         ), "var_config should be a dict of dicts with lists as the leaf values to allow each configuration option to take multiple possible values"
         value_tuples.append(var_configs[config_type][key])
 
 
@@ -2,6 +2,7 @@
 from ray import tune
 import numpy as np
 from collections import OrderedDict
+
 num_seeds = 5
 timesteps_total = 10_000_000
 
@@ -106,8 +107,8 @@
 value_tuples = []
 for config_type, config_dict in var_configs.items():
     for key in config_dict:
-        assert (
-            isinstance(var_configs[config_type][key], list)
+        assert isinstance(
+            var_configs[config_type][key], list
         ), "var_config should be a dict of dicts with lists as the leaf values to allow each configuration option to take multiple possible values"
         value_tuples.append(var_configs[config_type][key])
 
 
@@ -1,6 +1,7 @@
 import itertools
 from ray import tune
 from collections import OrderedDict
+
 num_seeds = 5
 timesteps_total = 10_000_000
 
@@ -103,8 +104,8 @@
 value_tuples = []
 for config_type, config_dict in var_configs.items():
     for key in config_dict:
-        assert (
-            isinstance(var_configs[config_type][key], list)
+        assert isinstance(
+            var_configs[config_type][key], list
         ), "var_config should be a dict of dicts with lists as the leaf values to allow each configuration option to take multiple possible values"
         value_tuples.append(var_configs[config_type][key])
 
 
@@ -1,6 +1,7 @@
 import itertools
 from ray import tune
 from collections import OrderedDict
+
 num_seeds = 5
 timesteps_total = 10_000_000
 
 
@@ -1,6 +1,7 @@
 import itertools
 from ray import tune
 from collections import OrderedDict
+
 num_seeds = 5
 timesteps_total = 10_000_000
 
 
@@ -1,6 +1,7 @@
 import itertools
 from ray import tune
 from collections import OrderedDict
+
 num_seeds = 5
 timesteps_total = 10_000_000
 
@@ -103,8 +104,8 @@
 value_tuples = []
 for config_type, config_dict in var_configs.items():
     for key in config_dict:
-        assert (
-            isinstance(var_configs[config_type][key], list)
+        assert isinstance(
+            var_configs[config_type][key], list
         ), "var_config should be a dict of dicts with lists as the leaf values to allow each configuration option to take multiple possible values"
         value_tuples.append(var_configs[config_type][key])