transformer same model size

rpatrik96 · rpatrik96 · commit a1bfee9d4039 · 2024-01-28T19:43:37.000+01:00
diff --git a/sweeps/transformer.yaml b/sweeps/transformer.yaml
@@ -12,15 +12,15 @@ metric:
   name: Val/loss
 parameters:
   trainer.max_epochs:
-      value: 35000
+    value: 50000
   model.dim_model:
-    value:  8
+    value: 10
   model.num_heads:
-    value: 4
+    value: 5
   model.dim_feedforward:
     value: 1024
   model.num_decoder_layers:
-    value: 3
+    value: 5
   model.dropout_p:
     value: 0.1
   model.test_prompt_length:
@@ -31,6 +31,10 @@ parameters:
     value: 0.002
   model.layer_norm_eps:
     value: 6e-3
+  model.adversarial_training:
+    value: false
+  model.extrapolation_training:
+    value: false
   data.max_length:
     value: 256
   data.batch_size: