broadinstitute · kathwy · Jun 23, 2020 · Jun 23, 2020 · Jun 23, 2020 · Jun 24, 2020
diff --git a/ml4cvd/arguments.py b/ml4cvd/arguments.py
@@ -224,6 +224,7 @@ def parse_args():
     parser.add_argument("--embed_visualization", help="Method to visualize embed layer. Options: None, tsne, or umap")
     parser.add_argument("--explore_export_errors", default=False, action="store_true", help="Export error_type columns in tensors_all*.csv generated by explore.")
     parser.add_argument('--plot_hist', default=True, help='Plot histograms of continuous tensors in explore mode.')
+    parser.add_argument('--plot_train_curves', default=False, action="store_true", help='Plot PR and ROC curves for training set.')
 
     # Training optimization options
     parser.add_argument('--num_workers', default=multiprocessing.cpu_count(), type=int, help="Number of workers to use for every tensor generator.")

diff --git a/ml4cvd/models.py b/ml4cvd/models.py
@@ -1016,6 +1016,7 @@ def train_model_from_generators(
     inspect_show_labels: bool,
     return_history: bool = False,
     plot: bool = True,
+    defer_worker_halt: bool = False
 ) -> Union[Model, Tuple[Model, History]]:
     """Train a model from tensor generators for validation and training data.
 
@@ -1051,8 +1052,9 @@ def train_model_from_generators(
         validation_steps=validation_steps, validation_data=generate_valid,
         callbacks=_get_callbacks(patience, model_file),
     )
-    generate_train.kill_workers()
-    generate_valid.kill_workers()
+    if not defer_worker_halt:
+        generate_train.kill_workers()
+        generate_valid.kill_workers()
 
     logging.info('Model weights saved at: %s' % model_file)
     if plot:

diff --git a/ml4cvd/recipes.py b/ml4cvd/recipes.py
@@ -139,10 +139,17 @@ def train_multimodal_multitask(args):
     model = train_model_from_generators(
         model, generate_train, generate_valid, args.training_steps, args.validation_steps, args.batch_size,
         args.epochs, args.patience, args.output_folder, args.id, args.inspect_model, args.inspect_show_labels,
+        defer_worker_halt=args.plot_train_curves
     )
-
     out_path = os.path.join(args.output_folder, args.id + '/')
     test_data, test_labels, test_paths = big_batch_from_minibatch_generator(generate_test, args.test_steps)
+    train_data, train_labels = big_batch_from_minibatch_generator(generate_train, args.training_steps)
+    if args.plot_train_curves:
+        out_path_train = os.path.join(args.output_folder, args.id + '/train_pr_roc_curves/')
+        _predict_and_evaluate(model, train_data, train_labels, args.tensor_maps_in, args.tensor_maps_out, args.batch_size, args.hidden_layer, out_path_train, test_paths, args.embed_visualization, args.alpha)
+    if args.plot_train_curves:
+        generate_train.kill_workers()
+        generate_valid.kill_workers()
     return _predict_and_evaluate(model, test_data, test_labels, args.tensor_maps_in, args.tensor_maps_out, args.batch_size, args.hidden_layer, out_path, test_paths, args.embed_visualization, args.alpha)