SelfExplainML
diff --git a/‎examples/tf2_exnn.ipynb
+47 b/‎examples/tf2_exnn.ipynb
+47
diff --git a/‎examples/tf2_gamnet.ipynb
+47 b/‎examples/tf2_gamnet.ipynb
+47
diff --git a/‎examples/tf2_xnn.ipynb
+47 b/‎examples/tf2_xnn.ipynb
+47
diff --git a/‎exnn/base.py
+54-46 b/‎exnn/base.py
+54-46
diff --git a/‎exnn/exnn.py
+6-6 b/‎exnn/exnn.py
+6-6
@@ -727,6 +727,53 @@
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
    "version": "3.6.8"
+  },
+  "latex_envs": {
+   "LaTeX_envs_menu_present": true,
+   "autoclose": false,
+   "autocomplete": true,
+   "bibliofile": "biblio.bib",
+   "cite_by": "apalike",
+   "current_citInitial": 1,
+   "eqLabelWithNumbers": true,
+   "eqNumInitial": 1,
+   "hotkeys": {
+    "equation": "Ctrl-E",
+    "itemize": "Ctrl-I"
+   },
+   "labels_anchors": false,
+   "latex_user_defs": false,
+   "report_style_numbering": false,
+   "user_envs_cfg": false
+  },
+  "varInspector": {
+   "cols": {
+    "lenName": 16,
+    "lenType": 16,
+    "lenVar": 40
+   },
+   "kernels_config": {
+    "python": {
+     "delete_cmd_postfix": "",
+     "delete_cmd_prefix": "del ",
+     "library": "var_list.py",
+     "varRefreshCmd": "print(var_dic_list())"
+    },
+    "r": {
+     "delete_cmd_postfix": ") ",
+     "delete_cmd_prefix": "rm(",
+     "library": "var_list.r",
+     "varRefreshCmd": "cat(var_dic_list()) "
+    }
+   },
+   "types_to_exclude": [
+    "module",
+    "function",
+    "builtin_function_or_method",
+    "instance",
+    "_Feature"
+   ],
+   "window_display": false
   }
  },
  "nbformat": 4,
 
@@ -179,6 +179,53 @@
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
    "version": "3.6.8"
+  },
+  "latex_envs": {
+   "LaTeX_envs_menu_present": true,
+   "autoclose": false,
+   "autocomplete": true,
+   "bibliofile": "biblio.bib",
+   "cite_by": "apalike",
+   "current_citInitial": 1,
+   "eqLabelWithNumbers": true,
+   "eqNumInitial": 1,
+   "hotkeys": {
+    "equation": "Ctrl-E",
+    "itemize": "Ctrl-I"
+   },
+   "labels_anchors": false,
+   "latex_user_defs": false,
+   "report_style_numbering": false,
+   "user_envs_cfg": false
+  },
+  "varInspector": {
+   "cols": {
+    "lenName": 16,
+    "lenType": 16,
+    "lenVar": 40
+   },
+   "kernels_config": {
+    "python": {
+     "delete_cmd_postfix": "",
+     "delete_cmd_prefix": "del ",
+     "library": "var_list.py",
+     "varRefreshCmd": "print(var_dic_list())"
+    },
+    "r": {
+     "delete_cmd_postfix": ") ",
+     "delete_cmd_prefix": "rm(",
+     "library": "var_list.r",
+     "varRefreshCmd": "cat(var_dic_list()) "
+    }
+   },
+   "types_to_exclude": [
+    "module",
+    "function",
+    "builtin_function_or_method",
+    "instance",
+    "_Feature"
+   ],
+   "window_display": false
   }
  },
  "nbformat": 4,
 
@@ -664,6 +664,53 @@
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
    "version": "3.6.8"
+  },
+  "latex_envs": {
+   "LaTeX_envs_menu_present": true,
+   "autoclose": false,
+   "autocomplete": true,
+   "bibliofile": "biblio.bib",
+   "cite_by": "apalike",
+   "current_citInitial": 1,
+   "eqLabelWithNumbers": true,
+   "eqNumInitial": 1,
+   "hotkeys": {
+    "equation": "Ctrl-E",
+    "itemize": "Ctrl-I"
+   },
+   "labels_anchors": false,
+   "latex_user_defs": false,
+   "report_style_numbering": false,
+   "user_envs_cfg": false
+  },
+  "varInspector": {
+   "cols": {
+    "lenName": 16,
+    "lenType": 16,
+    "lenVar": 40
+   },
+   "kernels_config": {
+    "python": {
+     "delete_cmd_postfix": "",
+     "delete_cmd_prefix": "del ",
+     "library": "var_list.py",
+     "varRefreshCmd": "print(var_dic_list())"
+    },
+    "r": {
+     "delete_cmd_postfix": ") ",
+     "delete_cmd_prefix": "rm(",
+     "library": "var_list.r",
+     "varRefreshCmd": "cat(var_dic_list()) "
+    }
+   },
+   "types_to_exclude": [
+    "module",
+    "function",
+    "builtin_function_or_method",
+    "instance",
+    "_Feature"
+   ],
+   "window_display": false
   }
  },
  "nbformat": 4,
 
@@ -25,7 +25,7 @@ def __init__(self, meta_info,
                  lr_bp=0.001,
                  l1_proj=0.001,
                  l1_subnet=0.001,
-                 smooth_lambda=0.00001,
+                 l2_smooth=0.00001,
                  batch_size=1000,
                  training_epochs=2000,
                  tuning_epochs=500,
@@ -38,7 +38,6 @@ def __init__(self, meta_info,
         super(BaseNet, self).__init__()
 
         # Parameter initiation
-        self.meta_info = meta_info
         self.subnet_num = subnet_num
         self.subnet_arch = subnet_arch
         self.task_type = task_type
@@ -49,7 +48,7 @@ def __init__(self, meta_info,
         self.lr_bp = lr_bp
         self.l1_proj = l1_proj
         self.l1_subnet = l1_subnet
-        self.smooth_lambda = smooth_lambda
+        self.l2_smooth = l2_smooth
         self.batch_size = batch_size
         self.beta_threshold = beta_threshold
         self.tuning_epochs = tuning_epochs
@@ -63,43 +62,52 @@ def __init__(self, meta_info,
         np.random.seed(random_state)
         tf.random.set_seed(random_state)
 
-        self.categ_variable_num = 0
-        self.numerical_input_num = 0
-        self.categ_variable_list = []
-        self.categ_index_list = []
-        self.noncateg_index_list = []
-        self.noncateg_variable_list = []
-        self.variables_names = list(self.meta_info.keys())
-        for i, (key, item) in enumerate(self.meta_info.items()):
-            if item['type'] == "target":
+        self.dummy_values_ = {}
+        self.nfeature_scaler_ = {}
+        self.cfeature_num_ = 0
+        self.nfeature_num_ = 0
+        self.cfeature_list_ = []
+        self.nfeature_list_ = []
+        self.cfeature_index_list_ = []
+        self.nfeature_index_list_ = []
+        
+        self.feature_list_ = []
+        self.feature_type_list_ = []
+        for idx, (feature_name, feature_info) in enumerate(meta_info.items()):
+            if feature_info["type"] == "target":
                 continue
-            if item['type'] == "categorical":
-                self.categ_variable_num += 1
-                self.categ_variable_list.append(key)
-                self.categ_index_list.append(i)
+            if feature_info["type"] == "categorical":
+                self.cfeature_num_ += 1
+                self.cfeature_list_.append(feature_name)
+                self.cfeature_index_list_.append(idx)
+                self.feature_type_list_.append("categorical")
+                self.dummy_values_.update({feature_name:meta_info[feature_name]["values"]})
             else:
-                self.numerical_input_num +=1
-                self.noncateg_index_list.append(i)
-                self.noncateg_variable_list.append(key)
+                self.nfeature_num_ += 1
+                self.nfeature_list_.append(feature_name)
+                self.nfeature_index_list_.append(idx)
+                self.feature_type_list_.append("continuous")
+                self.nfeature_scaler_.update({feature_name:meta_info[feature_name]["scaler"]})
+            self.feature_list_.append(feature_name)
 
-        self.subnet_num = min(self.subnet_num, self.numerical_input_num)
         # build
-        self.proj_layer = ProjectLayer(index_list=list(self.noncateg_index_list),
-                                       subnet_num=self.subnet_num,
-                                           l1_proj=self.l1_proj,
-                                           method=self.proj_method)
+        self.subnet_num = min(self.subnet_num, self.nfeature_num_)
+        self.proj_layer = ProjectLayer(index_list=self.nfeature_index_list_,
+                               subnet_num=self.subnet_num,
+                               l1_proj=self.l1_proj,
+                               method=self.proj_method)
 
-        self.categ_blocks = CategNetBlock(meta_info=self.meta_info, 
-                                         categ_variable_list=self.categ_variable_list, 
-                                         categ_index_list=self.categ_index_list,
-                                         bn_flag=self.bn_flag)
+        self.categ_blocks = CategNetBlock(feature_list=self.feature_list_,
+                               cfeature_index_list=self.cfeature_index_list_,
+                               dummy_values=self.dummy_values_, 
+                               bn_flag=self.bn_flag)
 
         self.subnet_blocks = SubnetworkBlock(subnet_num=self.subnet_num,
-                                             subnet_arch=self.subnet_arch,
-                                             activation_func=self.activation_func,
-                                             smooth_lambda=self.smooth_lambda,
-                                             bn_flag=self.bn_flag)
-        self.output_layer = OutputLayer(subnet_num=self.subnet_num + self.categ_variable_num, l1_subnet=self.l1_subnet)
+                                 subnet_arch=self.subnet_arch,
+                                 activation_func=self.activation_func,
+                                 l2_smooth=self.l2_smooth,
+                                 bn_flag=self.bn_flag)
+        self.output_layer = OutputLayer(subnet_num=self.subnet_num + self.cfeature_num_, l1_subnet=self.l1_subnet)
 
         self.optimizer = tf.keras.optimizers.Adam(learning_rate=self.lr_bp)
         if self.task_type == "Regression":
@@ -116,9 +124,9 @@ def call(self, inputs, training=False):
         self.subnet_outputs = self.subnet_blocks(self.proj_outputs, training=training)
 
         concat_list = []
-        if self.numerical_input_num > 0:
+        if self.nfeature_num_ > 0:
             concat_list.append(self.subnet_outputs)
-        if self.categ_variable_num > 0:
+        if self.cfeature_num_ > 0:
             concat_list.append(self.categ_outputs)
 
         if self.task_type == "Regression":
@@ -157,7 +165,7 @@ def get_active_subnets(self, beta_threshold=0):
             beta = self.output_layer.output_weights.numpy()
         else:
             subnet_norm = [self.subnet_blocks.subnets[i].moving_norm.numpy()[0] for i in range(self.subnet_num)]
-            categ_norm = [self.categ_blocks.categnets[i].moving_norm.numpy()[0]for i in range(self.categ_variable_num)]
+            categ_norm = [self.categ_blocks.categnets[i].moving_norm.numpy()[0]for i in range(self.cfeature_num_)]
             beta = self.output_layer.output_weights.numpy() * np.hstack([subnet_norm, categ_norm]).reshape([-1, 1])
         beta = beta * self.output_layer.output_switcher.numpy()
         subnets_scale = (np.abs(beta) / np.sum(np.abs(beta))).reshape([-1])
@@ -169,7 +177,7 @@ def get_active_subnets(self, beta_threshold=0):
         for i in active_index:
             if i in range(self.subnet_num):
                 active_me_index.append(i)
-            elif i in range(self.subnet_num, self.subnet_num + self.categ_variable_num):
+            elif i in range(self.subnet_num, self.subnet_num + self.cfeature_num_):
                 active_categ_index.append(i)
         return active_me_index, active_categ_index, beta, subnets_scale
 
@@ -228,7 +236,7 @@ def fit(self, train_x, train_y):
 
         self.evaluate(tr_x, tr_y, training=True) # update the batch normalization using all the training data
         active_me_index, active_categ_index, _, _ = self.get_active_subnets(self.beta_threshold)
-        scal_factor = np.zeros((self.subnet_num + self.categ_variable_num, 1))
+        scal_factor = np.zeros((self.subnet_num + self.cfeature_num_, 1))
         scal_factor[active_me_index] = 1
         scal_factor[active_categ_index] = 1
         self.output_layer.output_switcher.assign(tf.constant(scal_factor, dtype=tf.float32))
@@ -270,8 +278,8 @@ def fit(self, train_x, train_y):
         self.subnet_input_max = []
         self.evaluate(tr_x, tr_y, training=True) # update the batch normalization using all the training data
         for i in range(self.subnet_num):
-            min_ = np.dot(train_x[:,self.noncateg_index_list], self.proj_layer.get_weights()[0])[:, i].min()
-            max_ = np.dot(train_x[:,self.noncateg_index_list], self.proj_layer.get_weights()[0])[:, i].max()
+            min_ = np.dot(tr_x[:,self.noncateg_index_list], self.proj_layer.get_weights()[0])[:, i].min()
+            max_ = np.dot(tr_x[:,self.noncateg_index_list], self.proj_layer.get_weights()[0])[:, i].max()
             self.subnet_input_min.append(min_)
             self.subnet_input_max.append(max_)
 
@@ -328,21 +336,21 @@ def visualize(self, folder="./results/", name="demo", save_png=False, save_eps=F
                 ax1.set_title("Ridge Functions", fontsize=24)
                 ax2.set_title("Projection Indices", fontsize=24)
 
-        if self.categ_variable_num > 0:
+        if self.cfeature_num_ > 0:
             for indice in active_categ_index:
-                dummy_name = self.categ_variable_list[indice - self.numerical_input_num]
+                feature_name = self.cfeature_list_[indice - self.numerical_input_num]
                 dummy_gamma = self.categ_blocks.categnets[indice - self.numerical_input_num].categ_bias.numpy()
                 norm = self.categ_blocks.categnets[indice - self.numerical_input_num].moving_norm.numpy()
                 ax3 = f.add_subplot(np.int(max_ids), 1, np.int(max_ids))
-                ax3.bar(np.arange(len(self.meta_info[dummy_name]['values'])), np.sign(beta[indice]) * dummy_gamma[:, 0] / norm)
-                ax3.set_xticks(np.arange(len(self.meta_info[dummy_name]['values'])))
-                ax3.set_xticklabels(self.meta_info[self.categ_variable_list[indice - self.numerical_input_num]]['values'], fontsize=14)
+                ax3.bar(np.arange(len(self.dummy_values_[feature_name])), np.sign(beta[indice]) * dummy_gamma[:, 0] / norm)
+                ax3.set_xticks(np.arange(len(self.dummy_values_[feature_name])))
+                ax3.set_xticklabels(self.dummy_values_[feature_name], fontsize=14)
 
                 yint = np.round(np.linspace(np.min(np.sign(beta[indice]) * dummy_gamma[:, 0] / norm),
                            np.max(np.sign(beta[indice]) * dummy_gamma[:, 0] / norm), 6), 2)
                 ax3.set_yticks(yint)
                 ax3.set_yticklabels(["{0: .2f}".format(j) for j in yint], fontsize=14)
-                ax3.set_title(dummy_name + " (" + str(np.round(100 * subnets_scale[indice], 1)) + "%)", fontsize=20)
+                ax3.set_title(feature_name + " (" + str(np.round(100 * subnets_scale[indice], 1)) + "%)", fontsize=20)
 
         if max_ids > 0:
             if save_png:
 
@@ -63,8 +63,8 @@ class ExNN(BaseNet):
     :type  l1_subnet: float
     :param l1_subnet: optional, default=0.001, the strength of L1 penalty for scaling layer.
 
-    :type  smooth_lambda: float
-    :param smooth_lambda: optional, default=0.000001, the strength of roughness penalty for subnetworks.
+    :type  l2_smooth: float
+    :param l2_smooth: optional, default=0.000001, the strength of roughness penalty for subnetworks.
 
     :type  verbose: bool
     :param verbose: optional, default=False. If True, detailed messages will be printed.
@@ -86,7 +86,7 @@ class ExNN(BaseNet):
 
     def __init__(self, meta_info, subnet_num, subnet_arch=[10, 6], task_type="Regression",
                  activation_func=tf.tanh, batch_size=1000, training_epochs=10000, lr_bp=0.001, lr_cl=0.1,
-                 beta_threshold=0.05, tuning_epochs=500, l1_proj=0.001, l1_subnet=0.001, smooth_lambda=0.000001,
+                 beta_threshold=0.05, tuning_epochs=500, l1_proj=0.001, l1_subnet=0.001, l2_smooth=0.000001,
                  verbose=False, val_ratio=0.2, early_stop_thres=1000, random_state=0):
 
         super(ExNN, self).__init__(meta_info=meta_info,
@@ -99,7 +99,7 @@ def __init__(self, meta_info, subnet_num, subnet_arch=[10, 6], task_type="Regres
                              lr_bp=lr_bp,
                              l1_proj=l1_proj,
                              l1_subnet=l1_subnet,
-                             smooth_lambda=smooth_lambda,
+                             l2_smooth=l2_smooth,
                              batch_size=batch_size,
                              training_epochs=training_epochs,
                              tuning_epochs=tuning_epochs,
@@ -119,7 +119,7 @@ def train_step_init(self, inputs, labels):
                 regularization_loss = tf.math.add_n(self.proj_layer.losses + self.output_layer.losses)
                 cl_loss = pred_loss + regularization_loss
                 bp_loss = pred_loss + regularization_loss
-                if self.smooth_lambda > 0:
+                if self.l2_smooth > 0:
                     smoothness_loss = self.subnet_blocks.smooth_loss
                     bp_loss += smoothness_loss
 
@@ -147,7 +147,7 @@ def train_step_finetune(self, inputs, labels):
             pred = self.__call__(inputs, training=True)
             pred_loss = self.loss_fn(labels, pred)
             total_loss = pred_loss
-            if self.smooth_lambda > 0:
+            if self.l2_smooth > 0:
                 smoothness_loss = self.subnet_blocks.smooth_loss
                 total_loss += smoothness_loss