Adding cross entropy losses

viig99 · Dec 17, 2019 · 6286fed · 6286fed
1 parent 4925e83
commit 6286fed
Showing 1 changed file with 46 additions and 1 deletion.
diff --git a/lsaceloss.py b/lsaceloss.py
@@ -1,3 +1,4 @@
+import math
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
@@ -21,4 +22,48 @@ def forward(self, logits, targets, input_lengths, target_lengths):
         probs = probs/T_
         targets_padded = targets_padded/T_
         targets_padded = F.normalize(targets_padded, p=1, dim=1)
-        return F.kl_div(torch.log(probs), targets_padded, reduction='batchmean')
+        return F.kl_div(torch.log(probs), targets_padded, reduction='batchmean')
+
+class SentenceCrossEntropy(nn.Module):
+
+    def __init__(self, label_smoothing=0.1):
+        super(SentenceCrossEntropy, self).__init__()
+        self.label_smoothing = label_smoothing
+        self.PAD_INDEX = 0
+
+    def forward(self, logits, targets, input_lengths, target_lengths):
+        T_, bs, class_size = logits.size()
+        targets_split = list(torch.split(targets, target_lengths.tolist()))
+        targets_padded = torch.nn.utils.rnn.pad_sequence(targets_split, batch_first=True, padding_value=self.PAD_INDEX)
+        targets_padded = F.pad(input=targets_padded, pad=(0, T_ - targets_padded.shape[1]), mode='constant', value=self.PAD_INDEX)
+        mask = targets_padded != self.PAD_INDEX
+        targets_padded = F.one_hot(targets_padded.long(), num_classes=class_size).to(logits.device) # batch, seq, class
+        targets_padded = targets_padded.mul(1.0 - self.label_smoothing) + (1 - targets_padded).mul(self.label_smoothing / (class_size - 1))
+        loss = -(F.log_softmax(logits.permute(1, 2, 0), dim=1).mul(targets_padded.permute(0, 2, 1)).sum(1))
+        loss = loss.masked_select(mask.to(loss.device)).mean()
+        return loss
+
+class FocalSentenceCrossEntropy(SentenceCrossEntropy):
+
+    def __init__(self, alpha=0.25, gamma=0.5):
+        super().__init__()
+        self.alpha = alpha
+        self.gamma = gamma
+
+    def forward(self, log_probs, targets, input_lengths, target_lengths):
+        loss = super().forward(log_probs, targets, input_lengths, target_lengths)
+        p = torch.exp(-loss)
+        return self.alpha * torch.pow((1-p), self.gamma) * loss
+
+class FocalCTCLoss(nn.CTCLoss):
+    def __init__(self, reduction='mean', zero_infinity=True, alpha=0.25, gamma=0.5):
+        super(FocalCTCLoss, self).__init__(
+            reduction=reduction, zero_infinity=zero_infinity)
+        self.alpha = alpha
+        self.gamma = gamma
+
+    def forward(self, logits, targets, input_lengths, target_lengths):
+        ctc_loss_param = F.ctc_loss(torch.log_softmax(logits, dim=2), targets, input_lengths,
+                                    target_lengths, self.blank, self.reduction, self.zero_infinity)
+        p = torch.exp(-ctc_loss_param)
+        return self.alpha * torch.pow((1-p), self.gamma) * ctc_loss_param