updated

culurciello · culurciello · commit d212d84c0d02 · 2017-04-05T12:08:47.000-04:00
diff --git a/rnn-example/rnn-simple.py b/rnn-example/rnn-simple.py
@@ -1,7 +1,10 @@
 #! /usr/local/bin/python3
 
 # RNN example "abba" detector
-#
+# 
+# see this for a more complex example:
+# http://pytorch.org/tutorials/intermediate/char_rnn_classification_tutorial.html
+# 
 # E. Culurciello, April 2017
 #
 
@@ -15,60 +18,109 @@
 import torch
 import torch.nn as nn
 from torch.autograd import Variable
+import torch.optim as optim
+
+np.set_printoptions(precision=2)
+print('Simple RNN model to detect a abba/0110 sequence')
 
 # create a fake dataset of symbols a,b:
+num_symbols = 2 # a,b
 data_size = 256
 seq_len = 4 # abba sequence to be detected only!
-data = np.random.randint(0, 2, data_size) # 0=1, 1=b, for example
-label = np.zeros(data_size, dtype=int)
-print('dataset is:', data, 'with length:', len(data))
-for i in range(3, data_size-1):
-   if (data[i-3]==0 and data[i-2]==1 and data[i-1]==1 and data[i]==0):
-      label[i] += 1
+rdata = np.random.randint(0, num_symbols, data_size) # 0=1, 1=b, for example
+
+# turn it into 1-hot encoding:
+data = np.empty([data_size, num_symbols])
+for i in range(0, data_size):
+   data[i,:] = ( rdata[i], not rdata[i] )
+
+print('dataset is:', data, 'with size:', data.shape)
+
+# create labels:
+label = np.zeros([data_size, num_symbols])
+count = 0
+for i in range(3, data_size):
+   label[i,:] = (1,0)
+   if (rdata[i-3]==0 and rdata[i-2]==1 and rdata[i-1]==1 and rdata[i]==0):
+      label[i,:] = (0,1) 
+      count += 1
 
-print('labels is:', label, 'total number of example sequences:', np.sum(label))
+print('labels is:', label, 'total number of example sequences:', count)
 
 
 # create model:
-model = nn.RNN(1,1,1)
-criterion = nn.L1Loss()
+model = nn.RNN(num_symbols, num_symbols, 1) # see: http://pytorch.org/docs/nn.html#rnn
+criterion = nn.MSELoss()
+optimizer = optim.Adam(model.parameters(), lr=0.005)
 
-# test model:
-# inp = Variable(torch.randn(seq_len).view(seq_len,1,1))
-# h0 = Variable(torch.randn(seq_len).view(seq_len,1,1))
+# test model, see: http://pytorch.org/docs/nn.html#rnn
+# inp = torch.zeros(seq_len, 1, num_symbols)
+# inp[0,0,0]=1
+# inp[1,0,1]=1
+# inp[2,0,1]=1
+# inp[3,0,0]=1
+# h0 = torch.zeros(1, 1, num_symbols)
 # print(inp, h0)
-# output, hn = model(inp, h0)
+# output, hn = model( Variable(inp), Variable(h0))
 # print('model test:', output,hn)
 
 
+num_epochs = 4
+
+
 def train():
    model.train()
-   hidden = Variable(torch.zeros(1,1,1))
-   for i in tqdm(range(0, data_size-seq_len, seq_len)):
-      X_batch = Variable(torch.from_numpy(data[i:i+seq_len]).view(seq_len,1,1).float())
-      y_batch = Variable(torch.from_numpy(label[i:i+seq_len]).view(seq_len,1,1).float())
-      model.zero_grad()
-      output, hidden = model(X_batch, hidden)
-      loss = criterion(output, y_batch)
-      loss.backward(retain_variables=True)
-      print('in/label/out:', data[i:i+seq_len], label[i:i+seq_len], output.data.view(1,4).numpy())
-      # # print(X_batch, y_batch)
-      if (data[i]==0 and data[i+1]==1 and data[i+2]==1 and data[i+3]==0):
-         print('RIGHT')
-      print(loss.data.numpy())
+   hidden = Variable(torch.zeros(1, 1, num_symbols))
+   
+   for epoch in range(num_epochs):  # loop over the dataset multiple times
+      
+      running_loss = 0.0
+      for i in range(0, data_size-seq_len, seq_len):
+         # get inputs:
+         inputs = torch.from_numpy( data[i:i+seq_len,:]).view(seq_len, 1, num_symbols).float()
+         labels = torch.from_numpy(label[i:i+seq_len,:]).view(seq_len, 1, num_symbols).float()
+         
+         # wrap them in Variable
+         inputs, labels = Variable(inputs), Variable(labels)
+
+         # forward, backward, optimize
+         optimizer.zero_grad()
+         output, hidden = model(inputs, hidden)
+         
+         loss = criterion(output, labels)
+         loss.backward(retain_variables=True)
+         optimizer.step()
+
+         # print info / statistics:
+         # print('in:', data[i:i+seq_len,0], 'label:', label[i:i+seq_len,1], 'out:', output.data.numpy())
+         # print(inputs, labels)
+         running_loss += loss.data[0]
+         num_ave = 64
+         if i % num_ave == 0:   # print every ave mini-batches
+            print('[%d, %5d] loss: %.3f' % (epoch+1, i+1, running_loss / num_ave))
+            running_loss = 0.0
+   
+   print('Finished Training')
 
 
 def test():
    model.eval()
-   hidden = Variable(torch.zeros(1,1,1))
+   hidden = Variable(torch.zeros(1, 1, num_symbols))
    for i in range(0, data_size-seq_len, seq_len):
-      X_batch = Variable(torch.from_numpy(data[i:i+seq_len]).view(seq_len,1,1).float())
-      y_batch = Variable(torch.from_numpy(label[i:i+seq_len]).view(seq_len,1,1).float())
-      output, hidden = model(X_batch, hidden)
-      print('in/label/out:', data[i:i+seq_len], label[i:i+seq_len], output.data.view(1,4).numpy())
-      if (data[i]==0 and data[i+1]==1 and data[i+2]==1 and data[i+3]==0):
-         print('RIGHT')
+
+      inputs = torch.from_numpy( data[i:i+seq_len,:]).view(seq_len, 1, num_symbols).float()
+      labels = torch.from_numpy(label[i:i+seq_len,:]).view(seq_len, 1, num_symbols).float()
+      
+      inputs = Variable(inputs)
+      
+      output, hidden = model(inputs, hidden)
+      
+      print('in:', data[i:i+seq_len,0], 'label:', label[i:i+seq_len,1], 'out:', output.data.numpy())
+      if label[i,1]>0:
+         print('RIGHT\n\n')
 
 # train model:
+print('\nTRAINING ---')
 train()
+print('\n\nTESTING ---')
 test()