thunderock
diff --git a/‎graph_ml/models/gensim_node2vec.py
Lines changed: 3 additions & 0 deletions b/‎graph_ml/models/gensim_node2vec.py
Lines changed: 3 additions & 0 deletions
diff --git a/‎graph_ml/models/node2vec.py
Lines changed: 59 additions & 0 deletions b/‎graph_ml/models/node2vec.py
Lines changed: 59 additions & 0 deletions
diff --git a/‎graph_ml/utils/config.py
Lines changed: 1 addition & 0 deletions b/‎graph_ml/utils/config.py
Lines changed: 1 addition & 0 deletions
diff --git a/‎graph_ml/utils/gpu_utils.py b/‎graph_ml/utils/gpu_utils.py
diff --git a/‎graph_ml/utils/torch_utils.py
Lines changed: 24 additions & 0 deletions b/‎graph_ml/utils/torch_utils.py
Lines changed: 24 additions & 0 deletions
@@ -0,0 +1,3 @@
+import numpy as np
+import gensim
+from ..utils import config, torch_utils
@@ -0,0 +1,59 @@
+import numpy as np
+import torch
+from torch_geometric.nn import Node2Vec as PyGNode2Vec
+
+
+from ..utils import config, torch_utils
+
+
+class Node2Vec(object):
+    def __init__(self, adj_list, embedding_dim, walk_length, context_size, device=config.DEVICE,
+                 logging=config.LOGGING, **params):
+        edge_index = torch_utils.adj_list_to_edge_index(adj_list)
+        self.model = PyGNode2Vec(
+            edge_index, embedding_dim, walk_length, context_size, **params
+        ).to(device)
+        self.num_workers = config.WORKER_COUNT
+        self.logging = logging
+        self.loader = self.optimizer = None
+
+    def fit(self, epochs=1, learning_rate=.1, batch_size=128):
+
+        # TODO (ashutosh): check if training two times works
+        self.loader = self.model.loader(
+            batch_size=batch_size, shuffle=True, num_workers=self.num_workers
+        )
+        self.optimizer = torch.optim.SparseAdam(self.model.parameters(), lr=learning_rate)
+        self.model.train()
+        total_loss = [0] * epochs
+        for epoch in range(epochs):
+            for pos_rw, neg_rw in self.loader:
+                self.optimizer.zero_grad()
+                loss = self.model.loss(pos_rw.to(self.model.device), neg_rw.to(self.model.device))
+                loss.backward()
+                self.optimizer.step()
+                total_loss[epoch] += loss.item()
+            total_loss[epoch] /= len(self.loader)
+            if self.logging:
+                print(f"Epoch: {epoch}, Loss: {total_loss[epoch]}")
+        return sum(total_loss) / epochs
+
+    def transform(self, nodes=None, type_=np.ndarray):
+        if nodes is None:
+            nodes = torch.arange(self.model.num_nodes)
+        if type_ is np.ndarray:
+            return self.model(nodes).detach().cpu().numpy()
+        return self.model(nodes).detach()
+
+    def fit_transform(self, epochs=1, learning_rate=.1, batch_size=128, nodes=None, type_=np.ndarray):
+        self.fit(epochs, learning_rate, batch_size)
+        return self.transform(nodes, type_)
+
+
+
+
+
+
+
+
+
@@ -25,3 +25,4 @@ def get_formatted_os():
     if PLATFORM == "darwin":
         return "MacOS"
     assert False, f"Unsupported platform: {PLATFORM}"
+    return None
@@ -0,0 +1,24 @@
+import numpy as np
+import torch
+
+
+# TODO (ashutosh): move these assert statements once we have a stable code
+def convert_to_tensor(data):
+    if isinstance(data, np.ndarray):
+        return torch.from_numpy(data)
+    assert isinstance(data, torch.Tensor)
+    return data
+
+
+def convert_to_numpy(data):
+    if isinstance(data, torch.Tensor):
+        return data.cpu().numpy()
+    assert isinstance(data, np.ndarray)
+    return data
+
+
+def move_to_device(data, device):
+    if isinstance(data, np.ndarray):
+        return convert_to_tensor(data).to(device)
+    assert isinstance(data, torch.Tensor)
+    return data.to(device)
Original file line number	Diff line number	Diff line change
`@@ -0,0 +1,3 @@`
	`1`	`+import numpy as np`
	`2`	`+import gensim`
	`3`	`+from ..utils import config, torch_utils`