Fix lmdeploy 0.7.3 (#3584)

tastelikefeet · web-flow · commit c3fb9dbd0c82 · 2025-03-20T14:02:10.000+08:00
diff --git a/swift/llm/infer/infer_engine/utils.py b/swift/llm/infer/infer_engine/utils.py
@@ -265,16 +265,21 @@ def __init__(self,
             if not load_weights:
                 for _ in e.map(self.model_comm.process_weight, self.gpu_list, ranks):
                     pass
-            for _ in e.map(self.model_comm.create_engine, self.gpu_list, ranks, repeat(self.nccl_params)):
-                pass
+            if version.parse(lmdeploy.__version__) < version.parse('0.7.2'):
+                for _ in e.map(self.model_comm.create_engine, self.gpu_list, ranks, repeat(self.nccl_params)):
+                    pass
+            else:
+                for _ in e.map(self.model_comm.create_engine, self.gpu_list, ranks):
+                    pass
 
     def _create_weight(self, model_comm):
         """Allocate weight buffer, load params if from_workspace."""
 
         # TODO: support mpi
         self.node_id = 0
         self.node_num = 1
-        self.nccl_params = model_comm.create_nccl_params(self.node_id)
+        if version.parse(lmdeploy.__version__) < version.parse('0.7.2'):
+            self.nccl_params = model_comm.create_nccl_params(self.node_id)
         torch.cuda.synchronize()
 
         # create weight