[REFACTOR] load model 수정

bokyeong0405 · bokyeong0405 · commit abe2b438e7fb · 2025-02-27T20:00:49.000+09:00
diff --git a/core/model_loader.py b/core/model_loader.py
@@ -1,42 +1,46 @@
-import os
 import torch
-from transformers import AutoModel, AutoTokenizer, AutoConfig
-from safetensors.torch import load_file
-from peft import PeftModel, PeftConfig
+from transformers import AutoModelForCausalLM, AutoTokenizer
+from peft import PeftModel
 
 MODEL_PATH = "downloaded_model"
 
-def load_tokenizer():
-    # Tokenizer 로드
-    tokenizer = AutoTokenizer.from_pretrained(f"{MODEL_PATH}/tokenizer.json", local_files_only=True, use_fast=True)
+# def load_tokenizer():
+#     # Tokenizer 로드
+#     tokenizer = AutoTokenizer.from_pretrained(f"{MODEL_PATH}/tokenizer.json", local_files_only=True, use_fast=True)
     
-    return tokenizer
+#     return tokenizer
 
 def load_model():
-    # Config 로드
-    config = AutoConfig.from_pretrained(f"{MODEL_PATH}/config.json", local_files_only=True) 
+    base_model_name = "Bllossom-llama-3.2-ko"
+    lora_model_path = MODEL_PATH
 
-    # 모델 생성 (AutoModelForCausalLM, AutoModelForSequenceClassification 등 선택)
-    model = AutoModel.from_config(config)
+    base_model = AutoModelForCausalLM.from_pretrained(base_model_name, device_map="auto")
+    tokenizer = AutoTokenizer.from_pretrained(base_model_name)
 
-    # .safetensors 로드
-    weights = load_file(f"{MODEL_PATH}/model.safetensors") # 파일명 확인
+#     # Config 로드
+#     config = AutoConfig.from_pretrained(f"{MODEL_PATH}/config.json", local_files_only=True) 
 
-    # 모델에 가중치 적용
-    model.load_state_dict(weights, strict=False)
+#     # 모델 생성 (AutoModelForCausalLM, AutoModelForSequenceClassification 등 선택)
+#     model = AutoModel.from_config(config)
 
-    # # 모델을 GPU로 이동 (선택)
-    # device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-    # model.to(device)
-    model.eval() # 모델 평가 모드로 설정
+#     # .safetensors 로드
+#     weights = load_file(f"{MODEL_PATH}/adapter_model.safetensors") # 파일명 확인
 
-    # Adapter 설정 로드
-    adapter_config = PeftConfig.from_pretrained(f"{MODEL_PATH}/adapter_config.json", local_files_only=True)
+#     # 모델에 가중치 적용
+#     model.load_state_dict(weights, strict=False)
 
-    # Adapter 적용
-    model = PeftModel(model, adapter_config)
+#     # # 모델을 GPU로 이동 (선택)
+#     # device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+#     # model.to(device)
+#     model.eval() # 모델 평가 모드로 설정
 
-    return model
+#     # Adapter 설정 로드
+#     adapter_config = PeftConfig.from_pretrained(f"{MODEL_PATH}/adapter_config.json", local_files_only=True)
 
-# # 모델 로드
-# llama_model = load_model()
+#     # Adapter 적용
+#     model = PeftModel(model, adapter_config)
+
+#     return model
+
+# # # 모델 로드
+# # llama_model = load_model()
diff --git a/requirements.txt b/requirements.txt
@@ -13,4 +13,5 @@ boto3
 dotenv
 transformers
 safetensors
-peft
+peft
+torch