Merge branch 'dev' of https://github.com/SKT-FlyAI-BoraMettugi/BE into dev

SeoYeomm · SeoYeomm · commit e45d703690e8 · 2025-02-27T21:35:23.000+09:00
diff --git a/.gitignore b/.gitignore
@@ -6,4 +6,5 @@ __pycache__
 *.bin
 .idea/
 venv/
-main_my.py
+main_my.py
+test_download/
diff --git a/api/routes/answer.py b/api/routes/answer.py
@@ -2,7 +2,8 @@
 from sqlalchemy.orm import Session
 from database.nolly import get_db
 from crud.answer import get_answer_history, get_answer_scores
-from schemas.answer import AnswerResponse, AnswerScoreResponse
+from schemas.answer import AnswerResponse, AnswerScoreResponse, AnswerSubmit
+from crud.model_inference import get_tokenizer, get_model # , get_device
 
 router = APIRouter()
 
@@ -22,4 +23,72 @@ async def get_answer_scores_api(user_id: int, question_id: int, db: Session = De
     if not answer_scores:
         raise HTTPException(status_code=404, detail="채점 결과를 찾을 수 없습니다.")
 
-    return answer_scores
+    return answer_scores
+
+# 문제 답안 제출 == 채점
+@router.post("/{user_id}/{question_id}")
+async def grade_answers(
+    user_id: int, question_id: int, 
+    answer_data: AnswerSubmit, tokenizer = Depends(get_tokenizer), model = Depends(get_model), 
+    db: Session = Depends(get_db) # device: str = Depends(get_device), 
+):
+    
+    # 1. 사용자 답변 불러오기
+    input_text = answer_data.answer
+    # 2. 모델에 넣을 수 있도록 토큰화 ########################## pt 맞는지 확인 ###
+    inputs = tokenizer(input_text, return_tensors="pt") 
+
+    # 3. 모델 추론 수행
+    with torch.no_grad():
+        outputs = model(**inputs)
+
+    # 4. 모델 결과 가공 ########################## 실제 결과에 맞게 수정 필요 ###
+    scores = outputs["scores"].tolist()  # [창의, 논리, 사고, 설득, 깊이]
+    reviews = outputs["explanations"]  # ["창의성 설명", "논리 설명", ...]
+
+    total_score = sum(scores) / len(scores) if scores else 0
+
+    # 5. DB에 저장 : 기존 답변 O (값 update), X (db에 새로 add)
+    existing_answer = db.query(Answer).filter(
+        Answer.user_id == user_id, 
+        Answer.question_id == question_id
+    ).first()
+
+    if existing_answer:
+        # 기존 데이터가 있으면 업데이트
+        existing_answer.content = input_text
+        existing_answer.creativity = scores[0]
+        existing_answer.logic = scores[1]
+        existing_answer.thinking = scores[2]
+        existing_answer.persuasion = scores[3]
+        existing_answer.depth = scores[4]
+        existing_answer.creativity_review = reviews[0]
+        existing_answer.logic_review = reviews[1]
+        existing_answer.thinking_review = reviews[2]
+        existing_answer.persuasion_review = reviews[3]
+        existing_answer.depth_review = reviews[4]
+        existing_answer.total_score = total_score
+    else:
+        # 기존 데이터가 없으면 새로 추가
+        new_answer = Answer(
+            user_id=user_id,
+            question_id=question_id,
+            content=input_text,
+            creativity=scores[0],
+            logic=scores[1],
+            thinking=scores[2],
+            persuasion=scores[3],
+            depth=scores[4],
+            creativity_review=reviews[0],
+            logic_review=reviews[1],
+            thinking_review=reviews[2],
+            persuasion_review=reviews[3],
+            depth_review=reviews[4],
+            total_score=total_score
+        )
+        db.add(new_answer)
+
+    # DB 반영
+    db.commit()
+
+    return  # 응답 없이 종료 / FastAPI는 자동으로 200 OK 반환
diff --git a/api/routes/question.py b/api/routes/question.py
@@ -21,4 +21,6 @@ async def get_question(question_id: int, db: Session = Depends(get_db)):
     if not question:
         raise HTTPException(status_code=404, detail="해당 문제를 찾을 수 없습니다.")
     
-    return question
+    return question
+
+
diff --git a/core/minio_service.py b/core/minio_service.py
@@ -0,0 +1,65 @@
+import boto3
+import os
+from dotenv import load_dotenv
+
+# .env 로드
+load_dotenv(override=True)
+
+MINIO_URL = os.getenv("MINIO_URL")
+AWS_ACCESS_KEY_ID = os.getenv("AWS_ACCESS_KEY_ID")
+AWS_SECRET_ACCESS_KEY = os.getenv("AWS_SECRET_ACCESS_KEY")
+S3_BUCKET_NAME = os.getenv("S3_BUCKET_NAME")
+
+# MinIO 클라이언트 생성
+s3 = boto3.client(
+    "s3",
+    endpoint_url=f"http://{MINIO_URL}",
+    aws_access_key_id=AWS_ACCESS_KEY_ID,
+    aws_secret_access_key=AWS_SECRET_ACCESS_KEY
+)
+
+# minio에서 모델 다운로드
+def download_model_from_minio(model_s3_path: str, local_dir: str):
+    """
+    MinIO에서 모델 전체 다운로드
+    :param model_s3_path: MinIO 내 저장된 모델 경로 (예: "llama_model/")
+    :param local_dir: 로컬에 저장할 경로 (예: "./downloaded_model/")
+    """
+    try:
+        os.makedirs(local_dir, exist_ok=True)  # 로컬 저장 폴더 생성
+        
+        # MinIO에서 해당 모델 폴더의 모든 객체 가져오기
+        objects = s3.list_objects_v2(Bucket=S3_BUCKET_NAME, Prefix=model_s3_path)
+
+        if 'Contents' not in objects:
+            print(f"❌ MinIO에 {model_s3_path} 경로 없음")
+            return None
+        
+        for obj in objects['Contents']:
+            file_key = obj['Key']
+            file_name = os.path.basename(file_key)
+            local_path = os.path.join(local_dir, file_name)
+
+            s3.download_file(S3_BUCKET_NAME, file_key, local_path)
+            print(f"✅ {file_key} 다운로드 완료 → {local_path}")
+        
+        return local_dir
+    except Exception as e:
+        print(f"❌ MinIO에서 {model_s3_path} 다운로드 실패: {e}")
+        return None
+
+
+# def download_test_from_minio(model_path: str, local_save_path: str):
+#     """
+#     MinIO에서 파일 다운로드 (예: test.txt)
+#     :param model_path: MinIO 내 저장된 파일 경로 (예: test_folder/test.txt)
+#     :param local_save_path: 로컬에 저장할 경로 (예: ./downloaded_model/test.txt)
+#     """
+#     try:
+#         os.makedirs(os.path.dirname(local_save_path), exist_ok=True)  # 로컬 저장 폴더 생성
+#         s3.download_file("test", model_path, local_save_path)
+#         print(f"✅ {model_path} 다운로드 완료 → {local_save_path}")
+#         return local_save_path
+#     except Exception as e:
+#         print(f"❌ MinIO에서 {model_path} 다운로드 실패: {e}")
+#         return None
diff --git a/core/model_loader.py b/core/model_loader.py
@@ -0,0 +1,46 @@
+import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer
+from peft import PeftModel
+
+MODEL_PATH = "downloaded_model"
+
+# def load_tokenizer():
+#     # Tokenizer 로드
+#     tokenizer = AutoTokenizer.from_pretrained(f"{MODEL_PATH}/tokenizer.json", local_files_only=True, use_fast=True)
+    
+#     return tokenizer
+
+def load_model():
+    base_model_name = "Bllossom-llama-3.2-ko"
+    lora_model_path = MODEL_PATH
+
+    base_model = AutoModelForCausalLM.from_pretrained(base_model_name, device_map="auto")
+    tokenizer = AutoTokenizer.from_pretrained(base_model_name)
+
+#     # Config 로드
+#     config = AutoConfig.from_pretrained(f"{MODEL_PATH}/config.json", local_files_only=True) 
+
+#     # 모델 생성 (AutoModelForCausalLM, AutoModelForSequenceClassification 등 선택)
+#     model = AutoModel.from_config(config)
+
+#     # .safetensors 로드
+#     weights = load_file(f"{MODEL_PATH}/adapter_model.safetensors") # 파일명 확인
+
+#     # 모델에 가중치 적용
+#     model.load_state_dict(weights, strict=False)
+
+#     # # 모델을 GPU로 이동 (선택)
+#     # device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+#     # model.to(device)
+#     model.eval() # 모델 평가 모드로 설정
+
+#     # Adapter 설정 로드
+#     adapter_config = PeftConfig.from_pretrained(f"{MODEL_PATH}/adapter_config.json", local_files_only=True)
+
+#     # Adapter 적용
+#     model = PeftModel(model, adapter_config)
+
+#     return model
+
+# # # 모델 로드
+# # llama_model = load_model()
diff --git a/crud/model_inference.py b/crud/model_inference.py
@@ -0,0 +1,11 @@
+
+from typing import Any
+
+def get_tokenizer() -> Any:
+    return app.state.tokenizer
+
+def get_model() -> Any: 
+    return app.state.model
+
+# def get_device():
+#     return app.state.device
diff --git a/main.py b/main.py
@@ -3,6 +3,10 @@
 from api import main
 from starlette.middleware.cors import CORSMiddleware
 from core.redis_subscriber import start_redis_subscriber
+from core.minio_service import download_model_from_minio # 모델 파일 다운로드
+from core.model_loader import load_tokenizer, load_model # tokenizer, 모델 로드
+import os
+# import torch
 
 app = FastAPI()
 
@@ -18,6 +22,16 @@
 
 app.include_router(main.api_router)
 
+# 서버 실행 시 모델 파일 다운로드 + 모델 로드
+@app.on_event("startup")
+async def cache_model():
+    download_model_from_minio(f"", "downloaded_model") # MODEL_PATH : 어제 test 시 "test_download" 사용
+    app.state.tokenizer = load_tokenizer()
+    app.state.model = load_model()
+    # device = torch.device("cpu")
+    # app.state.device = device
+    # app.state.model.to(device)
+
 #if __name__ == '__main__':
     #uvicorn.run('main:app', reload=True)
 
diff --git a/requirements.txt b/requirements.txt
@@ -7,4 +7,11 @@ sqlalchemy
 pymysql
 websockets
 redis
-httpx
+httpx
+minio
+boto3
+dotenv
+transformers
+safetensors
+peft
+torch
diff --git a/schemas/answer.py b/schemas/answer.py
@@ -24,4 +24,8 @@ class AnswerScoreResponse(BaseModel):
     total_score: Optional[int] = None  # 총점
 
     class Config:
-        orm_mode = True
+        orm_mode = True
+
+
+class AnswerSubmit(BaseModel):
+    answer: str  # 사용자가 제출하는 답변