한국 GDP 예측 ML 모델을 웹 인터페이스를 통해 이용할 수 있게 하는 프로젝트
사이킷런을 통해 미래 한국 GDP를 예측하는 AI 모델을 ElasticNet 기법을 이용해 구축하였고, 사용자가 웹 인터페이스를 통해 경제 지표 데이터를 입력하면 예측된 GDP가 출력되도록 하였습니다.
사용자의 form data가 스프링 서버에 도착하면 스프링 서버가 HttpUrlConnection을 이용해 JSON 데이터를 플라스크 서버로 전송하고 플라스크 서버는 미리 저장되어있는 AI모델에 경제지표 데이터를 입력하여 예측을 수행합니다. 예측 값은 다시 스프링 서버로 돌아가 모델에 담겨 뷰로 전달됩니다.
사용 기술 스택 |
---|
java |
springboot |
python |
flask |
scikitlearn |
MDbootstrap |
Ridge regression과 Lasso regression의 장점을 모두 이용할 수 있는 ElasticNet 기법을 이용하였습니다.
Ridge regression과 Lasso regression은 둘 다 Ordinary least squares 기법에 penalty(lambda * the slope^2, lambda * |the slope|)를 부과하여 Training data에 대한 Overfitting을 방지합니다.
LR은 불필요한 변수들을 제거하여 variance를 낮출 수 있다는 장점이 있고, RR은 대부분의 데이터가 유용할 때 사용하면 모델의 성능이 증가합니다.
하지만 모델 속 변수가 유용할지 불필요할지 미리 알 수 없기 때문에 RR과 LR의 장점을 합친 ElasticNet regerssion을 사용하였습니다.
경희대학교 소프트웨어융합학과 구현서 [mnb9139@khu.ac.kr]