티스토리 뷰

개발 프로젝트

My first Dacon

망고농장주인 2021. 6. 25. 00:54

이번 데이콘은 아이펠에서 비슷한 관심사로 모인 사람들끼리 도전하였다.

팀원과 팀명

강민정 + 김이삭 + 김인유 + 문성은 = ModuWay
(상금을 타서 subway 30cm를 먹는 호사를 누려보자!라는 취지에서 way를 붙였다.)

일정

대회 시작은 3월 8일 부터였지만 팀 모이는데 시간이 걸려서, 우리팀은 3월 13일에 온라인으로 첫만남을 가졌다.

대회 내용

간단하게는 비트코인 가격을 예측하는 것이었다. 더 나아가 설명하자면, 매수 시점이 고정된 529개의 비트 코인의 2시간의 가격을 각각 예측해서 가장 많은 돈을 버는 것이 목표였다. 시드머니는 모두 $10000 로 시작하는 가정이었다.

진행

  1. EDA
  2. baseline 분석
  3. GitHub organization 생성
    (노션과 GitHub 중 고민 중에 github 연습을 위해 organization으로 선택)
  4. 시계열 데이터 prediction에 적합한 모델 탐색
    (ARIMA, fbprophet, LSTM, RNN+fb 등)
  5. Trading(언제 팔건지) 관련 지표 탐색

1. EDA

시작할 때, 가장 중요한 부분인데 소홀히 시작한 점이 아쉬웠다.

(첫 술의 배부르랴. 다음에는 초반에 충분한 시간을 투자할 것이다.)


매수는 정해진 시간에 open 가격에 사는 조건이었다. 그래서 대회 초반에는 매 분마다의 open가격에 집중했었다.

2. baseline 분석

3가지의 baseline이 있었는데, 한 가지는 DACON 자체에서 올려준 것이고 나머지 두가지는 참가자가 직접 올린 것이었다. DACON에서 올린 베이스라인에는 ARIMA 모델을 사용해서 AIFFEL에서 배운적있는 ARIMA 모델을 사용해서 반가웠다. 당시 우수 노드자였던 '정수희'님의 프로젝트와 함께 분석하고 어떻게 auto arima와 grid search를 적용할 수 있을까 고민했다. fbprophet 모델을 사용한 베이스라인도 있었는데, 이때 처음으로 fbprophet 모델을 처음 접했다. 그래서 facebook에서 만든 모델이라는 것부터 공부하면서 베이스라인을 분석했다.

3. GitHub organization 생성

개인적으로 아직까지 아쉬운 점이 많은 파트이다. GitHub 공부가 부족함을 알고 있으면서도 LMS를 진행하면서 불편한 점이 없어서 안일하게 file upload로 과제를 제출했었다. 처음으로 organization 을 사용하면서 나의 부족함을 직시하게 되고 내가 어떤 공부를 더 해야할지 알 수있게 되었다.

4. 시계열 데이터 prediction에 적합한 모델 탐색

ARIMA처럼 소수의 모델만 prediction이 가능한 줄 알았던 나에게 가장 큰 공부가 되었다. 간단한 RNN 부터 시작해서 CV에서만 사용한다고만 생각했던 CNN으로도 예측 모델을 만들어 낼 수 있었다. '성은님'이 여러 모델로 예측한 코드들을 빠른 속도로 어마어마하게 많은 양을 모아줬는데 정확하게 목표한 것을 찾았내는 구글링 실력에 감탄해 마지않을 수 없었다. '민정님'은 fbprophet보다 더 낯선 모델을 찾아왔다. 고군분투하며 열심히 돌려주셨는데, 왜인지 에폭이 작을 수록 더 많은 주식을 샀다. 이 부분은 다음 출전(?)에 다시 짚고 넘어가야 할 것이다.

5. Trading(언제 팔건지) 관련 지표 탐색

주식과 비트코인은 정말 수많은 지표를 가지고 있다. 흔하게 사용되는 매수,매도량부터 MACD까지 그 양은 두꺼운 책 한권을 꽉 채울 만큼 엄청나다. '이삭님'은 이러한 지표들 중에서 제한된 데이터와 가장 맞는 지표를 골라 코드까지 짰다. 당연히 코드까지 완성한 지표를 막상 적용하니 데이터가 연결되지 않아 결국 사용하지 못하는 시행착오도 겪었다. 그럼에도 이러한 지표를 적극 활용해 여러 주식까지도 도전해 볼 수 있다는 생각을 하게 했다.

여담

마지막 제출 날이던 3/31 22:56분에 혼신에 힘을 다한 마지막 제출을 하려던 그때!!!
팀 모두가 그때 처음 보았다. 제출이 17:59까지 였다는 것을.....
그 때의 허탈함은 말로 전할 수 없지만, 당장에 확신할 수 있는 것은 우리는 앞으로 절대 날짜 기한을 넘길 일은 평생에 없을 것이라는 거다. 하하하(힘들 때 웃는 우리는 일류)

몰아치는 지식 속에서 자신감을 잃고 좌절 중인던 나에게 큰 응원과 웃음을 준 우리 팀원들에게 큰 빚을 진 기분이다. 여러분, 제가 빚 갚을 때까지 나랑 함께해요. 정말 고마워요. 다음 출전도 화이팅입니다.