본문 바로가기
활동

솔직한 2020 빅콘테스트 퓨처스리그 후기

by 방구석 데이터사이언티스트 2022. 1. 12.
728x90
반응형

무더운 여름에 시작해서 한겨울이 되기까지 길다면 길었던 빅콘테스트 여정의 후기를 남겨봅니다.

참고로 저는 3명의 친구들과 퓨처스리그에 참가하여 최우수상을 수상했습니다ㅎㅎ' 

 

1. 빅콘테스트란?

기업에서 실제 보유하고 있는 데이터를 자유롭게 활용하여 새로운 비지니스 모델과 참신한 아이디어를 제시하는 국내 최대규모의 데이터분석 경연대회

※ 대상 팀은 500만원 상금과 과학기술정보통신부장관상이 주어집니다.

  자세한 사항은 www.bigcontest.or.kr 참고

 

분야는 크게 두 가지로 나눠지고 혁신아이디어분야와 데이터 분석 분야로 나눠집니다. 

또 데이터 분석 분야에서도 퓨처스리그와 챔피언 리그로 나눠집니다. 

 

2. 심사과정 및 후기 

대회일정 및 과정

 

 

개인적인 후기 1. 데이터 분석분야의 경우 데이터를 제공받기 전 주제를 먼저 알려줍니다. 

                       2. 대회기간은 2달정도로 꽤 길다.

                       3. 리더보드가 없다. -> 모델의 성능만이 아닌 분석과정을 종합적으로 평가

먼저 빅콘테스트의 컨셉?은 창의적인 아이디어와 논리적인 결과물이라고 생각합니다. 제가 참가한 경험만이 아니라 주변에서도 많이 수상한 사례를 보면, 같은 주제와 데이터를 가지고 얼마나 차별화 된 결과물을 만들었는지, 결과물과  

그 과정이 논리적인지가 중요한 요소로 느꼈습니다. 

예를 들어, 예측 모델 개발을 다룬다면 우리 팀이 선택한 모델은 무엇이고 왜 그 모델을 선택했는지를 생각해야되는 것이죠 그리고 그 근거는 데이터 탐색 과정에서 찾을 수 있을 것입니다. 

 

대회기간이 꽤 길기 때문에 조급해하지 말고 다양한 시도를 해보는 것을 추천드립니다. 

 

3. 발표현장 

코로나임에도 불과하고 대면발표를 진행했는데요. 저는 발표자가 아닌 옆에서 지켜본 입장에서 얘기드리면

 

1. 심사위원분들은 발표는 귀로 듣고 자신의 노트북으로 PPT를 더 집중해서 보신다.

2. 질의응답은 모든 팀원들이 대답할 수 있다. 하지만 질문은 생각이상으로 날카롭다. 

 

 제출마감과 1차결과 발표사이의 기간이 꽤 길기때문에 자신이 했던 코드나 생각들을 잠시 잊어버리게 됩니다.

발표준비기간동안 되새겨내려고해도 2달동안의 기억들을 모두 되돌려내기는 어렵습니다. 

따라서 내가 왜 이런 과정을 했는지를 잘 정리해 놓는 것이 좋습니다. 

 

 

(TMI)

예를 들어. 저희팀은 예측선발투수라는 파생변수를 생성했는데 그 변수는 선발투수를 예측해 그 선수의 기록을 변수로 사용하는 아이디어입니다. 하지만 예측선발투수의 예측정확도는 60-70퍼센트였고 그 부분에서 심사위원들에게 질문을 받았습니다. "예측정확도가 다소 높지않아 모델의 성능에 영향을 끼친 것 아니냐" 

사실 이 변수의 아이디어는 제가 생각했고 정확도가 다소 높지 않더라도 변수로 사용한 이유는 선발투수는 통상적으로 5선발 로테이션으로 운영되는데 사실상 1선발과 2선발이 아닌 선발투수들은 기록의 차이가 거의 없고 그 선수가 어떤 선수인지는 틀려도 그 선수의 기록을 사용하기 때문에 문제가 안될 것이라고 판단했습니다. 그 점을 당연하게 생각해 잊고 있었고 발표현장에서도 대답하지 못했죠ㅜㅜ 

 

4. 수상후기

방학내내 빅콘테스트를 준비하면서 남들 놀 때 놀지도 못해 힘들었고 팀내에서 갈등을 겪을 때마다 현타도 많이 왔지만

모든 과정과 노력은 다 좋은 결과로 돌아오는 것 같습니다.

 

"혼신의 노력은 결코 배반하지 않는다 평범한 노력은 노력이 아니다." -전 야구선수 이승엽-

 

 

 

728x90
반응형

댓글