본문 바로가기
728x90
반응형

전체 글48

솔직한 2021 날씨 빅데이터 콘테스트 후기 "팀보다 위대한 선수란 없다."라는 말을 깨닫게 해준 날씨 빅데이터 콘테스트의 후기를 남겨봅니다. 3명의 친구들과 함께 장려상을 수상했던 솔직한 후기를 말씀드리겠습니다. 1. 날씨 빅데이터 콘테스트란? 다양한 기상기후 빅데이터에 대한 이해를 높이고, 활용분야를 넓힘과 동시에 기상-타분야(공공, 민간) 빅데이터 융합 분야 공모를 통한 참신한 아이디어 발굴하기 위한 목적으로 매년 기상청에서 주최하는 빅데이터 분석 경진대회입니다. ※ 대상 팀은 300만원 상금과 환경부장관상이 주어집니다. ※ 수상 팀은 빅데이터 관련 기업 일자리 매칭 프로그램(빅매칭 캠프)에 참가 및 추천을 받을 수 있습니다. ※ 자세한 사항은 https://bd.kma.go.kr/contest/ 공모 분야는 공공협력형 분야와 민간협력형 분야.. 2022. 1. 16.
[머신러닝][개념]의사결정나무 1. 의사결정나무 의사결정나무란? 대표적인 지도학습 모형으로 데이터를 학습 해 분류 규칙을 만드는 알고리즘입니다. - Classifier, Regressor 모두 가능한 분석 방법 - 해석의 용이성, 교호작용효과의 해석 - 비모수적 모형 2. 분리기준 분리기준이란? 하나의 부모마디로부터 자식마디들이 형성될 때 입력변수의 선택과 선택된 입력변수에 따른 범주를 선택할 때의 기준을 의미합니다. 의사결정나무 분리기준은 다양한 방법이 있지만 그 컨셉은 동일합니다. 타겟에 따라 최대한 순수한 집단으로 분리하고자하는 것입니다. 순수한 집단이라고 하면, 예를 들어) Target = 1 혹은 0 일 때 하나의 리프노드 안에 데이터들이 전부 1이라면 그 리프노드는 순수한 집단이 되는 것입니다. 반대로 리프노드안에 1과0이.. 2022. 1. 15.
[머신러닝][파이썬]K-means clustering 오늘은 KBL 선수들의 기록 데이터로 클러스터링을 진행해보겠습니다. 데이터는 KBL 공식 홈페이지를 통해 최근 5년간의 KBL 선수의 개인 기록을 크롤링했습니다. 1. 모듈 가져오기 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 import pandas as pd import numpy as np import seaborn as sns import matplotlib as mpl import matplotlib.pyplot as plt import matplotlib.font_manager as fm %matplotlib inline from factor_analyzer import FactorAnalyzer from sklearn.cluster import KMeans from .. 2022. 1. 14.
[머신러닝][개념]K-means clustering Clustering Analysis이란? - 여러 집단의 데이터들이 섞여 있고 각 데이터의 소속집단을 모르는 경우 유사한 속성을 갖는 데이터의 군집을 찾는 기법 - 주어진 개체 중에서 유사한 것들을 몇몇의 집단으로 그룹화하여, 각 집단의 성격을 파악함으로써 데이터 전체의 구조에 대한 이해를 돕고자 하는 탐색적 데이터 분석 방법 목적 * 주어진 데이터를 통해 군집을 잘 구분하는 것이 분석의 최대 목적 - 동일한 군집의 개체들은 유사한 성격을 갖도록한다. - 서로 다른 군집에 속한 개체들 사이에는 상대적으로 서로 다른 성격을 갖도록한다. 유사성과 거리. 군집분석에서는 유사성의 척도로 거리를 사용한다 거리의 종류는 크게 세 가지로 유크리드 거리, 민코우스키 거리, 마할라노비스 거리가 있고 통상적으로 유클리드 .. 2022. 1. 13.
솔직한 2020 빅콘테스트 퓨처스리그 후기 무더운 여름에 시작해서 한겨울이 되기까지 길다면 길었던 빅콘테스트 여정의 후기를 남겨봅니다. 참고로 저는 3명의 친구들과 퓨처스리그에 참가하여 최우수상을 수상했습니다ㅎㅎ' 1. 빅콘테스트란? 기업에서 실제 보유하고 있는 데이터를 자유롭게 활용하여 새로운 비지니스 모델과 참신한 아이디어를 제시하는 국내 최대규모의 데이터분석 경연대회 ※ 대상 팀은 500만원 상금과 과학기술정보통신부장관상이 주어집니다. ※ 자세한 사항은 www.bigcontest.or.kr 참고 분야는 크게 두 가지로 나눠지고 혁신아이디어분야와 데이터 분석 분야로 나눠집니다. 또 데이터 분석 분야에서도 퓨처스리그와 챔피언 리그로 나눠집니다. 2. 심사과정 및 후기 대회일정 및 과정 개인적인 후기 1. 데이터 분석분야의 경우 데이터를 제공받기.. 2022. 1. 12.
ADsP(데이터분석준전문가) 합격 후기 저는 제 25회 데이터 분석 준전문가(ADsP) 시험에 합격했는데요, ADsP 자격증을 준비하는 분들에게 조금이나마 도움을 드리기 위해 제가 공부하면서 느낀 점, 꿀팁, 정보 등에 대해 얘기하겠습니다. 1. 합격 인증 ● 1과목 : 데이터 이해 14/20 ● 2과목 : 데이터 분석 기획 18/20 ● 3과목 : 데이터 분석 50/60 총점 : 82 / 100 (합격!) -> 100점 까비ㅎㅎ 2. 시험 정보 ● 시험 시간 - 90분 ● 시험 문제 - 50문제 3. 준비 기간 및 공부방법 저는 통계학과이긴하지만 공부 당시에는 배경지식이 전혀없는 비전공자에 가까웠습니다. 공부량 : 평일 1시간 / 주말 4시간 공부기간 : 1개월 반 공부 방법 : 데이터 에듀에서 출판한 민트 책을 5회독정도 했습니다. 개인적.. 2022. 1. 12.
728x90
반응형