728x90
Problem Definition
다음과 같이 문제에 대한 의도를 정확하게 파악하고 정의해야한다.
"내가 지금 풀어야 할 문제가 무엇인가?"
"이 문제의 Input과 Output은 무엇인가?"
"이 솔루션은 어디서 어떻게 사용되어지는가?"
Data Description
File 형태, Metadata Field 소개 및 설명이 작성되어있다. 즉, "데이터 스펙 요약본"이라고 할 수 있다.
Notebook
데이터 분석, 모델 학습, 테스트 셋 추론의 과정을 서버에서 연습 가능하다.
Submission & Leaderboard
테스트 예측 결과물 제출과 순위를 확인 할 수 있다.
Discussion
등수를 올리는 것 보다, 문제를 해결하고 싶은 마음으로 참여하는 것이 좋다.
Machine Learning Pipeline
간단한 머신 러닝 흐름은 다음과 같다.
하지만 Competition의 경우 다음과 같이 Data를 대부분 주어지기 때문에 바로 분석을 할 수 있게 해준다. 이 때 바로 Data를 보는 것보다 Overview를 통해 Domain Understanding를 먼저 진행하는 것을 권장하는 것이아니라 그렇게 해야한다.
728x90
'Boostcamp AI Tech' 카테고리의 다른 글
[Boostcamp Day-16] Image Classification - Dataset (0) | 2021.08.25 |
---|---|
[Boostcamp 4주차] 피어세션과 학습 회고 (0) | 2021.08.24 |
[Boostcamp Day-15] Image Classification - EDA (0) | 2021.08.24 |
[Boostcamp Day-15] Image Classification - Overview (0) | 2021.08.24 |
[Boostcamp 3주차] 피어세션과 학습 회고 (0) | 2021.08.20 |