본문 바로가기

Minding's Programming/Kaggle and Dacon

[Dacon] 랜드마크 분류 문제 소개

728x90
반응형

dacon.io/competitions/official/235585/overview/description

 

랜드마크 분류 AI 경진대회

출처 : DACON - Data Science Competition

dacon.io


[밑바닥부터 시작하는 딥러닝] 스터디를 하면서 한 가지 과제를 공동적으로 경험해보기로 했다.

 

Kaggle과 Dacon에 딥러닝을 사용하여 풀 수 있는 여러 Dataset과 Competition이 많았는데,

그 중 Dacon의 '랜드마크 분류 AI 경진대회'를 풀어보려고 한다.

 

물론 연습을 목표로 푸는 문제이기에, 경진대회이지만 이미 대회기간은 끝났다. (20.11.16 까지였다.)

 

랜드마크 분류 AI 경진대회는

- 국내 인공지능 기반 Large-Scale 이미지 분류 알고리즘 개발 저변 확대 모색

- 고성능 딥러닝 알고리즘의 확보를 통한 개발기간의 단축과 개발비용 감소

- 불균형 데이터셋을 해결하기 위한 집단지성 활용

이라는 배경을 가지고 열리게 되었으며,

 

최종적으로 대용량 이미지 데이터셋에서 랜드마크 이미지를 분류하는 인공지능 알고리즘 개발하는 것이 목표이다.

 

데이콘, 크라우드웍스, 피씨엔에서 주최 및 주관하며

한국정보화진흥원에서 후원한 대회였다.

 

데이터셋은 비식별화된 한국형 랜드마크로, 클래스는 1049개 이다.

 train data로는 88,102장 (22GB)이 주어지고, test data로는 37,964장이 (9.4GB) 주어진다.

 

랜드마크에는 대학교, 명소, 공원, 시장 등 여러가지가 있다.

먼저 푼 사람들의 '코드 공유'까지 가능하니, 참고하면서 학습할 수 있다.

 

다음 포스팅부터는 해당 문제를 해결하는 방법을 찾아보고, 그에 대해 글을 작성해 볼 것이다.

728x90