랜덤포레스트 썸네일형 리스트형 [ML/DL] 랜덤포레스트(Random Forest) & 앙상블(Ensemble) 오늘은 랜덤포레스트에 대해 알아보고자 한다. 랜덤포레스트는 기본적으로 앙상블 모델이기 때문에, 앙상블 기법과 간단한 개념도 복습하였다. 랜덤포레스트(Random Forest) 여러 결정트리로부터 분류 결과를 집계하여 결론을 내리는 기법 결정트리의 오버피팅을 막을 수 있는 전략 랜덤포레스트 프로세스 트리 생성에 무작위성 투입하여 결정트리를 많이 만듦 각 트리가 고유하게 만들어지도록 무작위 선택 (Bootstrap Sample) 기존 트리와 달리 무작위로 선택 후 후보들 중 최선의 테스트 도출 Bagging Features 결정트리를 만들 때 속성 선택에 있어 제한을 두어 다양성을 줌 일반적으로 특성(칼럼) 개수의 제곱근을 임의적으로 선택하는 특성 개수로 활용 (ex. 25개의 칼럼이 있다면 5개의 칼럼 선.. 더보기 [ML / DL] 의사결정나무 (Decision Tree) 의사결정나무 (Decision Tree) 데이터가 나타내는 패턴들을 예측 가능한 규칙들의 조합으로 나타낸 모형 (모양이 나무가지가 뻗어나가는 모양) 결정트리의 특징 분류와 회귀문제 모두에서 사용가능 True / False 또는 Yes / No 질문들로 이어가며 학습 (특정 질문에 따라 데이터를 구분) 질문/정답이 들어있는 상자를 Node라고 하며 맨 위의 있는 상자를 Root Node, 맨 마지막에 위치한 상자들을 Terminal Node / Leaf Node라고 함 알고리즘이 직관적이고 규칙파악이 용이함 데이터 전처리 작업이 덜 필요함 결정트리 프로세스 데이터를 가장 잘 구분할 수 있는 질문(특성)으로 데이터를 나눔 나뉜 각 범주에서 데이터를 가장 잘 구분할 수 있는 질문으로 나눔 (반복) 데이터를 지.. 더보기 이전 1 다음