딥러닝 썸네일형 리스트형 [ML / DL] KNN (K-Nearest-Neighbor, K-최근접 이웃) 오늘은 KNN에 대해 공부해보았다. KNN (K-Nearest-Neighbor, K-최근접 이웃) 새로운 데이터가 주어졌을 때 기존 데이터에서 가장 가까운 k개 이웃의 정보를 통해 새로운 데이터를 예측 분류문제라면 주변 이웃정보를 토대로 투표, 회귀문제라면 주변 이웃정보들의 평균이 예측값이 됨 KNN 프로세스 학습이 따로 필요하지 않은 방법론 새로운 데이터가 들어오면, 기존 데이터 사이의 거리를 재서 이웃들을 뽑음 모델을 별도로 구축하지 않는다는 뜻의 게으른 모델(Lazy model) / 거리 기반 학습(Instance-based Learning) 이라고 함 그 대신 학습모델보다 빠른 예측이 가능 KNN 하이퍼파라미터 거리 측정 방법 탐색할 이웃 수(k) k가 작을경우 데이터의 지역적 특성을 지나치게 반.. 더보기 [ML/DL] 랜덤포레스트(Random Forest) & 앙상블(Ensemble) 오늘은 랜덤포레스트에 대해 알아보고자 한다. 랜덤포레스트는 기본적으로 앙상블 모델이기 때문에, 앙상블 기법과 간단한 개념도 복습하였다. 랜덤포레스트(Random Forest) 여러 결정트리로부터 분류 결과를 집계하여 결론을 내리는 기법 결정트리의 오버피팅을 막을 수 있는 전략 랜덤포레스트 프로세스 트리 생성에 무작위성 투입하여 결정트리를 많이 만듦 각 트리가 고유하게 만들어지도록 무작위 선택 (Bootstrap Sample) 기존 트리와 달리 무작위로 선택 후 후보들 중 최선의 테스트 도출 Bagging Features 결정트리를 만들 때 속성 선택에 있어 제한을 두어 다양성을 줌 일반적으로 특성(칼럼) 개수의 제곱근을 임의적으로 선택하는 특성 개수로 활용 (ex. 25개의 칼럼이 있다면 5개의 칼럼 선.. 더보기 [Numpy exercise 100] 61번 ~ 70번 문제풀이 [Numpy exercise 100] 1번 ~ 30번 문제풀이 [Numpy exercise 100] 1번 ~ 30번 문제풀이 Data Scientist로의 역량 강화와 데이터 분석 분야 면접 준비를 위해 numpy를 다시 한번 복습하고자 Numpy excersise 100문제를 풀기로 마음을 먹었다. https://github.com/rougier/numpy-100 GitHub - rougier/nu.. minding-deep-learning.tistory.com [Numpy exercise 100] 31번 ~ 60번 문제풀이 [Numpy exercise 100] 31번 ~ 60번 문제풀이 [Numpy exercise-100] 1번 ~ 30번 문제풀이 [Numpy exercise-100] 1번 ~ 30번.. 더보기 [머신러닝 딥러닝에 필요한 기초수학 with 파이썬] CH01. 머신러닝과 선형회귀 책에 나와있는 그림 그리는 코드 참고 : https://github.com/metamath1/noviceml metamath1/noviceml 도서 머신러닝·딥러닝에 필요한 기초 수학 with 파이썬의 예제 코드와 그래프 그리는 코드 및 웹앱 저장소 - metamath1/noviceml github.com 머신러닝과 선형회귀 머신러닝이란? 경험 또는 학습을 통해서 결과를 개선해 나가는 것을 컴퓨터에 시키는 것 (지도학습에 국한된 내용) 머신러닝이 첫점과 끝점을 연결하는 방법 알아보기 위의 데이터는 예시와 비슷한 모습 필요한 함수 정의 def machine_learning(D): """ 선형회귀 알고리즘을 사용하여 최적의 직선을 계산합니다. D : (2,N)의 어레이로 1행에는 데이터의 x좌표 2행에는 데.. 더보기 [Image Dataset] GITY : Gather Image Through Youtube, 이미지 데이터셋 생성 프로젝트 https://github.com/kyeul611/gity kyeul611/gity gather_image_through_youtube. Contribute to kyeul611/gity development by creating an account on GitHub. github.com GITY는 이미지 분류문제에서 부족한 데이터셋의 문제를 해결하기 위한 프로젝트로, 자신이 원하는 키워드로, 동적인 객체를 Youtube의 동영상에서 객체를 검출하여 이미지 데이터셋을 만들 수 있다. 교내 Python프로젝트 수업의 실습 팀 프로젝트로 진행했으며, 2021년 5월 ~ 2021년 6월 간 진행되었다. references 다음 Open source를 참고하였다. Image Cut & Save : video-p.. 더보기 [Tensorflow Tutorial] 케라스와 텐서플로 허브를 사용한 영화 리뷰 텍스트 분류하기 TF Hub와 Keras 사용한 기초적인 전이학습(transfer learning) !pip install -q tensorflow-hub !pip install -q tfds-nightly import tensorflow_hub as hub import tensorflow_datasets as tfds print("버전: ", tf.__version__) print("즉시 실행 모드: ", tf.executing_eagerly()) print("허브 버전: ", hub.__version__) print("GPU", "사용 가능" if tf.config.experimental.list_physical_devices("GPU") else "사용 불가능") |███████████████████████████.. 더보기 [Tensorflow Tutorial] 기본 텍스트 분류 - 영화 리뷰를 사용한 텍스트 분류 https://www.tensorflow.org/tutorials/keras/text_classification?hl=ko 영화 리뷰를 사용한 텍스트 분류 | TensorFlow Core Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도 불구하고 공식 영문 문서의 내용과 일치하지 않을 수 www.tensorflow.org 영화 리뷰 텍스트를 긍정 또는 부정으로 분류 이진(binary) 분류 문제 인터넷 영화 데이터베이스의 IMDB 데이터셋 사용 : 5만개의 영화리뷰 텍스트 25000개의 훈련데이터셋, 25000개의 테스트 데이터셋 긍정적 리뷰와 부정적 리뷰 개수 동일 IMDB 데이터셋 다운로드 리뷰들은 미리 전처리 된.. 더보기 [Tensorflow Tutorial] 첫 번째 신경망 훈련하기: 기초적인 분류 문제 Tensorflow 공식 홈페이지에 있는 Tensorflow Tutorial로 TF와 Keras의 기본 지식을 배워보자! https://www.tensorflow.org/tutorials/keras/classification?hl=ko 첫 번째 신경망 훈련하기: 기초적인 분류 문제 | TensorFlow Core Note: 이 문서는 텐서플로 커뮤니티에서 번역했습니다. 커뮤니티 번역 활동의 특성상 정확한 번역과 최신 내용을 반영하기 위해 노력함에도 불구하고 공식 영문 문서의 내용과 일치하지 않을 수 www.tensorflow.org 첫번째 신경망 훈련하기 : 기초적인 분류 문제 # tensorflow, keras import import tensorflow as tf from tensorflow impo.. 더보기 이전 1 2 다음