
[메이저리그 야구 통계학 2/e] 4장 - 상관관계는 인과관계가 아니다(3)
·
Minding's Reading/메이저리그 야구 통계학 2e
정규분포 : 얼마나 칠 것인가? 타율 / 출루율 / 장타율 등 연속형 변수들은 데이터 상호독립성을 띄고 있기 때문에 평균을 중심으로 정규분포를 구성 홈런 / 타점 등 이산형변수도 데이터가 충분하다면 중심극한정리에 기반해 정규분포의 모양을 띤다고 할 수 있음 중심극한정리? 동일한 확률분포를 가진 독립 확률 변수 n개의 평균의 분포는 n이 적당히 크다면 정규분포에 가까워진다는 정리 중심극한정리는 연속형 변수 및 이산 변수에 데이터 상호 독립성을 유지하면서, 회귀분석에 사용될 수 있는 이론적 근거를 제시 (데이터 양이 충분해야 함) 서로 독립적이지 않은 데이터의 예 : 선수마다 보유하고 있는 네트워크 library(sand) library(igraph) g