[메이저리그 야구 통계학 2/e] 3장 - 선수의 능력은 어떻게 측정할 것인가?(2)
·
Minding's Reading/메이저리그 야구 통계학 2e
데이터에서 룰을 찾다 : 연관성 분석 분석할 데이터에서 패턴과 연관성을 잘 파악하면 마케팅 등 전략에 활용할 여지가 많음 연관성 분석 연관성 분석은 변수 내 개별 관측자료가 여타 관측자료와 어떻게 어울리는지 파악하는데 주력 ex) 이적시장에서 특정 팀 출신의 선수를 전략적으로 선호하는가? # 전처리 library(Lahman) a 2010&yearID {MIA} 0.00171969 1.0000000 [3] {NYA, PHI} => {PIT} 0.00171969 0.5000000 coverage lift count [1] 0.018916595 10.744642 25 [2] 0.001719690 18.910569 4 [3] 0.003439381 8.551471 4 lhs Length:3 Length:3 Cl..
[메이저리그 야구 통계학 2/e] 3장 - 선수의 능력은 어떻게 측정할 것인가?(1)
·
Minding's Reading/메이저리그 야구 통계학 2e
과학적 측정 야구는 팀의 조화가 중요한 다른 스포츠(축구, 농구)보다 선수 개인 능력이 승리에 미치는 영향이 월등히 큼. 야구 뿐 아니라 다양한 분야에서 평가 및 가치를 측정하는 직업들이 존재 전문성의 기준은 무엇인가? 전문가 집단의 진입장벽 (ex. 시험 등) 경험이 쌓이며 대상을 볼 줄 아는 안목, 통찰력, 노하우 등 전문적 지식이 과학적 지식은 아님 경험과 노하우가 쌓이면서 모든 사건에 균등한 관심보다는 특정 사건에 집중하는 선택적 관심을 가지기 때문 전통적인 스카우터가 홈런 등 기본 툴에 집중하고 출루율, 볼넷 등을 가볍게 보는게 그 예시 선택적 관심의 벽을 넘어 데이터 입수 / 분석 / 해석 능력이 있다면, 비전문가도 의사결정이 가능 측정의 신뢰도 누가 평가했느냐보다는, 모든 요인을 고려하는 균..
[메이저리그 야구 통계학 2/e] 책 읽기 전 변수 개념 정리
·
Minding's Reading/메이저리그 야구 통계학 2e
중고서점 알라딘에서 프로그래밍 관련 책을 둘러보던 중, 흥미로운 주제의 책을 하나 발견했다. [메이저리그 야구 통계학]이라는 제목의 책이었다. 사실 베이스볼서번트, 팬그래프 등의 사이트가 너무 잘돼있어 필자 또한 그 데이터로 분석을 해보았을 만큼 특별한 주제는 아니다. 구글링을 좀만 해봐도 메이저리그 데이터셋으로 온갖 분석을 한 글들이 나온다. 하지만 이 책이 내게 특별한 점은 바로 야구라는 도메인을 가지고 R언어를 가르쳐준다는 점이다. 안 그래도 빅데이터분석기사 필기 시험이후로 실기를 위해 R언어를 배울까 말까 생각만 가지고 있던 내게 필요한 책이었다. 이왕이면 흥미있는 주제로 공부를 하는게 좋지 않겠는가. 인터넷을 찾아보니 머신러닝 파트가 추가된 2판이 나와있어 이 책을 구매했다. 이 책의 초반부는 ..