r 썸네일형 리스트형 [메이저리그 야구 통계학 2/e] 3장 - 선수의 능력은 어떻게 측정할 것인가?(2) 데이터에서 룰을 찾다 : 연관성 분석 분석할 데이터에서 패턴과 연관성을 잘 파악하면 마케팅 등 전략에 활용할 여지가 많음 연관성 분석 연관성 분석은 변수 내 개별 관측자료가 여타 관측자료와 어떻게 어울리는지 파악하는데 주력 ex) 이적시장에서 특정 팀 출신의 선수를 전략적으로 선호하는가? # 전처리 library(Lahman) a 2010&yearID {MIA} 0.00171969 1.0000000 [3] {NYA, PHI} => {PIT} 0.00171969 0.5000000 coverage lift count [1] 0.018916595 10.744642 25 [2] 0.001719690 18.910569 4 [3] 0.003439381 8.551471 4 lhs Length:3 Length:3 Cl.. 더보기 [메이저리그 야구 통계학 2/e] 2장 - 메이저리그 데이터 마이닝 마이닝의 개념 데이터의 발굴에서부터 해석으로 이어지는 일련의 과정을 뜻함. - 분석 목적에 맞는 데이터를 추출(준비) - 분석가능한 형태의 데이터로 변형 - 변형된 데이터를 이용해 상관관계 / 유사집단 / 변화 패턴 파악 등 분석 및 해석 간단한 데이터 직접 만들어보기 변수에 5개의 타율 데이터가 순서대로 나열되도록 코딩 # a : 변수이름 # [,1] [,2] [1,] "C" "26" [2,] "F" "22" [3,] "A" "31" [4,] "D" "30" [5,] "B" "38" [6,] "E" "29" # 칼럼 이름 변경 colnames(d) > player avg age 1 A 0.28 31 2 B 0.257 38 3 C 0.312 26 4 D 0.197 30 5 E 0.288 29 6 F 0... 더보기 [메이저리그 야구 통계학 2/e] R 설치, R Studio(Posit) 설치 오늘은 R 설치 및 R을 활용할 수 있는 R Studio(Posit으로 이름이 바뀌었다.) 설치법을 알아보았다. R 설치하기 1. 아래 링크에 접속한다. https://www.r-project.org/ R: The R Project for Statistical Computing www.r-project.org 2. 왼쪽 상단 부분에 Download 밑에 있는 CRAN을 선택한다. CRAN은 the Comprehensive R Archive Network의 약자로, R과 관련되어 업데이트된 자료 및패키지를 보관하고 있다. 3. 밑으로 스크롤해 Korea 밑에 있는 Network 중 하나를 선택하고, 운영체제에 맞게 설치한다. R을 처음 설치하는 거라면 'install R for the first time'.. 더보기 이전 1 다음