본문 바로가기

반응형

메이저리그

[메이저리그 야구 통계학 2/e] 3장 - 선수의 능력은 어떻게 측정할 것인가?(1) 과학적 측정 야구는 팀의 조화가 중요한 다른 스포츠(축구, 농구)보다 선수 개인 능력이 승리에 미치는 영향이 월등히 큼. 야구 뿐 아니라 다양한 분야에서 평가 및 가치를 측정하는 직업들이 존재 전문성의 기준은 무엇인가? 전문가 집단의 진입장벽 (ex. 시험 등) 경험이 쌓이며 대상을 볼 줄 아는 안목, 통찰력, 노하우 등 전문적 지식이 과학적 지식은 아님 경험과 노하우가 쌓이면서 모든 사건에 균등한 관심보다는 특정 사건에 집중하는 선택적 관심을 가지기 때문 전통적인 스카우터가 홈런 등 기본 툴에 집중하고 출루율, 볼넷 등을 가볍게 보는게 그 예시 선택적 관심의 벽을 넘어 데이터 입수 / 분석 / 해석 능력이 있다면, 비전문가도 의사결정이 가능 측정의 신뢰도 누가 평가했느냐보다는, 모든 요인을 고려하는 균.. 더보기
[메이저리그 야구 통계학 2/e] 2장 - 메이저리그 데이터 마이닝 마이닝의 개념 데이터의 발굴에서부터 해석으로 이어지는 일련의 과정을 뜻함. - 분석 목적에 맞는 데이터를 추출(준비) - 분석가능한 형태의 데이터로 변형 - 변형된 데이터를 이용해 상관관계 / 유사집단 / 변화 패턴 파악 등 분석 및 해석 간단한 데이터 직접 만들어보기 변수에 5개의 타율 데이터가 순서대로 나열되도록 코딩 # a : 변수이름 # [,1] [,2] [1,] "C" "26" [2,] "F" "22" [3,] "A" "31" [4,] "D" "30" [5,] "B" "38" [6,] "E" "29" # 칼럼 이름 변경 colnames(d) > player avg age 1 A 0.28 31 2 B 0.257 38 3 C 0.312 26 4 D 0.197 30 5 E 0.288 29 6 F 0... 더보기
[메이저리그 야구 통계학 2/e] 책 읽기 전 변수 개념 정리 중고서점 알라딘에서 프로그래밍 관련 책을 둘러보던 중, 흥미로운 주제의 책을 하나 발견했다. [메이저리그 야구 통계학]이라는 제목의 책이었다. 사실 베이스볼서번트, 팬그래프 등의 사이트가 너무 잘돼있어 필자 또한 그 데이터로 분석을 해보았을 만큼 특별한 주제는 아니다. 구글링을 좀만 해봐도 메이저리그 데이터셋으로 온갖 분석을 한 글들이 나온다. 하지만 이 책이 내게 특별한 점은 바로 야구라는 도메인을 가지고 R언어를 가르쳐준다는 점이다. 안 그래도 빅데이터분석기사 필기 시험이후로 실기를 위해 R언어를 배울까 말까 생각만 가지고 있던 내게 필요한 책이었다. 이왕이면 흥미있는 주제로 공부를 하는게 좋지 않겠는가. 인터넷을 찾아보니 머신러닝 파트가 추가된 2판이 나와있어 이 책을 구매했다. 이 책의 초반부는 .. 더보기
[MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 Fangraph나 MLB savant 홈페이지에서 직접 csv, DB파일을 다운로드 받는 것이 아닌 MLB서버에 연결된 API로 손쉽게 데이터를 구할 수 있는 방법을 야구공작소 글을 보며 알게되었다. 그 중 파이썬으로 API를 이용할 수 있도록 구현해놓은 패키지가 있어, 사용법을 알아보게 되었다. 제공해주는 데이터의 종류가 매우 풍부해 무궁무진한 활용이 가능하다고 생각한다. 아래는 내가 참고한 야구공작소의 [MLB Stats API’라고 혹시 들어보았나요] 글과 파이썬 패키지를 제작한 개발자의 Github이다. https://yagongso.com/?p=15519 'MLB Stats API'라고 혹시 들어보았나요 - 야구공작소 새로운 데이터 수집방법 사람들은 여러 방법을 통해 MLB 데이터를 수집한다. .. 더보기
[MLB Stats API] statsapi.notes(endpoint) [MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 [MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 Fangraph나 MLB savant 홈페이지에서 직접 csv, DB파일을 다운로드 받는 것이 아닌 MLB서버에 연결된 API로 손쉽게 데이터를 구할 수 있는 방법을 야구공작소 글을 보며 알게되었다. 그 중 파이썬으로 API minding-deep-learning.tistory.com 지정된 endpoint에 둘 이상의 고유 매개변수가 필요한 경우 (예: teamId, legueId 또는 legueListId 중 하나가 endpoint에 포함되어야 함) 필요 매개변수 목록에는 각 요구사항 집합에 대한 하위 목록이 포함됨 예시 : awards 엔드.. 더보기
[MLB Stats API] statsapi.meta(type, fields=None) [MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 [MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 Fangraph나 MLB savant 홈페이지에서 직접 csv, DB파일을 다운로드 받는 것이 아닌 MLB서버에 연결된 API로 손쉽게 데이터를 구할 수 있는 방법을 야구공작소 글을 보며 알게되었다. 그 중 파이썬으로 API minding-deep-learning.tistory.com 다른 쿼리에 사용하기 위해 API에서 사용 가능한 값 검색하거나 API 결과에서 발견된 값에 대한 설명을 조회 각 함수에서 인자(파라미터)로 사용할 수 있는 값들의 목록과 각 값에 대한 설명을 제공 meta에서 값/설명 조회가 가능한 것들 (type 파라미터에 사용.. 더보기
[MLB Stats API] statsapi.get(endpoint, params, force=False) [MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 [MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 Fangraph나 MLB savant 홈페이지에서 직접 csv, DB파일을 다운로드 받는 것이 아닌 MLB서버에 연결된 API로 손쉽게 데이터를 구할 수 있는 방법을 야구공작소 글을 보며 알게되었다. 그 중 파이썬으로 API minding-deep-learning.tistory.com 팀 코드는 위 링크에서 확인 가능 MLB StatsAPI를 호출하고 JSON 데이터를 반환 endpoint와 그에맞는 파라미터를 입력하면 조건에 맞는 json 데이터를 반환받을 수 있음 endpoint 자료 (https://github.com/toddrob99/ML.. 더보기
[MLB 스탯캐스트] 머신러닝으로 MLB 타자들의 최종 홈런 성적 예측해보기 - 3. 데이터 재전처리하여 예측 https://github.com/JeongMinHyeok/Handling_MLB_Statcast (predict_HR 폴더) GitHub - JeongMinHyeok/Handling_MLB_Statcast Contribute to JeongMinHyeok/Handling_MLB_Statcast development by creating an account on GitHub. github.com 이전 발행글 (최초 전처리 및 모델링 / 예측) MLB 스탯캐스트] 머신러닝으로 MLB 타자들의 최종 홈런 성적 예측해보기 - 1. EDA & Data Engineering [MLB 스탯캐스트] 머신러닝으로 MLB 타자들의 최종 홈런 성적 예측해보기 - 1. EDA & Data Engineering 머신러닝 코드.. 더보기

728x90