본문 바로가기

반응형

야구데이터

[FastAPI/Crawling] 네이버 뉴스 API를 활용해 야구 뉴스 데이터 수집하기 토이 프로젝트로 야구장 관련 홈페이지를 만들고 있는데, KBO 야구장을 소개하는 것이다보니 해당 뉴스를 함께 노출할 수 있었으면 좋겠다는 생각에 야구 뉴스만을 수집하는 크롤러를 제작해보았다. 실시간으로 뉴스 업데이트를 해주는 것이 목표이기 때문에, 기본적으로 비동기적 실행이 가능하도록 제작했다. 우선 '야구'라는 키워드를 가진 뉴스를 모두 수집한 다음 link라는 칼럼(네이버 뉴스 상의 하이퍼링크)에서 'kbaseball'이라는 키워드가 포함된 것만 DB에 저장할 리스트에 추가하는 방식으로 설계했다. import aiohttpimport asynciofrom config import get_secretclass NaverNewsScraper: NAVER_API_NEWS = "https://opena.. 더보기
[MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 Fangraph나 MLB savant 홈페이지에서 직접 csv, DB파일을 다운로드 받는 것이 아닌 MLB서버에 연결된 API로 손쉽게 데이터를 구할 수 있는 방법을 야구공작소 글을 보며 알게되었다. 그 중 파이썬으로 API를 이용할 수 있도록 구현해놓은 패키지가 있어, 사용법을 알아보게 되었다. 제공해주는 데이터의 종류가 매우 풍부해 무궁무진한 활용이 가능하다고 생각한다. 아래는 내가 참고한 야구공작소의 [MLB Stats API’라고 혹시 들어보았나요] 글과 파이썬 패키지를 제작한 개발자의 Github이다. https://yagongso.com/?p=15519 'MLB Stats API'라고 혹시 들어보았나요 - 야구공작소 새로운 데이터 수집방법 사람들은 여러 방법을 통해 MLB 데이터를 수집한다. .. 더보기
[MLB Stats API] statsapi.notes(endpoint) [MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 [MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 Fangraph나 MLB savant 홈페이지에서 직접 csv, DB파일을 다운로드 받는 것이 아닌 MLB서버에 연결된 API로 손쉽게 데이터를 구할 수 있는 방법을 야구공작소 글을 보며 알게되었다. 그 중 파이썬으로 API minding-deep-learning.tistory.com 지정된 endpoint에 둘 이상의 고유 매개변수가 필요한 경우 (예: teamId, legueId 또는 legueListId 중 하나가 endpoint에 포함되어야 함) 필요 매개변수 목록에는 각 요구사항 집합에 대한 하위 목록이 포함됨 예시 : awards 엔드.. 더보기
[MLB Stats API] statsapi.meta(type, fields=None) [MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 [MLB Stats API] 파이썬 패키지로 MLB Stats API 사용해보기 Fangraph나 MLB savant 홈페이지에서 직접 csv, DB파일을 다운로드 받는 것이 아닌 MLB서버에 연결된 API로 손쉽게 데이터를 구할 수 있는 방법을 야구공작소 글을 보며 알게되었다. 그 중 파이썬으로 API minding-deep-learning.tistory.com 다른 쿼리에 사용하기 위해 API에서 사용 가능한 값 검색하거나 API 결과에서 발견된 값에 대한 설명을 조회 각 함수에서 인자(파라미터)로 사용할 수 있는 값들의 목록과 각 값에 대한 설명을 제공 meta에서 값/설명 조회가 가능한 것들 (type 파라미터에 사용.. 더보기
[MLB 스탯캐스트] 타구속도(Exit Velocity, EV)와 홈런개수의 상관관계 오래 전 아주 어렸을 때부터 야구를 좋아했었고, 중학생 시절부터 야구에 관련된 직업을 가지겠다는 꿈을 가졌다. Python부터 머신러닝까지 데이터 분석 기법들을 배우기 시작한 계기도 야구 데이터에 관심을 크게 가졌기 때문이다. 평소부터 야구데이터를 다뤄보고 싶었지만, 스탯캐스트가 공개된 2016년부터 너무 많은 시간이 흘렀다. 좀 더 배우고, 좀 더 깊게 데이터를 다루고 싶은 마음때문에 이것저것 건드려보았지만, 결국 내가 제일 즐거웠던 건 빅콘테스트 퓨처스리그 때 팀 별 잔여경기 승률을 맞추는 문제였다. 지금이라도 MLB 스탯캐스트에 공개된 데이터를 가지고 이것저것 개인적인 호기심을 풀어보려고 한다. 부족하더라도 조금씩 조금씩 직접 데이터를 다루며 배워가보려고 한다. 본인의 Github : https:/.. 더보기

728x90