경주마 혈통 데이터 조회
경마는 단순히 빠른 말이 이기는 게임이 아니다. 수많은 데이터와 전략, 훈련이 맞물린 복합적인 스포츠이며, 그중에서도 ‘혈통’은 경주마의 잠재력을 가늠하는 데 있어 가장 기본적이면서도 중요한 요소다.
경주마의 능력은 유전적 요인과 훈련에 의해 결정되는데, 특히 스피드, 지구력, 스타트 능력, 그리고 어떤 거리에서 더 강점을 보이는지와 같은 경주 적성은 상당 부분 혈통에 의해 유전이 되며, 실제로 세계적인 경주마 ‘딥임팩트(Deep Impact)’나 ‘프랑켈(Frankel)’처럼, 혈통 명문 가문의 후손은 경매에서 수억 원을 호가하기도 한다.
따라서 경마 전문가나 고배당 마권을 노리는 마니아들은 혈통 데이터를 분석해, 특정 거리나 주로 상태에서 강점을 보일 수 있는 말을 미리 예측하기도 하며, 이는 곧 배당률의 차이를 만들어내는 핵심 정보가 되기도 한다.
만약, 데이터 분석에 경주마의 혈통 관련 정보를 반영해서 데이터 분석을 진행한다면, 크롤링을 진행 할때 이름이 동일한 경우나 이름이 부분적으로 겹치는 경우 등 경주마의 이름에 대한 자연어처리 부분과 현재 용도(폐사 여부) 등을 신경써야 할 것이다.
ex1) 이름이 동일한 경우 : 유레카 (0044601 / 승용), 유레카 (0006760 / 폐사)
ex2) 이름이 겹치는 경우 : 유레카(0044601 / 승용), 유레카어게인 (0021960 / 폐사)
한국마사회에서는 경주마의혈통정보도 공개하고있으며, 아래의 URL에서 경주마의 이름으로 조회할 수 있다.
한국마사회 말혈통 정보
studbook.kra.co.kr