목록분류 전체보기 (13)
'그 뭐더라'에서 '그' 를 설명하는 블로그
파트 1에서는 무작위로 우승마를 고르거나, 인기(최저 배당)말에 배팅하는 단순한 접근으로는 돈을 잃는다는 사실을 확인했습니다. 이번 Part 2의 목표는 분명합니다. “경마에서 실제로 돈을 벌 수 있는 모델”을 만드는 것. 이를 위해 머신러닝을 중심에 놓고 다음 세 가지를 실행했습니다.이번 파트 2에서는 머신러닝을 기반으로 경마에 접근해보겠습니다.- 어느 정도의 경마 도메인 지식을 바탕으로 피처 엔지니어링으로 머신러닝 모델의 성능을 높일 유용한 피처들을 생성했습니다.- 다음으로, 경주 데이터 자체가 시계열 기반 데이터이기때문에 훈련과 테스트 세트를 연속적으로 갱신했습니다.- 마지막으로, catboostranker와 LightGBM, XGBoost을 기반으로 머신러닝 모델을 앙상블하여 월별 손익을 평가했습..
개요이 글의 목적은 마사회 공개 API(서울·부산경남·제주)에서 수집한 경마 데이터를 바탕으로 각 경주의 우승마 또는 Top-3 를 예측하고, 실제 승식별 배팅 시뮬레이션으로 수익/손실을 검증하는 것입니다.분석/모델링은 Python, Pandas, NumPy, scikit-learn, CatBoost, LightGBM, XGBoost로 수행했습니다.데이터셋데이터셋은 마사회에서 제공하는 open API에서 가져온 것으로 경주성적정보, 경주기록정보부터 질병, 마주, 기수... 혈통정보까지 다양한 API를 활용하여 2010년도부터 2025년까지 데이터를 수집하였습니다.데이터는 총 110391회의 경주로 구성되어 있고 우승말은 10236마리 Top-3 말은 30699마리 데이터로 구성되어 있습니다.경주 데이터에..
1경주 3.83경주 4.44경주 5.55경주 6.2 3번경주 7.1 총14경주에 21배정도 먹었다.3만원 투자해서 6만원으로 경마를 끝낼수있었다.승식을 고정해서 투자하는거에 중요함을 느낀 날이였다.자아를 첨가해서 이 말이 좋아보인다 이 기수는 믿어야한다면서 다른 승식이나 모델이 추천하지않은말에 배팅을하여 돈을 잃는 경우가 꽤 있다.경마에 대해 잘 알지 못했을때는 이러지않았는데 오래 배팅하고 머리가 커지다보니 이런 경우가 발생하는것같다.더욱 자아를 버리고 모델을 믿으면서 배팅을 강행해야겠다.🏁 [2025-08-09 1번 경주] (α=0.50) Ranker: training_seoul_0711 | Classifier: training_seoul_0711📋 간단 결과:[52856] 넌퍼레일 | 출주 번호:..
2경주 1.9 3경주 5.6 11경주 4.2 14경주 8.1 까지 하려 총 17배정도 먹었다.투자는 매 경주마다 똑같은 비용을 추가하려고 노력한다. 14경주의 경우 1,2/3 으로 샀기 때문에 사실상 8.1배가 아니라 4배정도라고 생각하면되고2경주의 경우 복승이 3배 아래면 기존 경주의 8 x 2배 정도 투자를 한다.이번주는 모든 경마를 끝내고 금요일부터 글을 정리해서 작성중인데잘 벌면 하루에 투자금액의 2배정도를 회수하지만 못버는날에는 정말 그 날의 투자비용을 거의 잃을 수도 있다.우선 다음날 경주를 쓰면서 해당 이야기를 이어가 써보도록 하겠다.🏁 [2025-08-08 1번 경주] (α=0.50) Ranker: training_jeju_0711 | Classifier: training_jeju_071..
오늘은 배당을 보고 배팅 금액을 조절해봤다.예를 들어 모델이 1,2순위로 예측했는데 복승 배당이 5배 아래면 10000원정도 배팅하는 방식이였다.생각보다 잘 맞아떨어져 돈을 잃지 않고 방어할 수 있었다.🏁 [2025-08-02 1번 경주] (α=0.50) Ranker: training_seoul_0711_3 | Classifier: training_seoul_0711_3📋 간단 결과:[53239] 어게인굿맨 | 출주 번호: 8 | 순위: 1 | 확률: 16.3%[53074] 굿모닝컴 | 출주 번호: 11 | 순위: 2 | 확률: 15.2%[53912] 유니카 | 출주 번호: 2 | 순위: 3 | 확률: 14.0%[53486] 파이브스타 | 출주 번호: 5 | 순위: 4 | 확률: 11.2%[53224..
오늘은 제주 경마가 휴장을 하여 부산 경마만 14경주 하는날이였다.급하게 부산 모델을 발전시키느라 1경주는 예측하지 못했다.생각보다 복승을 잘 먹어서 오늘은 결과가 나쁘지 않았다.실제로 2013년부터 2025년 데이터를 두고 평균을 냈을떄삼위 3마리 복승조합을 돌리는 적중률이 43%정도 된다. 🏁 [2025-08-01 2번 경주]📋 간단 결과:[1412143] 마더원더풀 | 출주 번호: 4 | 순위: 1 | 확률: 17.2%[50990] 글로벌포스 | 출주 번호: 11 | 순위: 2 | 확률: 14.6%[51596] 월드트리플캣 | 출주 번호: 9 | 순위: 3 | 확률: 12.5%[47094] 골든카드 | 출주 번호: 2 | 순위: 4 | 확률: 12.3%[51901] 닥터카라 | 출주 번호: 1 ..
경주 모델에 대해 간단하게 설명하고자 한다.현재 모델은 앙상블 기법을 사용하고 있고 위 CatBoost, LightGBM, XGBoost 머신러닝을 사용중이다.여기서 머신러닝이란?컴퓨터가 데이터를 보고 패턴을 학습하여 예측을 하는 기술이다. 마치 사람들이 경험을 통해 배우는것과 같다!경마 예측의 경우- 입력 : 말의 정보, 경주 정보, 기수 조교사 성적, 주로 상태...등등- 타켓 : 말의 경주 완주 시간으로 학습하고 있다. CatBoost, LightGBM, XGBoost는 모두 트리 기반 모델이다.말의 나이가 5세 이상인가?├─ 예: 기수 경력이 10년 이상인가?│ ├─ 예: 1등 확률 80%│ └─ 아니오: 1등 확률 40%└─ 아니오: 최근 성적이 좋은가? ├─ 예: 1등 확률 60%..
제주, 서울, 부산 모델중 제주 모델이 가장 좋은편이다.그래서 이번주 부산이 여름 휴가로 제주경기만 한다고 하여 기대를 많이 했다.하지만 실제 결과는 그리 좋지 않았다.다행히 마지막 경주를 맞췄는데너무 못맞춰 열받은 상태에서 막 경주에 올인을해서오늘 경주비용을 방어할 수 있었다.제주 모델의 성능을 좀 더 검사해봐야겠다. 🏁 [2025-07-25 1번 경주] 어마장장 | 출주 번호: 8 | 순위: 1 | Ranker=19.3%, Cls=24.5%, 확률: 21.9%파워스타 | 출주 번호: 6 | 순위: 2 | Ranker=11.9%, Cls=11.2%, 확률: 11.6%일품스톰 | 출주 번호: 4 | 순위: 3 | Ranker=12.7%, Cls=10.2%, 확률: 11.5%대륙황후 | 출주 번호: 2 ..