기여내역은 언제든 초기화될 수 있으며, 예기치 못한 오류가 발생할 수 있습니다.
WAR
덤프버전 :
1. 개요[편집]
Wins Above Replacement(대체 수준 대비 승리 기여도)의 약어.[1]
야구의 세이버메트릭스 기록으로, 선수가 팀 승리에 얼마나 공헌하였는가를 종합하여 표현하는 성격의 스탯이다. 오늘날 야구에서 가장 각광받는 스탯이라해도 과언이 아니다.[2]
이 지표의 값은 곧 팀의 승수를 의미하며, 이에 따라 한국어로 읽을 때는 nWAR을 'n승'이라고 읽어도 무방하다. 다만 중요한 것은 대체 선수에 비해 몇 승을 더 기여했는지를 나타낸다는 것이다.
2. 설명[편집]
WAR을 이해하기 위해 먼저 알아야할 대체 선수란 절대 팀내의 그 포지션의 후보 선수를 의미하는 게 아니다. 일반적인, 가상의 대체 선수 수준[3] 을 의미한다. 바로 이 대체 수준의 선수와 비교함으로써, WAR을 구하고자하는 선수가 득점과 실점 억제에 얼마나 기여했는지를 구하고, 이를 승수로 바꿔 표현하는 과정을 거치면 WAR가 산출된다.
덕분에 매우 직관적으로 활용 가능하단 장점이 있다. 예를 들면 유격수 자리에 WAR이 0인, 즉 대체 수준의 선수를 썼던 팀이 87승을 했다고 할 때, 이 선수 대신 WAR 3인 선수를 썼다면 90승을 했을 것이란 식이다. 팬그래프스의 따르면 2017년 기준 FA 1WAR 당 가격은 1050만 달러에 달한다고 한다.출처[4]
일반적으로 WAR이 2~3정도 되면, 어느 팀에서도 주전자리를 차지할 수 있는 경쟁력이 있는 선수로 보는데, 이는 메이저리그 경기수를 기준으로 한 식 계산법이다.
2~3의 WAR 스케일을 가진 플레이어가 어느 팀에서나 주전 경쟁이 가능한 Solid Starter로 불리는 데에는 이유가 있는 것이다.
일반적으로 MLB에서 포스트 시즌에 진출하기 위한 최소한의 승수를 대충 90승 정도로 잡는데, 팀에 15~17명의 Solid Player를 보유하더라도 약 10정도의 WAR스케일이 더 필요한 것이다. 2016시즌 103승을 거두며 MLB 전체 승률 1위를 달성한 시카고 컵스의 경우, 투타에서 WAR 상위 10걸을 차지한 선수들의 WAR 합계는 fWAR, bWAR 모두 55 내외였다. 시카고 컵스의 103승에서 대체 선수로 이루어진 팀의 일반적인 승수로 계산되는 48을 빼면 공교롭게도 딱 55가 나온다. 그만큼 팀의 성적을 가늠하는데 정확도가 괜찮은 지표인 것.
Fangraphs의 WAR는 fWAR, Baseball-Reference의 WAR는 bWAR라고 약칭한다.
참고로 WAR로는 (특히 수비 측정 방식이 다르므로) 다른 시대 선수들과는 비교가 무리라고 생각하는 야구 팬들도 있지만, 최소한 창립자들의 생각은 그렇지 않다.[12] bWAR를 만든 션 포먼은 다음과 같이 말했다.#
단순 수비 포지션에 대한 보정만으로도 ‘안하는 것 보단 나은’ 스탯이 될 겁니다. 하지만, WAR를 고안한 목적은 동시대의 선수를 비교하고자 하는 것이 아니었어요. 서로 다른 시대의 서로 다른 선수들을 동일 선상에 놓고 볼 만한 메트릭이 필요해서 탄생한 것이지요. 시즌 내에서의 선수 퍼포먼스 비교라면 굳이 WAR를 쓸 필요는 없을 겁니다. VORP라던가, 공격 스탯만을 반영하는 다른 좋은 메트릭들도 많아요.
3. 역사[편집]
- 1980년대 - Pete Palmer가 Total Baseball에 Total Player Rating(TPR)을 게시.
- 1992년 - Brock Hanke의 Baseball Sabermetric이 종합, 공격 및 수비 ‘Wins Above Replacement’의 리더 보드를 발행.
- 1993년 – rec.sport.baseball에서 ‘Wins Above Replacement’를 처음 언급.
- 1995년 - Keith Woolner가 the Bosox Mailing List에서 Value Over Replacement Player(VORP)을 개발.
- 2001년 정도 - Baseball Prospectus가 Wins Above Replacement Player(WARP)를 시작.
- 2002년 - Bill James가 Win Shares를 발표.
- 2008년 11월 - Sean Smith가 Hardball Times에서 replacement level 및 WAR에 대한 자신의 작업을 게시.# Tom Tango는 거의 완성된 WAR 구현을 위한 지금까지의 프레임 워크가 무엇인지에 대한 방법론을 발표.
- 2008년 12월 - Fangraphs가 WAR를 추가.
- 2010년 5월 - Baseball-Reference는 BaseballProjection의 Sean Smith에서 WAR를 추가. #
4. 다양한 베리에이션[편집]
WAR은 정해진 표준이란 게 없는 비표준화 스탯으로, 타격, 주루, 수비, 피칭 각각을 평가하는 방법, 비교 대상이 되는 대체 수준 설정에 따라 다양한 베리에이션을 가진다.
비유하자면 자동차와 같다. 차를 구성하는 각 요소마다의 차이로 수많은 자동차의 갈래가 생겨나듯 WAR 역시 마찬가지다. 때문에 WAR을 언급할 때는 어떤 WAR인지 명확히 지칭할 필요가 있다. 자동차의 특정 모델이 가지는 특성을 자동차에 대한 보편적 특성이라고 단정할 수는 없으니까.
최소 2019년에 이미 모든 구단은 WAR를 활용하고 있으며, 대부분은 자신들 고유의 WAR를 운용하고 있는 것으로 보인다. 예를 들어, 필라델피아 필리스가 운용하는 WAR는 pWAR라고 부르고, 워싱턴 내셔널스가 운용하는 WAR는 펜타곤이라 부른다. 펜타곤의 보안 수준은 펜타곤에 준한다고 한다. 다들 자신들의 WAR 계산 방법은 비밀로 유지하고 있으며, 일부는 계산 방법이라는 주제조차도 언급하는 것을 꺼린다.#
4.1. MLB의 WAR[편집]
현재 대중적으로 가장 유명한 WAR는 Baseball-Reference의 WAR(bWAR)[13] Fangraphs의 WAR(fWAR)다. 그리고 매니악한 Baseball Prospectus의 WAR(WARP)가 있다. 각각의 특징을 표로 간단히 정리하면 아래와 같다.
가장 널리 알려진 bWAR과 fWAR을 비교할 경우, 타자는 DRS냐 UZR이냐의 차이, 투수는 실점이냐 FIP이냐의 차이라고 할 수 있다.[19] 이에 대해선 DIPS 항목을 참고. 대체로 투수는 ERA와 FIP의 괴리가 큰 경우가 잦아서 bWAR과 fWAR의 차이가 꽤 큰 투수들이 많고,[20] 타자의 경우 타자는 가장 중요한 공격 스탯을 거의 같은 걸 쓰기 때문에 bWAR과 fWAR의 차이가 투수보다는 낮다고 여겨진다. 하지만 2023 시즌 종료 기준 현역 톱 20위들을 비교해 보면, 개개인 유형마다 bWAR과 fWAR 차이가 많이 나는 선수가 있다.
톰 탱고, 데이브 카메론, 댄 짐보스키[22] 등의 세이버메트리션들은 표본에 따라 적절히 보는 것을 권장하고 있다. 투수의 경우 한두 시즌 정도의 표본이라면 FIP을 사용하는 fWAR쪽이 신뢰도가 높지만, 선발 투수 기준 4-5년(700~800이닝; 3,000타석)이 넘어가는 순간 bWAR이 역전한다고 한다.[23]
한편 WARP는 Baseball Prospectus 자체가 워낙 폐쇄적이라 공개된 정보도 제한적이고 인지도가 상대적으로 낮은 편이다. 하지만 그만큼 더 하드코어하고 진보적인 자료가 많은 곳이기도 하기에 인지도를 이유로 WARP를 낮게 평가할 건 없다. 참고로 ESPN의 키스 로는 2018년 9월 채팅에서 자신은 BP 통계를 사용하지 않는다고 밝혔다.#
4.1.1. fWAR와 bWAR 비교[편집]
베이스볼 레퍼런스에서 제공하는 WAR Comparison Chart를 참조하여 그대로 번역하였다. 하지만 fWAR도 2008년 발표 후 꾸준히 업데이트 되었으나 베이스볼 레퍼런스에서 제공하는 정보라 그런지 아직 전혀 반영하지 않은 것으로 보인다. 원래는 어떤 모습이었나를 아는 것도 도움이 되므로, 바뀐 점에 대해서는 각주로 반영한다.
4.1.2. Joint WAR[편집]
연봉 조정 이전 선수들 중 성적이 좋은 선수에 대한 보상 문제가 대두되었고, 새로운 CBA에 따라 2022년 12월 서비스타임 3년차 미만의 연봉 조정 이전으로 시즌을 시작하여 아직 슈퍼2 상태를 통해 연봉 조정 자격을 얻지 못한 선수들을 위한 특별 보너스 분배가 시작되었다.
여기에서도 WAR는 큰 기준이 된다. 자세한 분배 방법은 다음과 같다.[34]
이 보너스는 총액 5000만 달러 규모로 일단 수상자에게 먼저 돈을 분배한다.
- MVP 혹은 사이영 상 수상: 250만 달러
- MVP 혹은 사이영 상 2위: 175만 달러
- MVP 혹은 사이영 상 3위: 150만 달러
- MVP 혹은 사이영 상 4~5위: 100만 달러
- ALL-MLB 퍼스트 팀 선정: 100만 달러
- 신인왕 수상: 75만 달러
- ALL-MLB 세컨드 팀 선정: 50만 달러
- 신인왕 2위: 50만 달러
5000만 달러에서 위 금액을 제외한 뒤, ‘합동 대체 선수 대비 승리 기여도(Joint WAR)’에 따른 줄 세우기로 100명을 선정하여 그들 각자의 WAR 비율대로 해당 금액을 나눠 먹는다.[35]
공개된 자료에 따르면 ‘합동 대체 선수 대비 승리 기여도(Joint WAR)’는 “필드에서 선수가 생산하는 기여도를 가능한 한 포괄적이고 정확하게 반영하도록 디자인하였으며, 공개적으로 이용 가능한 WAR 메트릭스와 높은 수준의 상관 관계를 달성하도록 만들어졌다.”
타자는 4개의 카테고리에서 가치를 생산한다.
- 배팅: wOBA에 기반[36]
- 주루: 도루와 타구시 주루 결과(advancing on batted balls)
- 수비: OAA(Outs Above Average)를 기반으로 외야수는 송구, 포수는 프레이밍과 송구로 인한 주자 아웃 그리고 블러킹을 포함한다.
- 포지션 조정
투수 WAR는 기본적으로 bWAR와 fWAR의 조합을 기초로 하며, 불펜의 경우 하이 레버리지 투구 시 가산점을 받는다.#
실제 분배된 결과에 대해서는 MLB distributes first bonuses through Pre-Arb Pool Program 혹은 부분 번역 기사를 참조.
4.2. KBO의 WAR[편집]
KBO는 MLB만큼 자세하고 오랫동안 누적된 Play-by-Play 데이터가 없어서 fWAR나 bWAR 만큼 자세한 WAR를 구하는 것은 무리다. Statiz와 KBReport간의 WAR를 비교하면 조금 차이가 있는데, 편의를 위해 Statiz의 WAR는 sWAR, KBReport의 WAR은 kWAR이라고 부르기로 한다.
이중 KBReport는 투수에 한해 kWAR와 RA9-WAR를 따로 계산했다. 야수의 kWAR는 수비율과 파크팩트는 계산하지 않고 야수의 공격력에 주루기여도, MLB의 포지션 조정상수에 출장 이닝에 비례해서 계산했고,#[37] 투수의 kWAR는 복잡해서 링크로 대신한다. RA9-WAR는 FIP 대신 RA/9(평균실점)을 대입해서 계산했다.# sWAR의 산출방법은 아직 알려지지 않았으나 수비율과 파크팩터까지는 계산한 것으로 알려져있다.
KBO 리그만의 상수가 필요한거 아니냐는 주장이 제기된 WAR의 포지션 조정상수 검토라는 글도 참고하자.
4.2.1. sWAR와 kWAR의 비교[편집]
- sWAR(Statiz)
- 선발투수 평균이닝 6 / 구원투수 평균이닝 3이라 가정.
- 전체 투수 대체 선수 기용시 리그 평균 - 15.8% 기대승률 = 34.2% 기대승률
- 타자 72 - 27승 = 45승
- 리그 평균 대비 (72) - 투수 (22.8) - 타자 (27) = 22.2 승 (기대승률 0.154)
- kWAR(KBReport)
- 전체 투수 대체 선수 기용시 리그 평균 - 9% 기대승률 = 41% 기대승률
- 타자 72 - 18승 = 54승
- 리그 평균 대비 (72) - 투수 (12.96) - 타자 (18) = 41.04 승 (기대승률 0.285)
EqA로 계산시 kWAR는 0.230 / sWAR는 약 0.212 정도가 된다. 그렇다면 어느 곳의 대체 선수레벨이 맞을까?
2006 ~ 2015 팀당 13인 이외의 선수 밖 모든 선수의 EqA 평균을 내면 0.207이다. 이것은 600 타석 기준 리그 평균선수의 WAR는 약 3.22 정도이다. 전 구간은 아니지만 이것을 고려해 볼 때 타자는 sWAR가 정확한 것이 맞다. 애초에 kWAR(KBReport)쪽은 수비 이닝만 같으면 전준우와 박해민의 dWAR을 같다고 하기 때문에 정확할 수가 없다.
4.2.2. 비판점[편집]
KBO리그의 경우 Statiz를 통해 한국프로야구의 WAR가 제공된 이후로 WAR에 대한 언급과 동시에 비판도 늘어났는데, 대부분의 비판이 산출 과정의 문제점을 지적하는 것이 아닌 '어떻게 이 선수가 저 선수보다 잘했다는거냐 말도 안된다'라는 식이다. Statiz WAR의 비판 예시를 몇가지 소개하자면 다음과 같다.
사실 스탯티즈가 개인이 운영하는 사이트이다 보니 오류도 꽤 있었고, 제대로 된 수비 스탯도 측정이 불가능한 한국야구의 여건상 어쩔 수 없는 수치 자체의 문제, 대체 선수의 불균형 등 계산 과정 자체의 문제 등 지적할 점은 꽤 있었지만, 일반인에게 제공되는 정보가 정말 부족한 한국야구에서 그나마 제공된 정보를 최대한 이용하여 한국야구 나름대로의 일관성있는 평가기준[39] 을 세웠으며, 문제점에 대한 피드백을 통해 점차 개선되어가고 있었다. 개개인의 마음 속 가중치를 적용한 고전스탯 측정을 통한 선수평가와 비교하면 상대적으로 근거있고 합리적인 평가기준이라고 할 수 있다.
가장 큰 문제점은 역시 수비에 대한 평가의 신뢰도가 거의 없다시피한 수준이라는 거다. kbreport의 경우 포지션만 구분하고 수비력은 아예 보지도 않는다는 것이 정설이며, 스탯티즈 역시 타구분석따윈 없이 그라운드를 나눈 후 해당 포지션에 타구 책임만은 묻는 정도로만 평가하기 때문에 정확할 수가 없다. 아니, 오히려 이런 수박 겉 핥기 식의 평가는 타격만 보는 것보다 더 부정확할 수 있다. 수비(와 주루)가 타격에 비해 차지하는 비중은 낮지만 절대 무시할 수 있는 수치가 아님에도 불구하고(메이저리그의 사례에도 부족한 공격력을 수비로 메우는 형태의 선수는 WAR에서 수치로 반영이 된다.) 이를 무시하는 것에 가까운 현 상태는 종합스탯이라는 WAR을 안보느니만 못한 정도의 가치로 만들어버린다. 실제로 KBO 야구팬 중 세이버에 어느정도 관심있는 사람은 스탯티즈의 타격 WAR 정도만 참고하거나 아예 WAR은 무시하고 wRC+만 참고하는 상황으로, 현재 KBO에서 종합 WAR이란 스탯은 무가치함에 가깝고, 결국 아직 KBO에서 종합적인 선수평가를 할 수 있는 스탯은 없다고 할 수 있는 상황이다.
5. 계산 과정[편집]
5.1. 타자의 경우[편집]
- 1. 파크팩터가 적용된 wRAA 산출(Batting Run)[40]
- 2. Ultimate Zone Rating 또는 Defensive Runs Saved 산출
- 3. 포지션별 수비기여도 보정
- 4. 주루, 팀배팅 기여도 산출
- 5. 대체 선수 대비 타석수 보정
- 6. 리그 차이 보정
- 7. RAR 산출
- 8. WAR 산출
자, 위의 정보를 바탕으로 2013 시즌 마이크 트라웃의 팬그래프 WAR(fWAR)가 어떻게 나왔는지 간단히 살펴보자.
팬그래프가 제공하는 공식 다음과 같다.# WAR = (Batting Runs + Base Running Runs +Fielding Runs + Positional Adjustment + League Adjustment +Replacement Runs) / (Runs Per Win)[42]
이를 자세히 설명하면 다음과 같다.
팬그래프는 2013년 트라웃이 타격(Batting)에서 평균보다 62.2점 많은 공헌을 했다고 계산했다. 주자(Base Running)로서는 8.2점, 외야수 수비수(Fielding)로는 1.6점의 공헌을 했다고 평가했기 때문에 트라웃의 총 팀 공헌 점수는 72.0점(리그 평균 선수보다 72.0점이 더 높다는 뜻)이었다. 그런데 만약 리그 평균보다 기량이 상당히 떨어지는 대체 선수가 트라웃의 자리에서 한 시즌을 뛰었다고 가정하면, 그 선수는 -20.5점 정도의 공헌을 했을 것으로 예상되기에 트라웃의 평가에 20.5점을 더하게 된다(Replacement). 그리고 수비 포지션 조정 점수(Positional)인 -1.2점을 더해준다.[43] 마지막으로 리그 보정 점수(League) 2.6을 더해준다. 그래서 트라웃이 2013년 대체 선수에 비해 팀에 기여한 총 점수(RAR)는 94.0점(72.0+20.5-1.2+2.6=93.9인데 소수점 두자리의 합에서 0.1이 올라간 것으로 보인다.)이 된다. 1승에 필요한 점수는 빌 제임스가 만든 기대승률 모델을 가지고 각 시즌마다 따로 계산한다.[44] 보통은 10점 당 1승 정도가 되는데, 2013 시즌의 경우는 9.264점이다.# 2013 시즌의 94.0점을 승수로 환산하면 10.1468이 나온다. 따라서 2013 트라웃의 fWAR는 10.1이 된다.
팬그래프에서 선수 성적을 보면 처음에 나오는 항목들이다. 다른 것은 쉽기에 설명을 생략하고, BsR이 주자로서의 점수인 Base Running임을 알 수 있고, Off(Offense)는 Batting과 Base Running(BsR)의 합이다. Def(Defense)는 Fielding에서 Positional을 합친 것이다. 모두 평균적인 선수에[45] 비해 몇 점을 기여했는지를 나타내는 것이고, 거칠게 표현하면 10점당 fWAR 1이라 보면 된다. 결론적으론 Off + Def + Replacement + League = RAR이 된다.
* 다른 방식의 설명
2009년 687타수 단타 98, 2루타 28, 3루타 4, 홈런 31, 4구 85, 고의사구 3, 사구[46] 24, 도루 24개를 기록한 체이스 어틀리의 성적을 이용하여 WAR을 구해보자
687타수 단타 97, 2루타 28, 3루타 5, 홈런 28, 4구 85, 고의사구 3, 사구[49] 24, 도루 24개 홈런의 개수가 3개 줄어든 것을 확인할 수 있다
- 이후 wOBA와 wRAA를 계산해야 한다.
우선 리그평균 wOBA를 구하여 선수의 wOBA를 이용해 wRAA를 계산해야 하는데 wOBA의 계산법[50] 을 참고해라. 이후 (선수의wOBA-리그평균wOBA)/1.15×타석 을 하여 wRAA를 구할수 있다 wRAA란 쉽게말해 타격으로 리그평균대비 몇점을 뽑았는지 라고 생각하면 쉽다 보통 0이하는 후보급선수 0~20 팀내 주전 21~40 실버슬러거를 노려볼만하며 40이상이면 MVP를 노려볼만 하다.
어틀리의 2009년 wRAA는 37.45로 MVP를 노려본 시즌이기도 하다.
어틀리의 경우 600/20×687이기에 백업선수대비 22.90점을 더 득점한 것이다
어틀리의 경우 2루수로 1357이닝을 뛰며 UZR10.9를 기록했다.
포수 : 12.5
유격수 : 7.5
중견수, 2루수, 3루수 : +2.5
좌익수, 우익수 : -7.5
1루수 : -12.5
지명타자 : -17.5
이는 풀시즌 기준이기에 경기수인 162*9 이닝수만큼 나눠야한다
어틀리의 경우 2루수로만 출장했기에 (2.5×1357)/1458 = 2.33의 조정값이 나온다.
어틀리의 경우 23개의 도루를 성공시키고 단 한번의 도루실패도 없으니 23×0.175-0×0.467=4.03의 득점을 기여했다는 것이다
대체선수대비 기여도 22.9
UZR 10.9
포지션조정 2.33
주루 4.03
도합 77.6으로 77.6점에 대해 관여했다 10점당 1승으로 계산하기에 77.6을 10으로 나누어 WAR은 7.76이 되는 것이다
5.2. 투수의 경우[편집]
참고로 설명은 베이스볼 레퍼런스 기준이다. 팬그래프는 사이트에 설명이 있다.
5.2.1. 선발[편집]
5.2.1.1. 원리[편집]
A라는 투수가 9이닝 동안 3실점 할 실력이고 한 시즌동안 180이닝을 던졌다고 가정하자. 해당리그의 평균적인 선수들은 9이닝 동안 5실점 할 실력이라면, 팀은 평균적인 투수와 비교할때 9이닝당 2실점을 이득보는 것이다. 이때 9이닝당 10점을 막는것이 1승의 가치를 지닌다면, 이 선수는 9이닝당 2점을 절약하므로 9이닝당 2/10승(=0.2승)을 팀에 챙겨주는 선수이다. 이때 다른 모든 조건이 동일하다면 한 팀은 50%의 승률을 지니므로 '이 투수가 등판 함으로써' 팀은 9이닝동안 0.7(=0.5+0.2)승을 얻을 것을 기대할 수 있다.
한편 땜빵선수... 다시 말해 대체 선수[53] 는 9이닝당 0.38승을 기대할 수 있는데, 이로인해 A투수는 9이닝당 0.32승을 땜빵선수보다 더 벌어들이는 선수라는 사실을 알 수 있다. 이때 선수가 던진 이닝은 총 180이닝이므로 선수는 한 시즌동안 6.4(=0.32*(180/9))승을 팀에 가져다 바친, 다시말해 WAR 6.4의 피칭을 했다는 것을 알 수 있다. 이때 투수가 배팅으로 기록한 WAR과 피칭으로 기록한 WAR을 합하면 투수의 총 WAR이 된다.[54][55]
5.2.1.2. 계산[편집]
[math(\rm Adjusted~RA = \LARGE{ \frac{\frac{FIP}{lgERA:lgRA}}{Park~Factor}})]
우선 선수가 9이닝당 몇점을 실점할지 계산한다. 여기서 흔히 ERA나 FIP를 떠올리기 쉽지만 그대로 적용해서는 안된다. WAR에서 원하는 실점수준이란 '자책점'이 아닌 '실책이고 뭐고 모조리 반영된 실점'이다.[56] 따라서 ERA와 FIP는 쓰지 않고, RA/9[57] 혹은 RA/9 스케일 FIP를 사용한다.[58] 이때 RA/9 스케일의 FIP는 선수의 FIP에서 (리그 자책점/리그 실점)을 나누어서 구해준다. 이렇게 구한 수치에서 다시 홈구장의 파크팩터를 나누어주면 Adjusted RA가 산출된다.
[math(\rm Runs~Per~Win = \left( \left( \Large{ \frac{ \left(18 - \frac{IP}{GS} \right) \cdot lgRA + \left( \frac{IP}{GS} \cdot Adjusted~RA \right) }{18} } \right) +2 \right) \times 1.5)]
몇점이 1승의 가치가 있는지를 구해준다.
공수 총 18이닝동안 투수가 할 실점, 동료 불펜이 할 실점, 상대팀 투수진이 할 실점을 구한다. 이렇게 구한 값은 18이닝으로 나눈다. +2와 *1.5는 피타고리안 승률을 간소화 시키는 절차에서 들어가는 조정 수치.
[math(\rm Expected~Winning~\% = \Large \frac{League~RA - Adjusted~RA}{Runs~Per~Win} \normalsize + 0.5)]
투수가 등판했을때 팀이 9이닝당 기대할 수 있는 승수를 계산한다.
[math(\rm WAR = \Large{\frac{(Expected~Winning~\% - 0.38)\cdot IP}{9}})]
위에서 구한 9이닝당 기대승수와 '땜빵투수'의 9이닝당 기대승수의 차를 투수가 총 던진 이닝으로 환산해준다.
이렇게 해서 투수의 피칭 WAR을 구할 수 있다.
5.2.2. 불펜[편집]
계투의 경우에는 선발투수와 비슷한 과정으로 계산하되 끝에서 등판 상황의 중요도(Leverage Index)를 적용하는 과정을 거친다. 대체 선수는 선발투수가 9이닝당 0.38승이 기대되는 반면 불펜투수는 0.47승이 기대된다. 불펜투수의 경우 땜빵투수로 대체해도 선발투수에 비해서 팀의 승리에 끼치는 영향이 크지않다. 같은 이닝으로 환산하여도! 때문에 불펜투수는 선발투수보다 높은 WAR을 기록하기가 어렵고 시장에서의 인식도 '쉽게 대체가능한 선수'이다.
6. 평가[편집]
그야말로 세이버메트릭스 스탯의 공수주를 아우르는 총체이자 정수라고 할 수 있는 선수 평가 기준이다.
위에서 제시한 계산법은 하나의 보기일 뿐이며 선수의 플레이를 득점단위로 환산해서 대체 선수와 비교해 평가한다라는 틀만 있다면 계산방식은 얼마든지 달라질 수 있다. 파크팩터를 넣어도 되고 빼도 되고, 투수의 실점능력을 판단하는데 사용할 수 있는 스탯도 FIP, SIERA, ERA, RA/9 등 뭘 사용해도 된다. 주루나 수비능력에 있어서 대체 선수의 기준을 따로 잡을 수도 있다. 실제로 WAR를 제공하고 있는 매체에 따라 WAR는 제법 차이가 나는 편이다.
득실점 기여도를 가지고 평가하기 때문에 투수와 타자의 직접 비교가 가능해진다. 정확한 설명은 아니지만 이해를 쉽게 하기 위해 예를 들자면, 타격으로 팀 득점에 대체 선수 대비 +10점을 기여한 타자와 피칭으로 팀 실점에 대체 선수 대비 -10점을 기여한 투수는 기여도가 같다고 생각하면 쉽다.[59][60][61]
선수를 평가할 때 WAR만 가지고 평가하는 세이버메트리션들은 '한가지 스탯만으로 평가하는건 시각이 좁은 것이다'는 말을 듣기도 하는데, WAR 자체가 수많은 변형 형태를 가진 종합평가스탯이므로 '타율만 보지말고 홈런도 봐야지'라는 식의 고전스탯 판단 기준을 적용할 필요는 없다. 처음부터 포지션이나 팀내 사정 등 여러가지 여건이 다른 선수들을 한눈에 보고 비교하려고 줄세우려 이것저것 다 짬뽕한 스탯이 WAR임을 잊지 말자.
물론 WAR는 같아도 팀 사정상 가치가 달리지는 경우도 많고, 각각의 세부 항목에 적용된 스탯도 완벽할 수는 없으므로 여러 가지를 볼 필요는 있다.[62] 또한 WAR도 계산방법(특히 야수의 수비)에 따라 결과가 다양하게 나오므로 WAR 제공 매체별로 차이가 나는 평가 항목들도 살펴보는 것이 좋다.
연봉조정 과정에서 자신이 왜 이 돈을 받아야 하는지 혹은 구단에서는 왜 그 돈을 줄 수 없는지 설명해야 하는데, 거기에서도 fWAR, bWAR는 흔히 근거로 인용된다. 최지만의 연봉조정 뒷이야기 기사를 살펴보면 간접적으로 이를 알 수 있다.
7. 비판과 반론[편집]
WAR에 대한 비판 중 가장 흔한 비판은 수비 스탯에 대한 비판이다. 수비 스탯을 신뢰할 수 없으니 그것을 사용하는 WAR 또한 신뢰할 수 없다는 것. 이런 경우 흔히 언급되는 수비 스탯에 대한 비판의 근거는
- 1. "수비는 눈으로 직접 보지 않고서는 제대로 된 상황을 읽어낼 수 없다."
- 2. "연간 변동폭이 지나치게 크다."
정도가 있다. 어느 정도 수긍이 가는 점이 있지만 편견에 사로잡힌 의견이기도 하다.
일단 1번 항목의 경우 KBO에서만 해당하지 MLB에서는 실제로 보고 평가한다. UZR이나 DRS를 계산하기 위해선 수많은 타구와 야수들의 플레이에 대한 정보가 수집돼야 하는데, 이 정보들은 바로 비디오 스카우트라 불리는 사람들이 경기를 직접 보면서 수집, 가공한 것들이다.# 이를 생각해보면 결국 수비 스탯이야말로 모든 경기, 모든 상황을 눈으로 직접 보고 평가한 결과물에 가깝다.
또한 2.의 경우, 실제로 수비 기록은 타격에 비해 변동이 크다. 타격에 비해 수비 스탯의 연간 변동폭이 큰 이유는, 애초에 자기 앞으로 타구가 와야 수비 기회가 주어지므로 타격 기회보다 안정적으로 주어지지도 않고, 애초에 횟수가 적어서 샘플이 적으며, 실점과 관련된 시추에이션은 더더욱 낮다,[63] 거기에 타구의 질은 수비수가 전혀 제어할 수 없기 때문에 가뜩이나 적은 샘플이 더 운에 좌우하기 때문이라고 볼 수 있다. 실제 수비 기회를 200회 이상으로 잡는다면 UZR의 연간 상관 관계는 500타석 이상으로 설정한 wOBA의 상관 관계와 맞먹는 값이 나오게 된다.# 어찌됐든 분명한 것은, 현재의 UZR 또는 DRS를 사용한 WAR이 사용하지 않은 WAR보다 나은 결과를 낸다는 점이고 수비 스탯을 WAR에 활용할 당위성은 충분하다고 볼 수 있다.#
자신의 생각과 다른 평가가 나오는 이유를 포지션 문제로 생각해서 포지션간 보정이 들어가므로 다른 포지션의 선수들을 비교하는데는 적합지 않다는 의견이 있으나, 일반적으로 포지션 상관없이 일관적으로 대체 선수가 적용되기 때문에 타격스탯은 포지션과 상관이 없다.[64] 다만 수비스탯에 있어서 과거의 사례를 기준으로 한 포지션별 난이도 보정을 거치는 과정이 있는데, 이 부분은 보정을 안하면 오히려 불공평해 진다.
위에서 언급했듯 어떤 식으로든 득실점에 기여한 정도를 가지고 승수에 대한 기여를 통해 합리적인 가치평가를 하기 위해 만들어진 개념이므로 투수와 타자 비교, 포지션간 비교를 빼면 WAR은 의미가 없어진다.
또한 많은 이들에게는 세이버메트릭스는 주루와 수비를 과소평가한다는 근거없는 선입견이 있어서 WAR도 그러할 것이라고 생각하는 경우도 있지만,[65] 사실 WAR은 그 반대로 타격이 좀 딸리는 선수라도 수비와 주루를 쏠쏠하게 해주면 좋게 평가해주는 수치라서 시즌 WAR 순위를 보면 타격으로는 생각보다 임팩트가 없었던 선수가 상위권에 위치하는 경우가 아주 많진 않아도 쉽게 찾아볼 수 있을 정도로 있다.
예를 들어 체이스 어틀리는 전성기인 2005~2010년동안 클래식 스탯에선 넘사벽 급인 알버트 푸홀스와 자웅을 겨룰 법한 WAR를 기록했는데, 그 이유는 어틀리가 꾸준히 보여준 리그 최고 수준의 2루 수비와 주루능력 덕이다.[66][67] "꾸준히"라는 말이 생각보다 중요한데, 1~2년이 아닌 10년 가까운 장기적인 시각에서 볼 때 어틀리나 스즈키 이치로급의 꾸준함이 없이는 수비와 주루 WAR로 좋은 평가를 받기는 힘든 면도 있다. 웬만한 수준으로 오랜기간 커리어를 쌓는 선수들은 나이가 먹어가며 타격능력보다 빠르게 감퇴(포지션을 옮기든 도루가 줄든)하게 마련이기 때문이다.
계산과정 설명 중에 나온 포지션 보정을 봐도 포수가 수비력만으로 1루수에 비해 풀시즌 기준 2.5점을 더 먹고 들어가는데, 이건 상당히 높은 수치다.[68] 주루에 있어서도 각종 주루 수치, 하다못해 도루와 도루자로 발생하는 Run의 득실만으로도 따로 놓고보면 무시될 수준이 절대 아니다.
오히려 수비를 과대평가한다는 비판도 있다. 이에 대한 답은 WAR 지표는 수비 스탯을 과대평가한다?를 참조.
기여도가 나눠먹히는 문제가 있다는 비판도 있다. 이를 주장하는 견해는 다음과 같이 설명한다.
- (사례 1) 리그만 다르고 기타 조건은 같은 두 팀에 각각 속한 우수한 선수 A와 B가 있다고 가정해 보자. 1시즌에서 A와 B의 팀은 각각 전승을 했고 A와 B는 똑같이 WAR 10을 얻었다. 2시즌에서 A와 B가 같은 팀이 되었고 팀은 전승을 했다. 만약 A와 B가 각각 지난 시즌의 WAR을 유지하기 위해서는 10승을 더 해야 한다. 하지만 2시즌에서도 팀에 떨어지는 승수는 1시즌과 동일하므로 나눠먹기가 이루어지며 A와 B는 필연적으로 WAR가 지난 시즌에 비해 줄어들게 된다.
- (사례 2) 비슷하게 기량이 동일한 선수 둘이 각각 강팀과 약팀에 속해 있고 나머지 조건이 동일하다고 한다면 WAR은 약팀에 속한 선수에게 더 유리하다. 강팀에는 기량이 뛰어난 선수가 여럿 포진하여 기여도가 나눠먹히기 때문이다.
팀 승리 숫자에 따른 계수 조정은 없다. 물론 타자구장, 투수구장 조정이 있지만 이는 파크팩터 반영 여부의 문제이지, 승리가 많은 팀 적은 팀 구별 문제와는 논의의 평면을 달리한다. 즉 마이크 트라웃이 홈런을 10개 치든, 무키 베츠가 홈런을 10개 치든, 에릭 호스머가 홈런을 10개 치든 똑같은 성적을 내면, (파크팩터를 무시한다면) WAR는 똑같다. 위에서 비판 견해가 제시하는 예에 대한 답을 하자면 다음과 같다.
사례 1의 경우 전체 리그의 변동이 없는 1시즌과 2시즌에 A, B가 매시즌 모두 똑같은 성적을 거두었다면, A와 B는 1시즌이든 2시즌이든 각각 10WAR씩 부여받는다.
사례 2의 경우 강팀이든 약팀이든 동일한 성적을 찍었다면 동일한 WAR가 나온다. 애초에 승리를 나눠먹는 개념이 맞다 하더라도 사례 2는 강팀이 더 많이 승리하고, 약팀은 더 적게 승리할 것이며, 각각 이를 나눠 먹을 것이므로 전제 자체도 잘못되었다.
WAR 자체의 결함은 아니지만 투수 평가를 위해 FIP을 사용하는 fWAR에 관한 문제가 존재한다. FIP은 엄연히 경기의 일부인 운의 요소를 고의적으로 배제하여, 그 해의 성적보다는 선수의 원래 실력이나 다른 스탯의 기대치를 계산하자는 취지에서 만들어진 스탯인데, WAR이 지향하는 것은 운이 좋았건 말건 대체선수보다 얼마나 승수를 추가시켜주었느냐는 것이지 선수의 미래 가치 계산이나 다음 해에 어떤 성적을 낼 지 따위가 아님에도 불구하고 fWAR에서는 투수의 성적 계산에 FIP을 사용하고 있어 스탯 자체로는 나름의 의미가 있더라도 '대체선수 대비 승리 수'인 WAR로서는 적절한지에 대한 의문이 있을 수밖에 없다.
또한 WAR을 단순히 비례적인 스탯으로 간주해 1 WAR당 가치를 산정하고는 선수를 비교하는 경우도 자주 있는데, 이는 잘못된 계산법이다. 물론 이것도 WAR 자체의 결함은 아니지만, 각종 기사들과 매체에서 이런 방식으로 선수들을 비교하는 경우는 아주 흔하다. 그러나 WAR 0의 선수는 대체 선수로서 대부분 2군에서는 충분히 주전으로 뛰는 선수이고, 당연히 이에 따른 연봉을 받을 수 있다. 최상위 리그에서 WAR가 0보다 낮은 선수 또한 연봉을 받음은 물론이다. 또한 WAR 2의 선수를 WAR 4의 선수로 대체하는 것은 WAR 0의 선수를 WAR 2의 선수로 대체하는 것보다 공급의 부족으로 인해 훨씬 어려우므로, 이 두 경우의 선수 영입에 들어가는 비용은 WAR에 정확히 비례하지 않는다. 그리고 구단에게는 단순히 WAR의 총합을 올리는 것이 아닌, 포지션에 따라 필요한 선수를 영입하는 것도 중요하므로, WAR가 높은 선수의 수요는 항상 유동적이어서 이런 선수들의 연봉 또한 리그와 구단의 상황에 따라 크게 변할 수 있다. 따라서 WAR 1의 가치가 균등하다고 볼 수 없기에, 연봉을 WAR로 나누어 비교하는 것은 제대로 된 비교라고 할 수 없다.
또한 WAR 평가의 문제는 팀에 있어서는 단순히 덧셈만으로 결과를 평가해서는 안되는 경우가 있다는 것이다. WAR은 기본적으로 누적 스탯이기 때문에 불펜보다는 선발, 지명타자보다는 야수 쪽 수치가 높은 구조를 갖는다. 하지만 뉴욕 양키스나 LA 다저스와 같은 팀에서 WAR 합계가 90이라고 가정했을 때, WAR 3.0급인 선발 투수와 WAR 1.5급인 불펜 투수 중 누구를 영입해야 월드 시리즈를 우승 할 수 있는가?라는 문제에 대한 해답이 애매해진다. WAR을 단순 덧셈으로 보면, 불펜이 약한 팀이라면 WAR 1.5급의 불펜 투수를 영입해야함에도 불구하고, WAR 3.0급의 선발투수를 영입해서 팀 WAR을 93으로 만들어야 한다는 결론이 되어 버린다. 선발투수가 WAR 숫자가 더 높다고 해서 모든 투수를 선발로만 구성 할 수는 없다. 또한 WAR의 의미를 잘 새겨보면, '대체 선수' 대비 승리기여이기 때문에, 그 팀에 대체 선수 급을 WAR 3.0급 선발 투수가 대체할 상황이라면 당연히 그 선발 투수를 영입하는게 맞다. 하지만 컨텐더급 팀에서는 WAR 0점에 달하는 선수가 선발 투수일리가 거의 없기 때문에 WAR이 3.0 넘는 선발이 오더라도 그만큼 효과가 없는 것이다. 예를 들어 WAR 2.0의 선발을 WAR 3.0 선수가 대체하면 단순하게 따졌을 때는 1.0 정도 오르지만, WAR 0.0의 불펜을 WAR 1.5 불펜이 대체하면 1.5가 오르는 산수가 가능하다. 그래서 단순 산수를 하더라도 '대체를 해야 할 상황'인지를 살핀 다음에 덧셈을 해야 한다는 뜻이다.
7.1. 수비의 비중은 과연 얼마인가[편집]
2014년에 제프 파산에 의해 주류 언론에서 수비에 대한 과대평가 논란이 일었다.
이에 대해 많은 사람들이 반응했는데, 그 중 팬그래프의 수장인 데이브 카메론의 A Discussion About Improving WAR를 살펴본다.
WAR 개선에 대한 논의
제프 파산은 주류 미디어에서 팬그래프를 가장 적극적으로 옹호하는 사람 중 한 명으로, 정기적으로 순위표의 데이터와 개념을 인용하고 대중에게 야구를 보는 다양한 방식에 대해 가르치는 데 도움을 준다. 파산은 확실히 투승타타를 믿는 올드 스쿨 인물이 아니며, 데이터로 지원되는 새로운 아이디어를 기꺼이 받아들인다. 그러나 그는 여전히 WAR에 몇 가지 문제가 있으며, 특히 수비 요소가 가장 가치 있는 선수 논의에 타격 미달 타자를 야구 최고의 강타자와 어깨를 나란히 할 수 있게 만들어 주는 것에 대한 문제를 제기한다. 그의 주장을 전체적으로 이해하려면 그의 기사 원문을 읽으라. 내가 그의 주장 중 핵심으로 선택한 문단은 다음과 같다.
수비는 WAR에서 한 몫을 차지한다. Just not in its present incarnation, not until we know more. 필드에서의 포지셔닝을 설명할 수 있을 때까지는 아니어야 한다. 타구가 배트에 맞는 순간 정확한 속도와 야수가 얼마나 빨리 내딛는지, 타구에 대한 각도와 공에 도달하는 효율성을 알 수 있을 때까지는 아니어야 한다. 우리가 수비에 대해 더 많이 이해하고 수비 플레이에서 가치를 적절하게 측정하는 방법을 이해할 수 있을 때까지는 그렇지 않아야 한다. 그렇다. 몇 년이 걸릴 수도 있다. but look how long it took us to get to this point, where we know more about hitting and pitching than anyone ever thought possible.
이것을 “WAR, 그게 무슨 소용이야, 전혀 무가치하다.”라고 외치는 진부한 러다이트들에 동조하는 견해로 보아서는 안 된다. 반대로 WAR는 누가 최고인지에 대한 논쟁을 민주화하려는 노력인 놀라운 아이디어다. 이처럼 몹시 주관적인 진술에 어떠한 형태의 객관성을 부여하는 것은 매우 어렵고 가치 있는 작업이다.
그렇기 때문에 적어도 책임자들 사이에서 더 많은 대화가 필요하다. 그들은 이전에 WAR 공식을 변경했다. (언젠가) 그들은 다시 바꿀 것이다. 그리고 그럴 때 수비 지표의 영향력이 최소화되기를 바란다.
나는 파산이 해당 기사에서 쓴 모든 것을 부정하지만(I don’t agree with everything Passan wrote in the piece, but), 그의 측정 기준에 대한 비판이 완전히 근거가 없는 것은 아니다. 실점 방지(run prevention)보다 득점(run scoring)을 평가하는 것이 더 쉽다. WAR는 결함이 있고 불완전한 모델이다. 모델 구성의 일부 가정은 완전히 틀릴 수 있으며, 더 많은 정보를 얻으면 WAR가 제안한 결론 중 일부가 틀렸으며, 그것이 적지 않을 수도 있음을 알게 될 것이다. 통계 커뮤니티가 투수 승률과 타점의 문제를 빠르게 조명한 것처럼 파산이 WAR의 문제를 조명하는 것은 타당하다. 그 논의의 목적이 모델을 개선하는 데 도움이 되는 것이라면 더욱 그러하다.
그럼 WAR 개선을 위한 파산의 제안에 대해 이야기해 보자. 주로 그는 선수의 계산된 값을 어느 정도 후퇴(regressing)시켜, 계산에서 수비 값을 낮출 것을 제안한다. 이것이 처음 제안된 것은 아니며, 비슷한 의견을 가진 내가 존경하는 많은 사람들이 있다. 터무니 없는 제안이 아니며, 더 나은 대안이 될 수도 있다. 그러나 두 가지 방법을 나란히 평가할 수 있도록 해당 변경 사항의 의미를 살펴본다.
현재 우리는 2,430경기당 1,000 WAR(각각 162경기를 플레이하는 30개 팀)을 나눠주고 1,000 WAR 중 570은 포지션 선수(야수)에게, 나머지 430은 투수에게 주어지도록 분할하고 있다. 이 57/43 스플릿은 타자가 경기 전체 중 절반인 득점 부문에서는 전적인 책임을 지고, 나머지 절반인 실점 부문에서는 일부 몫만 책임이 있다는 것을 의미한다. 우리가 포지션 선수들에게 파이의 57%를 준다는 사실은 실점 방지가 86%의 투구와 14%의 수비로 이루이지는 것이라 생각한다는 것을 의미하지만, 그 수치는 계시처럼 전해지는 것이 아니며 합리적인 사람들의 논의에 따라 달라질 수 있는 것이다.
예를 들어 WAR의 수비 요소가 단순히 절반으로 줄었다면(투수는 실점 방지에 93% 책임이 있고 수비수는 파이의 7%만 차지함), 실점 방지에 대한 공로의 변화를 인정하고 움직여야 한다. 따라서 57/43 스플릿 대신 포지션 플레이어와 투수 사이에 53.5/46.5 스플릿이 대두된다. 그것이 더 바람직할 수도 있겠지만, 현재 WAR에서 사용하고 있는 것보다 포지션 플레이어와 투수 사이의 간격이 더 작다는 증거가 있는가?
이를 시험하는 한 가지 방법은 MLB의 실제 급여 할당을 살펴보는 것이다. 지난 2월에 Wendy Thurm은 각 팀의 급여를 분석하여 포지션 플레이어, 선발 투수, 불펜 투수에게 지급된 총 급여와 비율을 기록했다.# 선발 투수와 불펜 투수의 합계를 합친 다음 라인업과 벤치를 합치면 MLB 팀이 적어도 급여 측면에서 선수/투수 스플릿 포지션으로 정한 것을 볼 수 있다.
그녀가 조사한 전반적인 수치는 2014년 선수 급여에 대한 총 리그 지출에서 33억 달러를 조금 초과했다. 그 33억 달러 중 19억 달러는 타자에게, 14억 달러는 투수에게 할당되었다. 올해 팀이 결정한 급여 분할은? 57/43, 현재 WAR에서 사용하고 있는 것과 동일한 비율이다. 이것이 일종의 결정적인 답은 아니겠지만, 수비 계산을 제한하는 데 필요한 결론인 팀들이 투수가 포지션 선수보다 더 높은 가치가 있는 것을 시사하는 방식으로 돈을 쓰고 있다는 증거를 우리는 찾지 못했다.
그리고 포지션 플레이어가 투수보다 상당히 더 가치가 있다는 생각이 새로운 세이버메트릭 개념은 아니다. 비트 라이터들은 가장 뛰어난 투수조차도 매일 플레이하지 않기 때문에 강력한 MVP 후보가 아니며, 따라서 6개월 동안 매일 안타와 수비를 하는 포지션 플레이어만큼 가치가 없다고 오랫동안 주장해 왔다. 수비의 가치를 제한하는 것이 WAR를 향상시킬 것이라고 생각한다면, 우리는 역사적으로 급여 부문에서 타자/투수 분할이 수년 동안 지속되었기 때문에 투수들이 꽤 오랫동안 드라마틱하게 과소평가(및 과소급여)되어 왔다고 주장해야 한다.
그것이 올바른 입장일 수도 있지만, WAR에서 수비의 가치를 떨어뜨리는 것은 왜 팀들이 지출과 관련하여 포지션 선수를 과대평가하고 투수를 과소평가하는지에 대한 설명이 선행되어야 한다. 그럴 수도 있지만, 팀들이 현재 모델링된 것보다 더 작은 포지션 선수/투수 스플릿을 구매하고 있다는 증거가 많지 않다는 점을 고려해 볼 가치가 있다고 생각한다. WAR의 분할이 급여의 분할과 일치한다는 사실은 결정적 단서는 아니지만, 적어도 포지션 플레이어 쪽에서 투수 쪽으로 가치를 이동하는 개선을 통한 WAR의 결함 보완을 고려할 것인지 여부에 대해 생각하기 전에 멈춰야 할 지점이다.
사실, 57/43 스플릿이 수비 가치를 과대 평가한다는 증거만큼 수비 가치를 과소 평가한다는 많은 증거가 있는 것으로 보인다. 로버트 아서는 몇 주 전에 ERA를 요약하려는 선형 회귀에서 수비 메트릭의 값을 모델링할 때 다음과 같이 언급했다.#
BP의 FRAA와 마찬가지로 FanGraphs의 UZR에 기반한 dWAR(디펜스 WAR, 즉 수비 WAR)은 ERA 모델에 어느 정도 정확도를 제공한다. 그리고 BP의 수비 지표와 마찬가지로, 만약 오류가 발생한다면, 수비에 가중치를 충분히 두지 않은 것이다. 최적의 정확성을 위해 플레이어의 수비 통계 간의 차이를 후퇴시키는 것이 아니라(not regressing them) 강조해야 한다.
이러한 결과가 전적으로 놀라운 것은 아니다. 수비 WAR는 하늘이 내려준 진리가 아니다. 그것은 실점(runs allowed)에 대한 우리의 이해를 향상시킨다는 사실에 대한 완전한 지식을 가지고 (매우 유능한 sabermetricians에 의해) 설계되었다. 수비 플레이를 실점으로 변환하는 계수는 모자(hat)나 난수 생성기(a random number generator)에서 임의로 선택되지 않고, 오히려 ERA와 같은 항목에 맞는 결과 모델의 능력에 최소한 어느 정도 주의를 기울여 보정되었다. 이러한 이유로 수비 메트릭이 ERA 예측에 적합하다는 사실은 놀랍지 않은 일이다. 실제로 두 모델(FG 및 BP)에서 관찰된 작은 오류는 방어 지표가 약간 활용도가 낮은 설계에 의한 것이라고 장담한다.
이 실험을 고려하면, 파산의 주장에도 불구하고 전체적으로 수비 WAR의 가중치에 특별한 문제가 있다고 생각하지 않는다. 특히 알렉스 고든의 dWAR(또는 누구든지)에 문제가 있을 수 있다. Yet, the overall weighting of dWAR is reasonably accurate, or it would have been discarded for something different.
우리의 수비 추정치에 대한 신뢰가 공격 추정치에 대한 신뢰보다 떨이진다는 진술은 전적으로 옳다. 그러나 그 진술은 우리가 수비 지표를 후퇴시키더라도 여전히 사실이며, WAR의 구성 요소에서 수비 요소를 제외하면 지표의 정확성이 더더욱 침해될 수 있다. WAR와 같은 모든 총 가치 지표는 포지션 선수의 수비 기여도에 대한 가치에 대해 어느 정도의 몫을 가정해야 한다. 더 작은 범위의 기여가 보기에는 더 좋을 수 있지만, 실제로는 더 부정확할 수 있다.
불확실성은 양방향으로 진행된다. 현재 수비 지표 자체가 실점 방지 가치의 14%를 포지션 플레이어에게 할당하는 데, 이것이 너무 급진적이라는 강력한 증거는 없다. 올바른 숫자가 10% 또는 12%일 수 있는 것처럼 16% 또는 18%일 수도 있다. 나는 5-10%(또는 15-20%) 사이의 무언가보다 10-15% 사이의 무언가를 지지하는 증거가 더 많다고 제안하고 싶다. 수비의 가치를 제한하는 것은 WAR를 플레이어 가치의 더 나은 모델이 아니라, 더 나쁜 모델로 만들 것이다.
이는 57/43 분할이 바이블이기에 변경할 수 없다거나, 어떤 식으로든 WAR의 수비 요소는 조정될 수 없다는 선언이 아니다. 우리는 모델이 우리가 가진 데이터의 가능한 최선의 사용과 야구 선수의 가치 평가 방법에 대한 대중의 이해를 반영하기를 원한다. 확실히 수정하고 싶은 모델의 결함이 있으며, 이러한 문제 중 일부를 해결할 수 있는 변경 사항을 구현하는 방법에 대해 수많은 논의를 거쳤다.
예를 들어, 포수 프레이밍은 WAR에 중요한 추가 사항이 될 것이며, 우리는 프레이밍 메트릭에서 제안하는 매우 높은 값을 WAR에 구현하는 적절한 방법에 대해 많은 시간을 보냈다. 아직 최상의 솔루션이 있는지 확신할 수 없기 때문에 지금 시점에서는 구현하지 않았다. so we have left the model incomplete and wildly incorrect for some players, while attempting to acknowledge that limitation along the way. The addition of framing — which probably isn’t too terribly far away at this point — will also have ramifications for how we think about pitcher WAR, as the acceptance of framing runs saved necessarily requires pitchers to receive altered credit for their contributions to walks and strikeouts at the least.
실상은 실점 방지 해석이 어렵고, 모델의 문제를 모두 지우는 마법 같은 해결책이 없다는 것이다. 수비 요소를 후퇴시키는 것은 가치 있는 노력이 될 수 있으며, 이는 우리도 고려했었고 계속 고려할 것이다. 우리는 많은 사람들이 피칭 WAR에 대해 실점 기준(a runs allowed basis)을 선호한다는 것을 알고 있으며, 투수에 대해 사용하는 계산을 변경할지 여부에 대해 많은 대화를 나누었다. 모델에 대한 파산의 비판이 너무 지나칠 수도 있지만, 모델에 문제가 있고 개선해야 할 영역이 있다는 그의 말은 틀리지 않았다.
현재 계산의 문지기가 되어 더 나은 계산을 막으려 하는 것이 아니다. 이것이 현재 우리가 생각하는 최선이기 때문이다. 우리는 포지션 플레이어를 위한 도루가 아닌 베이스 플레이에 베이스런을 추가하는 것부터 내야 플라이에 대해 투수의 몫(crediting)을 인정하는 것까지 수년에 걸쳐 WAR에 많은 변화를 주었다. 작년에 우리는 베이스볼 레퍼런스와 통합 대체 수준을 결정했다. 이 모델은 지속적으로 검토 및 업데이트되고 있으며, 시간이 지남에 따라 계속 개선되기를 바란다.
그래서 나는 독자들에게 이 질문을 던질 것이다. 파산은 수비 요소가 최소화되면 WAR에 더 좋을 것이라고 제안했으며 실점 방지에 대한 몫 중 일부는 포지션 플레이어에서 투수로 이동했다. 동의하는가? 아래에 간단한 예/아니오 설문 조사가 있지만, 보다 심층적인 응답을 듣고 싶다.[70] 57/43 스플릿이 득점 방지에 대한 포지션 플레이어의 기여도를 너무 강조한다는 데 동의한다면, 선호하는 타자/투수 스플릿은 무엇인가? WAR에서 후퇴 버전의 수비 구성 요소를 사용하는 것을 선호한다면 숫자를 얼마나 후퇴시키고 어떤 의미로 후퇴하겠는가?
우리의 희망은 항상 WAR가 합리적으로 가능한 최선의 모델이 되는 것이다. 제안된 변경 사항의 결과를 고려할 때, 어떻게 개선하겠나? 그리고 모델을 변경하면, 플레이어 가치에 대한 현재 인식에 더 호감이 갈 뿐 아니라 실제로 더 나아질 수 있다는 것을 보여줄 수 있는가? 모델에 대한 개선이 합리적이라고 입증될 수 있는 경우, 개선이 이루어질 것이다. 우리는 WAR의 불완전성에 대해 무지하지 않으며, WAR가 필요 이상으로 계속되기를 원하지 않는다.[71] 우리의 목표는 모델을 발전시키는 것이며, 이를 수행하는 방법에 대한 제안을 환영한다.
8. KBO와 WAR[편집]
메이저리그는 십년도 더 전부터 세이버메트릭스를 적극 받아들여 사실상 현 존재하는 모든 지표 중 가장 신뢰하는 기준이 되었다. 선수들의 연봉 그리고 연봉조정 때에도 WAR를 기준삼고 진행하며 FA 등 계약을 할 때도 WAR가 주요하게 작용한다. 하지만 KBO는 여전히 세이버메트릭스에 대해 중요히 여기지 않는 모습을 보인다. 골든글러브 시상에도 해당 포지션의 WAR 1위 선수가 골든글러브를 수상한 경우는 70%정도이며 30%정도가 포지션에 1위를 했음에도 수상에 실패한 것이다.[72] 2017년에는 무려 6명의 선수가 해당포지션에서 1위가 아님에도 수상을 했다. 가장 최근인 2022년에도 전체 3위의 최지훈이 수상을 실패했다.[73] MVP의 경우는 WAR 1위 선수가 수상할 확률은 30%대에 머물고 있다. 이는 여전히 투승타타에 목메고있는 기자들의 이름값투표 단순 숫자투표가 한몫 하고 있는 것이다.
허나 이는 단순 비야구인만의 문제가 아닌데 2021 올림픽 야구 국가대표 라인업을 보면 WAR와는 전혀 관련없는 엔트리가 나왔고 결과는 참담했다. 물론 국제대회 같은 경우는 순수 실력뿐만 아니라 좌투인지 우투인지, 경험, 수비특화, 주루특화, 병역 문제 등 고려요인이 많다.
9. 감독 WAR는 몇일까[편집]
유명한 통계사이트 파이브서티에이트닷컴은 메이저리그 감독들의 ‘실력’을 계산봤는데, 그 방법은 선수들의 대체선수 대비 승리기여(WAR)의 변화를 계산해 ‘예상 WAR’을 설정하고, 각 시즌의 로스터를 분석해 예상 WAR과 실제 WAR의 합계 등을 조합한 것. 이를 통해 ‘100년 넘는 메이저리그의 모든 감독 중 95%는 팀 성적에 겨우 2승 정도만 영향을 미친다’는 결론을 얻었다. 뛰어난 감독이라도 실제 전력에 2승을 더할 수 있고, 경기 운영을 엉망으로 해도 실제 전력에 2패 정도 더하는 게 전부다. 물론, 통계적 문제는 있다.[74] 조사자인 닐 페인은 “감독의 실제 실력을 파악하기 위해서는 1000경기 이상의 샘플이 필요한 것 같다”고 말했다.#
이는 감독의 경기 내의 영향력이라고 볼 수 있으며, 선수 기용이나 선수단 분위기 조성 등 흔히 감독의 역량이라 불리는 부분은 포함되지 않은 수치라 볼 수 있다. 물론 이를 측정하는 것 역시 어떤 요소를 반영해야 할지를 따지는 것부터 매우 어려운 일이기도 하고
10. 통산 WAR 순위[편집]
10.1. MLB[편집]
10.1.1. 역대[편집]
10.1.2. 현역[편집]
10.2. KBO[편집]
10.2.1. 역대[편집]
10.2.1.1. 타자[편집]
10.2.1.2. 투수[편집]
10.2.2. 현역[편집]
10.2.2.1. 타자[편집]
10.2.2.2. 투수[편집]
11. 역대 WAR 당해시즌 1위와 MVP[편집]
11.1. MLB (1995~)[편집]
11.1.1. AL[편집]
11.1.2. NL[편집]
11.2. KBO[편집]
스탯티즈 기준 KBO에서 연도별 sWAR 최강자는 다음과 같다. sWAR 1위가 아니면서 MVP를 탄 선수는 비고란에 추가 설명을 추가한다.
비고란을 보면 알 수 있듯이 KBO MVP는 세이버 스탯은 거의 안보고 타이틀 및 클래식 스탯(타자는 홈런왕, 투수는 다승왕 타이틀에 가장 큰 비중을 둔다)과 당해 임팩트, 그리고 상징성으로 수상하는 경우가 많다. 타격왕 홈런왕이면 다른 기록은 보지도 않고 무조건 후보에 올리지만 이 두 타이틀 중 하나라도 없으면 거의 후보조차 안올려주던게 원년부터 2010년대 후반까지의 역사다. [106] 비공식이지만 리그와 무관한 국가대표 활약 가산점이나 한국시리즈 우승팀의 에이스/최고 타자는 우승팀 프리미엄까지 받는다. 또한 1980년대는 투수혹사가 많았던 시대라 WAR 1위는 투수가 많다. 1980년대에 국한하지 않더라도 KBO는 리그에서 가장 가치있는 선수(WAR가 높은 선수)가 투수인 경우가 많은 리그이기는 하다.[107] 류현진이 MLB로 진출한 이후로는 타자들의 리그 WAR 1위를 많이 차지한 편이지만, 2018년 이후 3년간은 다시 투수들이 1위를 차지했다. 야구 실력 외 요소(약물전력 등)에 대한 서술은 KBO MVP/비판 및 논란 문서 참조.