워크포워드 분석과 과최적화 판별법
최종 업데이트: 2026-05-20 | 예상 읽기 시간: 20분
백테스트에서 우수한 성적을 보인 EA가 실제 시장에서는 전혀 통하지 않는 경우가 있습니다. 그 가장 큰 원인이 과최적화(커브피팅)입니다. 워크포워드 분석은 EA가 '단순히 과거에 맞춰진 것'인지 '진정한 우위성을 가진 것'인지를 구분하기 위한, 가장 신뢰할 수 있는 검증 방법입니다.
워크포워드 분석이란
워크포워드 분석(Walk-Forward Analysis, WFA)이란 과거 데이터를 '최적화에 사용하는 기간(인샘플 / IS)'과 '검증에만 사용하는 기간(아웃오브샘플 / OOS)'으로 나누고, 이를 시간 순서에 따라 이동하면서 반복하는 검증 방법입니다.
예를 들어 2015~2017년 데이터로 파라미터를 최적화하고, 그 설정 그대로 2018년에 테스트합니다. 다음으로 2016~2018년으로 최적화하여 2019년에 테스트하는 방식으로, 창을 슬라이드합니다. OOS 기간은 'EA가 한 번도 본 적 없는 미래 데이터'이기 때문에, 실제 운용에 가까운 성적을 얻을 수 있습니다.
일반 백테스트와의 차이
| 항목 | 일반 백테스트 | 워크포워드 분석 |
|---|---|---|
| 평가 대상 데이터 | 최적화에 사용한 것과 같은 기간 | 최적화에 사용하지 않은 미래 기간 |
| 과최적화 검출 | 불가 (오히려 숨겨짐) | 가능 (OOS에서 성적이 무너짐) |
| 결과 신뢰성 | 낮음 (과거 데이터 맞춤) | 높음 (실제 운용에 가까움) |
| 필요 데이터 양 | 수년치 | 10년 이상이 바람직 |
| 작업량 | 적음 (1회 실행) | 많음 (창 수만큼 반복) |
| 알 수 있는 것 | 과거에 수익이 났는지 | 미래에도 통할 가능성이 있는지 |
과최적화의 전형적인 징후
다음과 같은 특징을 가진 EA는 커브피팅을 강하게 의심해야 합니다.
파라미터가 너무 많음 (6개 이상)
조정 가능한 파라미터가 많을수록 과거 데이터에 '딱 맞추는' 자유도가 높아집니다. 진정한 우위성이 있는 전략은 오히려 적은 파라미터로 성립합니다. 기준은 5개 이하입니다.
프로핏 팩터가 비정상적으로 높음 (PF 3.0 초과)
5년 이상의 백테스트에서 PF가 3.0을 초과하면, 거의 확실하게 커브피팅입니다. 실재하는 우위성은 PF 1.1~1.5 수준에 머무는 것이 보통입니다.
자산 곡선이 부자연스럽게 매끄러움
드로다운이 거의 없이 일직선으로 오르는 곡선은 과거 가격 움직임에 맞춘 결과입니다. 진짜 전략에는 반드시 연패와 회복의 파동이 있습니다.
특정 시간·요일에만 거래
'화요일 13시에만 진입'과 같은 제한 조건은 과거의 우연을 포착한 것에 불과한 경우가 많으며, 미래에는 재현되지 않습니다.
파라미터를 조금만 바꿔도 성적이 급변
최적값에서 한 칸만 벗어나도 손익이 크게 무너진다면, 그 '산꼭대기'는 노이즈입니다. 진정한 우위성이 있다면 주변 값에서도 완만하게 수익이 납니다.
워크포워드 효율(WFE) 판단 기준
워크포워드 효율(WFE)은 OOS 기간의 성적을 IS 기간의 성적으로 나눈 값입니다. 최적화한 기간 대비, 미지의 기간에서 얼마나 실력을 유지했는지를 나타냅니다.
| WFE | 판정 | 대응 |
|---|---|---|
| 50% 이상 | ✅ 양호 | 실운용 후보. 포워드 테스트로 진행 |
| 30~50% | ⚠️ 허용 범위 | 주의하여 채용. 리스크 %는 보수적으로 |
| 0~30% | ❌ 과최적화 의심 | 파라미터를 단순화하여 재검증 |
| 마이너스 | 🚨 불채용 | OOS에서 손실. 전략 자체를 재검토 |
워크포워드 분석 실행 절차
데이터 기간을 분할한다
10년 이상의 가격 데이터를 준비하고, IS:OOS = 3:1~4:1로 분할합니다. 예: IS 3년 → OOS 1년. 이를 1년씩 이동하면서 복수의 창을 만듭니다.
IS 기간만으로 최적화한다
MT5의 최적화 기능으로 IS 기간의 파라미터만 탐색합니다. OOS 기간을 절대로 최적화에 포함하지 않는 것이 철칙입니다.
그 설정 그대로 OOS 기간에서 테스트한다
IS 기간에서 얻은 최적 파라미터를 고정하고, 이어지는 OOS 기간에서 단 한 번 테스트합니다. 여기서 성적이 무너지면 과최적화입니다.
창을 이동하며 반복한다
기간을 1년씩 슬라이드하여 Step 2~3을 5회 이상 반복합니다. 복수의 OOS 결과를 모음으로써 신뢰성이 높아집니다.
OOS 성적을 합산하여 평가한다
전체 OOS 기간의 손익을 합산하고, WFE와 통산 성적으로 판정합니다. 다수의 창에서 안정적으로 플러스라면 진정한 우위성을 기대할 수 있습니다.
📡 다음은 포워드 테스트로 실전 검증
워크포워드 분석으로 과거 데이터의 견고성을 확인했다면, 다음은 실제 시장에서의 포워드 테스트입니다. 본 사이트에서는 배포 중인 모든 EA의 포워드 테스트 실적을 공개하고 있습니다.
포워드 테스트란 →