How We Measure Accuracy
정확도를 어떻게
측정하는가
자이랜드의 정확도 수치 뒤에 있는 방법론 — 무엇을 측정하고, 왜 그 방식으로 측정하며, 그것이 기관에 어떤 의미인지 설명합니다.
정확도는 숫자가 아닙니다 —
검증 구조입니다
어떤 AVM이든 높은 정확도를 주장할 수 있습니다. 중요한 것은 그 수치가 어떻게 산출되었느냐입니다. 자이랜드의 정확도 수치는 단 하나의 기준만을 사용합니다: 모델이 학습에 사용하지 않은 실제 국토교통부 실거래와의 비교.
정확도(Accuracy)란 자이랜드 AVM의 추정 가격이 국토교통부 실거래가와 얼마나 근접하는지를 나타냅니다 — 학습 데이터와 완전히 분리된 표본외(out-of-sample) 거래에서만 측정합니다.
이 구분은 중요합니다. 모델이 학습한 데이터로 자기 자신을 평가하면 항상 좋은 수치가 나옵니다. 감사 대응이 가능한 AVM이라면 학습 데이터와 시간적으로 분리된 실거래에서 검증되어야 합니다.
수천 건의 거래에서 이 오차를 집계하면 모델의 전반적인 정확도가 도출됩니다. 하지만 어떤 집계 방식을 사용하느냐가 결과를 크게 좌우합니다.
표본외 검증이란 무엇이며,
왜 그것만 사용하는가
대부분의 머신러닝 모델은 학습 데이터와 테스트 데이터를 분리합니다. 자이랜드는 한 단계 더 나아갑니다: 검증에 사용되는 거래는 모델 개발 과정 전체에서 격리됩니다.
데이터 수집
국토교통부 실거래 + 건축물대장 + GIS 정보를 결합하여 정제합니다.
- 아파트 · 단독/다가구 · 오피스텔 · 빌라 · 도시형생활주택
- 인프라, 학군, 교통 접근성 변수 포함
- 이상치 필터링 및 거래 신뢰도 검증
데이터 엔지니어링
원시 데이터를 학습 가능한 특성(feature)으로 변환하는 단계입니다.
- 지오코딩 및 공간 변수 생성
- 결측치 처리 및 중복 제거
- 자산 유형별 독립 전처리
모델 학습
비교사례 접근법 기반으로 자산 유형별 독립 모델을 학습합니다.
- 지역별 가격 구조 차이 반영
- 하이퍼파라미터 최적화
- 과적합 방지를 위한 교차검증
표본외 검증
학습에 전혀 사용되지 않은 실거래 데이터로만 정확도를 측정합니다.
- 시간 기반 분리 (미래 거래 = 테스트)
- 독립 QA 게이트 통과 후 공시
- 버전 관리 및 감사 로그 보관
자이랜드는 학습 성능을 공시하지 않습니다. 오직 표본외 테스트 성능만 공개합니다. 학습 성능은 과적합 탐지용으로만 내부 참조합니다.
세 가지 표준 지표와
각각을 사용하는 이유
자이랜드는 국제적으로 통용되는 세 가지 통계 지표를 사용합니다. 각 지표는 서로 다른 질문에 답합니다.
이 지표가 답하는 질문
“전형적인 거래에서 오차가 얼마나 되는가?” 극단값(outlier)의 영향을 받지 않아 실제 일반적 성능을 가장 잘 반영합니다.
평균이 아닌 중앙값을 쓰는 이유
주거용 부동산 시장에는 특수 거래가 존재합니다. 경매 낙찰가, 급매, 친족간 거래 등은 통계적 이상치를 만들어냅니다. 평균(MAPE)은 이런 거래에 과도하게 영향받아 실제 성능을 왜곡합니다. 중앙값은 이 왜곡 없이 전형적 성능을 보여줍니다.
이 지표가 답하는 질문
“±10% 이내로 맞힌 비율이 얼마나 되는가?” 은행권 담보 AVM의 국제 표준 임계값입니다. MISMO CCS의 기반 지표이기도 합니다.
자이랜드는 PPE@5%, PPE@10%, PPE@20% 세 가지 구간을 함께 공시합니다. 기관의 여신 정책에 따라 요구 허용 오차가 다를 수 있기 때문입니다.
이 지표가 답하는 질문
“모델이 가격 변동을 얼마나 잘 설명하는가?” 0에서 1 사이의 값으로, 1에 가까울수록 시장 가격 변동을 정확히 포착함을 의미합니다.
R²만으로는 충분하지 않습니다. Train R²와 Test R²의 차이가 작아야 과적합 없이 잘 일반화된 모델임을 나타냅니다. 자이랜드는 두 값을 함께 모니터링합니다.
| 모델 | Train R² | Test R² | 과적합 여부 |
|---|---|---|---|
| 아파트 | ~0.99 | 0.98 | ✓ 안정 |
| 단독/다가구 | ~0.98 | 0.96 | ✓ 안정 |
| 오피스텔 | ~0.98 | 0.97 | ✓ 안정 |
실제 자산 유형별 측정값은 정확도 공시 페이지 →에서 확인하실 수 있습니다.
정확도 오차가
금융 리스크로 이어지는 구조
정확도는 기술 지표가 아닙니다. AVM 평가 오차는 직접적으로 여신 의사결정에 영향을 미칩니다.
LTV 리스크
담보 가치를 10% 과대평가하면 LTV가 실제보다 낮게 산출됩니다. 은행은 실제보다 낮은 위험으로 인식하고 대출을 실행합니다. 부동산 가격 하락 시 이 오차가 손실로 현실화됩니다.
충당금 민감도
포트폴리오 전체의 담보 가치가 체계적으로 과대평가되면 대손충당금이 실제 리스크를 반영하지 못합니다. 자산건전성 분류와 자본적정성 평가가 왜곡됩니다.
감독 리스크
AI기본법(2026년 시행)은 대출 심사 AI를 고영향 시스템으로 분류하고 설명가능성을 요구합니다. 감사 추적이 불가능한 AVM 수치는 규제 검토 시 방어하기 어렵습니다.
비아파트 맹점
한국 AVM들은 아파트 중심으로 설계되어 빌라·단독주택 정확도가 크게 낮습니다. 전세사기와 NPL 리스크가 집중된 바로 이 자산군에서 측정 가능한 정확도가 없습니다.
정확도는 고정된 수치가 아닙니다
정확도는 관리되는 프로세스입니다. 시장 구조가 바뀌고 새로운 거래 데이터가 쌓이면 모델도 재보정되어야 합니다.
정확도 재검증
최신 실거래 데이터로 표본외 성능을 재측정하고 공시를 업데이트합니다. 성능 저하가 감지되면 재학습 게이트가 트리거됩니다.
파이프라인 재학습
신규 거래 데이터와 시장 변화를 반영하여 모델을 재학습합니다. 재학습 전후 성능 비교 테스트가 필수 선행됩니다.
감사 로그 보관
모든 공시 지표는 타임스탬프, 데이터셋 버전, QA 담당자와 함께 감사 추적 가능한 형태로 보관됩니다.
MISMO CCS 준수
개별 평가에 MISMO 공통 신뢰도 점수(CCS)를 출력하는 로드맵을 실행 중입니다. 한국 최초 CCS 준수 AVM을 목표합니다.
독립 학술 검증
자이랜드의 측정 방법론은 외부 독립 연구자에 의해 동료심사(peer review) 검증을 거쳤습니다. 연세대학교 구강모 교수(자이랜드와 무관)가 공동 저자로 참여한 논문이 부동산분석학술지(Journal of Real Estate Analysis) Vol.10 No.3에 게재되었습니다(2024).
기관 대상 심층 정확도 보고서
17개 시·도 전체 지역별 성과, 자산 유형 교차 분석, 시계열 안정성 검증 데이터를 제공합니다.