ETL 파이프라인, 매칭 로직, 필드값 불일치 등 데이터 정합성 관련 이슈.


#23 — MEDIAN_INCOME 값 파일 간 불일치 (02-28)

현상: 소득 기반 필터링 결과가 코드 경로에 따라 상이.

원인: extract_info.pymatching.py에서 2026년 중위소득 값이 서로 다른 수치.

조치: 보건복지부 공식 수치로 통일. (PR #35, d62332f)


#40 — _parse_int('0')이 None 반환 (03-06)

현상: income_max=0인 정책이 None으로 처리되어 필터링 로직이 오동작.

원인: if not value: return None으로 falsy 값 체크. Python에서 0은 falsy.

조치: if value is None으로 변경. (PR #40, 03065a9)


#41 — ETL에 특수조건 5개 필드 누락 (03-06)

현상: ETL 실행 시 특수조건 데이터가 전부 소실.

원인: 리팩토링된 ETL 파이프라인에서 sbiz_cd 등 5개 필드 누락.

조치: transformer/loader에 5개 필드 추가 + _is_newlywed_exclusive() 파서 구현. (PR #40, 03065a9)


#42 — income_max=0 처리 3개 경로 불일치 (03-06)

현상: 3개 경로에서 각각 상이한 방식으로 처리.

조치: 3개 경로 전부 income_max=0 → "미기재" 통과 처리로 통일. (PR #40, 03065a9)