IV1 데이터 비닝과 WOE(Weight of Evidence), IV(Information Value) 데이터 비닝(변수 구간화) 연속형 변수를 구간화를 통해 그룹으로 나누는 과정이다. 데이터 비닝을 통해 해당 변수의 스케일이나, 분포가 모델에 미치는 영향을 줄일 수 있고, 모델 복잡도를 줄일 수 있다. 비닝의 가장 대표적인 예시 - 카운팅/ 값에 대한 경계로 구간화 - 값으로 통일 폭 변수 구간화 - 동일 빈도 변수 구간화 - 구간별 평균값으로 평활화 - 중앙값으로 평활화 - 경계값으로 평활화 구간화를 어떻게 하는지는 데이터에 따라 달라진다. (나이 : 10대,20대,30대 등, 학점 등) 오늘 포스팅에서는 변수 구간화 이후, Feature Selection의 영역에서 각 구간별로 나누어진 변수가 얼마나 예측력이 있는지 WOE(Weight of Evidence) 와 IV(Information)를 활용하여.. 2024. 2. 29. 이전 1 다음