PORT MIS 대기시간 예측 - 3. 결측치 처리(시계열 데이터, 중앙값)
이 포스팅은 2차 전처리(입출항 기준 데이터셋 재구성)에 이은, 결측치 처리(3차 전처리)에 관한 내용을 담고 있다. 개요 결측치 처리 방법은 다음과 같다. 1. 선박제원정보 : 선박용도별 중앙값 대체 2. 기상데이터 결측치 : 선형보간법 사용 1. 선박제원정보 결측치 처리 선박제원정보 데이터 타입 변경(숫자) # 쉽표 제거 columns_to_fix = ['총톤수', '재화중량톤수', '선박제원(총길이, m)', '선박제원(너비, m)', '만재흘수(m)', '깊이(m)', '길이1(m)'] df[columns_to_fix] = df[columns_to_fix].replace({',': ''}, regex=True) # 숫자로 변환 df[columns_to_fix] = df[columns_to_fix]..
2023. 11. 30.