반응형
NaN대체
-
[Python] Pandas에서 NaN,NA 대체/제거하기: fillna, dropna코딩/파이썬 2023. 8. 4. 15:24
Pandas로 데이터를 다루다 보면, 특정 셀의 정보가 NaN으로 표시될 때가 있습니다. 어떤 작업을 수행할 때, 이러한 결측치 데이터 때문에 작업 오류가 발생할 때가 많습니다. 이번 글에서는 Pandas에서 결측값을 대체하거나 제거하는 방법에 대해서 알아보도록 하겠습니다. 목차 1. 결측값이란? 2. Pandas의 결측값 처리 함수: fillna와 dropna 2.1. fillna 2.2. dropna 1. 결측값이란? 결측값 - NaN, NA, None ... 결측값이란 데이터에 존재해야 하지만, 어떤 이유로 누락되어 존재하지 않는 값을 의미합니다. Python에서는 주로 NaN(Not a Number)로 표현됩니다. 데이터에 결측값이 많을 경우, 데이터의 통계적 신뢰성이 떨어지고, 모델링에도 악영향..