pandas
-
[Python] pandas dataframe에서 데이터 읽기 : loc, iloc 사용법코딩/파이썬 2023. 8. 5. 08:22
Pandas에서 가장 자주 사용하는 기능이 특정 위치의 데이터를 찾고 수정하는 것입니다. Pandas는 loc와 iloc 등을 이용해 쉽게 특정 행과 칼럼을 찾을 수 있는 방법을 제공합니다. 이번 글에서는 loc와 iloc사용법에 대해서 알아보겠습니다. 목차 1. pandas loc 사용법 2. pandas iloc 사용법 3. 기타 주의할 점 1. pandas loc 사용법 dataframe.loc[ 행, 칼럼명] 형태로 데이터프레임의 정보를 가져올 수 있다. loc는 'Location based indexing'을 의미하며, 이를 통해 데이터 프레임에서 특정 행이나 열을 선택할 수 있습니다. 이를 사용하면 인덱스 값 또는 열 이름을 기준으로 특정 데이터를 추출할 수 있습니다. loc의 사용법은 다음과..
-
[Python] Pandas에서 NaN,NA 대체/제거하기: fillna, dropna코딩/파이썬 2023. 8. 4. 15:24
Pandas로 데이터를 다루다 보면, 특정 셀의 정보가 NaN으로 표시될 때가 있습니다. 어떤 작업을 수행할 때, 이러한 결측치 데이터 때문에 작업 오류가 발생할 때가 많습니다. 이번 글에서는 Pandas에서 결측값을 대체하거나 제거하는 방법에 대해서 알아보도록 하겠습니다. 목차 1. 결측값이란? 2. Pandas의 결측값 처리 함수: fillna와 dropna 2.1. fillna 2.2. dropna 1. 결측값이란? 결측값 - NaN, NA, None ... 결측값이란 데이터에 존재해야 하지만, 어떤 이유로 누락되어 존재하지 않는 값을 의미합니다. Python에서는 주로 NaN(Not a Number)로 표현됩니다. 데이터에 결측값이 많을 경우, 데이터의 통계적 신뢰성이 떨어지고, 모델링에도 악영향..