전체 글
-
최고의 번역툴, Deepl 서비스 이용 방법 및 국내 출시 일정코딩/AI, 통계 2023. 8. 18. 10:30
구글 번역과 파파고를 압도하는 최고의 번역 서비스인 DeepL의 유료 서비스의 국내 출시합니다. 이번 글에서는 DeepL의 번역 품질과 사용법에 대해서 알아보겠습니다. DeepL의 번역 품질 비교 개인적으로 영어와 한글 번역이 필요할 경우, 구글 번역이나 파파고 보다는 DeepL을 이용합니다. 일본어 번역에는 아무래도 파파고가 더 나은 측면이 있지만, 영어 번역 시에 딥엘의 자연스러움을 따라오지 못합니다. 몇 가지 예를 들어 볼까요? 아래 하와이 화재 기사에 대해서 구글, 파파고, DeepL 번역을 해보겠습니다. Michael Walker, Hawaii’s fire protection forester, urged state lawmakers last year to make a relatively meag..
-
[Python] pandas dataframe에서 데이터 읽기 : loc, iloc 사용법코딩/파이썬 2023. 8. 5. 08:22
Pandas에서 가장 자주 사용하는 기능이 특정 위치의 데이터를 찾고 수정하는 것입니다. Pandas는 loc와 iloc 등을 이용해 쉽게 특정 행과 칼럼을 찾을 수 있는 방법을 제공합니다. 이번 글에서는 loc와 iloc사용법에 대해서 알아보겠습니다. 목차 1. pandas loc 사용법 2. pandas iloc 사용법 3. 기타 주의할 점 1. pandas loc 사용법 dataframe.loc[ 행, 칼럼명] 형태로 데이터프레임의 정보를 가져올 수 있다. loc는 'Location based indexing'을 의미하며, 이를 통해 데이터 프레임에서 특정 행이나 열을 선택할 수 있습니다. 이를 사용하면 인덱스 값 또는 열 이름을 기준으로 특정 데이터를 추출할 수 있습니다. loc의 사용법은 다음과..
-
[Python] pandas csv 읽을 때 칼럼명 지정하기: read_csv()코딩/파이썬 2023. 8. 4. 16:27
Pandas 에서 read_csv() 함수로 읽을 때, 칼럼명을 임의로 지정하고 싶을 때가 있습니다. 이 번에는 read_csv에서 칼럼명지정 방법에 대해서 설명하겠습니다. 목차 1. read_csv() 기본 사용법제목 2. read_csv에서 칼럼명 지정하기 1. read_csv() 기본 사용법 먼저 pandas의 read_csv() 함수의 기본적인 사용법을 간단히 살펴봅시다. 아래 코드를 실행하면, 'filename.csv' 파일을 DataFrame 객체로 읽어옵니다. 이 때, 첫 번째 행은 기본적으로 열 이름(칼럼명)으로 사용됩니다. import pandas as pd df = pd.read_csv('파일경로/filename.csv') 2. read_csv에서 칼럼명 지정하기 read_csv에서 n..
-
[Python] pandas 에 csv 파일 불러오기: pd.read_csv()코딩/파이썬 2023. 8. 4. 16:07
실무에서는 xlsx 파일과 함께 csv 파일도 많이 다룹니다. csv는 comma-separated values 로 값이 콤마로 구분되는 텍스트 파일 형식입니다. Pandas에서는 csv 파일과 같은 텍스트 파일을 간단히 불러와 dataframe으로 저장하는 메소드를 제공합니다. 이번 글에서는 이러한 함수인 read_csv()에 대해서 알아보겠습니다. 목차 1. csv 파일 불러오기: read_csv() 2. header 읽어오는 방법 3. UnicodeDecodeError 대처법 1. csv 파일 불러오기: read_csv() CSV 읽어 오기 : df = pd.read_csv('filename.csv') CSV 파일은 Comma-Separated Values의 약자로, 데이터 값을 쉼표로 구분하는 텍..
-
[Python] Pandas에서 결측치 보간하기 - interpolate 함수 이용법코딩/파이썬 2023. 8. 4. 15:44
앞선 Pandas 관련 글에서 NaN값을 대체하거나 제거하는 방법에 대해서 알아봤습니다. 이번에는 결측치를 통계적인 방법으로 추정하는 함수인 interpolate에 대해서 알아보겠습니다. 목차 1. 결측치 보간 방법은? 2. interpolate 사용 방법 & 예제 3. 사용시 주의점 1. 결측치 보간 방법은? 보간법은 결측치의 앞뒤 데이터를 이용해 적절한 값을 추정하는 방법이다. 결측치 보간(interpolation)은 결측치가 발생한 위치의 앞뒤 데이터를 사용하여 적절한 값을 추정하는 방법입니다. 선형 보간, 시간 보간, 다항 보간 등 다양한 방법이 있으며, 상황에 따라 적절한 방법을 선택해야 합니다. 이 중 선형 보간은 두 점 사이를 일정하게 연결하는 방법으로, 가장 간단하고 널리 사용됩니다. Pa..
-
[Python] Pandas에서 NaN,NA 대체/제거하기: fillna, dropna코딩/파이썬 2023. 8. 4. 15:24
Pandas로 데이터를 다루다 보면, 특정 셀의 정보가 NaN으로 표시될 때가 있습니다. 어떤 작업을 수행할 때, 이러한 결측치 데이터 때문에 작업 오류가 발생할 때가 많습니다. 이번 글에서는 Pandas에서 결측값을 대체하거나 제거하는 방법에 대해서 알아보도록 하겠습니다. 목차 1. 결측값이란? 2. Pandas의 결측값 처리 함수: fillna와 dropna 2.1. fillna 2.2. dropna 1. 결측값이란? 결측값 - NaN, NA, None ... 결측값이란 데이터에 존재해야 하지만, 어떤 이유로 누락되어 존재하지 않는 값을 의미합니다. Python에서는 주로 NaN(Not a Number)로 표현됩니다. 데이터에 결측값이 많을 경우, 데이터의 통계적 신뢰성이 떨어지고, 모델링에도 악영향..
-
[Python] 초보자를 위한 cProfile로 코드 최적화하기코딩/파이썬 2023. 8. 1. 14:05
cProfile은 Python의 내장 프로파일러로, Python 코드를 최적화하는 데 도움이 됩니다. 이 글에서는 cProfile이 무엇인지, 그리고 어떻게 사용하는지 알아보도록 하겠습니다. 목차 1. cProfile이란? 2. cProfile 사용하기 2.1. 기본적인 사용 방법 - console에서 사용하기 2.2. 코드 내에서 cProfile 사용하기 3. cProfile 결과 분석하기 1. cProfile이란? cProfile은, 코드 성능 최적화를 위해, 프로그램의 실행시간과 메모리 사용량을 측정하는 도구이다. 프로파일링은 애플리케이션의 실행 시간과 메모리 사용량을 정밀하게 측정하고, 최적화할 부분을 찾는 과정입니다. Python에서는 이를 위해 cProfile이라는 내장 프로파일러를 제공합니다..
-
[python] 딕셔너리에서 기본값 설정하기코딩/파이썬 2023. 8. 1. 13:39
파이썬에서 가장 많이 사용하는 dictionary 는 간단히 key값만 있으면 원하는 정보를 찾을 수 있는 편리한 데이터 구조입니다. 하지만 가끔 key가 존재하지 않을 경우, 에러가 발생해서 불편함 있는데요. 이번 글에서는 딕셔너리에서 어떻게 디폴트 값을 설정하는지에 대해 알아보겠습니다. 목차 1. dict.get(key, default) 메서드 사용하기 2. collections.defaultdict 사용하기 3. dict.setdefault(key, default) 메서드 사용하기H2제목 1. dict.get(key, default) 메서드 사용하기 dict의 get(key, default) 메소드를 이용하면, 디폴트값 설정이 가능하다. 딕셔너리에서 키를 사용하여 값을 가져오는 가장 일반적인 방법은..