데이터분석

[pandas] read_csv 화폐 단위 열 콤마(,) 제외하고 숫자로 읽어오기

jadePark 2022. 10. 14. 16:41

 

pandas.read_csv

pandas.read_csv(filepath_or_buffer, sep=_NoDefault.no_default,delimiter=None,header='infer',

names=_NoDefault.no_default,index_col=None,usecols=None,squeeze=None,prefix=_NoDefault.no_default,

mangle_dupe_cols=True,dtype=None,engine=None,converters=None,true_values=None,false_values=None,

skipinitialspace=False,skiprows=None,skipfooter=0,nrows=None,na_values=None,keep_default_na=True,

na_filter=True, verbose=False,skip_blank_lines=True,parse_dates=None,infer_datetime_format=False,

keep_date_col=False,date_parser=None,dayfirst=False,cache_dates=True,iterator=False,

chunksize=None,compression='infer', thousands=None, decimal='.',lineterminator=None,

quotechar='"',quoting=0,doublequote=True,escapechar=None,comment=None,

encoding=None,encoding_errors='strict',dialect=None,error_bad_lines=None,warn_bad_lines=None,

on_bad_lines=None,delim_whitespace=False,low_memory=True,memory_map=False,

float_precision=None,storage_options=None)

 

 

read_csv에는 참 많은 파라미터 가 있다.

워낙 많다보니 쓰는 파라미터만 쓰게 된다. (노란 배경색이 들어간 부분,,많이 쓰는것도 종종 쓰는것도 있다)

하지만 read_csv 함수로 바로 처리할 수 있는 데이터를 굳이 replace( ',' , '' ) 이런식으로 apply 하고 싶지 않기 때문에 

thousands 파라미터를 활용하고자 한다. 

 

import pandas as pd

pd.read_csv(file,thousands=',')