본문 바로가기
반응형

Python/Pandas49

.ix 메서드를 이용한 인덱싱-pandas(13) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 .ix 인덱서를 이용한 인덱싱 본 포스팅에서는 .ix 메서드에 대해 좀 더 상세히 알아볼 것이며, 이 메서드를 이용한 인덱싱에 대해 살펴볼 것이다.사실 .ix인덱서는 최근 버전에들어서는 사용하지 말 것을 권하고 있으며, 앞으로 사라질 가능성이 크다. .ix 메서드에 대한 설명 .ix 메서드는 기본적으로 레이블(label)과 위치 정수를 사용하여 행에 접근하는 메서드이다.하지만 최근 pandas 버전에서는 .ix 메서드의 사용을 하지 말 것을 권하고 있다. ○ 대화형 모드에서 .ix 인덱서를 사용할 경우 인덱싱은 되긴 하지만 경고가 뜬다. ○ 그 이유로는 레이블과 위치 정수 둘 다 사용할 수 있다는 장점이 있지만, 인덱싱을 할때 모호해지기 때문이다.. 2019. 10. 22.
.iloc 메서드(정수 위치)를 이용한 인덱싱과 슬라이싱-pandas(12) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 .iloc 메서드(정수 위치)를 이용한 인덱싱 본 포스팅에서는 .iloc 메서드에 대해 좀 더 상세히 알아볼 것이며, 이 메서드를 이용한 인덱싱에 대해 살펴볼 것이다. .iloc 메서드에 대한 설명 pandas는 순수하게 정수 기반 인덱싱을 위한 일련의 메서드들을 제공한다..iloc 메서드는 주로 정수 위치(integer position) 기반으로 사용된다. ○ 여기서 정수 위치 인덱싱은 0에서 축의 길이-1에 해당된다. .iloc 메서드의 특징.iloc 메서드의 특징으로는 다음과 같다. ○ python 인덱싱과 동일하게 0부터 시작한다. (0-based 인덱싱) ○ 파이썬과 Numpy 슬라이싱에 거의 가깝게 따른다. ▷ 슬라이싱을 사용할때 시작.. 2019. 10. 21.
.loc 메서드(레이블)를 이용한 인덱싱과 슬라이싱-pandas(11) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 .loc 메서드(레이블)를 이용한 인덱싱 본 포스팅에서는 .loc 메서드에 대해 좀 더 상세히 알아볼 것이며, 이 메서드를 이용한 인덱싱에 대해 살펴볼 것이다. .loc 메서드에 대한 설명 .loc 메서드는 기본적으로 레이블(label)을 사용하여 행에 접근하는 메서드이다. ○ .loc 메서드에 정수를 입력할 경우 에러가 발생한다. .loc 메서드의 특징.loc 메서드에 대한 특징은 다음과 같다. ○ 순수한 레이블 기반 인덱싱이다. ▷ 정수 역시 사용이 가능은 하나, 레이블이 정수일 경우에만 그렇다. (자세한 내용 예제참고) ○ 불린 배열(boolean array)과 함께 사용될 수 있다. ○ .loc는 해당 객체를 찾을 수 없을 경우 KeyEr.. 2019. 10. 20.
데이터 인덱싱(loc, iloc, 슬라이싱, 불린인덱싱, at, iat, ix)-pandas(10) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 데이터 인덱싱 방법과 예제 본 포스팅에서는 Series와 DataFrame에 대해 각종 메서드를 이용하여 인덱싱 하는 방법에 대해 다룰 것이다. 인덱싱 앞 포스팅에서 대괄호 [ ]를 사용하여 데이터 처리에 대한 기초적인 방법을 소개했다.이 섹션에서는 다양한 방법을 통한 인덱싱 처리방법을 간략히 다룰 것이다. 각각의 방법에 대한 상세한 사항은 차후에 다룰 예정이다. 인덱싱 방법들아래 표는 pandas에서 처리하는 대표적인 인덱싱 방법을 보여준다. 별다른 설명이 없다면 Series는 스칼라 값을 인덱싱하고, DataFrame는 행을 인덱싱한다. ○ 예를들어, 행을 선택하는 것은 DataFrame의 행에 해당하는 Series를 반환한다. 이름 기호 설.. 2019. 10. 19.
데이터 및 열 선택, 배정, 추가, 인덱싱, pop 및 insert 메서드-pandas(9) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 데이터의 선택, 추가, 제거, 인덱싱(DataFrame 및 Series) 본 포스팅에서는 pandas에서 데이터의 선택, 배정, 추가하는 방법에 대해서 간략히 다룰 예정이다. 그외에 pop 메서드와 insert 메서드에 대해서도 다뤄볼 것이다. 데이터의 선택, 배정, 추가, 제거 대괄호를 이용한 데이터의 처리DataFrame과 Series 객체와 유사하게 처리할 수 있다.대괄호에는 데이터의 위치를 나타내는 레이블이 가능하다.딕셔너리에서 사용하는 대괄호[ ]를 사용하는 문법을 적용하여 데이터를 처리할 수 있다. ○ Series: 해당되는 요소, 즉 스칼라(Scalar)를 선택하여 처리할 수 있다. ○ DataFrame: 해당되는 열(columns).. 2019. 10. 18.
데이터 추출(array, to_numpy, values)-pandas(8) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 Series에서의 배열 데이터 추출 본 포스팅에서는 DataFrame이나 Series의 데이터에 접근하거나 추출할 수 있는 array, to_numpy, values 메서드들에 대해 알아본다.그리고 본 포스팅에서 다루는 메서드들은 Series에 적용이 가능하며, 일부 메서드는 DataFrame에도 적용이 가능하다. ○ Series 적용 가능 메서드: array, to_numpy, values ○ DataFrame 적용 가능 메서드: to_numpy, values Series.array 메서드 만약 사용자가 Series나 배열 데이터만 추출하고싶다면 array 메서드를 이용하면 된다.이 메서드는 ExtensionArray 객체를 반환한다. ○ Ex.. 2019. 10. 17.
데이터 정보 확인(index, columns, shape) - pandas(7) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 데이터 정보 확인을 위한 메서드들 본 포스팅에서는 데이터 정보 확인을 위한 메서드들(shape, index, columns)에 설명한다. 데이터의 정보 확인을 위한 메서드들 pandas의 객체들은 사용자에게 메타데이터에 접근할 수 있게 해주는 많은 어트리뷰트를 보유하고 있다.본 포스팅에서는 데이터의 형상정보를 확인하기 위해 사용될 수 있는 세가지 메서드를 아래에 다루도록 한다. ○ shape ○ index ○ columns 이 세 메서드는 다음과 같은 특징을 가진다. ○ 각 아래에서 소개하는 각 메서드들은 따로 입력변수를 가지지 않는다. ○ 사용 시에 다른 메서드들과 다르게 소괄호( )를 사용하지 않는다. shape 메서드를 통한 축 정보의 확인.. 2019. 10. 16.
데이터의 확인(head, tail, print함수 사용) - pandas(6) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 pandas에서 데이터의 확인법 본 포스팅에서는 pandas에서의 데이터를 확인하기 위한 head() 메서드와, tail() 메서드에 대해 다룬다. 이외에 부가적으로 파이썬에서 제공하는 print 함수를 활용한 출력도 살펴볼까 한다. head와 tail 메서드 Pandas에서 데이터를 확인하는 방법으로는 여러가지가 있겠지만, 가장 쉽고 단순하게 사용할 수 있는 메서드로는 head와 tail 메서드를 활용하는 방법이 있다. 이 메서드들은 데이터의 전부를 보여주지 않고 데이터의 상단부분(head)와 하단부분(tail)만 출력하여 보여준다.광대한 데이터를 다룰 수 있는 pandas의 특성상 특정 변수에 제대로된 데이터가 들어갔는지 간략히 확인할 수 있.. 2019. 10. 15.
DataFrame의 생성(from_dict, from_record) - pandas(5) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 DataFrame의 하위 메서드를 사용한 DataFrame의 생성 본 포스팅에서는 DataFrame을 구축하기 위한 from_dict() 메서드와, from_records() 메서드를 다룬다. DataFrame과 Series에 관한 상세 사항은 타 포스팅을 참고하자.Series의 소개와 생성법 - pandas(2)Series의 상세특징 - pandas(3)DataFrame의 소개와 생성법 - pandas(4) DataFrame.from_dict() 메서드와 DataFrame.from_records() 메서드 DataFrame.from_dict() 메서드DataFrame.from_dict() 메서드는 다음과 같은 자료형을 입력으로 가진다. ○ 딕셔.. 2019. 10. 13.
반응형