본문 바로가기
반응형

전체 글165

.loc 메서드(레이블)를 이용한 인덱싱과 슬라이싱-pandas(11) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 .loc 메서드(레이블)를 이용한 인덱싱 본 포스팅에서는 .loc 메서드에 대해 좀 더 상세히 알아볼 것이며, 이 메서드를 이용한 인덱싱에 대해 살펴볼 것이다. .loc 메서드에 대한 설명 .loc 메서드는 기본적으로 레이블(label)을 사용하여 행에 접근하는 메서드이다. ○ .loc 메서드에 정수를 입력할 경우 에러가 발생한다. .loc 메서드의 특징.loc 메서드에 대한 특징은 다음과 같다. ○ 순수한 레이블 기반 인덱싱이다. ▷ 정수 역시 사용이 가능은 하나, 레이블이 정수일 경우에만 그렇다. (자세한 내용 예제참고) ○ 불린 배열(boolean array)과 함께 사용될 수 있다. ○ .loc는 해당 객체를 찾을 수 없을 경우 KeyEr.. 2019. 10. 20.
데이터 인덱싱(loc, iloc, 슬라이싱, 불린인덱싱, at, iat, ix)-pandas(10) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 데이터 인덱싱 방법과 예제 본 포스팅에서는 Series와 DataFrame에 대해 각종 메서드를 이용하여 인덱싱 하는 방법에 대해 다룰 것이다. 인덱싱 앞 포스팅에서 대괄호 [ ]를 사용하여 데이터 처리에 대한 기초적인 방법을 소개했다.이 섹션에서는 다양한 방법을 통한 인덱싱 처리방법을 간략히 다룰 것이다. 각각의 방법에 대한 상세한 사항은 차후에 다룰 예정이다. 인덱싱 방법들아래 표는 pandas에서 처리하는 대표적인 인덱싱 방법을 보여준다. 별다른 설명이 없다면 Series는 스칼라 값을 인덱싱하고, DataFrame는 행을 인덱싱한다. ○ 예를들어, 행을 선택하는 것은 DataFrame의 행에 해당하는 Series를 반환한다. 이름 기호 설.. 2019. 10. 19.
데이터 및 열 선택, 배정, 추가, 인덱싱, pop 및 insert 메서드-pandas(9) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 데이터의 선택, 추가, 제거, 인덱싱(DataFrame 및 Series) 본 포스팅에서는 pandas에서 데이터의 선택, 배정, 추가하는 방법에 대해서 간략히 다룰 예정이다. 그외에 pop 메서드와 insert 메서드에 대해서도 다뤄볼 것이다. 데이터의 선택, 배정, 추가, 제거 대괄호를 이용한 데이터의 처리DataFrame과 Series 객체와 유사하게 처리할 수 있다.대괄호에는 데이터의 위치를 나타내는 레이블이 가능하다.딕셔너리에서 사용하는 대괄호[ ]를 사용하는 문법을 적용하여 데이터를 처리할 수 있다. ○ Series: 해당되는 요소, 즉 스칼라(Scalar)를 선택하여 처리할 수 있다. ○ DataFrame: 해당되는 열(columns).. 2019. 10. 18.
데이터 추출(array, to_numpy, values)-pandas(8) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 Series에서의 배열 데이터 추출 본 포스팅에서는 DataFrame이나 Series의 데이터에 접근하거나 추출할 수 있는 array, to_numpy, values 메서드들에 대해 알아본다.그리고 본 포스팅에서 다루는 메서드들은 Series에 적용이 가능하며, 일부 메서드는 DataFrame에도 적용이 가능하다. ○ Series 적용 가능 메서드: array, to_numpy, values ○ DataFrame 적용 가능 메서드: to_numpy, values Series.array 메서드 만약 사용자가 Series나 배열 데이터만 추출하고싶다면 array 메서드를 이용하면 된다.이 메서드는 ExtensionArray 객체를 반환한다. ○ Ex.. 2019. 10. 17.
데이터 정보 확인(index, columns, shape) - pandas(7) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 데이터 정보 확인을 위한 메서드들 본 포스팅에서는 데이터 정보 확인을 위한 메서드들(shape, index, columns)에 설명한다. 데이터의 정보 확인을 위한 메서드들 pandas의 객체들은 사용자에게 메타데이터에 접근할 수 있게 해주는 많은 어트리뷰트를 보유하고 있다.본 포스팅에서는 데이터의 형상정보를 확인하기 위해 사용될 수 있는 세가지 메서드를 아래에 다루도록 한다. ○ shape ○ index ○ columns 이 세 메서드는 다음과 같은 특징을 가진다. ○ 각 아래에서 소개하는 각 메서드들은 따로 입력변수를 가지지 않는다. ○ 사용 시에 다른 메서드들과 다르게 소괄호( )를 사용하지 않는다. shape 메서드를 통한 축 정보의 확인.. 2019. 10. 16.
데이터의 확인(head, tail, print함수 사용) - pandas(6) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 pandas에서 데이터의 확인법 본 포스팅에서는 pandas에서의 데이터를 확인하기 위한 head() 메서드와, tail() 메서드에 대해 다룬다. 이외에 부가적으로 파이썬에서 제공하는 print 함수를 활용한 출력도 살펴볼까 한다. head와 tail 메서드 Pandas에서 데이터를 확인하는 방법으로는 여러가지가 있겠지만, 가장 쉽고 단순하게 사용할 수 있는 메서드로는 head와 tail 메서드를 활용하는 방법이 있다. 이 메서드들은 데이터의 전부를 보여주지 않고 데이터의 상단부분(head)와 하단부분(tail)만 출력하여 보여준다.광대한 데이터를 다룰 수 있는 pandas의 특성상 특정 변수에 제대로된 데이터가 들어갔는지 간략히 확인할 수 있.. 2019. 10. 15.
DataFrame의 생성(from_dict, from_record) - pandas(5) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 DataFrame의 하위 메서드를 사용한 DataFrame의 생성 본 포스팅에서는 DataFrame을 구축하기 위한 from_dict() 메서드와, from_records() 메서드를 다룬다. DataFrame과 Series에 관한 상세 사항은 타 포스팅을 참고하자.Series의 소개와 생성법 - pandas(2)Series의 상세특징 - pandas(3)DataFrame의 소개와 생성법 - pandas(4) DataFrame.from_dict() 메서드와 DataFrame.from_records() 메서드 DataFrame.from_dict() 메서드DataFrame.from_dict() 메서드는 다음과 같은 자료형을 입력으로 가진다. ○ 딕셔.. 2019. 10. 13.
DataFrame 생성, 설명, 소개, 옵션 - pandas(4) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 DataFrame의 소개와 생성법 본 포스팅에서는 pandas에서의 DataFrame이 소개, 설명, 특징 및 작성법을 다룬다. Pandas에서 DataFrame란? DataFrame은 2차원 테이블 데이터 구조를 가지는 자료형이다. 그리고 Series와 함께 pandas의 주요 데이터 유형 중 하나이다. Series 객체를 딕셔너리처럼 모아둔 컨테이너(container)라고 봐도 된다. ○ Series 객체를 모아둔 자료구조라 생각하면 이해하기 편하다. ○ 스프레트시트나 SQL 테이블이라고 생각해도 무방하다. DataFrame의 특징Pandas의 DataFrame은 몇 가지 특징을 가지는데 다음과 같다. ○ DataFrame의 크기가 변경 가능.. 2019. 10. 9.
Series의 상세특징 - pandas(3) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 Series의 상세특징 본 포스팅에서는 Series의 특징에 대해 좀더 자세히 알아보려 한다. ● Series는 ndarray와 유사한 특성(ndarray-like) ● Series는 딕셔너리와 유사한 특성 ● 벡터화된 연산과 Series에서의 레이블 정렬 ● name 어트리뷰트의 존재 Series와 관련된 내용을 다루는 포스팅은 다음과 같으므로 필요하면 참고하자.Series의 소개와 생성법 - pandas(2) Series의 ndarray와 유사한 특성(ndarray-like)Series는 ndarray와 상당히 유사하게 작동하며, 대부분의 Numpy 함수의 입력변수로 유효하게 적용할 수 있다.또한, Series는 대부분의 ndarray에 지원.. 2019. 10. 7.
반응형