파이썬 버전 3.7 기준
pandas 버전 0.25.1 기준
데이터 정보 확인을 위한 메서드들 |
본 포스팅에서는 데이터 정보 확인을 위한 메서드들(shape, index, columns)에 설명한다.
데이터의 정보 확인을 위한 메서드들 |
pandas의 객체들은 사용자에게 메타데이터에 접근할 수 있게 해주는 많은 어트리뷰트를 보유하고 있다.
본 포스팅에서는 데이터의 형상정보를 확인하기 위해 사용될 수 있는 세가지 메서드를 아래에 다루도록 한다.
○ shape
○ index
○ columns
이 세 메서드는 다음과 같은 특징을 가진다.
○ 각 아래에서 소개하는 각 메서드들은 따로 입력변수를 가지지 않는다.
○ 사용 시에 다른 메서드들과 다르게 소괄호( )를 사용하지 않는다.
shape 메서드를 통한 축 정보의 확인 |
shape 메서드는 객체의 축에 대한 정보를 제공한다.
좀더 구체적으로 설명하면 각 축에 몇 개의 요소가 있는지에 대한 정보를 반환한다.
index 레이블의 확인 |
index 메서드는 행의 레이블에 대한 정보를 보유하고 있다.
index 메서드를 사용할 경우 행의 레이블에 대한 정보를 확인할 수 있다.
이 메서드는 행의 레이블에 대한 정보를 보유하고 있다.
즉, 이 말은 이 메서드에 인덱스 레이블에 대한 정보를 새로 배정하면 인덱스 레이블을 수정할 수 있음을 의미한다.
columns 레이블의 확인 |
columns 메서드는 열의 레이블에 대한 정보를 보유하고 있다.
Series는 1차원 데이터를 저장하기 때문에, 이 메서드는 Series에는 적용이 불가능하다.
index 메서드와 마찬가지로 이 메서드는 열의 레이블에 대한 정보를 보유하고 있다.
따라서, 이 메서드에 열 레이블에 대한 새로운 정보를 배정하면, 열 레이블을 수정할 수 있음을 의미한다.
각 메서드들의 사용 예)
# pandas와 numpy의 import
In[2]: import pandas as pd
In[3]: import numpy as np
# shape 메서드 사용 예
In[4]: ex_df=pd.DataFrame(np.random.rand(4,4), index=['R_0', 'R_1', 'R_2', 'R_3'], columns=['C_0', 'C_1', 'C_2', 'C_3'])
In[5]: ex_df.shape
Out[5]: (4, 4)
# index 메서드 사용 예
In[6]: ex_df.index
Out[6]: Index(['R_0', 'R_1', 'R_2', 'R_3'], dtype='object')
# columns 메서드 사용 예
In[7]: ex_df.columns
Out[7]: Index(['C_0', 'C_1', 'C_2', 'C_3'], dtype='object')
Index 및 columns 메서드를 통한 배정 |
위에서 설명했다싶이 index 및 columns 메서드에는 배정이 가능하다.
하지만 배정을 수행할 때에는 index나 columns 메서드에 가지는 요소의 수와 배정을 하려고 하기위해 입력되는 이터레이블한 자료형의 요소의 수가 동일해야 한다.
index 및 columns 메서드 배정의 예)
# pandas와 numpy의 import
In[2]: import pandas as pd
In[3]: import numpy as np
# index 메서드 배정 예
In[8]: ex_df.index=['a', 'b', 'c', 'd']
In[9]: ex_df.index
Out[9]: Index(['a', 'b', 'c', 'd'], dtype='object')
# columns 메서드 배정 예
In[10]: ex_df.columns=['A', 'B', 'C', 'D']
In[11]: ex_df.columns
Out[11]: Index(['A', 'B', 'C', 'D'], dtype='object')
'Python > Pandas' 카테고리의 다른 글
데이터 및 열 선택, 배정, 추가, 인덱싱, pop 및 insert 메서드-pandas(9) (0) | 2019.10.18 |
---|---|
데이터 추출(array, to_numpy, values)-pandas(8) (0) | 2019.10.17 |
데이터의 확인(head, tail, print함수 사용) - pandas(6) (0) | 2019.10.15 |
DataFrame의 생성(from_dict, from_record) - pandas(5) (0) | 2019.10.13 |
DataFrame 생성, 설명, 소개, 옵션 - pandas(4) (0) | 2019.10.09 |
댓글