본문 바로가기
반응형

멀티인덱스4

멀티인덱스의 슬라이스(slice)와 단면(cross-section)추출-pandas(44) 파이썬 버전 3.8 기준pandas 버전 1.1.4 기준 멀티인덱스의 슬라이스와 단면추출 본 포스팅에서는 멀티인덱스에서의 슬라이스와, 단면추출을 하는 방법에 대해 다뤄보도록 한다.이를 위해 pandas.IndexSlice와 xs메서드를 다룬다. 슬라이서의 사용 사용자는 MultiIndex에서 다수의 인덱서(indexer)를 사용하는 것으로 슬라이싱 할 수 있다. 슬라이싱을 할때 레이블에 의해 인덱싱이 가능하다(선택자(Selector)를 이용한 인덱싱 등). ○ 선택자는 슬라이싱, 레이블의 리스트, 레이블들, 불린인덱서를 포함한다. ○ 상세한건 이전의 슬라이스 포스팅(슬라이싱을 이용한 선택)을 참고하자. 사용자는 특정 Level의 모든 내용물을 선택하기 위해 slice(None)을 사용할 수 있다. ○ s.. 2020. 12. 27.
멀티인덱스(MultiIndex)의 인덱싱(indexing)-pandas(43) 파이썬 버전 3.8 기준pandas 버전 1.1.4 기준 멀티인덱스(MultiIndex)의 인덱싱(indexing) 본 포스팅에서는 멀티인덱스를 인덱싱하는 방법에 대해서 다루도록 한다.이를 위해 대괄호 [ ]를 활용하는 방법과 .loc메서드를 이용하여 다루는 방법을 소개한다.이외에 슬라이싱(slicing)을 이용한 데이터 선택에 대해서도 간략히 소개한다.멀티인덱스가 아닌 일반적인 인덱싱에 대한 방법은 선행 포스팅(링크)를 참고할 수 있다. MultiIndex의 기본적인 인덱스 방법 멀티인덱스(MultiIndex)의 인덱싱의 중요한 기능 중 하나는 사용자가 레이블로 데이터를 선택할 수 있다는 점이다. 데이터 선택은 DataFrame에서 열을 선택할 때랑 유사하게 작동한다. 열(Column)의 멀티인덱스 선.. 2020. 11. 8.
멀티인덱스 레이블의 추출과 비사용 level의 제거-pandas(42) 파이썬 버전 3.8 기준pandas 버전 1.1.1 기준 멀티인덱스 레이블의 추출과 비사용 level의 제거 본 포스팅에서는 멀티인덱스(MultiIndex)의 특정 level(단계)의 레이블을 추출하고, 사용하지 않는 level(단계)를 삭제하는 방법에 대해 다루도록 한다.이를 위해 get_level_values() 메서드와 remove_unused_levels() 메서드를 소개한다. 특정 level 레이블의 추출을 위한 get_level_values() 메서드 사용자가 MultiIndex에서 특정 level(단계)의 레이블을 추출해야하는 경우에는, get_level_values() 메서드를 이용하면된다.get_level_values() 메서드는 특정 level에서 각각의 위치에 대한 레이블의 벡터를 반.. 2020. 11. 5.
멀티인덱스(Multiindex)의 생성-pandas(41) 파이썬 버전 3.8 기준pandas 버전 1.1.1 기준 멀티인덱스 생성 본 포스팅에서는 멀티인덱스에 대한 소개와 생성하는 방법에 대해서 다루도록 한다.이를 위해 from_arrays(), from_tuples(), from_product(), from_frame() 함수를 소개하며 이를 이용한 생성 예제를 다룬다. 다단계 인덱싱(멀티인덱스) 멀티인덱스는 데이터 프레임에 여러 level(단계)의 인덱스를 넣는 것을 지칭한다.즉, 인덱스를 다단계로 만들어 다차원 객체를 생성할 수 있다. ○ 다단계/멀티인덱싱은 꽤 정교한 데이터분석과 조작을 할 수 있게 한다. ○ 그중에서도 특히 높은 차원(Dimension)을 다루는데 유용하다. ○ 사용자에게 Series(1D)나 DataFrame(2D)같은 낮은 차원의 .. 2020. 11. 4.
반응형