반응형 duplicated1 중복데이터의 처리(duplicated, drop_duplicates)-pandas(22) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 중복데이터의 처리 본 포스팅에서는 pandas에서 duplicated 및 drop_duplicates 메서드를 활용하여 중복데이터를 처리하는 방법에 대해 다룬다. 중복 데이터 처리를 위한 메서드 만약 사용자가 DataFrame에서 중복된 열을 확인하거나 제거해야한다면, 아래의 2가지 메서드를 통해 이를 할 수 있다. ○ duplicated: 메서드가 적용된 열과 길이가 동일한 불린 벡터를 반환한다. 그리고 어떤 요소가 중복된 요소인지 확인할 수 있다. ○ drop_duplicates: 중복 요소를 삭제한다. ○ 이 두 메서드는 중복된 요소를 식별하기 위해 열을 입력변수로 사용한다.이 메서드들은 Series, DataFrame, Index객체에 적.. 2019. 11. 6. 이전 1 다음 반응형