본문 바로가기
반응형

Python/Pandas49

DataFrame 생성, 설명, 소개, 옵션 - pandas(4) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 DataFrame의 소개와 생성법 본 포스팅에서는 pandas에서의 DataFrame이 소개, 설명, 특징 및 작성법을 다룬다. Pandas에서 DataFrame란? DataFrame은 2차원 테이블 데이터 구조를 가지는 자료형이다. 그리고 Series와 함께 pandas의 주요 데이터 유형 중 하나이다. Series 객체를 딕셔너리처럼 모아둔 컨테이너(container)라고 봐도 된다. ○ Series 객체를 모아둔 자료구조라 생각하면 이해하기 편하다. ○ 스프레트시트나 SQL 테이블이라고 생각해도 무방하다. DataFrame의 특징Pandas의 DataFrame은 몇 가지 특징을 가지는데 다음과 같다. ○ DataFrame의 크기가 변경 가능.. 2019. 10. 9.
Series의 상세특징 - pandas(3) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 Series의 상세특징 본 포스팅에서는 Series의 특징에 대해 좀더 자세히 알아보려 한다. ● Series는 ndarray와 유사한 특성(ndarray-like) ● Series는 딕셔너리와 유사한 특성 ● 벡터화된 연산과 Series에서의 레이블 정렬 ● name 어트리뷰트의 존재 Series와 관련된 내용을 다루는 포스팅은 다음과 같으므로 필요하면 참고하자.Series의 소개와 생성법 - pandas(2) Series의 ndarray와 유사한 특성(ndarray-like)Series는 ndarray와 상당히 유사하게 작동하며, 대부분의 Numpy 함수의 입력변수로 유효하게 적용할 수 있다.또한, Series는 대부분의 ndarray에 지원.. 2019. 10. 7.
Series의 생성, 설명, 소개, 옵션 - pandas(2) 파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 Series의 설명과 생성법 본 포스팅에서는 pandas에서의 Series에 대한 소개, 설명, 특징과 작성법에 대해서 다룬다. Series와 DataFrame에 관련된 내용을 다루는 포스팅은 다음과 같으므로 필요하면 참고하자.Series의 상세특징 - pandas(3)DataFrame의 소개와 생성법 - pandas(4)DataFrame의 생성(from_dict, from_record) - pandas(5) Pandas에서 Series란? Series는 어떤 데이터 타입이든 보유할 수 있는 레이블(label)링된 1차원 배열이다. ○ 정수, 문자열, float, 파이썬 객체, 기타 등등을 포함한다. ○ 인덱스는 시계열(Time series)도 .. 2019. 10. 6.
pandas의 개요 - pandas(1) 파이썬 버전 3.7 기준pandas 버전 0.24.2 기준 pandas의 개요 이 포스팅에서는 pandas의 개요에 대해 다룬다. pandas의 개요 pandas는 데이터 파이썬 데이터 패키지 중 하나이며, 빠르고, 유연하며 데이터의 구조를 잘 보여준다. 또한 pandas를 사용한다면 상관관계가 있거나 라벨링된 데이터를 매우 쉽고 직관적으로 다룰 수 있다.pandas는 파이썬에서 실용적이고 실제적인 데이터 분석을 수행하기 위한 핵심적인 고수준 구조블록(fundamental high-level building block)을 목표로 한다. 추가적으로 pandas는 어떤 언어에서도 이용가능한 가장 강력하고 유연한 오픈소스 데이터분석 및 조작 도구가 되는 것을 목표로 한다. pandas로 처리할 수 있는 데이터.. 2019. 6. 7.
반응형