확률통계 기초용어-확률과 통계(0)
확률통계 기초용어 본 포스팅에서는 다음과 같은 확률 통계의 기초 용어에 대한 설명을 다룰 것이다. ○ 확률실험, 표본공간, 사건, 확률변수, 확률질량함수, 확률밀도함수, 누적분포함수, 확률, 확률의 공리 ○ 데이터, 통계적추론, 모집단, 표본, 무작위표본 ○ 매개변수, 통계자료, 추정/평가, 점추정 확률 기초용어 확률과 통계 이론은 불확실성을 다루는 수학 분야 중 하나이다.확률이론은 데이터로부터 통계학적 추론을 위한 기초를 제공한다. 확률 실험(Experiment) ○ 하나의 행위가 하나 이상의 결과를 도출하는 것에 대한 과정 혹은 절차를 나타낸다. ○ 예) 동전 던지기, 주사위 던지기 등 표본공간(Sample Space) ○ 확률실험에서 발생할 수 있는 모든 결과로 구성된 집합(set)이다. ○ 표본공..
2020. 7. 5.
객체간의 비교 연산(eq, ne, lt, gt, le, ge, equals)-pandas(25)
파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 객체간의 비교 연산 본 포스팅에서는 pandas 메서드를 사용하여 객체간의 비교 연산을 수행하는 것에 대해 다루도록 한다. 객체간의 비교연산 Series와 DataFrame은 객체간 비교를 수행할 수 있도록 이항 비교 메서드(binary comparison method)들 가진다. ○ eq, ne, lt, gt, le, ge ○ 이 메서드들은 Fortran유저들이라면 익숙하지 않을까 싶다. ○ 기호로도 사용이 가능하다. 각각의 연산 메서드들의 의미는 다음과 같다. 비교연산 메서드 기호(※) 의미 eq() == 같다 ne() =! 다르다 lt() 크다 le() = 크거나 같다 ※ 기호와 메서드의 차이? A.eq(B)와 A==B는 동일한 연산을 수행..
2020. 4. 11.
객체간의 연산 add, sub, mul, div-pandas(24)
파이썬 버전 3.7 기준pandas 버전 0.25.1 기준 객체간의 연산 add, sub, mul, div 본 포스팅에서는 pandas에서 객체간의 연산과 메서드를 통한 누락데이터 처리에 대해 설명한다. 객체간의 연산 pandas와 data structure 간에 연산을 수행하기 위해, 두 가지 중요한 키포인트가 있다. ○ 브로드캐스팅(broadcasting) 거동 ▷ 높은 차원과 낮은 차원객체 간의 연산 수행 시 ○ 계산시 누락데이터(missing data)의 처리 여기서는 위의 이슈들을 어떻게 다루는지 살펴볼 것이다. 연산 메서드 개요DataFrame은 객체간의 이항 연산(binary operation)을 처리하기 위해 다양한 메서드들을 가진다. ○ add(), sub(), mul(), div(), ..
2020. 4. 5.