NLP/NLP 기초
EDA(Exploratory Data Analysis)
데이터 세상
2021. 3. 15. 18:32
728x90
반응형
EDA(Exploratory Data Analysis)
- 탐색적 데이터 분석
- 정해진 틀 없이 데이터에 대해 최대한 많은 정보를 추출
- 데이터에 대한 정보
- 데이터의 평균값, 중앙값, 최솟값, 최댓값, 범위 분포, 이상치(outlier) 등
- 데이터 변수 간의 관계, Null 값과 같은 결측값(missing value) 존재 유무 등을 파악
데이터를 분석할 때는 분석가의 선입견을 철저하게 배제하고 데이터가 부여주는 수치만으로 분석을 진행해야 한다
728x90
반응형