728x90
반응형
EDA(Exploratory Data Analysis)
- 탐색적 데이터 분석
- 정해진 틀 없이 데이터에 대해 최대한 많은 정보를 추출
- 데이터에 대한 정보
- 데이터의 평균값, 중앙값, 최솟값, 최댓값, 범위 분포, 이상치(outlier) 등
- 데이터 변수 간의 관계, Null 값과 같은 결측값(missing value) 존재 유무 등을 파악
데이터를 분석할 때는 분석가의 선입견을 철저하게 배제하고 데이터가 부여주는 수치만으로 분석을 진행해야 한다
728x90
반응형
'NLP > NLP 기초' 카테고리의 다른 글
[NLP] Data Preprocessing (0) | 2021.03.15 |
---|---|
[NLP] 텍스트 전처리 (0) | 2021.03.15 |
[NLP] Kaggle (0) | 2021.03.15 |
[NLP] Machine Comprehension (0) | 2021.03.15 |
[NLP] NLP(Natural Language Processing) (0) | 2021.03.12 |