NLP/NLP 기초

EDA(Exploratory Data Analysis)

데이터 세상 2021. 3. 15. 18:32

EDA(Exploratory Data Analysis)

  • 탐색적 데이터 분석
  • 정해진 틀 없이 데이터에 대해 최대한 많은 정보를 추출
  • 데이터에 대한 정보
    • 데이터의 평균값, 중앙값, 최솟값, 최댓값, 범위 분포, 이상치(outlier) 등
    • 데이터 변수 간의 관계, Null 값과 같은 결측값(missing value) 존재 유무 등을 파악

데이터를 분석할 때는 분석가의 선입견을 철저하게 배제하고 데이터가 부여주는 수치만으로 분석을 진행해야 한다

탐색적 데이터 분석 흐름도

 

반응형

'NLP > NLP 기초' 카테고리의 다른 글

[NLP] Data Preprocessing  (0) 2021.03.15
[NLP] 텍스트 전처리  (0) 2021.03.15
[NLP] Kaggle  (0) 2021.03.15
[NLP] Machine Comprehension  (0) 2021.03.15
[NLP] NLP(Natural Language Processing)  (0) 2021.03.12