R 프로그래밍

07. 데이터 분석 종류

작심반복하기 2025. 4. 5. 15:17

 

 

1. Descriptive (설명적)

목표: 데이터 세트 설명 또는 요약  
(분석 결과를 더 큰 모집단으로 일반화하거나, 결론 내리기 위함 X/ 데이터 설명 ≠ 데이터 해석

- 일반적으로 갖아 먼저 수행하는 분석 

- 표본 및 측정값에 대해 간단한 요약 도출 

 

2. Exploratory (탐색적) 

목표: 데이터 조사, 탐색해 이전에 몰랐던 관계를 찾는 것 

- 서로 다른 값의 상관관계를 찾지만, 해당 관계의 인과성은 확인 X 

- 새로운 연관성 발견에 유용하지만, 최종 결론 X 

  (가설을 공식화하고, 향후 연구 및 데이터 수집 설계에 유용 데이터가 갖는 상관관계의 이유, 방법에 대한 최종 결론 X)

- 모든 탐색적 분석은 원인이 아니라 관계가 존재함을 보여줌 

 

3. Inferntial (추론적) 

목표: 비교적 적은 데이터 표본에 기반하여 모집단 전반에 대해 추론하는 것 

- 일반적으로 통계 모델링 목표로 적은 양의 정보를 추정해 큰 그룹에 일반화 시킴 

- 추정치에 대한 불확실성을 측정하는 작업 포함 

- 추론적 분석에서 인구 조사는 사용하면 안됨
  => 인구 조사는 이미 기능적으로 전체 인구에 대한 정보를 수집하고 있으며추론 대상이 존재하지 않음  

- 예: 대기 오염을 경험한 수준을 감안할 때, 미국 일부 인구의 기대 수명을 보장할 수 없다는 연구 

 

4. Predictive (예측적) 

목표: 현재 데이터로 미래 데이터를 예측 

- 과거, 현재 데이터의 패턴을 분석해 예측 

- 정확도와 예측은 올바른 변수 측정에 달려있음 

 

*1~4까지의 분석 방법은 '관계'만 보여줄 뿐 "관계의 원인"을 보여주진 않음

이를 보완해주는 분석인 5.Causal (인과적) 분석 

 

5. Causal (인과적) 

목표: 관계의 원인과 결과를 살펴보고, 다른 변수를  바꿀 때 하나의 변수에 어떤 일이 발생하는 지 확인하는 것 

- 관찰 데이터로만 수행하기에는 상당히 복잡 

- 인과관계 식별을 위해 설계된 무작위 연구 결과에 적용되는 경우가 多

- 데이터 분석의 최적 표준으로 간주 

- 주의할 점: 데이터는 보통 종합적으로 분석되고, 관찰 관계는 일반적으로 평균적 영향이라는 점 

 

6. Mechanistic (기계적) 

목표: 다른 변수의 정밀한 변화를 유도해 변수 변화를 세밀히 분석하는 것 

- 일반적으로 사용되지는 않음 

- 많은 추론이 요구되면 어렵지만, 단순 상황이나 결정론적 방정식으로 모델링 된 경우는 가능 

- 물리학, 공학에서 많이 사용 (예: 재료 과학 실험)