R 프로그래밍

08. 실험 설계 용어

작심반복하기 2025. 4. 5. 15:55

실험설계

: 실험을 구성해 데이터 과학 질문에 답을 찾을 수 있는 정확하고 충분한 데이터를 얻는 것 

 

실험 설계 용어 

독립변수 (요인) : 실험자가 조작하는 변수로 X 축 

종속변수 (결과) : 변경이 예상되는 변수로 Y축 

가설: 변수와 실험 결과의 상관관계에 대한 경험적 추측 

예제>  신발 크기가 증가하면 문해력도 증가한다. 

 

표본크기: 실험에 포함할 실험 대상 수 

(최적 표본 크기를 선택하는 방법은 다양함) 

 

데이터를 수집하기 전에 실험에 잘못된 결과를 초래할 수 있는 문제를 고려해야 함. 

위 실험의 경우, 교란인자 (Confounder)로 인한 결함 발생 여부가 있음 

교란인자(Confounder) : 종속변수와 독립변수의 관계에 영향을 줄 수 있는 외부변수 

 

실험에서 발 사이즈와 문해력 모두 '나이'의 영향을 받음. 

-> 이를 통제하기 위해서는

    => 개인의 신발사이즈, 문해력 외 '나이' 측정도 진행
    => 모든 참가자 나이를 고정 

==================================================================

예제 2>  실험 약물을 투여하는 처치 집단고 투여하지 않은 집단 (대조집단

교란인자 영향 제어 전략 

1. 피험자가 자신이 배정된 집단에 대해 모르도록 하는 것 (플라시보 효과 방지) 

2. A약에는 실험약물 B약에는 설탕을 넣어 그룹별 모두 알약을 제공

 

==================================================================

복제 : 하나의 실험을 다른 실험 대상으로 반복하는 것 

(왜? 단일 실험의 결과는 우연히 발생한 가능성을 배제할 수 없기 때문) 

 

복제의 핵심은 "데이터 변동성을 보다 정확히 측정"할 수 있음에 있다. 

 

==================================================================

p- 값  (p-value) 

: 귀무가설이 참이라는 가설하에, 관측 결과가 나타날 확률 

일반적으로 과학연구에서 'p<0.05를 통계적으로 유의미하다'고 판단 

더보기

귀무가설: 통계적 가설 검정의 기본 가설로 일반적으로 '차이가 없다.' 또는 '효과가 없다'는 주장 

 

p- <0.05 : 귀무가설을 기각하고 대립가설을 지지 

 

예제> 신약 효과 검증 

귀무가설 : 신약은 위약과 비교하여 효과 차이가 없다.

대립가설: 신약은 위약 보다 효과가 있다. 

p- 해킹

claude