실험설계
: 실험을 구성해 데이터 과학 질문에 답을 찾을 수 있는 정확하고 충분한 데이터를 얻는 것
실험 설계 용어
독립변수 (요인) : 실험자가 조작하는 변수로 X 축
종속변수 (결과) : 변경이 예상되는 변수로 Y축
가설: 변수와 실험 결과의 상관관계에 대한 경험적 추측
예제> 신발 크기가 증가하면 문해력도 증가한다.
표본크기: 실험에 포함할 실험 대상 수
(최적 표본 크기를 선택하는 방법은 다양함)
데이터를 수집하기 전에 실험에 잘못된 결과를 초래할 수 있는 문제를 고려해야 함.
위 실험의 경우, 교란인자 (Confounder)로 인한 결함 발생 여부가 있음
교란인자(Confounder) : 종속변수와 독립변수의 관계에 영향을 줄 수 있는 외부변수
실험에서 발 사이즈와 문해력 모두 '나이'의 영향을 받음.
-> 이를 통제하기 위해서는
=> 개인의 신발사이즈, 문해력 외 '나이' 측정도 진행
=> 모든 참가자 나이를 고정
==================================================================
예제 2> 실험 약물을 투여하는 처치 집단고 투여하지 않은 집단 (대조집단)
교란인자 영향 제어 전략
1. 피험자가 자신이 배정된 집단에 대해 모르도록 하는 것 (플라시보 효과 방지)
2. A약에는 실험약물 B약에는 설탕을 넣어 그룹별 모두 알약을 제공
==================================================================
복제 : 하나의 실험을 다른 실험 대상으로 반복하는 것
(왜? 단일 실험의 결과는 우연히 발생한 가능성을 배제할 수 없기 때문)
복제의 핵심은 "데이터 변동성을 보다 정확히 측정"할 수 있음에 있다.
==================================================================
p- 값 (p-value)
: 귀무가설이 참이라는 가설하에, 관측 결과가 나타날 확률
일반적으로 과학연구에서 'p<0.05를 통계적으로 유의미하다'고 판단
귀무가설: 통계적 가설 검정의 기본 가설로 일반적으로 '차이가 없다.' 또는 '효과가 없다'는 주장
p- <0.05 : 귀무가설을 기각하고 대립가설을 지지
예제> 신약 효과 검증
귀무가설 : 신약은 위약과 비교하여 효과 차이가 없다.
대립가설: 신약은 위약 보다 효과가 있다.
p- 해킹
'R 프로그래밍' 카테고리의 다른 글
10. R 코드 작성 (작업 디렉터리 설정/텍스트 편집기)- Windows (0) | 2025.04.10 |
---|---|
09. 빅데이터 & 1강좌 실습과제 (Git bash 코드 정리) (0) | 2025.04.06 |
07. 데이터 분석 종류 (0) | 2025.04.05 |
06. R Markdown (0) | 2025.04.03 |
05. Rstudio, Git, Github 연결하기 (버전관리 및 프로젝트 참여 시) (0) | 2025.04.01 |