R 프로그래밍

14. 데이터 유형 - 누락된 값 (Missing Values)/데이터 프레임

작심반복하기 2025. 4. 13. 15:59

1. 결측값

R에서 결측값은 NA 또는 NaN으로 표시

NaN은 정의되지 않은 수학 연산에서 사용 (NA는 이곳 저곳)

NA는 잠재적으로 다른 클래스를 가질 수 있으므로

NaN 값도 NA가 될 수 있지만 NA값이 반드시 NaN값이 될 수 는 없다. 

 

is.na()  - 객체가 NA인지 테스트하는 함수 

is.nan()  - 객체가 NaN인지 테스트하는 함수 

x <- c(1, 2, NA, 10, 3)  #숫자벡터 
is.na(x) #논리벡텉 
[1] FALSE FALSE TRUE FALSE FALSE 
is.nan(x) 
[1] FALSE FALSE FALSE FALSE FALSE #NAN 값이 없기 때문/NA값이 NAN 값이 될 수 는 없다.
x <- c(1, 2, NaN, NA, 4) 
is.na(x) 
[1] FALSE FALSE TRUE TRUE FALSE  #NAN 값이 NA 값이 될 수는 있다.
is.nan(x) 
[1] FALSE FALSE TRUE FALSE FALSE

 

2. 데이터 프레임 

- 데이터 프레임의 각 열을 목록 요소로 간주할 수 있다. 

- 테이블이 되기 위해 모든 열의 길이는 같아야 하나, 같은 유형일 필요는 없다.

- read.table() / read.csv() => 데이터 프레임 호출  함수

- data.frame() => 데이터 프레임 호출 함수 

x <- data.frame(foo=1:4, bar=c(T,T,F,F))
x 
  foo  bar
1   1  TRUE
2   2  TRUE
3   3  FALSE 
4   4  FALSE
nrow(x) 
[1]  4
ncol(x) 
[1]  2

- data.matrix() => 데이터 프레임에서 행렬ㅇ르 만드는 함수