R 프로그래밍 22

21. (R) 벡터

- 벡터 : R에서 가장 간단하고 흔한 데이터 구조 - 벡터는 'atomic vectors'와 'lists'라는 두 가지 유형- atomic vectors는 1가지 데이터 타입 (정수형, 논리형, 문자형, 혼합형 등)- lists는 다양한 데이터 유형 logical vectors > num_vect tf tf[1] TRUE FALSE TRUE FALSE(TRUE == TRUE) | (TRUE == FALSE)TRUE| : 최소 한 가지 이상 TRUE면 된다. character vectors> my_char my_char[1] "My" "name" "is"> paste(my_char, collapse = " ") #따옴표 안에 공백 0 [1] "My name is"* paste( 벡터값,..

R 프로그래밍 2025.05.23

20. (R) 수열

> 1:20[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20> pi:10[1] 3.141593 4.141593 5.141593 6.141593 7.141593 8.141593 9.141593> 15:1[1] 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1?':'':' 연산자가 시작값과 끝값 사이의 연속된 정수 벡터를 생성한다는 설명과 사용법 (소수점이 포함되는 시퀀스 호출 희망시, seq()사용) ? 는 help(도움말) 호출 연산자 > seq(1,20)[1] 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19[20] 20> seq(0,10,by=0.5)[1]..

R 프로그래밍 2025.05.22

19. 하위집합 (목록, 행렬, 부분일치, 누락 값 제거)

1. R객체에서 하위집합을 추출하는 오퍼레이터 [ - 객체에서 다양한 요소 추출 (항상 원본과 같은 클래스 객체를 반환) [[ - 리스트나 데이터 프레임 요소 추출/ 단일 요소만 추출 (단, 반환 객체가 반드시 리스트나 데이터프레임일 필요는 없음) $ - 리스트나 데이터 프레임 요소를 문자명으로 추출 2. 하위집합 2-1. 벡터 x "a" u [1] FALSE TRUE TRUE TRUE TRUE TRUE FALSE x[u] [1] "b" "c" "c" "d" x[x > "a"] [1] "b" "c" "c" "d"2-2. 행렬 x 2-3. 리스트 xx x 2-4. 부분일치 x2-5. 누락 값 제거 x x

R 프로그래밍 2025.04.24

18. 외부에서 파일 불러오기 (R)

1. file() 텍스트 파일을 열 때 활용str(file)function(description= "파일명", open="표시형식", blocking = TRUE, encoding= getOption("en\coding"),raw=FALSE) *표시형식 옵션* r = 읽기 모드w= 쓰기 모드 (새로운 파일 시작 할 때도 포함) a = 추가 파일 rb,wb,ab = 윈도우(이진모드)에서 읽기, 쓰기, 추가 모드 예시 data 2. readLines() -텍스트 파일이 비구조적이거나 비정형화 데이터를 포함하고 있을 때 유용 -웹 페이지 코드 읽기에 유용 con con "[2] ""[3] ""[4] ""... + wirteLines() : 텍스트 파일에 쓰기 기능을 더해주는 함수

R 프로그래밍 2025.04.24

17. 텍스트 데이터 형식

1. 데이터 작성의 주요 함수 dump() dput() *dump 또는 dput에서 출력되지 않은 데이터를 읽는 데 사용하는 함수 source() dget() 2. Dput-ting R objects dput()는 R코드를 작성하고, 이를 사용해 R 개체를 다시 구성할 수 있다. y y :'y'라는 데이터 프레임을 생성, 데이터 프레임은 'a'라는 열에 숫자 1과 'b'라는 열에 문자열 "a"을 가짐dput(y) : 'y' 데이터 프레임의 구조를 R 코드 형태로 출력structure(list(a=1, b= structure(1L, .Label="a", class="factor")), .Names= c("a","b"), row.names =c(NA, -1L), class= "data.frame"): d..

R 프로그래밍 2025.04.17

16. R - 표 형식 데이터 읽기

1. 데이터 읽기 read.table(), read.csv() => 테이블 형식의 데이터를 읽기 위한 용도 (read.table의 기본 구분 기호는 공백, read.csv의 기본 구분 기호는 쉼표)read.lines() => 여러 줄의 텍스트 파일을 읽기 위한 용도 (어떤 유형의 파일이든 R에서 문자벡터로 텍스트 제공)source() => R코드를 읽는 용도 (모든 코드를 R로 읽음) dget() => R코드 파일을 읽는 데 중요하지만, 텍스트 파일(d파싱된 R객체를 읽기 위한 것) unserialize() => 이진객체를 R로 읽어들이기 위한 용도 2. 데이터 작성 유사 함수 write.table() write.Lines()dump()dput()save()serialize() +) sep 인수는 ..

R 프로그래밍 2025.04.14

14. 데이터 유형 - 누락된 값 (Missing Values)/데이터 프레임

1. 결측값R에서 결측값은 NA 또는 NaN으로 표시NaN은 정의되지 않은 수학 연산에서 사용 (NA는 이곳 저곳)NA는 잠재적으로 다른 클래스를 가질 수 있으므로NaN 값도 NA가 될 수 있지만 NA값이 반드시 NaN값이 될 수 는 없다.  is.na()  - 객체가 NA인지 테스트하는 함수 is.nan()  - 객체가 NaN인지 테스트하는 함수 x  2. 데이터 프레임 - 데이터 프레임의 각 열을 목록 요소로 간주할 수 있다. - 테이블이 되기 위해 모든 열의 길이는 같아야 하나, 같은 유형일 필요는 없다.- read.table() / read.csv() => 데이터 프레임 호출  함수- data.frame() => 데이터 프레임 호출 함수 x - data.matrix() => 데이터 프레임에서 행렬..

R 프로그래밍 2025.04.13

13. 데이터 유형 - 팩터

factor의 정의 : 수준 속성을 가진 정수 벡터: lm과 glm과 같은 모델링 기능으로 특별 처리 되므로 중요 : 선형모델 피팅을 위한 함수 factor의 2가지 유형 1. 순서가 없는 것 (범주형이지만 순서가 없는 레이블)    예: 남성과 여성 2. 순서가 있는 것 (서열은 있지만, 숫자가 아닌 것)   예: 대학에서 조교수 - 부교수 - 정교수 factor 활용 예 x 1. factor()함수에 대한 입력은 캐릭터 벡터 2. 위 코드에서는 2개의 수준을 가진 펙터 (yes와 no) 3. Level 이라는 별도의 속성 포함 4. table() 호출 시 각 수준의 빈도수 5. unclasss() 함수는 벡터에 대해 fa에 대한 클래스를 제거  x 1. 벡터 함수로 yes를 기준으로 설정했기 때문에,..

R 프로그래밍 2025.04.13