Johns Hopkins University 19

19. 하위집합 (목록, 행렬, 부분일치, 누락 값 제거)

1. R객체에서 하위집합을 추출하는 오퍼레이터 [ - 객체에서 다양한 요소 추출 (항상 원본과 같은 클래스 객체를 반환) [[ - 리스트나 데이터 프레임 요소 추출/ 단일 요소만 추출 (단, 반환 객체가 반드시 리스트나 데이터프레임일 필요는 없음) $ - 리스트나 데이터 프레임 요소를 문자명으로 추출 2. 하위집합 2-1. 벡터 x "a" u [1] FALSE TRUE TRUE TRUE TRUE TRUE FALSE x[u] [1] "b" "c" "c" "d" x[x > "a"] [1] "b" "c" "c" "d"2-2. 행렬 x 2-3. 리스트 xx x 2-4. 부분일치 x2-5. 누락 값 제거 x x

R 프로그래밍 2025.04.24

18. 외부에서 파일 불러오기 (R)

1. file() 텍스트 파일을 열 때 활용str(file)function(description= "파일명", open="표시형식", blocking = TRUE, encoding= getOption("en\coding"),raw=FALSE) *표시형식 옵션* r = 읽기 모드w= 쓰기 모드 (새로운 파일 시작 할 때도 포함) a = 추가 파일 rb,wb,ab = 윈도우(이진모드)에서 읽기, 쓰기, 추가 모드 예시 data 2. readLines() -텍스트 파일이 비구조적이거나 비정형화 데이터를 포함하고 있을 때 유용 -웹 페이지 코드 읽기에 유용 con con "[2] ""[3] ""[4] ""... + wirteLines() : 텍스트 파일에 쓰기 기능을 더해주는 함수

R 프로그래밍 2025.04.24

17. 텍스트 데이터 형식

1. 데이터 작성의 주요 함수 dump() dput() *dump 또는 dput에서 출력되지 않은 데이터를 읽는 데 사용하는 함수 source() dget() 2. Dput-ting R objects dput()는 R코드를 작성하고, 이를 사용해 R 개체를 다시 구성할 수 있다. y y :'y'라는 데이터 프레임을 생성, 데이터 프레임은 'a'라는 열에 숫자 1과 'b'라는 열에 문자열 "a"을 가짐dput(y) : 'y' 데이터 프레임의 구조를 R 코드 형태로 출력structure(list(a=1, b= structure(1L, .Label="a", class="factor")), .Names= c("a","b"), row.names =c(NA, -1L), class= "data.frame"): d..

R 프로그래밍 2025.04.17

16. R - 표 형식 데이터 읽기

1. 데이터 읽기 read.table(), read.csv() => 테이블 형식의 데이터를 읽기 위한 용도 (read.table의 기본 구분 기호는 공백, read.csv의 기본 구분 기호는 쉼표)read.lines() => 여러 줄의 텍스트 파일을 읽기 위한 용도 (어떤 유형의 파일이든 R에서 문자벡터로 텍스트 제공)source() => R코드를 읽는 용도 (모든 코드를 R로 읽음) dget() => R코드 파일을 읽는 데 중요하지만, 텍스트 파일(d파싱된 R객체를 읽기 위한 것) unserialize() => 이진객체를 R로 읽어들이기 위한 용도 2. 데이터 작성 유사 함수 write.table() write.Lines()dump()dput()save()serialize() +) sep 인수는 ..

R 프로그래밍 2025.04.14

14. 데이터 유형 - 누락된 값 (Missing Values)/데이터 프레임

1. 결측값R에서 결측값은 NA 또는 NaN으로 표시NaN은 정의되지 않은 수학 연산에서 사용 (NA는 이곳 저곳)NA는 잠재적으로 다른 클래스를 가질 수 있으므로NaN 값도 NA가 될 수 있지만 NA값이 반드시 NaN값이 될 수 는 없다.  is.na()  - 객체가 NA인지 테스트하는 함수 is.nan()  - 객체가 NaN인지 테스트하는 함수 x  2. 데이터 프레임 - 데이터 프레임의 각 열을 목록 요소로 간주할 수 있다. - 테이블이 되기 위해 모든 열의 길이는 같아야 하나, 같은 유형일 필요는 없다.- read.table() / read.csv() => 데이터 프레임 호출  함수- data.frame() => 데이터 프레임 호출 함수 x - data.matrix() => 데이터 프레임에서 행렬..

R 프로그래밍 2025.04.13

13. 데이터 유형 - 팩터

factor의 정의 : 수준 속성을 가진 정수 벡터: lm과 glm과 같은 모델링 기능으로 특별 처리 되므로 중요 : 선형모델 피팅을 위한 함수 factor의 2가지 유형 1. 순서가 없는 것 (범주형이지만 순서가 없는 레이블)    예: 남성과 여성 2. 순서가 있는 것 (서열은 있지만, 숫자가 아닌 것)   예: 대학에서 조교수 - 부교수 - 정교수 factor 활용 예 x 1. factor()함수에 대한 입력은 캐릭터 벡터 2. 위 코드에서는 2개의 수준을 가진 펙터 (yes와 no) 3. Level 이라는 별도의 속성 포함 4. table() 호출 시 각 수준의 빈도수 5. unclasss() 함수는 벡터에 대해 fa에 대한 클래스를 제거  x 1. 벡터 함수로 yes를 기준으로 설정했기 때문에,..

R 프로그래밍 2025.04.13

12. 데이터 유형 - 행렬

행렬: R에서 사용되는 벡터 중 하나, 차원속성을 지님 행렬을 만드는 방법 1 > m  1. 행렬 전체가 NA 값으로 초기화 2. dim() 함수는 차원 속성을 알려주는 데, 첫번째 숫자는 행의 개수, 두번째 숫자는 열의 개수 3. attributes()함수는 첫 번째 요소가 dim 요소이고 벡터 2,3이 포함된 리스트로 반환 2> m 1. 행렬은 열 우선 방식으로 구성  3> m 1. 벡터에 대한 차원 속성을 만들어 행렬 제작  4> x binding(바인딩) : 값을 확정지어 더 이상 변경할 수 없는 구속(bind)상태로 만드는 것 1. cbind( ) -> 열 바인딩 2. rbind( ) -> 행 바인딩

R 프로그래밍 2025.04.13

11. R콘솔 입력 및 데이터 유형(벡터, 목록(List))

R 콘솔 입력표현식 : R프롬프트에 입력하는 내용 x 객체와 벡터의 개념 ( 객체 안에 벡터 )객체 정의: 데이터를 저장하는 모든 종류의 컨테이너특징: 변수, 함수, 데이터 구조 등 객체로 취급 종류: 벡터, 행렬, 데이터 프레임, 리스트, 함수 등 모두 객체  벡터 정의: 같은 유형의 데이터가 일렬로 나열된 1차원 배열 특징: R의 가장 기본적인 구조로, 모든 원소가 동일한 타입이어야 한다. 생성: c()함수로 생성 (예: c(1,2,3))x [벡터의 요소 순번] ex> [1]  '이 줄의 1번째 요소가 해당 벡터의 1번째 요소' 임을 의미  데이터 유형 1. R 개체 및 속성 - R에는 5가지 기본 원자 클래스의 객체가 있다.(문자, 숫자, 정수, 복소수, 논리함수(참/거짓))-R의 가장 기본적인 객..

R 프로그래밍 2025.04.11

10. R 코드 작성 (작업 디렉터리 설정/텍스트 편집기)- Windows

###오늘의 코드###getwd()dir()ls()read("파일명") read.csv("파일명")source()1. 작업 디렉토리 설정 작업 디렉토리 : R이 컴퓨터에서 읽고 쓸 수 있는 모든 파일을 찾는 위치  getwd() 함수 => 현재 설정되는 작업 디렉토리 확인 read("파일명")  해결책 1. 파일 위치를 작업 디렉토리 파일로 이동 2. 작업 디렉토리 파일 위치를 파일 위치로 이동  파일 -> 작업 디렉토리 변경 아래와 같이 경로 설정 dir() => 현재 바탕화면에 있는 파일 목록 확인 가능 read.csv("mydata.csv") 입력 ============================================================2. 텍스트 편집기  Whymyfunction..

R 프로그래밍 2025.04.10