R 프로그래밍 22

12. 데이터 유형 - 행렬

행렬: R에서 사용되는 벡터 중 하나, 차원속성을 지님 행렬을 만드는 방법 1 > m  1. 행렬 전체가 NA 값으로 초기화 2. dim() 함수는 차원 속성을 알려주는 데, 첫번째 숫자는 행의 개수, 두번째 숫자는 열의 개수 3. attributes()함수는 첫 번째 요소가 dim 요소이고 벡터 2,3이 포함된 리스트로 반환 2> m 1. 행렬은 열 우선 방식으로 구성  3> m 1. 벡터에 대한 차원 속성을 만들어 행렬 제작  4> x binding(바인딩) : 값을 확정지어 더 이상 변경할 수 없는 구속(bind)상태로 만드는 것 1. cbind( ) -> 열 바인딩 2. rbind( ) -> 행 바인딩

R 프로그래밍 2025.04.13

11. R콘솔 입력 및 데이터 유형(벡터, 목록(List))

R 콘솔 입력표현식 : R프롬프트에 입력하는 내용 x 객체와 벡터의 개념 ( 객체 안에 벡터 )객체 정의: 데이터를 저장하는 모든 종류의 컨테이너특징: 변수, 함수, 데이터 구조 등 객체로 취급 종류: 벡터, 행렬, 데이터 프레임, 리스트, 함수 등 모두 객체  벡터 정의: 같은 유형의 데이터가 일렬로 나열된 1차원 배열 특징: R의 가장 기본적인 구조로, 모든 원소가 동일한 타입이어야 한다. 생성: c()함수로 생성 (예: c(1,2,3))x [벡터의 요소 순번] ex> [1]  '이 줄의 1번째 요소가 해당 벡터의 1번째 요소' 임을 의미  데이터 유형 1. R 개체 및 속성 - R에는 5가지 기본 원자 클래스의 객체가 있다.(문자, 숫자, 정수, 복소수, 논리함수(참/거짓))-R의 가장 기본적인 객..

R 프로그래밍 2025.04.11

10. R 코드 작성 (작업 디렉터리 설정/텍스트 편집기)- Windows

###오늘의 코드###getwd()dir()ls()read("파일명") read.csv("파일명")source()1. 작업 디렉토리 설정 작업 디렉토리 : R이 컴퓨터에서 읽고 쓸 수 있는 모든 파일을 찾는 위치  getwd() 함수 => 현재 설정되는 작업 디렉토리 확인 read("파일명")  해결책 1. 파일 위치를 작업 디렉토리 파일로 이동 2. 작업 디렉토리 파일 위치를 파일 위치로 이동  파일 -> 작업 디렉토리 변경 아래와 같이 경로 설정 dir() => 현재 바탕화면에 있는 파일 목록 확인 가능 read.csv("mydata.csv") 입력 ============================================================2. 텍스트 편집기  Whymyfunction..

R 프로그래밍 2025.04.10

09. 빅데이터 & 1강좌 실습과제 (Git bash 코드 정리)

-질문은 많은 양의 데이터를 보유하는 것이 유리하다. -데이터에 있는 약간의 부정확함은 데이터의 절대적인 규모로 그 영향력이 상쇄 가능하다. -빅데이터는 '왜'가 아닌 '무엇'에 대한 답을 제공한다. -올바른 질문과 적합한 데이터를 찾아야한다.  ======================================================== 1강좌  실습 과제 후기 크게 3 문항 정도의 실습 형태로 제공된다. 그 동안 배운 내용들이라서 강의 자료를 잘 정리해 두었다면, 난이도는 어렵지 않았다. 실습 과제를 하면서 느낀 것은 "꼼꼼함'최종과제를 제출하고, 다른 학생 과제를 평가해보는 시간이 스스로에게 좋은 피드백이 되었다. 1. 파일 확장명 정확히 보기 (.rmd/.md)2. terminal과 bas..

R 프로그래밍 2025.04.06

08. 실험 설계 용어

실험설계: 실험을 구성해 데이터 과학 질문에 답을 찾을 수 있는 정확하고 충분한 데이터를 얻는 것  실험 설계 용어 독립변수 (요인) : 실험자가 조작하는 변수로 X 축 종속변수 (결과) : 변경이 예상되는 변수로 Y축 가설: 변수와 실험 결과의 상관관계에 대한 경험적 추측 예제>  신발 크기가 증가하면 문해력도 증가한다.  표본크기: 실험에 포함할 실험 대상 수 (최적 표본 크기를 선택하는 방법은 다양함)  데이터를 수집하기 전에 실험에 잘못된 결과를 초래할 수 있는 문제를 고려해야 함. 위 실험의 경우, 교란인자 (Confounder)로 인한 결함 발생 여부가 있음 교란인자(Confounder) : 종속변수와 독립변수의 관계에 영향을 줄 수 있는 외부변수  실험에서 발 사이즈와 문해력 모두 '나이'의..

R 프로그래밍 2025.04.05

07. 데이터 분석 종류

1. Descriptive (설명적)목표: 데이터 세트 설명 또는 요약  (분석 결과를 더 큰 모집단으로 일반화하거나, 결론 내리기 위함 X/ 데이터 설명 ≠ 데이터 해석 ) - 일반적으로 갖아 먼저 수행하는 분석 - 표본 및 측정값에 대해 간단한 요약 도출  2. Exploratory (탐색적) 목표: 데이터 조사, 탐색해 이전에 몰랐던 관계를 찾는 것 - 서로 다른 값의 상관관계를 찾지만, 해당 관계의 인과성은 확인 X - 새로운 연관성 발견에 유용하지만, 최종 결론 X   (가설을 공식화하고, 향후 연구 및 데이터 수집 설계에 유용 데이터가 갖는 상관관계의 이유, 방법에 대한 최종 결론 X)- 모든 탐색적 분석은 원인이 아니라 관계가 존재함을 보여줌  3. Inferntial (추론적) 목표: 비교..

R 프로그래밍 2025.04.05

06. R Markdown

R Markdown:텍스트와 코드를 모두 결합할 수 있는 문서를 작성하는 방법  R Markdown 장점 - 재현성 - 버전관리 시스템과의 쉬운 연동 (R Markdown이 일반 텍스트 이기 때문)- 사용 용이-  결과를 인라인 코드로 렌더링  1. R Markdown 실행 install.packages("rmarkdown")HEADER : 제목, 이름, 날짜 및 희망하는 출력 문서 형태 TEXT : 파일 생성 시 텍스트로 렌더링 되는 부분 Knit : 일반텍스트와 코드 최종문서화  2. R Markdown 문서 고유 포맷팅 1> 텍스트 볼드체로 표시하는 방법 2> CodeCunck 만들기 -3개의 백틱 입력, 그 뒤에 중괄호로 소문자 r 둘러싸기 ```{r} + Code Cunck 단축키 - Windo..

R 프로그래밍 2025.04.03

05. Rstudio, Git, Github 연결하기 (버전관리 및 프로젝트 참여 시)

1. 버전관리 되지 않은 로컬 프로젝트를 git과 github에 연결하기 1-1. git 과 연결step 1 > 새로운 R project 생성 (temporary_add_to_version_control)  step 2> git 과 연결 (git bash)-디렉토리 git 저장소로 초기화 step 3 > git add . (띄어쓰기 주의) - 디렉토리 내 모든 파일을 로컬 저장소에 추가  step 4 > git commit -m "Initial Commit" 입력 (띄어쓰기 주의) - 변경 사항 git 저장소에 커밋 1-2.  github와 연결 step 5>  github 새 리포지토리 생성 step 6>   ... from the command line 코드 복사 step 7>  해당 코드 git b..

R 프로그래밍 2025.04.01

04. Github설치 및 Rstudio와 연결

1. Git과 Github 연결 * git config --global user.name "이름" * git config --global user.email 이메일주소* 이메일은 Github 가입 메일로 입력* git config --list  입력 -> 변경 내용 확인   변경을 원한다면, 아래 값 재입력    git config --global user.name "이름"    git config --global user.email 이메일주소  값 입력 후 exit 입력 -> 커맨드라인 종료  2.  Git 과 Rstudio 연결 * view public key 내용 클릭 -> 코드 복사 * Github settings -> SSH and GPG keys -> New SSH key* 새 리포지토리 생성..

R 프로그래밍 2025.03.30

03. 버전관리 및 Git 용어 정리

1. 버전관리란? 하나의 파일 또는 파일 집합의 변경 내용을 시간에 따라 기록하는 시스템  2. Git 란? 무료 오픈소스 버전 관리 시스템 Github는 Git의 온라인 인터페이스 (like dropbox)  3. Git 용어 - Repository -> Reop   : 저장소  - Commit  :편집내용과 변경사항 저장 (변경사항의 스냅샷)  * 커밋에는 목적이 있어야 한다. 하나의 커밋은 하나의 문제를 해결해야 함 * 커밋에 정보(목적 등)를 담은 메시지 작성 습관화 하기  - Push  : 편집내용을 저장소에 업로드  - Pull  : 저장소의 로컬버전을 현재 버전으로 업데이트  (주 저장소 버전이 최신인지 확인하는 용도)  -  Staging  : 커밋 파일 준비 작업으로 별도의 커밋 분리에 ..

R 프로그래밍 2025.03.28