프로그램 소개
•
R 프로그램은 통계 컴퓨팅과 그래픽에 특화된 프로그래밍 언어
•
벨 연구소에서 만들어진 S언어를 기반으로 만들어진 언어
•
CRAN이라 불리는 R 네트워크를 통하여 전 세계 연구자들이 수정 및 보완
장점
•
오픈 소스이며 무료이다.
•
운영체제를 가리지 않아서 확장성에 용이하다.
단점
•
오픈 소스이기 때문에 일관성이 떨어질 수도 있다.
프로그램 설치
프로그램 실행
•
R의 강점은 기본적인 산술 연산에 있는 것이 아니라 객체에 값을 할당하고 함수들을 사용하여 객체를 다루고 분석한다.
명령문 입력
•
R에서 사용가능한 변수의 이름은 규칙이 있다.
◦
문자 a~z, A~Z, 숫자 0~9, 그리고 ‘,’ 와 ‘_’의 조합으로 구성
# a에 1이 대입 b에 2대입 a+b는 3
> a<-1
> b<-2
> a+b
[1] 3
# 세미콜론을 이용하여 한 줄에 표현가능
> a=1; b=2; a+b
[1] 3
R
복사
◦
변수 a에 문자형 값을 입력
> a<-"use R!"
> a
[1] "use R"
> mode (a) #변수 a의 속성을 확인해 주는 R의 내장함수
[1] "charactor"
R
복사
◦
숫자 1과 2의 크기 비교에 대한 논리형 “logical” 연산작업
> c <- 1 > 2
> c
[1] FALSE
> mode(c)
[1] "logical"
R
복사
스크립트 실행
•
명령어의 집합. 그래서 한 줄 입력해도 반응하지 않는다.
•
블록으로 저장하여서 실행할 수 있다.
기본 활용
벡터의 생성
•
벡터는 R에 있어서 핵심적인 역할을 한다.
•
벡터는 c() 함수를 통해서 생성이 된다.
•
결측값 (NA)의 처리를 주의해야한다.
> 1/0 # 무한대
[1] lnf
> log(-1) #이상치
[1] NaN # 결측값 Not Available
R
복사
•
R의 내장함수를 이용하여 벡터 x에 대해 합, 평균, 분산등 기초 통계량을 계산
•
표준분산
>var (x)
[1] 9.166667
>is.na(y) #각 관측치가 NA여부 판단.
R
복사
주요 수학함수
실습
> 1+2
[1] 3
> a <-1
> b<-1
> a+b
[1] 2
> b<-3
> a+b
[1] 4
R
복사
스크립트 실행
블록단위로 실행도 가능하
a<-5
b<-7
a+b
R
복사