R은 무엇이고, 왜 R인가에 대해서 알아보았으므로 이제 직접 R을 다운로드해서 컴퓨터에 설치해보도록 하겠다.
- 하둡 클러스터 설치하는 것마냥 복잡하고 어려운 것도 아니고 (다운로드, 몇번 클릭하다보면 설치 끝),
- 상용 통계 툴처럼 다운로드 하는데 시간 올래걸리지도 않으며 (base 패키지 파일 사이즈 작음. 62Megabytes),
- 사용자 등록을 하라는 메시지가 뜨지도 않는다. (오픈소스니깐)
아래의 절차에 따라 차근차근 따라서 진행해보도록 하자.
1. CRAN(The Comprehensive R Archive Network, http://www.cran.r-project.org/)에 접속하기
CRAN 사이트에 접속하면 아래와 같은 화면이 보일 것이다.
CRAN 사이트는 R 사용자라면 앞으로 자주 방문할 곳이므로 북마크를 해놓도록 하자. 수많은 패키지 검색, 다운로드, 매뉴얼, R 새로운 소식 등을 접할 수 있는 R의 허브이자 정보집합소이다.
2. 해당 OS에 맞게 R 다운로드 하기 선택
Linix, (Mac) OS X, Windows 중에서 본인의 컴퓨터에 해당하는 OS를 선택하여 다운로드 하도록 한다.
3. Subdirectories에서 'base'를 선택
분석/그래픽/프로그램 용도로 사용할 것이므로 base, contrib, Rtools 의 세개 카테고리 중에서 'base' 시스템을 선택하여 다운로드 하도록 한다.
(참고로, R은 base 시스템을 먼저 설치하고(지금 이거 하고 있는 중임), (분석 기법별) 패키지를 이후에 하나씩 추가로 필요에 따라서 설치해서 사용하게 된다.)
4. 버전, OS 확인하고 다운로드 하기
필자는 Windows 사용 중이므로 'Download R 3.2.1 for Windows'를 클릭해서 다운로드 하였다.
(참고로, R은 버전 upgrade가 활발하게 이루어지고 있는 편이고, 버전에 따라서 설치해둔 패키지가 안돌아가는 경우도 있고 해서 사용하다가 어느 정도 기간이 지나면 upgrade를 해주어야 하는 일이 생긴다.)
미러 사이트를 선택하라는 메시지가 나올텐데 'Korea' 3군데 중에서 한 곳을 선택해서 다운로드 하도록 하자.
5. 다운로드한 R파일 클릭해서 설치 시작하기
독자의 컴퓨터의 '다운로드' 폴더에 가보면 'R-3.2.1-win' 이라는 방금전 다운로드 받은 프로그램 파일이 들어있을 것이다. 클릭해서 설치 시작하도록 하자.
설치 언어 '한국어' 선택하고, 디폴트 상태 유지한 채로 '예(Yes)'만 계속 몇 번 클릭하다 보면 어느새 설치 끝난다.
6. R 실행하기
컴퓨터바탕화면에 가보면 R 프로그램 아이콘이 새로 생긴 것을 확인할 수 있다.
R i386 3.2.1 은 "32비트" 컴퓨터용의 R 3.2.1 버전이라는 뜻이고, R x64 3.2.1 은 "64비트" 컴퓨터용의 R 3.2.1 버전이라는 뜻이다.
64비트로 처리하는 R x64 3.2.1이 처리속도 면에서 당연히 빠르겠지만, 본인의 컴퓨터가 이를 지원하도록 세팅이 되어있는지 확인하고 자신에게 해당하는 프로그램을 선택해서 쓰면 된다.
R이 메모리 기반으로 분석을 진행하다보니 대용량 데이터를 클라이언트PC에서 돌리다 보면 뻣어버리는 수가 있다.
7. R 실행화면
컴퓨터 바탕화면에 있는 R 아이콘 클릭했더니, 아래의 R 프로그램 화면이 뜬다면 설치 성공했다는 뜻이다.
R Console의 프롬프트(>) 옆에 아래와 같이 한 줄씩 입력한 후 [Enter]키를 누른다.
> x <- c(2, 4, 5, 3, 6, 1, 6, 4, 5, 3)
> y <- c(6, 7, 4, 9, 8, 9, 7, 9, 8, 9)
> mean(x)
> mean(y)
> t.test(x, y, alternative=”two.sided”, paired=FALSE) |
c(2, 4,…): 괄호 안에 있는 숫자들을 하나의 열 벡터(vector)로 합친다
x <- c(…): x라는 변수에 생성한 벡터를 할당
mean(x): x라는 변수에 들어있는 값들의 산술 평균을 계산
t.test(x, y,… ): 독립적인 두 그룹 x, y의 평균 차이에 대한 t 검정
명령어 뒤에 [Enter]키를 누르면 입력한 명령어에 따라서 바로 다음 줄에
결과를 출력하기도 하고 내부적으로 명령을 수행한 후 아무 응답 없이
다음 명령어 입력을 기다리는 프롬프트를 출력하기도 한다.
다음은 정상적으로 명령어를 입력하였을 때의 R Console 화면이다.
> x <- c(2,4,5,3,6,1,6,4,5,3)
> y <- c(6,7,4,9,8,9,7,9,8,9)
> mean(x)
[1] 3.9
> mean(y)
[1] 7.6
> t.test(x,y,alternative="two.sided", paired=FALSE)
Welch Two Sample t-test
data: x and y
t = -4.9992, df = 17.998, p-value = 9.303e-05
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-5.254946 -2.145054
sample estimates:
mean of x mean of y
3.9 7.6 |
명령어 입력 후 [Enter]를 눌렀을 때 경우에 따라서는 다음 줄에 + 표시가 나타나기도 하는데 이는 온전한 명령어를 입력하지 않은 상태에서 [Enter]키를 눌렀을 때이다. 명령어 문장을 문법에 맞추어 나머지 명령어를 입력하거나 [Esc]키를 눌러 명령어 입력을 취소하면 프롬프트(>) 상태로 돌아올 수 있다.
R을 종료하기 위해서는 RGui의 [파일] 메뉴에서 [종료]를 선택하거나 프롬프트에서 q( )라는 명령어를 입력한 후 [Enter]키를 누르면 된다.