머신러닝 및 딥러닝/R

[데이터 분석 with R] R 스튜디오에서 패키지 설치하기 (feat. 자주 쓰이는 패키지 추천)

삡삐in오즈 2021. 5. 30. 10:01
728x90
반응형


R 패키지란?

R 패키지란 사용자들이 만들어 놓은 함수 function이랑 데이터셋 모음집이다. R의 기본 기능을 개선하거나 새로운 기능을 추가할 수 있다.

데이터 분석에서 자주 쓰이는 패키지:

  • ggplot2 - 데이터 시각화에 자주 쓰이는 패키지이다.
  • dplyr/dbplyr - 데이터 조작(data manipulation)에 쓰이는 패키지. 파이썬의 pandas 또는 엑셀 (excel)처럼 테이블 식 데이터에서 원하는 열을 선택하거나, 원하는 값으로 filter, 열이나 행을 어떤 기준으로 정렬 arrange 하기 등등 다양한 데이터 조작이 가능하다.
  • mlr3 & caret - 머신러닝 기법을 사용할 수 있는 패키지
  • tidyverse - '데이터 과학을 위한 패키지'로 유명하며 데이터 분석에 주로 쓰이는 함수의 모음집이다 (ggplot2, dplyr가 포함되어 있다)

이 외에도 다양한 모델링 용 패키지, 리포트 작성에 도움이 되는 패키지, 시계열, 금융 데이터를 다루기 위해 쓰이는 패키지등 다양한 목적을 위한 패키지가 존재한다. CRAN (R 정식 웹사이트)에 올라온 패키지 수만 17,636개이다.

 

 

 

 

패키지 설치하기

패키지를 설치하고 싶을 때에는 R 쉘이나 R스튜디오 콘솔창에 install.packages()하고 괄호안에 원하는 패키지 이름을 써주면 끝! (쌍따옴표나 따옴표 안에 써줘야한다)

 

# ggplot2 패키지 설치하기
install.package("ggplot2")

 

R스튜디오 화면

 

 

다운로드한 패키지를 사용하려면 library(ggplot2)로 불러온 후 사용 가능하다. 

다운로드한 패키지를 로드 할 경우 따옴표는 필요없다.

# 패키지 설치
install.packages("ggplot2")

# 패키지 로드
library(ggplot2)

 

 

 

밑은 R에 포함되어 있는 mtcars 데이터셋을 사용하여 그려본 차트이다.

ggplot2 라이브러리를 사용하여 그린 차트

 

728x90
반응형