728x90
반응형

전체 글 49

[R] 데이터프레임 열 이름/변수명 바꾸기

이번 글에서는 R에서 데이터 프레임 열 이름을 바꾸는 방법에 대해 소개해보겠습니다. 특히 외부 데이터를 불러올 경우 원하지 않는 형식의 열 이름으로 불러올 경우가 있습니다. 이해하기 쉬운 열 이름으로 바꾸면 더 수월하게 작업할 수 있게 됩니다. 📊 샘플 데이터 프레임 예제로 변수가 3개인 데이터 프레임 df을 생성했습니다. df df v1 v2 v3 1 1 Harry 70 2 2 Ron 50 3 3 Hermione 100 ✏️ colnames() 사용 colnames()를 사용하여 데이터 프레임 df의 변수명을 확인해보겠습니다. > colnames(df) [1] "v1" "v2" "v3" 열 이름을 바꾸기 전에 df2라는 복사본을 만들겠습니다. 이렇게 할 경우 원본 데이터 프레임 df는 변하지 않으며 원..

[태블로 독학 시작] 태블로 Tableau란?

Tableau 태블로 태블로는 데이터 시각화 전용 플랫폼으로 비즈니스 인텔리전스 (BI) 업계에서 자주 쓰이는 툴이다. 비슷하게 유명한 툴로는 마이크로소프트 파워 BI가 있다. 파이썬이나 R 같은 프로그래밍 언어를 사용할 필요가 없으며 다른 도구에 비해 쉽게 배울 수 있기로 유명하다. 다양한 차트를 사용해 대시보드를 만들어 낼수있다. 태블로 제품 태블로는 클라우드 기반 솔루션인 Tableau Cloud, 데스크탑 용인 Tableau Desktop, 데이터 준비 및 정리를 도와주는 툴 Tableau Prep Builder 등등 다양한 제품을 다양한 요금제로 제공하고 있으니 웹사이트에서 자세한 내용을 확인해보세요. 무료인 Tableau Public https://public.tableau.com/app/di..

[파이썬] 모듈, 패키지, 라이브러리란?

모듈 모듈 module은 여러 클래스, 함수, 변수를 가지고 있는 파이썬 파일(.py)입니다. 파이썬에 기본적으로 내장되어 있는 내장 모듈, 다른 사람들이 만든 외부 모듈, 또는 직접 작성한 개인 모듈을 불러와 파일 안에 해당 클래스와 함수를 사용할 수 있습니다. 파이썬에서 제공하는 내장 (built-in) 모듈은 따로 설치가 필요 없이 바로 사용 가능합니다. 아래와 같이 모듈들인 비슷한 기능을 제공합니다. 자주 쓰이는 내장 모듈 몇개: datetime - 날짜와 시간 다루는 기능 e.g. 지금 날짜 출력 time - 시간 관련된 기능 e.g. 프로그램 몇 초간 실행 멈추기, 코드 실행시간 측정하기 math - 수학에 관련된 기능 e.g. 자연로그, 코사인, 사인 등등 random - 랜덤 한 값을 생성..

[파이썬] 딕셔너리와 반복문/for

딕셔너리 & 반복문 for 딕셔너리는 키(key)를 기반으로 값(value)을 저장하는 자료형입니다. 딕셔너리 예제: my_dict = { "name": "Harry Potter", "house": "Gryffindor", "age": 18 } 딕셔너리 역시 for문을 사용하여 동일한 코드를 키, 값에 실행할 수 있습니다. 이 글에선 위 my_dict를 사용하여 여러가지 예제를 살펴보겠습니다. 키 key 이름 출력하기 for문을 딕셔너리에 사용한다면 딕셔너리 내부에 있는 키가 변수로 사용됩니다. "for 키 변수 in 딕셔너리:" for key in my_dict: print(key) 아래와 같이 키 변수가 출력됩니다. name house age 또는 keys() 함수를 사용해서 딕셔너리의 키만 뽑아내 ..

[파이썬] for문 사용하기 (반복문, range, 예제)

반복문 (for문) 반복문(loop)은 어떠한 코드를 반복 처리를 하고 싶을때 사용할 수 있습니다. for문은 주로 리스트, 딕셔너리, 튜플, range 같은 이터레이터(iterator) 객체에 사용됩니다. for문의 기본 형태: for 변수 in 이터레이터 (리스트, 딕셔너리 등): 코드 예제) 리스트 안에 요소 각각 출력하기 letters는 'a', 'b', 'c', 'd' 네 가지의 문자열을 가지고 있는 리스트입니다. for문을 통해 리스트 안에 있는 요소를 각각 출력해보겠습니다. # 네 가지 요소가 저장된 리스트 'letters' letters = ['a', 'b', 'c', 'd'] # 리스트에 print()코드를 반복적으로 적용하기 for x in letters: print(x) output:..

[파이썬] 🥒피클 pickle - 파일 저장하기, 불러오기

pickle이란? 'pickle'은 파이썬 객체를 파일로 저장하고 불러오는데 쓰이는 모듈입니다. 예를 들어 작업 중인 파이썬 객체를 저장해 두고 나중에 이어서 작업하고 싶을 경우 사용하면 좋은 모듈입니다. 저 같은 경우에는 데이터 분석 중 정리, 분석, 변환 과정을 거친 배열을 피클 모듈을 사용해 파일로 저장한 후 다음 작업 때 불러와 쓴 경우가 많습니다. 파이썬 객체를 파일로 변환하는 과정은 Pickling (피클링)이라고 하고 반대로 파일을 불러올 경우 Unpickling이라고 합니다. pickle 활용법 먼저 피클 모듈을 아래와 같이 불러옵니다. import pickle 파일 저장하기: 피클링할 경우 (파이썬 객체 → 파일) pickle.dump(object, file) 파일 불러오기: 언피클링할 ..

[윈도우] MySQL 다운로드 & 설치하기

MySQL Community Edition MySQL의 제일 흔한 버전으로 Oracle사에서 제공하는 오픈소스 버전입니다. 다운로드는 MySQL 웹사이트에서 할 수 있습니다. https://www.mysql.com/products/community/ MySQL :: MySQL Community Edition MySQL Community Edition MySQL Community Edition is the freely downloadable version of the world's most popular open source database. It is available under the GPL license and is supported by a huge and active community of ope..

[파이썬] 데이터프레임 특정 조건에 맞는 값 추출하기

판다스 데이터프레임을 사용하여 데이터를 살펴볼 때 자주 필요한 필터링에 관한 글입니다. 판다스 라이브러리 부르고 샘플 데이터 입력하기: import pandas as pd data = {'name': ['Harry Potter', 'Draco Malfoy', 'Hermione Granger', 'Ron Weasley', 'Luna Lovegood'], 'age': [12, 12, 12, 12, 11], 'house': ['Gryffindor', 'Slytherin', 'Gryffindor', "Gryffindor", 'Ravenclaw'], 'grade': [80, 78, 99, 50, 60]} df = pd.DataFrame(data) df.head() #1. 한 칼럼 (열)에 조건이 맞는 행 추출하기..

Power BI란? (데스크톱 버전 다운로드하기, 파워BI 자격증)

Power BI란? Power BI는 마이크로소프트에서 제공하는 데이터 시각화 도구입니다. 여기서 BI는 Business Intelligence의 약자이며 "비즈니스 인텔리전스(Business Intelligence, BI)는 기업에서 데이터를 수집, 정리, 분석하고 활용하여 효율적인 의사결정을 할 수 있는 방법에 대해 연구하는 학문이다." - 위키피디아 파워BI를 사용하여 데이터를 모델링, 시각화하여 중요한 정보를 한눈에 확일할 수 있는 대시보드를 만들 수 있습니다. 주로 데이터 분석가들이 사용하는 도구 중 하나입니다. 많은 회사들이 데이터 시각화 도구인 파워BI이나 태블로 (Tableau)를 사용할 수 있는 데이터 분석가를 찾고는 합니다. (제가 있는 나라 기준) Power BI Ecosystem: ..

[파이썬] 그래프 크기 설정하기 (figsize)

figsize matplotlib.pyplot.figure 자료구조의 fiigure 사이즈를 정할 수 있는 파라미터로 (x축 길이, y축 길이) 튜플 형식을 입력해 주어야 합니다. 여기서 길이는 인치(inch)단위이며 기본 값은 (6.4, 4.8)입니다. matplotlib - 기본 사이즈 바꾸기 아래 코드를 사용하여 디폴트 값을 바꿔버리는 방법도 유용하게 쓰입니다. plt.rcParams["figure.figsize"] = (3,3) 아래 예를 보면 디폴트값을 위 코드로 변경 해준 후 출력되는 그래프는 사이즈가 (3, 3)인걸 확인할 수 있습니다. 판다스 plot() 판다스의 series나 DataFrame 자료구조 두 개 다 plot() 메소드를 사용해 다양한 그래프를 스릴수 있습니다. matplot..

728x90
반응형