머신러닝이란
컴퓨터(machine)가 데이터를 통해 무언가를 스스로 배우게 (learning)하는 방식이다.
그러므로 데이터가 많을수록! 깨끗할수록! 컴퓨터는 더 잘 배우게 되어 있다.
벌써 머신러닝은 많은 분야에서 우리에게 큰 도움을 주고 있다.
예를 들면 이메일이 들어왔을 때 스팸 이메일을 따로 분류를 해준다거나 내가 본 유튜브/넷플릭스 영상을 토대로 추천 동영상을 보여준다거나.
이 외에도 챗봇들, 네이버에 눈살 찌푸리게 만드는 댓글을 막아주는 봇들, 얼굴 인식, 음성 인식 등등...
이렇게 기계는 배우고 우리에게 편리함을 제공하고 있다.
머신러닝 (기계학습) 두 가지 방식
머신러닝은 크게 두가지로 분류된다.
지도 학습과 비지도 학습
1. 지도 학습 Supervised Learning
기계가 배우는 과정에 쓰는 데이터인 '훈련' training 데이터에 정답 label이 있으면 지도 학습이라고 한다.
예를 들면 스팸 메일을 분류시키고 싶을 때 컴퓨터에게 다양한 메일을 보여주면서 배우게 하는데 이때 어떤 이메일이 스팸인지 '상표 label'이 달려있는 메일을 보여주는 거다. 이걸 토대로 컴퓨터가 배워서 새로 이메일이 들어왔을 때 그게 스팸인지 아닌지 분류를 하는 게 지도 학습이다.
지도 학습에는 대표적으로 위 예처럼 분류(classification)하는 알고리즘 또는 가격이나 숫자를 예측하는 regression이 있다. 이 외에도 k-nearest neighbors, Support vector machine, neural network 등등 다양한 알고리즘이 있다.
2. 비지도 학습 Unsupervised Learning
지도 학습과 반대로 훈련 데이터에 label이 없이 기계를 학습시키는 알고리즘을 비지도 학습이라고 한다.
비지도 학습에는 대표적으로 clustering, k-means, PCA 등등이 있다.
군집화 (clustering)는 훈련 데이터를 넣었을 때 기계가 알아서 특성을 고려해 관련있는 항목끼리 묶어 그룹을 나눠주는 알고리즘이다.
예를 들면, 아무 사진을 넣었을때 사진의 특성 (색깔, 모양 등등)을 고려해 비슷한 사진끼리 묶어줄 수 있다.
'ᐧ༚̮ᐧ Data Science | AI > 머신러닝 및 딥러닝' 카테고리의 다른 글
[머신러닝/딥러닝] Foundation Model이란? (0) | 2024.05.28 |
---|---|
AI/머신러닝 논문 사이트 추천 (1) | 2023.02.23 |
[EPIC GAMES] 머신러닝 게임 "While True: Learn()" 리뷰 (0) | 2021.12.08 |
[인공지능 자격증] 마이크로소프트 AI Fundamentals 자격증 (AI-900) 취득 후기 (15) | 2021.10.22 |
[데이터 분석] 혼동행렬 Confusion Matrix (R과 Python 코드) (0) | 2021.06.09 |