찔끔찔끔씩😎

[인공지능] Supervised Learning, Unsupervised Learning 본문

Study/인공지능

[인공지능] Supervised Learning, Unsupervised Learning

댕경 2022. 6. 5. 00:08
728x90

 

머신러닝에는 Supervised Learning과 Unsupervised Learning 두가지로 구분 됩니다.

둘의 차이는 Dataset의 성격과 원하는 결과 값입니다.

 

Supervised Learning

말그대로 지도학습법입니다. 

이미 답을 알고 있는 상태에서 학습을 하는 경우 입니다.

DataSet이 이미 결과 값을 포함하고 있고 있기 때문에, 학습을 수행하여 나온 값과의 오차(Cost)까지 알 수 있습니다.

 

집은 사이즈가 커질 수록 매매가가 높아지기 때문에 연속적인 값으로 나타나게 됩니다. 이렇게 연속적인 결과 값으로 나오는 것을 Regression이라고 합니다. 

 

 

또는 집의 구조에 따라서 아파트인지 빌라인지 단독주택인지 구분이 되는데 이러한 값을 나타내는 것은 Classification이라고 합니다.

 

어떠한 데이터들을 구분을 한다는 것은 어떤 기준이 필요하게 됩니다.

아래와 같은 데이터들은 선형의 기준선으로 인해 분류가 될 수 있습니다.

이렇게 잘 구분할 수 있는 선을 찾고 하는 것이 supervised에서 머신이 학습을 하여 찾아내는 결과가 됩니다.

 

 

Unsupervised Learning

비지도학습은 지도학습과 달리 답을 모르는 상태에서 학습하는 경우입니다.

DataSet에 어떤 정보들이 있는지 우리는 알지 못하고 어떤 데이터로 구성이 되어 있는지도 알지 못할때 사용됩니다. 

우리가 원하는 결과들은 비슷한 의미를 가진 데이터들이나 비슷한 주제로 구성된 데이터들을 분류하여 보고자 할 때 사용됩니다. 이를 clustering 혹은 grouping 이라고 표현됩니다.

 

예를들어, 우리의 물건을 구매한 고객 데이터를 분석한다고 생각해보면 됩니다. 연령대 별로 혹은 소비자의 소득수준으로 구분되어 판매량을 분석할 수 있을 것이고 전체 시장에서 우리 물건에 대한 시장 점유율과 같은 결과로 나타날 수도 있을 것입니다.

 

또는 비슷한 뉴스나 피드들을 grouping하여 사용자에게 보여주는 서비스도 가능할 것입니다. 같은 주제에 대한 다양한 정보들을 한눈에 볼 수 있어 편리할 겁니다.

 

Comments