5.1.1 사이킷런의 분류와 회귀
- scikit-learn cheat sheet
https://scikit-learn.org
- scikit-learn cheat sheet
학습내용
scikit-learn에서는 cheatsheet를 제공하여 한 눈에 알고리즘을 확인할 수 있습니다.
Classification(분류)와 Regression(회귀)은 지도학습,
Clustering(군집화)와 Dimensionality Reduction(차원 축소)는 비지도학습으로 분류됩니다.
Classification은 카테고리 데이터로 답을 정할 때 사용하고, Regression은 수치를 예측하는 데 사용합니다.
비지도학습은 정답이 없는 데이터를 학습시키고 예측할 때 사용합니다.
또한 데이터 전처리에서도 많이 사용하는 편입니다.
feature가 너무 많아서 예측에 도움이 안될 때, 시각화할 때 차원 축소를 할 수 있습니다.
이전 강의까지는 분류 문제를 다뤘보았지만 이제부터는 회귀로 예측해보겠습니다.
그리고 Classification으로 결측치를 채워주는 방법을 다뤘는데, Regression으로 채워보는 방법도 알아보겠습니다.
- Google Colaboratory
https://colab.research.google.com
- pima-regression-baseline-01.ipynb