Supervised Learning

Apa itu Supervised Learning?
Supervised Learning adalah salah satu jenis utama Machine Learning di mana model dilatih menggunakan dataset berlabel. Artinya, setiap data input (XXX) memiliki output atau target (yyy) yang sudah diketahui. Tujuan model adalah mempelajari hubungan antara input dan output sehingga bisa memprediksi output baru dari input yang belum pernah dilihat.
Contoh sederhana:
- Input: ukuran rumah, jumlah kamar
- Output: harga rumah
Dengan banyak contoh data, model bisa memprediksi harga rumah baru berdasarkan ukurannya.
Jenis-Jenis Supervised Learning
Supervised Learning dibagi menjadi dua kategori besar:
1. Regresi (Regression)
Digunakan ketika output berupa nilai kontinu (angka yang bisa diukur).
- Contoh masalah:
- Memprediksi harga rumah
- Peramalan cuaca
- Prediksi permintaan pasar
- Algoritma populer:
- Linear Regression
- Polynomial Regression
- Decision Tree Regressor
- Random Forest Regressor
2. Klasifikasi (Classification)
Digunakan ketika output berupa kategori/discrete label.
- Contoh masalah:
- Deteksi email spam (spam / bukan spam)
- Prediksi penyakit (sakit / sehat)
- Pengenalan gambar (anjing / kucing)
- Algoritma populer:
- Logistic Regression
- K-Nearest Neighbors (KNN)
- Support Vector Machine (SVM)
- Decision Tree & Random Forest
- Naive Bayes
Alur Kerja Supervised Learning
- Kumpulkan Data
Dataset harus memiliki input (fitur) dan label (target). - Preprocessing Data
Bersihkan data, tangani missing values, normalisasi, dan encoding fitur kategorikal. - Pisahkan Data
Dataset dibagi menjadi training set dan test set.- Training: melatih model
- Test: menguji performa
- Pilih Algoritma
Tentukan apakah masalah berupa regresi atau klasifikasi. - Latih Model
Model belajar dari data training untuk menemukan pola. - Evaluasi Model
Gunakan metrik evaluasi sesuai jenis masalah (regresi/klasifikasi). - Tuning & Optimisasi
Sesuaikan hyperparameter agar performa lebih baik.
Metrik Evaluasi Supervised Learning
Untuk Regresi
- Mean Absolute Error (MAE)
- Mean Squared Error (MSE)
- Root Mean Squared Error (RMSE)
- R² Score
Untuk Klasifikasi
- Accuracy
- Precision
- Recall
- F1-Score
- ROC-AUC
Contoh Implementasi Sederhana (Python)
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score
# 1. Load dataset
iris = load_iris()
X, y = iris.data, iris.target
# 2. Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# 3. Train model
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
# 4. Evaluasi
y_pred = model.predict(X_test)
print("Accuracy:", accuracy_score(y_test, y_pred))
Penerapan Supervised Learning di Dunia Nyata
- Finansial: deteksi fraud, scoring kredit
- Kesehatan: diagnosa penyakit, prediksi kelangsungan hidup pasien
- Retail: rekomendasi produk, prediksi penjualan
- Transportasi: prediksi permintaan ride-sharing
- Teknologi: pengenalan wajah, speech-to-text
Kesimpulan
Supervised Learning adalah titik awal yang sangat penting dalam memahami Machine Learning. Dengan dataset berlabel, kita dapat membangun model yang mampu memprediksi nilai atau mengklasifikasikan data dengan akurat.
Menguasai regresi dan klasifikasi, beserta cara evaluasinya, adalah fondasi sebelum melangkah ke teknik ML yang lebih kompleks seperti Unsupervised Learning atau Deep Learning.