Supervised Learning

Apa itu Supervised Learning?

Supervised Learning adalah salah satu jenis utama Machine Learning di mana model dilatih menggunakan dataset berlabel. Artinya, setiap data input (XXX) memiliki output atau target (yyy) yang sudah diketahui. Tujuan model adalah mempelajari hubungan antara input dan output sehingga bisa memprediksi output baru dari input yang belum pernah dilihat.

Contoh sederhana:

Input: ukuran rumah, jumlah kamar
Output: harga rumah
Dengan banyak contoh data, model bisa memprediksi harga rumah baru berdasarkan ukurannya.

Jenis-Jenis Supervised Learning

Supervised Learning dibagi menjadi dua kategori besar:

1. Regresi (Regression)

Digunakan ketika output berupa nilai kontinu (angka yang bisa diukur).

Contoh masalah:
- Memprediksi harga rumah
- Peramalan cuaca
- Prediksi permintaan pasar
Algoritma populer:
- Linear Regression
- Polynomial Regression
- Decision Tree Regressor
- Random Forest Regressor

2. Klasifikasi (Classification)

Digunakan ketika output berupa kategori/discrete label.

Contoh masalah:
- Deteksi email spam (spam / bukan spam)
- Prediksi penyakit (sakit / sehat)
- Pengenalan gambar (anjing / kucing)
Algoritma populer:
- Logistic Regression
- K-Nearest Neighbors (KNN)
- Support Vector Machine (SVM)
- Decision Tree & Random Forest
- Naive Bayes

Alur Kerja Supervised Learning

Kumpulkan Data
Dataset harus memiliki input (fitur) dan label (target).
Preprocessing Data
Bersihkan data, tangani missing values, normalisasi, dan encoding fitur kategorikal.
Pisahkan Data
Dataset dibagi menjadi training set dan test set.
- Training: melatih model
- Test: menguji performa
Pilih Algoritma
Tentukan apakah masalah berupa regresi atau klasifikasi.
Latih Model
Model belajar dari data training untuk menemukan pola.
Evaluasi Model
Gunakan metrik evaluasi sesuai jenis masalah (regresi/klasifikasi).
Tuning & Optimisasi
Sesuaikan hyperparameter agar performa lebih baik.

Metrik Evaluasi Supervised Learning

Untuk Regresi

Mean Absolute Error (MAE)
Mean Squared Error (MSE)
Root Mean Squared Error (RMSE)
R² Score

Untuk Klasifikasi

Accuracy
Precision
Recall
F1-Score
ROC-AUC

Contoh Implementasi Sederhana (Python)

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# 1. Load dataset
iris = load_iris()
X, y = iris.data, iris.target

# 2. Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 3. Train model
model = DecisionTreeClassifier()
model.fit(X_train, y_train)

# 4. Evaluasi
y_pred = model.predict(X_test)
print("Accuracy:", accuracy_score(y_test, y_pred))

Penerapan Supervised Learning di Dunia Nyata

Finansial: deteksi fraud, scoring kredit
Kesehatan: diagnosa penyakit, prediksi kelangsungan hidup pasien
Retail: rekomendasi produk, prediksi penjualan
Transportasi: prediksi permintaan ride-sharing
Teknologi: pengenalan wajah, speech-to-text

Kesimpulan

Supervised Learning adalah titik awal yang sangat penting dalam memahami Machine Learning. Dengan dataset berlabel, kita dapat membangun model yang mampu memprediksi nilai atau mengklasifikasikan data dengan akurat.

Menguasai regresi dan klasifikasi, beserta cara evaluasinya, adalah fondasi sebelum melangkah ke teknik ML yang lebih kompleks seperti Unsupervised Learning atau Deep Learning.

Categories:Machine Learning