Matematika Dasar untuk Machine Learning

Machine Learning (ML) bukan hanya tentang menulis kode dan menggunakan pustaka seperti Scikit-learn atau TensorFlow. Di balik algoritma yang digunakan, terdapat konsep matematika yang menjadi fondasinya. Memahami matematika dasar membantu kamu:

Membaca paper dan dokumentasi dengan lebih mudah,
Memahami “mengapa model bekerja seperti itu”, bukan hanya “bagaimana menggunakannya”,
Menyusun solusi yang lebih optimal dan interpretatif.

Berikut adalah empat topik matematika inti yang perlu dikuasai untuk belajar Machine Learning.

Aljabar Linear: Vektor, Matriks, dan Operasi Dasar

Machine Learning bekerja dengan data numerik yang sering diwakili dalam bentuk vektor dan matriks.

Vektor

Vektor adalah array satu dimensi. Contohnya, fitur dari sebuah data bisa ditulis sebagai:

Misalnya, data rumah:

Matriks

Matriks adalah array dua dimensi, sering digunakan untuk menyimpan banyak data sekaligus:

Operasi Dasar

Penjumlahan/Pengurangan vektor dan matriks
Perkalian skalar dan dot product
Perkalian matriks
Transpos (A^T), invers (A^-1), determinan

Kegunaan dalam ML

Persamaan regresi linear: y= X_w + b
Optimisasi dan update bobot dalam neural networks
Transformasi ruang (PCA, rotasi, scaling)

Kalkulus: Turunan, Gradien, dan Optimisasi

Turunan (Derivative)

Turunan menunjukkan bagaimana suatu fungsi berubah. Dalam ML, ini digunakan untuk:

Menentukan arah perubahan fungsi loss
Menghitung sensitivitas prediksi terhadap input

Contoh: turunan fungsi error terhadap parameter model.

Gradien

Gradien adalah vektor turunan parsial dari fungsi multivariabel. Dalam konteks model ML, gradien menunjukkan arah tercepat untuk meminimalkan kesalahan (loss):

Optimisasi

Optimisasi adalah proses menemukan parameter terbaik yang meminimalkan fungsi loss. Contohnya:

Gradient Descent adalah algoritma yang menggunakan gradien untuk memperbarui parameter:

Kegunaan dalam ML

Training model melalui backpropagation
Fine-tuning hyperparameter
Loss minimization

Statistika & Probabilitas

Statistika dan probabilitas penting untuk memahami data dan membuat prediksi.

Ukuran Pemusatan dan Penyebaran

Mean (rata-rata):
Variance:
Standard Deviation: akar dari variance

Distribusi Probabilitas

Distribusi Normal (Gaussian): umum digunakan untuk model linear, noise, dan prior dalam Bayesian.
Distribusi Binomial, Poisson, Bernoulli: penting dalam klasifikasi dan NLP.

Teorema Bayes

Bayes digunakan dalam probabilistik inference:

Contoh penggunaannya adalah di model Naive Bayes classifier.

Kegunaan dalam ML

Inferensi statistik dan prediksi
Mengukur ketidakpastian
Membangun model probabilistik

Notasi dan Simbol Umum dalam Machine Learning

Simbol	Arti
	Input data
	Target/output
	Prediksi dari model
	Parameter model
	Loss function
	Gradien
	Penjumlahan dan perkalian
	Ekspektasi dari variabel acak xx
	Fungsi sigmoid
arg min, arg max	Nilai input yang meminimalkan/memaksimalkan fungsi

Penutup

Memahami matematika di balik Machine Learning bukan sekadar untuk keperluan akademik. Ia membentuk intuisi yang dalam, membantu debugging model, dan membuatmu mampu membangun solusi dari dasar. Tidak harus menjadi ahli matematika, tetapi memahami konsep intinya akan membuat kamu lebih percaya diri dalam membangun sistem yang cerdas.

Categories:Machine Learning