Matematika Dasar untuk Machine Learning

Machine Learning (ML) bukan hanya tentang menulis kode dan menggunakan pustaka seperti Scikit-learn atau TensorFlow. Di balik algoritma yang digunakan, terdapat konsep matematika yang menjadi fondasinya. Memahami matematika dasar membantu kamu:

  • Membaca paper dan dokumentasi dengan lebih mudah,
  • Memahami “mengapa model bekerja seperti itu”, bukan hanya “bagaimana menggunakannya”,
  • Menyusun solusi yang lebih optimal dan interpretatif.

Berikut adalah empat topik matematika inti yang perlu dikuasai untuk belajar Machine Learning.

Aljabar Linear: Vektor, Matriks, dan Operasi Dasar

Machine Learning bekerja dengan data numerik yang sering diwakili dalam bentuk vektor dan matriks.

Vektor

Vektor adalah array satu dimensi. Contohnya, fitur dari sebuah data bisa ditulis sebagai:

Misalnya, data rumah:

Matriks

Matriks adalah array dua dimensi, sering digunakan untuk menyimpan banyak data sekaligus:

Operasi Dasar

  • Penjumlahan/Pengurangan vektor dan matriks
  • Perkalian skalar dan dot product
  • Perkalian matriks
  • Transpos (AT), invers (A-1), determinan

Kegunaan dalam ML

  • Persamaan regresi linear: y= Xw + b
  • Optimisasi dan update bobot dalam neural networks
  • Transformasi ruang (PCA, rotasi, scaling)

Kalkulus: Turunan, Gradien, dan Optimisasi

Turunan (Derivative)

Turunan menunjukkan bagaimana suatu fungsi berubah. Dalam ML, ini digunakan untuk:

  • Menentukan arah perubahan fungsi loss
  • Menghitung sensitivitas prediksi terhadap input

Contoh: turunan fungsi error terhadap parameter model.

Gradien

Gradien adalah vektor turunan parsial dari fungsi multivariabel. Dalam konteks model ML, gradien menunjukkan arah tercepat untuk meminimalkan kesalahan (loss):

Optimisasi

Optimisasi adalah proses menemukan parameter terbaik yang meminimalkan fungsi loss. Contohnya:

  • Gradient Descent adalah algoritma yang menggunakan gradien untuk memperbarui parameter:

Kegunaan dalam ML

  • Training model melalui backpropagation
  • Fine-tuning hyperparameter
  • Loss minimization

Statistika & Probabilitas

Statistika dan probabilitas penting untuk memahami data dan membuat prediksi.

Ukuran Pemusatan dan Penyebaran

  • Mean (rata-rata):
  • Variance:
  • Standard Deviation: akar dari variance

Distribusi Probabilitas

  • Distribusi Normal (Gaussian): umum digunakan untuk model linear, noise, dan prior dalam Bayesian.
  • Distribusi Binomial, Poisson, Bernoulli: penting dalam klasifikasi dan NLP.

Teorema Bayes

Bayes digunakan dalam probabilistik inference:

Contoh penggunaannya adalah di model Naive Bayes classifier.

Kegunaan dalam ML

  • Inferensi statistik dan prediksi
  • Mengukur ketidakpastian
  • Membangun model probabilistik

Notasi dan Simbol Umum dalam Machine Learning

SimbolArti
Input data
Target/output
Prediksi dari model
Parameter model
Loss function
Gradien
Penjumlahan dan perkalian
Ekspektasi dari variabel acak xx
Fungsi sigmoid
arg min, arg maxNilai input yang meminimalkan/memaksimalkan fungsi

Penutup

Memahami matematika di balik Machine Learning bukan sekadar untuk keperluan akademik. Ia membentuk intuisi yang dalam, membantu debugging model, dan membuatmu mampu membangun solusi dari dasar. Tidak harus menjadi ahli matematika, tetapi memahami konsep intinya akan membuat kamu lebih percaya diri dalam membangun sistem yang cerdas.