Machine Learning : Regresi Linear Satu variabel (Bagian -1 )
Kali ini, penulis akan secara bertahap membahas, mengenai bagaimana algoritma machine learning bisa menyeleseikan berbagai persoalan dengan syarat – syarat seperti yang di bahas pada tulisan sebelumnya.
Komponen Machine Learning
Komponen dalam machine learning adalah sebagai berikut
- Input
- Output
- Fungsi Target
- Dataset
- Hypothesis
Masih bingung dengan istilah – istilah tadi? Oke, Mari mulai ambil contoh dari permasalahan yang sederhana, yaitu regresi linear satu variabel. Jika pembaca pernah belajar tentang statistik maka pembahasan ini akan terasa tidak asing.
Asumsikan, terdapat data yang berisi luas tanah yang berisi harga rumah di suatu kota. Dari data tersebut, diminta untuk dibuatkan sebuah sistem prediksi yang mampu memberikan nilai harga tanah dengan parameter masukan berupa luas tanah.
| Luas Tanah | Harga |
| 2104 | 400 |
| 1600 | 330 |
| 2400 | 369 |
| … | … |
Pada umumnya, ketika merancang sebuah persoalan pembelajaran. Tergantung pada si perancang untuk memilih parameter (selanjutnya disebut feature) apa saja yang digunakan sebagai input dari sistem .
Misalkan untuk kasus harga hunian, maka parameter yang mungkin tidak hanya luas tanah, tapi juga jumlah kamar tidur, lokasi dan banyak hal lain). Untuk simplifikasi, akan diambil feature berupa luas tanah sebagai masukan algoritma pembelajaran.
Misalkan, luas tanah merupakan feature yang disimbolkan dengan x, sedangkan harga merupakan nilai keluaran aktual yang dinotasikan dengan y. Korelasi antara x dan y disebut sebagai fungsi target f: X → y. Fungsi target adalah fungsi ideal dari domain X yang menghasilkan Y. Dalam kasus machine learning, fungsi target tidak diketahui, sehingga untuk itulah diperlukan algoritma pembelajaran yang dapat menghasilkan hypothesis yang merupakan pendekatan dari fungsi target.
Bagaimana mendapatkan hypothesis? Hypothesis adalah tujuan yang ingin didapatkan dari sebuah algoritma pembelajaran yang prosesnya digambarkan dengan skema sebagai berikut

Untuk mendapatkan hypothesis diperlukan sampel pelatihan (training example), atau training set atau bisa juga disebut dataset – yang merupakan data historis yang didapatkan sebelumnya. Dalam contoh penentuan harga rumah sebagaimana tabel, training set bisa dituliskan sebagai berikut
{(x(1),y(1) ),(x(2),y(2) ),(x(3),y(3) ),…,(x(m),y(m))}
Dengan m adalah jumlah dataset, sehingga jika jumlah data set yang dimiliki adalah 47 maka m=47.
Dataset tersebut menjadi masukan bagi algoritma pembelajaran (learning algorithm) untuk menghasilkan suatu formula hypothesis yang disimbolkan dengan h(x). Dari formula hypothesis inilah dihasilkan prediksi terhadap harga suatu hunian, dari luas area tanah yang diketahui.