Machine Learning : Regresi Linear Satu variabel (Bagian -1 )
Pada tulisan saya kali ini saya akan secara bertahap membahas, mengenai bagaimana algoritma machine learning bisa menyeleseikan berbagai persoalan dengan syarat – syarat seperti yang saya bahas pada tulisan sebelumnya.
Komponen Machine Learning
Komponen dalam machine learning adalah sebagai berikut
- Input
- Output
- Fungsi Target
- Dataset
- Hypothesis
Masih bingung dengan istilah – istilah tadi? Oke, kita mulai ambil contoh daridari permasalahan yang sederhana, yaitu regresi linear satu variabel. Jika anda pernah belajar tentang statistik maka pembahasan ini akan terasa tidak asing. Ya, sebagaimana tulisan sebelumnya, machine learning adalah multi disiplin ilmu yang salah satunya bersimpangan dengan ilmu statistik.
Asumsikan, kita dihadapkan pada data berikut yang berisi luas tanah berikut harga rumah di suatu kota. Dan kita diminta membuat sebuah sistem prediksi yang mampu memberikan nilai harga tanah dengan parameter masukan berupa luas tanah.
| Luas Tanah | Harga |
| 2104 | 400 |
| 1600 | 330 |
| 2400 | 369 |
| … | … |
Pada umumnya, ketika kita merancang sebuah persoalan pembelajaran. Tergantung pada si perancang untuk memilih parameter (selanjutnya saya sebut feature) apa saja yang digunakan sebagai input dari sistem . Misalkan untuk kasus harga hunian, maka parameter yang mungkin tidak hanya luas tanah, tapi juga jumlah kamar tidur, lokasi dan banyak hal lain) namun untuk saat ini, untuk latihan, saya mengabaikan variabel yang lain dan hanya mengambil luas tanah sebagai masukan algoritma pembelajaran saya.
Misalkan, luas tanah merupakan feature yang disimbolkan dengan x, sedangkan harga merupakan nilai keluaran aktual yang dinotasikan dengan y. Korelasi antara x dan y disebut sebagai fungsi target f: X → y. Fungsi target adalah fungsi ideal dari domain X yang menghasilkan Y. Dalam kasus machine learning, fungsi target tidak diketahui, sehingga untuk itulah diperlukan algoritma pembelajaran yang dapat menghasilkan hypothesis yang merupakan pendekatan dari fungsi target.
Bagaimana mendapatkan hypothesis? Hypothesis adalah tujuan yang ingin didapatkan dari sebuah algoritma pembelajaran yang prosesnya digambarkan dengan skema sebagai berikut

Untuk mendapatkan hypothesis diperlukan sampel pelatihan (training example), atau training set atau bisa juga disebut dataset – yang merupakan data historis yang didapatkan sebelumnya. Dalam contoh penentuan harga rumah sebagaimana tabel, training set bisa dituliskan sebagai berikut
{(x(1),y(1) ),(x(2),y(2) ),(x(3),y(3) ),…,(x(m),y(m))}
Dengan m adalah jumlah dataset, sehingga jika jumlah data set yang dimiliki adalah 47 maka m=47.
Dataset tersebut menjadi masukan bagi algoritma pembelajaran (learning algorithm) untuk menghasilkan suatu formula hypothesis yang disimbolkan dengan h(x). Dari formula hypothesis inilah dihasilkan prediksi terhadap harga suatu hunian, dari luas area tanah yang diketahui.
(Bersambung)