May 13

1. Apa yang dimaksud supervised learning, unsupervised learning dan reinforcement learning?berikan contoh masing-masing?

Supervised learning
Supervised learning merupakan suatu pembelajaran yang terawasi dimana jika output yang diharapkan telah diketahui sebelumnya. Biasanya pembelajaran ini dilakukan dengan menggunakan data yang telah ada. Pada metode ini, setiap pola yang diberikan kedalam jaringan saraf tiruan telah diketahui outputnya. Satu pola input akan diberikan ke satu neuron pada lapisan input. Pola ini akan dirambatkan di sepanjang jaringan syaraf hingga sampai ke neuron pada lapisan output. Lapisan output ini akan membangkitkan pola output yang nantinya akan dicocokkan dengan pola output targetnya. Nah, apabila terjadi perbedaan antara pola output hasil pembelajaran dengan pola output target, maka akan muncul error. Dan apabila nilai error ini masih cukup besar, itu berarti masih perlu dilakukan pembelajaran yang lebih lanjut.

Contoh algoritma jaringan saraf tiruan yang mernggunakan metode supervised learning adalah hebbian (hebb rule), perceptron, adaline, boltzman, hapfield, dan backpropagation.

Supervised-Learning1

Unsupervised learning

Unsupervised learning merupakan pembelajan yang tidak terawasi dimana tidak memerlukan target output. Pada metode ini tidak dapat ditentukan hasil seperti apa yang diharapkan selama proses pembelajaran, nilai bobot yang disusun dalam proses range tertentu tergantung pada nilai output yang diberikan. Tujuan metode uinsupervised learning ini agar kita dapat mengelompokkan unit-unit yang hampir sama dalam satu area tertentu. Pembelajaran ini biasanya sangat cocok untuk klasifikasi pola.

Contoh algoritma jaringan saraf tiruan yang menggunakan metode unsupervised ini adalah competitive, hebbian, kohonen, LVQ(Learning Vector Quantization), neocognitron.

Unsupervised-Learning2

Reinforcement learning

Reinforcement learning adalah sebuah teknik learning yang mempelajari aturan kontrol dengan cara berinteraksi dengan lingkungan yang masih asing. Ada 2 cara dalam teknik ini, teknik model-based dan teknik model-free.
Dalam teknik model-based, kita akan membuat sebuah subset berisi 4 tuple yang menggambarkan aksi, kondisi, hasil dan kondisi selanjutnya. Setelah mendapatkan subset yang cukup banyak maka kita dapat menghasilkan probability transition function dan reward function. Setelah mendapatkan kedua fungsi tersebut, kita dapat menggunakan dynamic programming untuk menghasilkan aturan yang paling optimal.
Dalam teknik model-free, kita tidak menyimpan subset yang berisi 4 tuple. Kita langsung menerapkan sebuah algoritma yang dapat langsung mengubah aturan kontrol menjadi lebih efisien.
Reinforcement-Learning3

 

2. Apa yang dimaksud dengan Learning Decision Tree dan berikan contohnya?

Learning Decision Tree
Learning Decision Tree digunakan pada statistik, data mining, dan machine learning. Learning Decision Tree menggunakan Decision Tree sebagai model prediktif yang memetakan observasi sesuatu menjadi sebuah kesimpulan target nilai. Input dari Decision Tree Learning adalah data diskret dan outputnya berupa RULE (pohon pengetahuan)

1. DATA SAMPLE
data sampleAda 10 variabel yang digunakan  untuk dasar mengambil keputusan. Kelas keputusan ada dua yakni Menunggu/Tidak di sebuah restoran
ALT : Alternate ; Bar : ada bar atau tidak ; FRI : Weekend ; Hun : Hungry ;PAT: pengunjung ; Price:harga ; RES: Reservation ; Type : tipe restoran ;EST: estimated time

2. HASILNYA POHON KEPUTUSAN

hasil

Kotak yang diarsir adalah daun . Kotak tanpa arsiran adalah akar atau cabang . Pola untuk mengubah menjadi RULE adalah
1)      Akar/Cabang adalah proposisi pembentuk frase IF
2)      Daun adalah proposisi pembentuk Frase THEN
Contoh
1)      IF Patron = None THEN Wait = False
2)      IF Patron = Full and Hungry = Yes and Type = French Then  wait = true
3)      IF Patron = Full and Hungry = Yes and Type = Thai and Fri/Sat = yes  Then  wait = true
dst

 

www.binus.ac.id