Implementasi Q-Learning dan Backpropagation pada Agen yang Memainkan Permainan Flappy Bird
Abstract: This paper shows how
to implement a combination of Q-learning and backpropagation on the case of
agent learning to play Flappy Bird game. Q-learning and backpropagation are
combined to predict the value-function of each action, or called value-function
approximation. The value-function approximation is used to reduce learning time
and to reduce weights stored in memory. Previous studies using only regular
reinforcement learning took longer time and more amount of weights stored in
memory. The artificial neural network architecture (ANN) used in this study is
an ANN for each action. The results show that combining Q-learning and
backpropagation can reduce agent’s learning time to play Flappy Bird up to 92%
and reduce the weights stored in memory up to 94%, compared to regular
Q-learning only. Although the learning time and the weights stored are reduced,
Q-learning combined with backpropagation have the same ability as regular
Q-learning to play Flappy Bird game.
Kata Kunci:
Flappy Bird, Q-Learning,
Value-Function Approximation, Artificial Neural Netowrk, Backpropagation
Penulis: Ardiansyah, Ednawati
Rainarli
Kode Jurnal: jptlisetrodd170177

Artikel Terkait :
Jp Teknik Listrik dan Mekatronika dd 2017
- RANCANG BANGUN SISTEM PROTEKSI KEBAKARAN PADA MINI SMART KITCHEN BERBASIS ARDUINO
- RANCANG BANGUN SISTEM KONTROL DAN MONITORING KELEMBABAN DAN TEMPERATURE RUANGAN PADA BUDIDAYA JAMUR TIRAM BERBASIS INTERNET OF THINGS
- PENGENALAN SURAT TANDA NOMOR KENDARAAN BERBASIS NEAR FIELD COMMUNICATION (NFC) DENGAN APLIKASI ANDROID
- PEMANFAATAN MATLAB VERSI 6.0 UNTUK SIMULASI PEMBANGKIT NADA DTMF (DUAL TONE MULTI FREQUENCY)
- MINIATURISASI ANTENA MIKROSTRIP DENGAN DESAIN FRAKTAL UNTUK APLIKASI GLOBAL POSITIONING SYSTEM
- STUDI PEMANFAATAN PEMBANGKIT LISTRIK TENAGA SURYA INTERKONEKSI DENGAN SUMBER LISTRIK UTAMA PADA GEDUNG DIREKTORAT JENDERAL KETENAGALISTRIKAN JAKARTA
- Implementasi Metode Waterfall pada Proses Digitalisasi Citra Analog
- Pengujian Validitas Model Blended Learning di Sekolah Menengah Kejuruan
- Analisa Perhitungan Titik Gangguan pada Saluran Transmisi Menggunakan Metode Takagi Aplikasi PT.CHEVRON PACIFIC Indonesia
- Analisa Drop Tegangan PT PLN (Persero) Rayon Lubuk Sikaping Setelah Penambahan PLTM Guntung
- Studi Analisa Probabilitas Perlindungan Kawat Tanah Terhadap Gangguan Kilat Pada Kawat Fasa Berdasarkan Tipe Tower Pada Saluran Udara Tegangan Tinggi (SUTT) 150 kV
- Setting Relai Gangguan Tanah (Gfr) Outgoing GH Tanjung Pati Feeder Taram PT. PLN (Persero) Rayon Lima Puluh Kota
- Evaluasi Keandalan Sistem Distribusi 20 Kv Menggunakan Metode Saidi Dan Saifi Di PT. PLN (Persero) Rayon Lubuk Alung Tahun 2015
- DISAIN REMOTE CONTROL HOIST BERBASIS GELOMBANG RADIO AM FREKUENSI 40,82 MHZ
- Implementasi Sensor Compas HMC5883L Terhadap Gerak Robot Micromouse dengan Menggunakan Algoritma PID
- PENGEMBANGAN PEMODELAN PEMBANGKIT MINI HYDRO UNTUK KAJIAN FREKUENSI
- Evaluasi Penempata Distributed Generation untuk meningkatkan keamanan dan Stabilitas Tegangan Sistem Tenaga Menggunakan Nose Curve Method
- PERANCANGAN KENDALI PADA ALAT PENGERING KERUPUK BERBASIS IC DIGITAL
- Optimalisasi Penyeimbangan Beban Transformator dengan Metode Seimbang Beban Seharian (Sbs) pada Gardu Depan Kantor Rayon PT. PLN (Persero) Rayon Kayu Aro
- Analisa Perbandingan Konfigurasi Vertikal dengan Bujur Sangkar Elektroda Pentanahan Menggunakan Matlab
- Analisa Nilai Indeks Keandalan Sistem Jaringan Distribusi Udara 20 kV pada Feeder PT.PLN (Persero) Rayon Sungai Penuh - Kerinci
- Sistem Kendali Distribusi Air Bersih Berbasis RFID (Radio Frequency Identification) Menggunakan Arduino
- Sistem Pendeteksi Dini Longsor Menggunakan Teknologi Wireless Sensor Network (WSN)
- Pengembangan Rangkaian Kendali untuk Mengoperasikan Motor Induksi3-Fasa
- Pemanfaatan Pin Control Dalam Upaya Meningkatkan Kapasitas Pin Data pada Port Parallel untuk Mengendalikan Motor Langkah