![](https://crypto4nerd.com/wp-content/uploads/2024/03/1jqKQMmCfO9RL1_Z5GpdkWQ-1024x491.png)
Halo semuanya!
Gue newbie banget nih di dunia DeepRacer. Baru ikutan Student League bulan ini, tapi udah langsung kepengen ngajak kalian ngobrol. Soalnya, nyari ilmu DeepRacer tuh ternyata susah-susah gampang. Banyak yang jago ngebut doang, tapi jarang yang bagi ilmunya.
Lintasan Hot Rod Super Speedway: Asyik tapi Bikin Pusing!
Bulan Maret ini, kita diajakin balapan di lintasan “Hot Rod Super Speedway”. Seru sih, treknya panjang, menantang adrenalin! Tapi jangan salah, banyak tikungan tajam yang bikin puyeng. Di sinilah model AI kita kudu pinter-pinter. Kapan harus ngebut, kapan harus pelan buat ngambil tikungan.
Hasil: Ada yang Puas, Ada yang Bingung
Selama ikutan, gue ngeluarin 15 model. Hasilnya? Cek deh infografis kece gue di bawah ini [Infografis hasil performa model]. Model “speed_model” juara nih! Catatan waktunya di bawah 200 detik, ngalahin semua model gue yang lain.
Ngomong-ngomong, model yang grafiknya datar panjang itu jangan langsung dianggap jelek ya. Soalnya, di Student League kita baru bisa liat performa model terakhir di pertengahan musim. Jadi progresnya selama awal-awal latihan nggak keliatan.
Catastrophic Forgetting: Bikin Bingung tapi Menarik!
Nah, yang bikin gue penasaran adalah fenomena “catastrophic forgetting”. Model kayak tiba-tiba jago banget (grafik menurun tajam), trus jelek lagi (grafik naik tajam), trus kayak naik turun nggak jelas (kayak kurva logaritmik terbalik). Aneh kan?
Yang lebih aneh lagi, kayaknya model nggak pernah bener-bener “konvergen” kayak definisinya Stanford (model stabil di nilai tertentu setelah latihan). Soalnya, beberapa model gue tetep nunjukin peningkatan walau pelan.
Terus terang, gue awalnya ngira model yang dilatih lama (overfitting) bakal juara. Ternyata nggak juga! Model gue yang terbaik malah cuma dilatih 300 menit.
Jajal Model Per Model: Yuk Ngorek Rahasianya!
Sebenarnya gue mau bahas semua model, tapi ini udah malem banget. Mending besok aja ya bahasnya. Sekarang kita bahas dua model terbaik dulu deh, “speed_model” dan “ResearchProductModel2”.
speed_model: Kencang Adalah Keadilan!
Model juara kita ini emang fokus banget ngebut. Ada kode programnya nih, tapi jangan takut pusing ya. Gue coba jelasin pelan-pelan.
Pertama, ada penalti gede kalo model keluar jalur. Wajar sih, namanya juga balap.
Kedua, ada reward khusus buat model yang ngebut. Semakin kenceng, semakin gede rewardnya.
Ketiga, ada reward juga buat model yang stay di tengah lintasan.
Keempat, ada reward tambahan buat model yang makin deket ke garis finish.
Terakhir, ada bonus reward gede lagi kalo model bisa finish tepat waktu.
Kesimpulan dan Rencana ke Depan
Ikutan Student League bulan pertama ini seru banget! Banyak banget yang harus dipelajarin. Terutama soal “catastrophic forgetting” yang bikin penasaran. Oh iya, ternyata model bisa direset di tengah jalan, dan kalo rewardnya negatif, model malah ngacau! Pantesan model tertentu nggak kunjung berkembang.
Ternyata para jagoan di Student League juga latihan modelnya di komputer sendiri dulu, baru diaduin di liga. Pantesan mereka jago banget!
Rencana gue ke depan adalah:
- Bikin tempat latihan model sendiri di komputer.
- Nyoba berbagai model baru