![](https://crypto4nerd.com/wp-content/uploads/2023/07/1H4WM6lTPbxPTcnolwv3Dsw.png)
Step 1
Gathering Data
Dataset ini berisi informasi terkait kesehatan jantung, dengan 1.025 entri data. Setiap entri mewakili pasien dan mencakup atribut berikut:
Age : Usia pasien.
Sex : Jenis kelamin pasien.
Chest pain type : Atribut kategorikal yang menunjukkan jenis nyeri dada yang dialami oleh pasien. Ini memiliki empat nilai yang mungkin.
Resting blood pressure : Tekanan darah istirahat pasien.
Serum cholestoral : Kadar kolesterol serum dalam mg/dl pasien.
Fasting blood sugar : Mengindikasikan apakah gula darah puasa pasien lebih besar dari 120 mg/dl.
Resting electrocardiographic results : Atribut kategori yang mewakili hasil elektrokardiogram istirahat. Ini memiliki tiga nilai yang mungkin.
Maximum heart rate achieved : Detak jantung maksimum yang dicapai oleh pasien.
Exercise induced angina : Menunjukkan apakah pasien mengalami angina (nyeri dada) yang disebabkan oleh olahraga.
Oldpeak : Depresi ST yang diinduksi oleh olahraga relatif terhadap istirahat.
Slope : Kemiringan segmen ST latihan puncak.
Number of major vessels : Mewakili jumlah pembuluh darah utama yang diwarnai dengan fluoroskopi (mulai dari 0 hingga 3).
Thal : Atribut kategorikal yang menunjukkan tipe thalassemia pasien. Ini memiliki tiga nilai yang mungkin: 0 untuk normal, 1 untuk cacat tetap, dan 2 untuk cacat reversibel.
Target: Kolom target berfungsi sebagai variabel hasil dan menunjukkan adanya penyakit jantung pada pasien. Nilai 0 menandakan tidak adanya penyakit jantung, sedangkan nilai 1 menandakan adanya penyakit jantung.
Step 2
Preparing Data
Pada langkah ini, untuk mengidentifikasi dan meminimalkan potensi bias dalam dua kumpulan data karakteristik data umumnya dibagi menjadi dua set: data pelatihan (training set) dan data pengujian (testing set). Data pelatihan digunakan untuk melatih model, sedangkan test data digunakan untuk menguji kinerja model yang telah dilatih. Dalam beberapa kasus, juga ada set data validasi yang digunakan untuk mengoptimalkan parameter model selama proses pelatihan. Disini dibagi datanya menjadi training sebanyak 75% dan data test 25%.
Step 3
Choosing Model
Setelah data telah dibagi pada langkah Data Preprocessing, langkah selanjutnya adalah memilih model machine learning yang tepat untuk memecahkan masalah yang ada. Pemilihan model yang tepat sangat penting karena akan mempengaruhi kualitas prediksi dan hasil akhir dari model yang dibangun. Saya memilih model Support Vector Machine (SVM) yang cocok dengan data saya.
Step 4
Training
Setelah model yang tepat telah dipilih yaitu Support Vector Machine (SVM), langkah ini melibatkan pelatihan model menggunakan data train yang telah disiapkan sebelumnya. Proses pelatihan ini memungkinkan model untuk belajar dari data dan menyesuaikan parameter internalnya agar dapat membuat prediksi yang akurat pada data yang belum pernah dilihat sebelumnya.
Step 5
Evaluation
langkah ini melibatkan evaluasi kinerja model untuk menilai sejauh mana model dapat melakukan prediksi dengan akurat. Evaluasi model sangat penting karena memberikan gambaran tentang seberapa baik model tersebut berfungsi dalam menyelesaikan masalah yang diberikan.
Dapat diketahui bahwa akurasi yang didapatkan sebesar 97,27% yang mana dari menggunakan 100 data yang diprediksi terdapat 98 data menghasilkan nilai yang benar.
Step 6
Hyperparameter Tuning
Setelah model telah dipilih dan dilatih, langkah ini melibatkan penyetelan atau pengaturan kembali hyperparameter dari model untuk meningkatkan kinerja dan performa model. Hyperparameter adalah parameter yang nilainya tidak diubah oleh model selama proses pelatihan, melainkan harus diatur sebelumnya oleh pengguna atau peneliti. Penting untuk mengoptimalkan hyperparameter agar model dapat memberikan hasil prediksi yang lebih akurat dan generalisasi yang lebih baik pada data yang belum pernah dilihat sebelumnya.
Dapat dilihat hasil dari hyperparameter tuning didapat akurasi paling besar yaitu 97,27%.
Step 7
Prediction
Setelah model telah dipilih, dilatih, dan disetel hyperparameternya, langkah terakhir adalah menggunakan model tersebut untuk melakukan prediksi.
Didapat bahwa menggunakan model tersebut untuk melakukan prediksi sebagian besar data mengeluarkan hasil yang akurat.