Ramadhan, Naufal Cahya (2024) Optimasi Algoritma Machine Learning Menggunakan Seleksi Fitur XGBoost Untuk Klasifikasi Kanker Payudara. TIN: Terapan Informatika Nusantara, 5 (2). ISSN 2722-7987
![1. Judul_240019_20416255201181_Naufal Cahya Ramadhan.pdf [thumbnail of 1. Judul_240019_20416255201181_Naufal Cahya Ramadhan.pdf]](http://repository.ubpkarawang.ac.id/style/images/fileicons/text.png)
1. Judul_240019_20416255201181_Naufal Cahya Ramadhan.pdf
Download (579kB)
![2.Daftar Isi_240019_20416255201181_Naufal Cahya Ramadhan.pdf [thumbnail of 2.Daftar Isi_240019_20416255201181_Naufal Cahya Ramadhan.pdf]](http://repository.ubpkarawang.ac.id/style/images/fileicons/text.png)
2.Daftar Isi_240019_20416255201181_Naufal Cahya Ramadhan.pdf
Download (41kB)
![3. Artikel Utama_240019_20416255201181_Naufal Cahya Ramadhan.pdf [thumbnail of 3. Artikel Utama_240019_20416255201181_Naufal Cahya Ramadhan.pdf]](http://repository.ubpkarawang.ac.id/style/images/fileicons/text.png)
3. Artikel Utama_240019_20416255201181_Naufal Cahya Ramadhan.pdf
Restricted to Registered users only
Download (816kB)
![4. Lampiran_240019_20416255201181_Naufal Cahya Ramadhan.pdf [thumbnail of 4. Lampiran_240019_20416255201181_Naufal Cahya Ramadhan.pdf]](http://repository.ubpkarawang.ac.id/style/images/fileicons/text.png)
4. Lampiran_240019_20416255201181_Naufal Cahya Ramadhan.pdf
Restricted to Registered users only
Download (4MB)
Abstract
Penelitian ini menganalisis kinerja algoritma K-Nearest Neighbors (KNN), Naïve Bayes, dan Random Forest dalam klasifikasi diagnosis kanker payudara menggunakan dataset Wisconsin Breast Cancer. Masalah yang dibahas adalah bagaimana meningkatkan akurasi klasifikasi diagnosis kanker payudara melalui teknik preprocessing yang tepat. Tujuan penelitian adalah mengevaluasi dan membandingkan kinerja ketiga algoritma tersebut setelah penerapan preprocessing yang meliputi pembersihan data, penanganan missing value, duplikasi data, dan outlier, serta seleksi fitur menggunakan XGBoost dan oversampling SMOTE. penerapan seleksi fitur untuk mengidentifikasi fitur yang paling relevan dan SMOTE untuk menyeimbangkan distribusi kelas dalam dataset. Hasil evaluasi kinerja menggunakan confusion matriks menunjukkan bahwa Random Forest memiliki kinerja terbaik dengan akurasi, presisi, recall, dan F1-score yang tinggi, mencapai AUC sebesar 98% setelah penerapan SMOTE. Kombinasi seleksi fitur dan SMOTE terbukti meningkatkan performa model secara signifikan, meskipun KNN menunjukkan penurunan performa dengan SMOTE, sementara Naïve Bayes mengalami peningkatan yang cukup baik. penelitian ini menunjukkan tentang pentingnya teknik preprocessing dalam pengembangan model machine learning untuk aplikasi medis, menekankan bahwa teknik yang tepat dapat secara signifikan meningkatkan kinerja klasifikasi dan menghasilkan diagnosis yang lebih akurat.
Kata Kunci: Seleksi Fitur; Extreme Gradient Boosting (XGBoost); K-Nearest Neighbor (KNN); Naïve Bayes; Random Forest
Item Type: | Article |
---|---|
Subjects: | T Technology > T Technology (General) |
Divisions: | Faculty of Engineering, Science and Mathematics > School of Electronics and Computer Science |
Depositing User: | Pustakawan UBP Karawang |
Date Deposited: | 29 Sep 2025 02:35 |
Last Modified: | 29 Sep 2025 02:35 |
URI: | http://repository.ubpkarawang.ac.id/id/eprint/4268 |