Optimasi Algoritma Machine Learning Menggunakan Seleksi Fitur XGBoost Untuk Klasifikasi Kanker Payudara

Ramadhan, Naufal Cahya (2024) Optimasi Algoritma Machine Learning Menggunakan Seleksi Fitur XGBoost Untuk Klasifikasi Kanker Payudara. TIN: Terapan Informatika Nusantara, 5 (2). ISSN 2722-7987

[thumbnail of 1. Judul_240019_20416255201181_Naufal Cahya Ramadhan.pdf] Text
1. Judul_240019_20416255201181_Naufal Cahya Ramadhan.pdf

Download (579kB)
[thumbnail of 2.Daftar Isi_240019_20416255201181_Naufal Cahya Ramadhan.pdf] Text
2.Daftar Isi_240019_20416255201181_Naufal Cahya Ramadhan.pdf

Download (41kB)
[thumbnail of 3. Artikel Utama_240019_20416255201181_Naufal Cahya Ramadhan.pdf] Text
3. Artikel Utama_240019_20416255201181_Naufal Cahya Ramadhan.pdf
Restricted to Registered users only

Download (816kB)
[thumbnail of 4. Lampiran_240019_20416255201181_Naufal Cahya Ramadhan.pdf] Text
4. Lampiran_240019_20416255201181_Naufal Cahya Ramadhan.pdf
Restricted to Registered users only

Download (4MB)

Abstract

Penelitian ini menganalisis kinerja algoritma K-Nearest Neighbors (KNN), Naïve Bayes, dan Random Forest dalam klasifikasi diagnosis kanker payudara menggunakan dataset Wisconsin Breast Cancer. Masalah yang dibahas adalah bagaimana meningkatkan akurasi klasifikasi diagnosis kanker payudara melalui teknik preprocessing yang tepat. Tujuan penelitian adalah mengevaluasi dan membandingkan kinerja ketiga algoritma tersebut setelah penerapan preprocessing yang meliputi pembersihan data, penanganan missing value, duplikasi data, dan outlier, serta seleksi fitur menggunakan XGBoost dan oversampling SMOTE. penerapan seleksi fitur untuk mengidentifikasi fitur yang paling relevan dan SMOTE untuk menyeimbangkan distribusi kelas dalam dataset. Hasil evaluasi kinerja menggunakan confusion matriks menunjukkan bahwa Random Forest memiliki kinerja terbaik dengan akurasi, presisi, recall, dan F1-score yang tinggi, mencapai AUC sebesar 98% setelah penerapan SMOTE. Kombinasi seleksi fitur dan SMOTE terbukti meningkatkan performa model secara signifikan, meskipun KNN menunjukkan penurunan performa dengan SMOTE, sementara Naïve Bayes mengalami peningkatan yang cukup baik. penelitian ini menunjukkan tentang pentingnya teknik preprocessing dalam pengembangan model machine learning untuk aplikasi medis, menekankan bahwa teknik yang tepat dapat secara signifikan meningkatkan kinerja klasifikasi dan menghasilkan diagnosis yang lebih akurat.
Kata Kunci: Seleksi Fitur; Extreme Gradient Boosting (XGBoost); K-Nearest Neighbor (KNN); Naïve Bayes; Random Forest

Item Type: Article
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Electronics and Computer Science
Depositing User: Pustakawan UBP Karawang
Date Deposited: 29 Sep 2025 02:35
Last Modified: 29 Sep 2025 02:35
URI: http://repository.ubpkarawang.ac.id/id/eprint/4268

Actions (login required)

View Item
View Item