Implementasi Metode Resampling Dalam Menangani Data Imbalance Pada Klasifikasi Multiclass Penyakit Thyroid

Nugraha, Najmi Cahaya (2024) Implementasi Metode Resampling Dalam Menangani Data Imbalance Pada Klasifikasi Multiclass Penyakit Thyroid. Building of Informatics, Technology and Science (BITS), 6 (2). ISSN 2685-3310

[thumbnail of 1. File Judul_240059_20416255201136_Najmi Cahaya Nugraha.pdf] Text
1. File Judul_240059_20416255201136_Najmi Cahaya Nugraha.pdf

Download (555kB)
[thumbnail of 2. Daftar isi_240059_20416255201136_Najmi Cahaya Nugraha.pdf] Text
2. Daftar isi_240059_20416255201136_Najmi Cahaya Nugraha.pdf

Download (317kB)
[thumbnail of 3. Artikel utama_240059_20416255201136_Najmi Cahaya Nugraha.pdf] Text
3. Artikel utama_240059_20416255201136_Najmi Cahaya Nugraha.pdf
Restricted to Registered users only

Download (1MB)
[thumbnail of 4. Daftar pustaka_240059_20416255201136_Najmi Cahaya Nugraha.pdf] Text
4. Daftar pustaka_240059_20416255201136_Najmi Cahaya Nugraha.pdf

Download (639kB)
[thumbnail of 5. Lampiran_240059_20416255201136_Najmi Cahaya Nugraha.pdf] Text
5. Lampiran_240059_20416255201136_Najmi Cahaya Nugraha.pdf
Restricted to Registered users only

Download (3MB)

Abstract

Diperkirakan setidaknya 17 juta orang Indonesia mengalami gangguan tiroid. Menariknya, hampir 60% dari mereka yang hidup dengan gangguan tiroid tidak mendapatkan diagnosis. Dengan demikian, perlu dilakukan penelitian yang mengaplikasikan metode-metode untuk memprediksi penyakit tiroid. Sebelum menggunakan metode prediksi, penting untuk menerapkan metode klasifikasi agar dapat memperoleh model prediksi yang akurat. Namun, agar hasil klasifikasi optimal dan untuk menghindari ketidakakuratan, diperlukan keseimbangan dalam data yang digunakan. Data Imbalance merupakan kondisi di mana rasio antara kelas pada data tidak seimbang yang dapat mengakibatkan model yang dihasilkan menjadi bias. Tujuan utama penelitian untuk menyajikan solusi yang dapat meningkatkan akurasi deteksi dini penyakit thyroid melalui penanganan ketidakseimbangan data dan penerapan algoritma klasifikasi yang tepat. Metode penelitian dimulai dengan pengumpulan dan analisis dataset sebanyak 9172 data dan dilakukan tahapan preprocessing sehingga dapat dibagi menjadi 5321 data latih dan 1331 data uji. Tahapan pengujian menggunakan 7 algoritma klasifikasi dengan 7 data resampling berbeda serta evaluasi menggunakan confusion matrix. Penelitian ini menghasilkan tingkat akurasi tertinggi yang diperoleh dari kombinasi Algoritma Random Forest dengan metode Random Over Sampling sebesar 98%. Dapat disimpulkan bahwa kombinasi Algoritma Random Forest dengan metode resampling Random Over Sampling dapat meningkatkan akurasi deteksi dini pada penyakit tiroid.

Kata Kunci: Klasifikasi, ketidakseimbangan data, metode resampling, tiroid

Item Type: Article
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Electronics and Computer Science
Depositing User: Pustakawan UBP Karawang
Date Deposited: 31 Oct 2025 03:40
Last Modified: 31 Oct 2025 03:40
URI: http://repository.ubpkarawang.ac.id/id/eprint/4844

Actions (login required)

View Item
View Item