Prediksi Kanker Paru Dengan Normalisasi Menggunakan Perbandingan Algoritma Random Forest, Decision Tree, dan Naive Bayes

Shafa, Banafshah Prediksi Kanker Paru Dengan Normalisasi Menggunakan Perbandingan Algoritma Random Forest, Decision Tree, dan Naive Bayes. DECODE: JURNAL PENDIDIKAN TEKNOLOGI INFORMASI. ISSN 2775-1813

[thumbnail of 1. COVER_240044_20416255201145_Banafshah Shafa.pdf] Text
1. COVER_240044_20416255201145_Banafshah Shafa.pdf

Download (794kB)
[thumbnail of 2. DAFTAR ISI_240044_20416255201145_Banafshah Shafa.pdf] Text
2. DAFTAR ISI_240044_20416255201145_Banafshah Shafa.pdf

Download (439kB)
[thumbnail of 3. ARTIKEL_240044_20416255201145_Banafshah Shafa.pdf] Text
3. ARTIKEL_240044_20416255201145_Banafshah Shafa.pdf
Restricted to Registered users only

Download (1MB)
[thumbnail of 4. LAMPIRAN_240044_20416255201145_Banafshah Shafa.pdf] Text
4. LAMPIRAN_240044_20416255201145_Banafshah Shafa.pdf
Restricted to Registered users only

Download (866kB)

Abstract

Berdasarkan data Global Cancer Observatory Organisasi Kesehatan Dunia angka kematian kanker paru sebanyak 1.796.144 orang di seluruh dunia. Kematian akibat kanker paru di Indonesia sebanyak 30.843 pada tahun 2020. Penyakit yang dapat membunuh orang akibat keganasannya yang paling umum disebabkan oleh kanker paru mencapai 13% dari keseluruhan diagnosis kanker. Penyakit ini dapat disebabkan dari internal ataupun eksternal paru- paru. Membuat model prediksi dirasa perlu, guna mendeteksi penyakit ini lebih awal untuk menekan angka kematian yang diakibatkan oleh kanker paru. Menggunakan proses pemodelan menggunakan algoritma Random Forest, Naïve Bayes dan Decision Tree untuk memproses data tersebut. Tujuan penelitian melakukan perbandingan algoritma Random Forest, Decision Tree serta Naïve Bayes untuk memprediksi penyakit kanker paru dengan menggunakan data yang terdiri dari 26. 000 data. Data ini meliputi informasi tentang pasien, gaya hidup, dan kondisi medis, seperti umur, jenis kelamin, polusi udara, konsumsi alkohol, alergi debu, risiko genetik, penyakit paru kronis, diet seimbang, obesitas, kebiasaan merokok, dan riwayat penyakit lain. Tahapan pengolahan data terdiri dari, pembersihan Data, yaitu menghilangkan fitur yang tidak relevan, seperti Index dan Patient ID, dan mengubah fitur kategorikal "Level" menjadi bentuk numerik, lalu analisis Korelasi,yaitu Mengidentifikasi atribut yang memiliki korelasi tinggi, seperti "Alcohol Use", "Occupational Hazards", "Genetic Risk", dan "Chronic Lung Disease", selanjutya normalisasi data mengubah sebaran data dari empat atribut yang memiliki korelasi tinggi agar lebih mudah diproses, kemudian seleksi fitur yaitu memilih fitur penting dengan menggunakan metode chi-square, yang menunjukkan bahwa "Coughing of Blood", "Passive Smoker", dan "Obesity" memiliki score tertinggi dan dianggap sebagai fitur penting, dilanjutkan dengan pemisahan Data, yaitu membagi data menjadi 80% untuk data pelatihan dan 20% untuk data pengujian, selanjutnya pembuatan model dengan menggunakan tiga algoritma, yaitu Random Forest, Decision Tree, dan Naïve Bayes, untuk memprediksi kanker paru. Random Forest dan Decision Tree mencapai akurasi 100%, sementara Naïve Bayes mencapai akurasi 86%. Berdasarkan evaluasi penelitian yang telah dilakukan pada data penyakit kanker paru, algoritma Random Forest dan Decision Tree sangat cocok untuk prediksi data penyakit kanker paru karena mampu menghasilkan model prediksi yang baik dengan pengujian Confusion Matrix serta Learning Curve.

Kata Kunci:
Confusion Matrix; Decision Tree; Naïve Bayes; Penyakit Kanker Paru; Random Forest.

Item Type: Article
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Electronics and Computer Science
Depositing User: Pustakawan UBP Karawang
Date Deposited: 29 Sep 2025 02:49
Last Modified: 29 Sep 2025 02:49
URI: http://repository.ubpkarawang.ac.id/id/eprint/4292

Actions (login required)

View Item
View Item