Implementasi Model Prediksi Diabetes Menggunakan Algoritma Random Forest, K-Nearest Neighbor, dan Regresi Logistik

Pratama, Rio (2024) Implementasi Model Prediksi Diabetes Menggunakan Algoritma Random Forest, K-Nearest Neighbor, dan Regresi Logistik. Jurnal Teknik Informatika (JUTIF), 5 (4). ISSN 2723-3871

[thumbnail of 1. File Judul_240045_20416255201046_Rio Pratama.pdf] Text
1. File Judul_240045_20416255201046_Rio Pratama.pdf

Download (687kB)
[thumbnail of 2. Daftar Isi_240045_20416255201046_Rio Pratama.pdf] Text
2. Daftar Isi_240045_20416255201046_Rio Pratama.pdf

Download (53kB)
[thumbnail of 3. Artikel Utama_240045_20416255201046_Rio Pratama.pdf] Text
3. Artikel Utama_240045_20416255201046_Rio Pratama.pdf
Restricted to Registered users only

Download (489kB)
[thumbnail of 4. Daftar Pustaka_240045_20416255201046_Rio Pratama.pdf] Text
4. Daftar Pustaka_240045_20416255201046_Rio Pratama.pdf

Download (157kB)
[thumbnail of 5. Lampiran_240045_20416255201046_Rio Pratama.pdf] Text
5. Lampiran_240045_20416255201046_Rio Pratama.pdf
Restricted to Registered users only

Download (4MB)

Abstract

Diabetes adalah penyakit metabolik serius yang dapat menyebabkan berbagai komplikasi kesehatan. Dengan lebih dari 537 juta orang di seluruh dunia yang hidup dengan diabetes pada tahun 2021, deteksi dini menjadi krusial untuk mencegah komplikasi lebih lanjut. Penelitian ini bertujuan memprediksi risiko diabetes menggunakan algoritma machine learning, yaitu Random Forest (RF), K-Nearest Neighbor (KNN), dan Logistic Regression (LR), dengan dataset diabetes dari UCI. Penelitian sebelumnya telah mengeksplorasi berbagai algoritma dan teknik, dengan hasil yang bervariasi dalam akurasi. Penelitian ini menggunakan dataset dari Kaggle yang terdiri dari 768 data dengan 8 parameter, yang diproses melalui teknik pra-pemrosesan dan normalisasi data. Model dievaluasi menggunakan metrik seperti akurasi, confusion matrix, dan ROC-AUC.Hasil menunjukkan bahwa Logistic Regression memiliki kinerja terbaik dengan akurasi 77% dan AUC 0,83, dibandingkan dengan KNN (75% akurasi, AUC 0,81) dan Random Forest (74% akurasi, AUC 0,81). Temuan ini menegaskan pentingnya pemilihan algoritma yang tepat dan pra-pemrosesan data yang baik dalam prediksi risiko diabetes. Penelitian ini menyimpulkan bahwa Logistic Regression adalah metode yang paling efektif untuk memprediksi risiko diabetes pada dataset yang digunakan.

Kata kunci: Diabetes, KNN, Random Forest, Logistic Regression.

Item Type: Article
Subjects: T Technology > T Technology (General)
Divisions: Faculty of Engineering, Science and Mathematics > School of Electronics and Computer Science
Depositing User: Pustakawan UBP Karawang
Date Deposited: 31 Oct 2025 03:19
Last Modified: 31 Oct 2025 03:19
URI: http://repository.ubpkarawang.ac.id/id/eprint/4830

Actions (login required)

View Item
View Item