Penerapan Sistem Data Mining Untuk Diagnosis Penyakit Kanker Payudara Menggunakan Classification Based on Association Algorithm

Herwanto Herwanto • Aniati Murni Arymurthy
Journal article Jurnal Ilmiah Teknologi Informasi • Juli 2010

Unduh teks lengkap
(Bahasa Indonesia, 10 pages)

Abstrak

Aplikasi system data mining untuk mengidentifikasi atribut-atribut penting yang berguna membantu pengambilan keputusan dari basis data rumah sakit akan dibahas dalam paper ini. Data-data medis pasien yang beresiko menderita penyakit kanker payudara dimasukkan ke dalam data warehouse. Metodologi model klasifikasi didasarkan pada tiga tahapan, yaitu a) menangani data yang tidak lengkap melalui ekstraksi, b) merubah data yang bernilai kontinyu menjadi data yang bernilai diskrit serta c) rule mining dan klasifikasi. Algoritma yang digunakan untuk proses data mining adalah Classification Based on Predictive Association Rule (CPAR). Pada tahapan diskritisasi, terdapat masalah yang dikenal dengan istilah "sharp boundary". Paper ini mengusulkan proses optimalisasi menggunakan soft discretization, di mana fuzzy logic digunakan untuk mempartisi data. Ada 2.767 pasien yang terpilih, masing-masing diambil 8 atribut: sex, umur dan hasil pemeriksaan laboratorium yaitu Hemoglobin (HB), Lekosit (Leko), Trombosit (Tromb), Hemotokrit (HCT), Red blood cell distribution width (RDW) dan RDW-SD. Tingkat akurasi maksimum untuk positif kanker payudara adalah 67% dan negatif kanker payudara 97%.

Metrik

  • 72 kali dilihat
  • 52 kali diunduh