Penanganan Imputasi Missing Values pada Data Time Series dengan Menggunakan Metode Data Mining

Main Article Content

Muhammad Riko Anshori Prasetya
Arif Mudi Priyatno
Nurhaeni

Abstract

Pengumpulan data untuk perkiraan cuaca menjadi sangat penting untuk dilakukan untuk meningkatkan kualitas dari perkiraan cuaca tetapi seringkali data yang didapatkan untuk melakukan perkiraan cuaca tersebut terdapat data yang hilang (missing values). Untuk mengatasi permasalahan missing values, metode yang paling umum dilakukan adalah dengan melakukan sebuah imputasi terhadap missing values tersebut. Agar dapat melakukan imputasi pada data yang terdapat missing values tersebut dibutuhkan suatu metode imputasi. Pada penelitian ini, metode imputasi yang dilakukan adalah dengan menggunakan metode konvensional yaitu dengan menggunakan mean dan nilai maksimum dan metode data mining yang menggunakan KNN dan Neural Network. Dari ujicoba yang dilakukan didapatkan jika Metode KNN memiliki nilai RMSE yang terendah.

Article Details

How to Cite
Prasetya, M. R. A., Priyatno, A. M., & Nurhaeni. (2023). Penanganan Imputasi Missing Values pada Data Time Series dengan Menggunakan Metode Data Mining . Jurnal Informasi Dan Teknologi, 5(2), 52-62. https://doi.org/10.37034/jidt.v5i2.324
Section
Articles

References

[1] S. Nikfalazar, C. H. Yeh, S. Bedingfield, and H. A. Khorshidi, “Missing data imputation using decision trees and fuzzy clustering with iterative learning,” Knowl Inf Syst, vol. 62, no. 6, pp. 2419–2437, Jun. 2020, doi: 10.1007/s10115-019-01427-1.
[2] W. Lan, X. Chen, T. Zou, and C. L. Tsai, “Imputations for High Missing Rate Data in Covariates Via Semi-supervised Learning Approach,” Journal of Business and Economic Statistics, vol. 40, no. 3, pp. 1282–1290, 2022, doi: 10.1080/07350015.2021.1922120.
[3] M. Alabadla et al., “Systematic Review of Using Machine Learning in Imputing Missing Values,” IEEE Access, vol. 10. Institute of Electrical and Electronics Engineers Inc., pp. 44483–44502, 2022. doi: 10.1109/ACCESS.2022.3160841.
[4] I. Pratama, A. E. Permanasari, I. Ardiyanto, and R. Indrayani, “A review of missing values handling methods on time-series data,” in 2016 International Conference on Information Technology Systems and Innovation, ICITSI 2016 - Proceedings, Institute of Electrical and Electronics Engineers Inc., Feb. 2017. doi: 10.1109/ICITSI.2016.7858189.
[5] N. Fazakis, G. Kostopoulos, S. Kotsiantis, and I. Mporas, “Iterative Robust Semi-Supervised Missing Data Imputation,” IEEE Access, vol. 8, pp. 90555–90569, 2020, doi: 10.1109/ACCESS.2020.2994033.
[6] R. Fajar, R. Setya Perdana, and Indriati, “Implementasi Metode Naïve Bayes Dengan Perbaikan Missing Value Menggunakan Metode Nearest Neighbor Imputation Studi Kasus: Penyakit Malaria Di Kabupaten Malang,” Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, vol. 2, no. 8, pp. 2430–2434, Aug. 2018, [Online]. Available: http://j-ptiik.ub.ac.id
[7] B. D. Chivers et al., “Imputation of missing sub-hourly precipitation data in a large sensor network: A machine learning approach,” J Hydrol (Amst), vol. 588, Sep. 2020, doi: 10.1016/j.jhydrol.2020.125126.
[8] E. Afrifa-Yamoah, U. A. Mueller, S. M. Taylor, and A. J. Fisher, “Missing data imputation of high-resolution temporal climate time series data,” Meteorological Applications, vol. 27, no. 1, Jan. 2020, doi: 10.1002/met.1873.
[9] A. Hicham, P. A. Sabri, and P. H. Tairi, “A Survey on Educational Data Mining [2014-2019] 1 st,” in 2020 International Conference on Intelligent Systems and Computer Vision (ISCV), Fez, Morocco: IEEE, 2020. doi: 10.1109/ISCV49265.2020.9204013.
[10] H. Benhar, A. Idri, and J. L Fernández-Alemán, “Data preprocessing for heart disease classification: A systematic literature review.,” Computer Methods and Programs in Biomedicine, vol. 195. Elsevier Ireland Ltd, Oct. 01, 2020. doi: 10.1016/j.cmpb.2020.105635.
[11] G. Gunadi, “Penerapan Algoritma K-MEANS CLUSTERING Untuk Menganalisa Transaksi Penjualan Jasa Cetak Pada Unit Print On Demand (POD) Percetakan Gramedia,” Infotech: Journal of Technology Information, vol. 8, no. 2, pp. 117–126, Nov. 2022, doi: 10.37365/jti.v8i2.148.
[12] Purwati Neni, Hendra Kurniawan, and Sri Karnila, Data Mining, vol. 1. Zahira Media Publisher, 2021.
[13] W. Xing and Y. Bei, “Medical Health Big Data Classification Based on KNN Classification Algorithm,” IEEE Access, vol. 8, pp. 28808–28819, 2020, doi: 10.1109/ACCESS.2019.2955754.
[14] L. Xiong and Y. Yao, “Study on an adaptive thermal comfort model with K-nearest-neighbors (KNN) algorithm,” Build Environ, vol. 202, Sep. 2021, doi: 10.1016/j.buildenv.2021.108026.
[15] A. Nikmatul Kasanah and U. Pujianto, “Penerapan Teknik SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Objektivitas Berita Online Menggunakan Algoritma KNN,” Jurnal RESTI (Rekayasa Sistem dan Teknologi Informasi), vol. 3, no. 2, pp. 196–201, Jun. 2019.
[16] A. Dwiki, A. Putra, and S. Juanita, “Analisis Sentimen Pada Ulasan Pengguna Aplikasi Bibit Dan Bareksa Dengan Algoritma KNN,” Jurnal Teknik Informatika dan Sistem Informasi, vol. 8, no. 2, 2021, [Online]. Available: http://jurnal.mdp.ac.id
[17] R. Ridwan, H. Lubis, and P. Kustanto, “Implementasi Algoritma Neural Network dalam Memprediksi Tingkat Kelulusan Mahasiswa,” Jurnal Media Informatika Budidarma, vol. 4, no. 2, p. 286, Apr. 2020, doi: 10.30865/mib.v4i2.2035.
[18] E. Saraswati, Y. Umaidah, and A. Voutama, “Penerapan Algoritma Artificial Neural Network untuk Klasifikasi Opini Publik Terhadap Covid-19,” Generation Journal, vol. 5, no. 2, pp. 2580–4952, 2021.
[19] F. S. Nugraha, M. J. Shidiq, and S. Rahayu, “Analisis Algortima Klasifikasi Neural Network Untuk Diagnosis Penyakit Kanker Payudara,” Jurnal Pilar Nusa Mandiri, vol. 15, no. 2, pp. 149–156, Aug. 2019, doi: 10.33480/pilar.v15i2.601.