Yıl: 2015 Cilt: 6 Sayı: 2 Sayfa Aralığı: 254 - 267 Metin Dili: Türkçe İndeks Tarihi: 29-07-2022

Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması

Öz:
Bu araştırmanın amacı kayıp veri sorununun çözümünde kullanılan farklı yöntemlerin etkililiğini ölçeklerin geçerliği ve güvenirliği bağlamında karşılaştırmaktır. Bu amaçla, PISA 2012 Türkiye örneklemi ve "Matematik Çalışma Etiği" ölçeğinden yararlanılmıştır. Analizler için Türkiye örnekleminden rastgele 200 kişilik tam veri seti çekilmiştir. Tam veri setinden, tamamıyla rassal olarak kayıp (TROK) mekanizması altında, farklı oranlarda veri silme ve bu verileri farklı kayıp veri yöntemleriyle yeni tam veri setlerine dönüştürme işlemlerinden sonra geçerlik ve güvenirliğe ilişkin analizler gerçekleştirilmiştir. Kayıp veri içeren setlerin yeni tam veri setlerine dönüştürülmesinde seri ortalaması, yakın noktaların ortalaması, yakın noktaların medyanı, doğrusal değer kestirimi, noktanın doğrusal eğimi, liste bazında silme, beklenti maksimizasyonu, regresyon ataması ve çoklu atama kayıp veri yöntemleri kullanılmıştır. Yeni tam veri setlerinden geçerlik ve güvenirliğe ilişkin elde edilen değerleri karşılaştırarak yorumlamada tam veri setinden elde edilen değerler referans değerler olarak kullanılmıştır. Araştırma sonuçlarına göre liste bazında silme yöntemi için elde edilen değerler, genel olarak tam veri setinden elde edilen değerlere en az benzerlik gösteren değerler olmuştur. Yaklaşık değer atama yöntemleri için elde edilen değerler kayıp veri oranının düşük olduğu durumlarda genel olarak tam veri setinden elde edilen değerlere yakın veya aynı değerleri verirken, tüm kayıp veri oranları için tam veri setinden elde edilen değerlere en yakın değer veren yöntemler çoklu atama, beklenti maksimizasyonu ve regresyon ataması yöntemleri olmuştur.
Anahtar Kelime:

Konular: Bilgisayar Bilimleri, Yazılım Mühendisliği Bilgisayar Bilimleri, Bilgi Sistemleri Bilgisayar Bilimleri, Yapay Zeka

Comparison of Various Methods Used in Solving Missing Data Problems in the context of Validity and Reliability of the Scales

Öz:
The purpose of this research is to compare the effectiveness of various methods used in solving missing data problems in the context of validity and reliability of the scales. For this purpose PISA 2012 Turkey sample and "Math Work Ethics" scale was used. For the analysis, complete data set of 200 persons were chosen from the Turkey sample at random. After the process of data deletion at different rates from complete data set and transforming them into new complete data sets, under missing completely at random (MCAR) mechanism, analysis of validity and reliability were realized. During the phase of transforming missing data set into new complete data sets, series mean, mean of nearby points, median of nearby points, linear interpolation, linear trend at point, listwise deletion, expectation maximization, regression imputation and multiple imputation methods were used. The values obtained from the complete data set were used as reference values in interpreting the values by comparing the values of validity and reliability at the new complete data sets. The research results reveal that the values obtained for the listwise deletion at different rates of missing data are the values with the least similarity to the ones generally obtained from the complete data set. While the values obtained for the approximate value imputation methods resulted in proximal or same values as the ones generally obtained from the complete data set in cases where the missing data rate is low multiple imputation, expectation maximization and regression imputation methods resulted in close proximal values at all missing data rates as the ones obtained from the complete data set.
Anahtar Kelime:

Konular: Bilgisayar Bilimleri, Yazılım Mühendisliği Bilgisayar Bilimleri, Bilgi Sistemleri Bilgisayar Bilimleri, Yapay Zeka
Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • Akhun, İ. (1994). İstatistiksel formüller ve tablolar. (4.Baskı). Ankara: Hacettepe Üniversitesi, Eğitim Faültesi
  • Allison, P.D. (2003). Missing data techniques for structural equation modeling. Journal of Abnormal Psychology, 112 (4), 545-557, DOI: 10.1037/0021-843X.112.4.545.
  • Allison, P.D. (2009). Missing data. Sage University Paper Series on Quantitative Applications in the Social Sciences, 72-89. London: Sage Publication.
  • Bal, C. (2003). Çok gruplu veri setlerinde eksik gözlem sorununun çözümlenmesi ve sağlık alanında bir uygulama. Yayımlanmamış Doktora Tezi, Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü, Eskişehir.
  • Bernaards, C.A. & Sijtsma, K. (2000). Influence of imputation and EM methods on factor analysis when item nonresponse in questionnaire data is nonignorable. Multivariate Behavioral Research, 35(3), 321-364, DOI: 10.1207/S15327906MBR3503_03.
  • Brown, M.L. & Kros, J. F. (2003). Data mining and the impact of missing data. Industrial Management & Data System, 103 (8), 611- 621, DOI: 10.1108/02635570310497657.
  • Buhi, E.R., Goodson, P. & Neilands, T.B. (2008). Out of sight, not out of mind: Strategies for handling missing data. American Journal of Health Behavior, 32 (1), 83-92.
  • Büyüköztürk, Ş. (2007). Sosyal bilim için veri analizi el kitabı (7.Baskı). Ankara: Pegem Akademi.
  • Carpita, M. & Manisera, M. (2011). On the imputation of missing data in surveys with likert-type scales. Journal of Classical, 28, 93-112, DOI: 10.1007/s00357-011-9074-z
  • Cheema, J. (2012). Handling missing data in educational research using SPSS. Unpublished doctoral dissertation, George Mason University, USA.
  • Chen, S.F., Wang, S. & Chen, Y.C. (2012). A simulation study using EFA and CFA programs based the impact of missing data on test dimensionality. Expert Systems with Applications, 39, 4026-4031.
  • Cumming, P. (2013). Missing data and multiple imputation. Clinical Review & Education, 167 (7), 656-661.
  • Çokluk, Ö. ve Kayri, M. (2011). Kayıp değerlere yaklaşık değer atama yöntemlerinin ölçme araçlarının geçerlik ve güvenirliği üzerindeki etkisi. Kuram ve Uygulamada Eğitim Bilimleri, 11 (1), 289-309.
  • Demir, E. ve Parlak, B. (2012). Türkiye'de eğitim araştırmalarında kayıp veri sorunu. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 3(1), 230-241.
  • Demir, E. (2013). Kayıp verilerin varlığında çoktan seçmeli testlerde madde ve test parametrelerinin kestirilmesi: SBS örneği. Eğitim Bilimleri Araştırmaları Dergisi, 3(2), 47-68.
  • Downey, R.G. & King, C.V. (1998). Missing Data in Likert Ratings: A Comparison of Replacement Methods. The Journal of General Psychology, 125 (2), 175-191, DOI: 10.1080/00221309809595542.
  • Duncan, T.E., Duncan, S.C. ve Li, F. (1998). A comparison of model- and multiple imputation-based approaches to longitudinal analyses with partial missingness. Structural Equation Modeling: A Multidisciplinary Journal, 5 (1), 1-21, DOI: 10.1080/10705519809540086.
  • Enders, C.K. (2001). A primer on maximum likelihood algorithms available for use with missng data. Structural Equation Modeling, 8(1), 128-141, DOI: 10.1207/S15328007SEM0801_7.
  • Enders, C.K. (2004). The impact of missing data on sample reliability estimates: Implications for reliability reporting practices. Educational and Psychological Measurement, 10.1177/0013164403261050. 64(3), 419-436, DOI:
  • Enders, C.K. (2013). Dealing with missing data in developmental research. Child Development Perspectives, 7 (1), 27- 31.
  • Field, A. (2009). Discovering statistics using SPSS (3. Edition). London: Sage Publication.
  • Finch, H., & Margraf, M. (2008). Imputation of categorical missing data: A Comparison of multivariate normal and http://www.mwsug.org/proceedings/2008/stats/MWSUG-2008-S05.pdf adresinden alınmıştır. methods. 20.11.2014 tarihinde
  • Ginkel, J.R.V., Van der Ark, L.A., Sijtma, K. & Vermunt, J.K. (2007). Two-way imputation: A Bayesian method for estimating missing scores in tests and questionnaires, and an accurate approximation. Computational
  • Statistics & Data Analysis, 51, 4013 - 4027, DOI:10.1016/j.csda.2006.12.022.
  • Ginkel, J.R.V., Sijtma, K., Van der Ark, L.A. & Vermunt, J.K. (2010). Incidence of
  • missing item scores in
  • personality measurement, and simple item-score imputation. Methodology, 6 (1), 17-30, DOI:
  • 1027/1614-2241/a000003
  • Graham, J.W., Hofer, S.M. ve Piccinin, A.M.(1994). Analysis with missing data in drug prevention research. Collins, L.M. ve Seitz, L.A. (eds.). Advances in data analysis for prevention intervention research (ss. 13- 64) içinde. National Institutes of Health.
  • Graham, J.W. (2009). Missing data analysis: Making it work in the real World. Annual Review of Psychology, 60, 549-576.
  • Granberg- Rademacker, J.S. (2007). A comparison of three approaches to handling incomplete state level data. State Politics and Policy Quarterly, 7(3), 325-338.
  • Hohensinn, C. ve Kubinger, K.D. (2011). On the impact of missing values on the item fit and the model validness of the Rasch model. Psychological Test and Assessment Modeling, 53 (3), 380-393.
  • Huck, S.W. (2012). Reading statistics and research (6.Edition). USA: Pearson. IBM (2012). 28.11.2014 tarihinde http://www- 01.ibm.com/support/knowledgecenter/SSLVMB_20.0.0/com.ibm.spss.statistics.cs/mva_describe_rerun _mcartest.htm sitesinden alınmıştır.
  • Karasar, N. (2007). Bilimsel araştırma yöntemi: kavramlar, ilkeler, teknikler. (17. Baskı). Ankara: Nobel Yayın Dağıtım.
  • Kenny, D.A. (1987). Statistics for the social and behavioral science. USA.
  • Leite, W. ve Beretvas, S.N. (2010). The performance of multiple imputation for likert-type items with missing data. Journal of Modern Applied Statistical Methods, (9)1, 64-74.
  • Little, R.J.A. (1988). Missing data adjustments in large surveys. Journal of Business & Economic Statistics, 6 (3), 287-296.
  • McKnight, P.E., McKnight, K.M., Sidani, S. & Figueredo, A.J (2007). Missing data: A gentle introduction. United States of America: The Guilford Press.
  • Musil,C.M., Warner, C.B, Yobas, P.K. & Jones, S.L. (2002). A comparison of imputation techniques for handling missing data. Western Journal of Nursing Research, 24(7),815-829,DOI: 10.1177/019394502237390.
  • Oğuzlar, A. (2001, Eylül). Alan araştirmalarinda kayıp değer problemi ve çözüm önerileri. V. Ulusal Ekonometri
  • ve İstatistik Sempozyumu'nda sunulan bildiri. Çukurova Üniversitesi, Adana.
  • Peng, C.-Y. J., Harwell, M., Liou, S.-M & Ehman L. H. (2006). Advances in missing data methods and implications for educational research. In S. Sawilowsky (ed.), Real data analysis (ss.31-78) içinde. Greenwich, CT: Information Age Publishing Inc.
  • Satıcı, E. ve Kadılar, C. (2009). Kayıp gözlem olduğunda kitle ortalamasının tahmini. Anadolu Üniversitesi Bilim ve Teknoloji Dergisi, 10(2), 549-556.
  • Streiner, D.V. (2002). The case of the missing data: Methods of dealing with dropouts and other research vagaries. Research methods in Psychiatry, 47, 68-75.
  • Van der Ark, L. A. & Vermunt, J. K. (2010). New developments in missing data analysis. Methodology, 6(1), 1- 2, DOI: 10.1027/1614-2241/a000001
  • Vansteelandt, S., Carpenter, J. & Kenward, M.G. (2010). Analysis of incomplete data using inverse probability weighting and doubly robust estimators. Methodology, 6(1), 37-48. DOI: 10.1027/1614-2241/a000005.
  • Yılmaz, H. (2014). Random forests yönteminde kayıp veri probleminin incelenmesi ve sağlık alanında bir uygulama. Yayımlanmamış Yüksek Lisans Tezi, Eskişehir Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü, Eskişehir.
  • Young, W., Weckman, G. & Holland, W. (2011) A survey of methodologies for the treatment of missing values within datasets: limitations and benefits, Theoretical Issues in Ergonomics Science, 12 (1), 15-43, DOI: 10.1080/14639220903470205
APA ŞAHİN KÜRŞAD M, NARTGÜN Z (2015). Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. , 254 - 267.
Chicago ŞAHİN KÜRŞAD MERVE,NARTGÜN ZEKERIYA Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. (2015): 254 - 267.
MLA ŞAHİN KÜRŞAD MERVE,NARTGÜN ZEKERIYA Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. , 2015, ss.254 - 267.
AMA ŞAHİN KÜRŞAD M,NARTGÜN Z Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. . 2015; 254 - 267.
Vancouver ŞAHİN KÜRŞAD M,NARTGÜN Z Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. . 2015; 254 - 267.
IEEE ŞAHİN KÜRŞAD M,NARTGÜN Z "Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması." , ss.254 - 267, 2015.
ISNAD ŞAHİN KÜRŞAD, MERVE - NARTGÜN, ZEKERIYA. "Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması". (2015), 254-267.
APA ŞAHİN KÜRŞAD M, NARTGÜN Z (2015). Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6(2), 254 - 267.
Chicago ŞAHİN KÜRŞAD MERVE,NARTGÜN ZEKERIYA Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi 6, no.2 (2015): 254 - 267.
MLA ŞAHİN KÜRŞAD MERVE,NARTGÜN ZEKERIYA Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, vol.6, no.2, 2015, ss.254 - 267.
AMA ŞAHİN KÜRŞAD M,NARTGÜN Z Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi. 2015; 6(2): 254 - 267.
Vancouver ŞAHİN KÜRŞAD M,NARTGÜN Z Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması. Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi. 2015; 6(2): 254 - 267.
IEEE ŞAHİN KÜRŞAD M,NARTGÜN Z "Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması." Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, 6, ss.254 - 267, 2015.
ISNAD ŞAHİN KÜRŞAD, MERVE - NARTGÜN, ZEKERIYA. "Kayıp Veri Sorununun Çözümünde Kullanılan Farklı Yöntemlerin Ölçeklerin Geçerlik ve Güvenirliği Bağlamında Karşılaştırılması". Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi 6/2 (2015), 254-267.