Elmas fiyat tahmini için makine öğrenmesi yöntemlerinin incelenmesi
Dosyalar
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Başta mücevherat olmak üzere birçok alanda çeşitli amaçlar için kullanılan elmasın, karmaşık bir fiyatlandırma sistemine sahip olması elmas ticaretinde sorunlara yol açmaktadır. Bu kapsamda, farklı kodlama ve normalizasyon tekniklerinin uygulandığı çeşitli veri ön işleme adımlarından geçirilerek elde edilen 4 değişik veri setiyle özgün makine öğrenmesi yöntemleri kullanılarak elmas fiyat tahmini yapılmaktadır. Elmas fiyat tahmininde kullanılan doğrusal (linear), k-en yakın komşu (k-nearest neighbors), destek vektör (support vector), karar ağacı (decision tree), rastgele orman (random forest), aşırı gradyan güçlendirme (extreme gradient boosting) ve çok katmanlı algılayıcı (multi-layer perceptron) yöntemlerinin performansları, yaygın olarak kullanılan MAE (Ortalama Mutlak Hata (Mean Absolute Error)), WMAE (Ağırlıklı Ortalama Mutlak Hata (Weighted Mean Absolute Error)), MSE (Ortalama Kare Hata (Mean Squared Error)), RMSE (Karekök Ortalama Kare Hata (Root Mean Squared Error)), R2 (R-Kare (R-Squared), Belirlilik Katsayısı (Coefficient of Determination)), MAPE (Ortalama Mutlak Yüzde Hata (Mean Absolute Percentage Error)) ve çalışmada geliştirilen yenilikçi metrikler QMAE (Kantil Ortalama Mutlak Hata (Quantile Mean Absolute Error)), AMAE (Asimetrik Ortalama Mutlak Hata (Asymmetric Mean Absolute Error)), QMAPE (Kantil Ortalama Mutlak Yüzde Hata (Quantile Mean Absolute Percentage Error)), AMAPE (Asimetrik Ortalama Mutlak Yüzde Hata (Asymmetric Mean Absolute Percentage Error)), MPAE (Ortalama Orantılı Mutlak Hata (Mean Proportion Absolute Error)), QMPAE (Kantil Ortalama Orantılı Mutlak Hata (Quantile Mean Proportion Absolute Error)), AMPAE (Asimetrik Ortalama Orantılı Mutlak Hata (Asymmetric Mean Proportion Absolute Error)) ile karşılaştırmalı olarak incelenmektedir. Bu incelemeler sonucunda, en uygun yöntemin belirlenmesi ve geliştirilen yenilikçi metriklerin geniş kullanım alanlarına sunulması hedeflenmektedir.
Diamond, widely used for various purposes, particularly in jewelry, has a complex pricing system that poses challenges in diamond trading. In this context, diamond price prediction is performed using original machine learning methods on four distinct datasets obtained through various data preprocessing steps, where different encoding and normalization techniques are applied. The performance of methods employed for diamond price prediction, namely linear, k-nearest neighbors, support vector, decision tree, random forest, extreme gradient boosting, and multi-layer perceptron, is investigated comparatively using widely adopted metrics such as MAE (Mean Absolute Error), WMAE (Weighted Mean Absolute Error), MSE (Mean Squared Error), RMSE (Root Mean Squared Error), R² (R-Squared, Coefficient of Determination), MAPE (Mean Absolute Percentage Error), alongside innovative metrics developed in this study such as QMAE (Quantile Mean Absolute Error), AMAE (Asymmetric Mean Absolute Error), QMAPE (Quantile Mean Absolute Percentage Error), AMAPE (Asymmetric Mean Absolute Percentage Error), MPAE (Mean Proportion Absolute Error), QMPAE (Quantile Mean Proportion Absolute Error), and AMPAE (Asymmetric Mean Proportion Absolute Error). These investigations aim to identify the most suitable method and to introduce the innovative metrics developed in this study for broader application areas.