İçerik
Bilim adamları, ekonomistler veya istatistikçiler teoriye dayanarak tahminlerde bulunup gerçek verileri topladıklarında, öngörülen ve ölçülen değerler arasındaki değişimi ölçmek için bir yola ihtiyaçları vardır. Bunlar genellikle, kare kare veri puanlarının eksi 2 puanına bölünmüş varyasyonlarının toplamı olan ortalama karesel hataya (MSE) dayanmaktadır. Veriler grafikte görüntülendiğinde, MSE'yi Düşey eksen veri noktalarındaki değişimlerin toplanması. Bir x-y grafiğinde, bu y değerleri olacaktır.
Neden Çeşitlemeler Kare?
Öngörülen ve gözlemlenen değerler arasındaki varyasyonun çarpılması, istenen iki etkidir. Birincisi, tüm değerlerin pozitif olduğundan emin olmaktır. Bir veya daha fazla değer negatif olsaydı, tüm değerlerin toplamı gerçek dışı küçük olabilir ve öngörülen ve gözlenen değerler arasındaki gerçek varyasyonun zayıf bir temsili olabilirdi. Karelemenin ikinci avantajı, daha büyük farklılıklara daha fazla ağırlık kazandırmaktır; bu, MSE için büyük bir değerin, büyük veri değişikliklerini işaret ettiğini garanti eder.
Örnek Hesaplama Stok Algoritması
Belirli bir hissenin fiyatlarını günlük olarak tahmin eden bir algoritma olduğunu varsayalım. Pazartesi günü, hisse senedi fiyatı 5.50 $, Salı günü 6.00 $, Çarşamba 6.00 $, Perşembe 7.50 $ ve Cuma 8.00 $ olacağını tahmin ediyor. Pazartesi gününü 1. gün olarak kabul edersek, şöyle görünen bir dizi veri noktanız var: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) ve (5, 8.00). Gerçek fiyatlar aşağıdaki gibidir: Pazartesi 4,75 ABD doları (1, 4,75); Salı 5,35 ABD Doları (2, 5,35); Çarşamba 6,25 ABD Doları (3, 6,25); Perşembe, 7,25 Dolar (4, 7,25); ve Cuma: 8.50 dolar (5, 8.50).
Bu noktaların y değerleri arasındaki farklılıklar sırasıyla 0.75, 0.65, -0.25, 0.25 ve -0.50'dir; burada negatif işaret, gözlenen değerden daha küçük tahmin edilen bir değeri gösterir. MSE'yi hesaplamak için, ilk önce eksi işaretlerini ortadan kaldıran ve 0.5625, 0.4225, 0.0625, 0.0625 ve 0.25 değerlerini veren her bir varyasyon değerini karelersiniz. Bu değerlerin toplanması, 1.36 verir ve eksi 2 olan 3 olan ölçüm sayısına bölünerek, MSE değeri 0.45 olur.
MSE ve RMSE
MSE için daha küçük değerler, öngörülen ve gözlemlenen sonuçlar arasında daha yakın bir anlaşmaya işaret eder ve 0,0 bir MSE, mükemmel bir anlaşmaya işaret eder. Ancak, varyasyon değerlerinin kare olduğunu hatırlamak önemlidir. Veri noktalarıyla aynı birimde olan bir hata ölçümü gerektiğinde, istatistikçiler kök ortalama kare hatasını (RMSE) alır. Bunu ortalama kare hatasının karekökünü alarak elde ederler. Yukarıdaki örnekte, RSME 0,671 veya yaklaşık 67 sent olacaktır.