İçerik
İstatistiklerde, Gauss ya da normal dağılım, birçok sistemi olan karmaşık sistemleri karakterize etmek için kullanılır. Stephen Stigler'in İstatistik Tarihinde açıklandığı gibi, Abraham De Moivre, Karl Fredrick Gauss’un adını taşıyan dağıtımı icat etti. Gauss’un katkısı, verinin en iyi kareye sığması ile veri sığdırma hatasını en aza indirmeye yönelik en küçük kareler yaklaşımına uygulanmasında yatmaktadır. Böylece istatistikte en önemli hata dağılımını yaptı.
Motivasyon
Bir veri örneğinin dağılımı nedir? Ya verinin temel dağılımını bilmiyorsanız? Temel dağılımı bilmeden veriler hakkındaki hipotezleri test etmenin bir yolu var mı? Merkezi Limit Teoremi sayesinde cevap evet.
Teorem Beyanı
Sonsuz bir popülasyondan alınan bir numunenin ortalama olarak yaklaşık normal veya Gausslu olduğunu, bunun altında yatan popülasyon ile aynı olduğunu ve popülasyon varyansına eşit varyansın, numune büyüklüğüne eşit olduğunu belirtir. Numune büyüklüğü arttıkça yaklaşım da iyileşir.
Yaklaşım ifadesi bazen normal dağılıma yakınlaşma hakkında bir sonuç olarak yanlış yazılmıştır. Yaklaşan normal dağılım numune büyüklüğü arttıkça değiştiğinden, böyle bir ifade yanıltıcıdır.
Teorem, Pierre Simon Laplace tarafından geliştirilmiştir.
Neden Her Yerde
Normal dağılımlar her yerdedir. Sebep, Merkezi Limit Teoreminden geliyor. Çoğu zaman, bir değer ölçüldüğünde, birçok bağımsız değişkenin toplam etkisidir. Bu nedenle, ölçülen değerin kendisi de örnek ortalama bir niteliğe sahiptir. Örneğin, bir sporcunun performansının dağılımı, diyet, antrenman, genetik, koçluk ve psikolojideki farklılıklar nedeniyle zil biçiminde olabilir. Erkek boylarının bile normal dağılıma sahip olması birçok biyolojik faktörün bir işlevidir.
Gaussian Copulas
Gauss dağılımına sahip “copula işlevi” olarak adlandırılan şey, teminatlı tahvillere yatırım yapma riskini değerlendirmek için kullanımı nedeniyle 2009’da haberi buldu. İşlevin yanlış kullanılması 2008-2009 mali krizinde etkili oldu. Krizin pek çok nedeni olmasına rağmen, rüzgarın ortasında Gauss dağılımları kullanılmamalıdır. Daha kalın bir kuyruğu olan bir fonksiyon, olumsuz olaylara daha büyük olasılıklar atayacaktır.
türetme
Merkezi Limit Teoremi, altta yatan popülasyonun mgf'nin bir fonksiyonu olarak (örnek ortalama - popülasyon ortalaması) / a (popülasyon varyansı / numune büyüklüğü) moment üretme fonksiyonunu (mgf) analiz ederek birçok hatta kanıtlanabilir. Teorem yaklaşımı kısmı, temel popülasyonun mgf'sini bir güç serisi olarak genişleterek tanıtılmakta ve daha sonra çoğu terimin gösterilmesi, örneklem büyüklüğü arttıkça önemsiz olmaktadır.
Aynı işlevin karakteristik denkleminde Taylor genişlemesi kullanılarak ve örneklem büyüklüğünü daha büyük hale getirerek daha az sayıda çizgide kanıtlanabilir.
Hesaplamalı Kolaylık
Bazı istatistiksel modeller hataları Gaussian olarak kabul eder. Bu, hipotez testlerinde kullanılmak üzere ki-kare ve F-dağılımı gibi normal değişkenlerin fonksiyon dağılımlarını sağlar. Spesifik olarak, F testinde, F istatistiği, normal varyans parametresinin bir fonksiyonu olan ki-kare dağılım oranından oluşur. İkisinin oranı, varyansın iptal edilmesine neden olur ve normallikleri ve sürekliliği dışındaki varyansların bilgisi olmadan hipotez testini mümkün kılar.