İçerik
- TL; DR (Çok Uzun; Okumadı)
- Veri Noktaları Sipariş Et
- İlk Çeyrek Konumunu Belirle
- Üçüncü Çeyrek Konumunu Belirle
- Çeyrekler arası aralığı hesapla
- IQR'nin Avantajları ve Dezavantajları
Genellikle IQR olarak kısaltılmış olan çeyrekler arası aralık, verilen herhangi bir veri setinin yüzde 25'inden yüzde 75'ine veya yüzde 50'sinin aralığını temsil eder. Çeyrekler arası aralık, bir testte ortalama performans aralığının ne olacağını belirlemek için kullanılabilir: çoğu insanın belirli bir sınavda puanlarının ne kadar olduğunu görmek için kullanabilirsiniz veya bir şirketteki ortalama çalışanın her ay ne kadar para kazandığını belirlemek için kullanabilirsiniz. . Çeyrekler arası aralık, veri kümesinin ortalamasına veya ortancasına göre daha etkili bir veri analizi aracı olabilir, çünkü dağılım aralığını tek bir sayı yerine tanımlamanıza olanak tanır.
TL; DR (Çok Uzun; Okumadı)
Çeyrekler arası aralık (IQR), bir veri kümesinin orta yüzde 50'sini temsil eder. Bunu hesaplamak için önce verilerinizi en azdan en büyüğe doğru sıralayın, ardından sırasıyla N (N + 1) / 4 ve 3 * (N + 1) / 4 formüllerini kullanarak birinci ve üçüncü çeyrek konumlarınızı belirleyin. Veri setindeki noktaların sayısı. Son olarak, veri kümesinin çeyrekler arası aralığını belirlemek için ilk çeyreği üçüncü çeyrekten çıkartın.
Veri Noktaları Sipariş Et
Bölümler arası aralık hesaplaması basit bir işlemdir, ancak hesaplama yapmadan önce veri kümenizin çeşitli noktalarını ayarlamanız gerekecektir. Bunu yapmak için, veri noktalarınızı en küçüğünden en büyüğüne sipariş ederek başlayın. Örneğin, veri noktalarınız 10, 19, 8, 4, 9, 12, 15, 11 ve 20 olsaydı, onları şu şekilde yeniden düzenlerdiniz: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Veri noktalarınız böyle sipariş edildikten sonra bir sonraki adıma geçebilirsiniz.
İlk Çeyrek Konumunu Belirle
Daha sonra, aşağıdaki formülü kullanarak ilk çeyreğin konumunu belirleyin: (N + 1) / 4, burada N, veri kümesindeki nokta sayısıdır. İlk çeyrek iki sayı arasına düşerse, iki sayı ortalamasını ilk çeyrek puanınız olarak alın. Yukarıdaki örnekte, dokuz veri noktası bulunduğundan, 10'a 1 ila 9 ekler ve ardından 2.5'e 4'e bölersiniz. İlk çeyrek, ikinci ve üçüncü değerlerin arasına düştüğünden, ilk çeyrek pozisyonu 8,5 olarak almak için ortalama 8 ile 9 arasında bir değer alırsınız.
Üçüncü Çeyrek Konumunu Belirle
İlk çeyreğinizi belirledikten sonra, aşağıdaki formülü kullanarak üçüncü çeyreğin konumunu belirleyin: 3 * (N + 1) / 4, N yine veri kümesindeki nokta sayısıdır. Aynı şekilde, üçüncü çeyrek iki sayının arasına düşerse, ilk çeyrek puanını hesaplarken olduğu gibi sadece ortalamayı alın. Yukarıdaki örnekte, dokuz veri noktası bulunduğundan, 10'a 1 ila 9 ekler, 30'a 3'e çarpıp sonra 7.5'e 7'ye bölersiniz. İlk çeyrek, yedinci ve sekizinci değer arasına düştüğünden, üçüncü çeyrek puanını 17 almak için 15 ile 19 arasında bir puan alırsınız.
Çeyrekler arası aralığı hesapla
Birinci ve üçüncü çeyreklerinizi belirledikten sonra, ilk çeyreğin değerini üçüncü çeyreğin değerinden çıkararak çeyrekler arası aralığı hesaplayın. Bu makale boyunca kullanılan örneği bitirmek için, veri kümesinin çeyrekler arası aralığının 8,5'e eşit olduğunu bulmak için 8'den 17'yi çıkarmalısınız.
IQR'nin Avantajları ve Dezavantajları
Çeyrekler arası aralık, bir veri setinin her iki ucundaki aykırı noktaları tanımlama ve eleme kabiliyetine sahiptir. Ayrıca IQR, çarpık veri dağılımı durumlarında iyi bir değişkenlik ölçüsüdür ve bu IQR'yi hesaplama yöntemi, veri noktalarını düzenlemek için kümülatif bir frekans dağılımı kullandığınız sürece, gruplanmış veri kümeleri için çalışabilir. Gruplandırılmış veriler için çeyrekler arası aralık formülü, gruplandırılmamış verilerle aynıdır; IQR, üçüncü çeyreğin değerinden çıkartılan ilk çeyrek değerine eşittir. Bununla birlikte, standart sapma ile karşılaştırıldığında birkaç dezavantajı vardır: birkaç aşırı puana daha az duyarlılık ve standart sapma kadar güçlü olmayan bir örnekleme kararlılığı.