Lineer Regresyonun Dezavantajları

Posted on
Yazar: Peter Berry
Yaratılış Tarihi: 19 Ağustos 2021
Güncelleme Tarihi: 13 Kasım 2024
Anonim
Doğrusal Regrezsyon (Linear Regression)  (Weka Eğitim Serisi 8)
Video: Doğrusal Regrezsyon (Linear Regression) (Weka Eğitim Serisi 8)

İçerik

Doğrusal regresyon, bir bağımlı değişken arasındaki ilişkiyi incelemek için istatistiksel bir yöntemdir. y ve olarak belirtilen bir veya daha fazla bağımsız değişken x. Bağımlı değişken, herhangi bir değeri alabilmesi için sürekli olmalı veya en azından devamlılığa yakın olmalıdır. Bağımsız değişkenler herhangi bir türde olabilir. Doğrusal regresyon kendi başına nedensellik gösteremese de, bağımlı değişken genellikle bağımsız değişkenlerden etkilenir.

Doğrusal Regresyon, Doğrusal İlişkilerle Sınırlıdır

Doğası gereği, lineer regresyon sadece bağımlı ve bağımsız değişkenler arasındaki lineer ilişkilere bakar. Yani, aralarında düz bir ilişki olduğunu varsayar. Bazen bu yanlış. Örneğin, gelir ve yaş arasındaki ilişki kavislidir, yani gelir yetişkinliğin erken kısımlarında yükselme, daha sonraki yetişkinlikte düzelme ve insanlar emekli olduktan sonra düşme eğilimindedir. Bunun bir sorun olup olmadığını ilişkilerin grafiksel temsillerine bakarak anlayabilirsiniz.

Doğrusal Regresyon, Sadece Bağımlı Değişkenlerin Ortalamalarına Bakar

Doğrusal regresyon, bağımlı değişkenin ortalaması ile bağımsız değişkenler arasındaki ilişkiye bakar. Örneğin, bebeklerin doğum ağırlığı ve yaş gibi anne özellikleri arasındaki ilişkiye bakarsanız, doğrusal gerileme, farklı yaşlardaki annelerden doğan bebeklerin ortalama ağırlığına bakacaktır. Bununla birlikte, bazen bağımlı değişkenin uçlarına bakmanız gerekir, örneğin bebekler ağırlıkları düşük olduğunda risk altındadır, bu nedenle bu örnekte uç noktalara bakmak istersiniz.

Ortalama tek bir değişkenin tam bir tanımı olmadığı gibi, doğrusal regresyon değişkenler arasındaki ilişkilerin de tam bir açıklaması değildir. Bu problemi kuantil regresyon kullanarak halledebilirsiniz.

Lineer Regresyon Aykırı Değerlere Duyarlıdır

Aykırı değerler şaşırtıcı olan verilerdir. Aykırı değerler tek değişkenli (bir değişkene dayalı) veya çok değişkenli olabilir. Yaş ve gelire bakıyorsanız, tek değişkenli aykırı değerler 118 yaşında olan veya geçen yıl 12 milyon dolar yapan biri gibi şeyler olacaktır. Çok değişkenli bir aykırı 1800 yaşında olacaktı ve 200 bin dolar kazandı. Bu durumda ne yaş ne de gelir çok aşırı değildir, ancak 18 yaşındaki çok az insan bu kadar para kazanıyor.

Aykırı değerler, regresyon üzerinde çok büyük etkiler yaratabilir. İstatistiksel yazılımınızdan etki istatistiklerini talep ederek bu sorunu çözebilirsiniz.

Veriler Bağımsız Olmalı

Doğrusal regresyon, verilerin bağımsız olduğunu varsayar. Bu, bir konunun (bir kişi gibi) puanlarının, diğerininkilerle hiçbir ilgisinin olmadığı anlamına gelir. Bu genellikle, ancak her zaman değil, mantıklı. Mantıklı gelmediği iki yaygın durum uzayda ve zamanda kümelemektir.

Uzayda kümelemenin klasik bir örneği, çeşitli sınıflardan, sınıflardan, okullardan ve okul bölgelerinden öğrencileriniz olduğunda, öğrenci test puanlarıdır. Aynı sınıftaki öğrenciler birçok yönden benzer olma eğilimindedir, yani, genellikle aynı mahallelerden gelirler, aynı öğretmenlere sahiptirler, vb. Böylece, bağımsız değillerdir.

Zamandaki kümelemeye örnekler, aynı konuları birçok kez ölçtüğünüz herhangi bir çalışmadır. Örneğin, bir diyet ve kilo çalışmasında, her kişiyi birçok kez ölçebilirsiniz. Bu veriler bağımsız değildir, çünkü bir kişinin ağırlığındaki ağırlık, diğer durumlarda ağırlığının ne olduğu ile ilgilidir. Bununla başa çıkmanın bir yolu çok seviyeli modellerdir.