Regresyon Analizi Nedir?
- 14 February 2021
- 357 Görüntülenme
- 0 Yorum
Bu yazı, Regresyon Analizinin pratik bir açıklamasını sağlar. Okuduktan sonra bu güçlü pazarlama aracının temellerini anlayacaksınız.
Regresyon Analizi nedir?
Regresyon Analizi, örneğin bir veri kümesindeki farklı değişkenler arasındaki bağlantıları keşfetmek için kullanılan istatistiksel bir yöntemdir. Verileri modellemek ve analiz etmek için önemli bir araçtır. Araç ayrıca neden-sonuç ilişkilerini tahmin etmek ve tanımlamak için de kullanılır. Örneğin, ölümcül yol kazalarının nedenlerini araştırmak için kullanılır. Regresyon Analizi, bağımlı ve bağımsız değişkenler arasındaki ilişkiyi ortaya çıkarır. Dahası, bir değişkenin diğerine etkisinin gücünü de gösterir.
Genel olarak konuşursak, bir veri kümesindeki büyük bir sayı dizisini incelemek ve bu veri noktaları arasında hangi ilişkilerin veya ilişkilerin olduğunu tam olarak anlamak zordur. Bu durumda, bir Regresyon Analizinin kullanılması, veri kümesine dayalı bir tahmin yapmak için en iyi yöntemdir. Regresyon Analizi gerçekleştirmek için kullanılabilecek farklı yazılım türleri vardır.
Regresyon terimi, uzun ataların torunlarının boylarının kısalmaya ve ortalamaya uyum sağlama eğiliminde olduğu olgusundan türetilmiştir. Bu teori, tamamen yukarıda açıklanan bağlamda olmasına rağmen, Francis Galton tarafından geliştirilmiştir. Çalışmaları daha sonra daha genel bir bağlam için genişletilecekti. Regresyon Analizi, aktif araştırma için önemli bir alan olmaya devam etmektedir. Son yıllarda, farklı karmaşık regresyon türlerini tanımlamak için birçok yeni yöntem geliştirilmiştir.
Regresyon Analizinde Terminoloji
Bir Regresyon Analizinin sonuçlarını parçalamak için önce temel jargonu anlamak önemlidir. Bir Regresyon Analizi yapılırken kullanılan en yaygın terminoloji aşağıda açıklanmaktadır.
İlişkiler
Regresyon Analizi hakkında konuşurken, insanlar genellikle korelasyonlardan bahseder. Bununla birlikte bir korelasyon analizi aslında yalnızca iki sürekli değişken arasındaki ilişkiyi veya ilişkiyi temsil etmek için kullanılır. Regresyon Analizi benzer bir tekniktir ama bir sonuç değişkeni ile bir veya daha fazla yıkıcı değişken arasındaki ilişkiyi ölçer.
Değişkenler
Sonuç değişkeni genellikle yanıt veya bağımlı değişken olarak da adlandırılır. Yıkıcı risk faktörlerine öngörücü veya bağımsız değişkenler denir. Regresyon Analizinde, bağımlı değişkenler bir Y ile ve bağımsız değişkenler bir X ile temsil edilir.
Aykırı Değerler
Aykırı değerler, çoğu parametrik istatistiği etkilediği için istatistikte bir sorundur. Örneğin, ortalamalar, standart sapmalar ve korelasyonlar buna son derece duyarlıdır. Bazı durumlarda, aykırı değerler bütün bir analizi değersiz hale getirebilir. Bu sorunlara rağmen, aykırı değerler basitçe dışlanamaz. Aslında, bazen ilginç nedenleri olabilecek meşru veriler olabilirler. Bu yüzden aykırı değerlerin nedenini bulmak önemlidir.
Çoklu bağlantı doğrusu
Bir analizde bağımsız değişkenler korelasyonlara sahip gibi göründüğünde çoklu bağlantıdan söz edilir. Bu bir sorun olabilir, çünkü adından da anlaşılacağı gibi, bağımsız değişkenlerin bağımsız olması gerekiyor. Buradaki fikir, belirli bir bağımsız değişkenin değeri değiştirildiğinde, başka bir bağımsız değişkenin aynı kalmasıdır. Birindeki bir değişiklik diğerinde bir değişikliğe neden olursa modelin bağımsız ve bağımlı değişkenler arasındaki ilişkiyi tahmin etmesi zorlaşır. Bunun nedeniyse her iki değişkenin aynı anda değişme eğiliminde olmasıdır.
Değişken varyans/eş varyans
Hata terimi, gürültü veya diğer rahatsızlıklar bağımsız değişkenin tüm değerleri için aynı olduğunda, homoscedastisiteden söz edilir. Değişken varyans, bu hata teriminin büyüklüğü bağımsız bir değişkenin belirli değerleri arasında farklılık gösterdiğinde mevcuttur.
Doğrusal Regresyon
Doğrusal regresyon, bağımlı değişkenler (Y) ile bir veya daha fazla bağımsız değişken (X) arasındaki ilişkinin analiz edildiği bir Regresyon Analizi biçimidir. Bu durum regresyon çizgisi olarak da bilinen bir çizgiyle görselleştirilir. Adından da anlaşılacağı gibi, bu çizginin doğası doğrusaldır. Bu formda, bağımlı değişken süreklidir ve bağımsız değişken, sürekli veya kesintili olabilir.
Bu durum Regresyon Analizinin en basit şeklidir. Örneğin, bir arabanın kilometresi ile bakım maliyetleri arasındaki ilişkiyi göstermenin kolay bir yolunu sağlar.
Doğrusal Olmayan Regresyon
Doğrusal bir regresyon analizini karakterize eden şey, çizginin doğrusal olmasıdır. Doğrusal olmayan bir karşılaştırma bu yüzden birçok farklı biçimde olabilir. Bu yüzden bu Regresyon Analizi formu aynı zamanda eğri uydurma için en iyi işlevsellikleri sunar. Doğrusal olmayan regresyon, aşağıdakiler dahil çeşitli türleri içerir.
Lojistik Regresyon
Lojistik regresyon, ikili bağımlı sonuç değişkenini bir veya daha fazla başka değişkene bağlamak için kullanılan Regresyon Analizi formudur. Tahmine dayalı bir analiz aracıdır ve bir değişken ile diğeri arasındaki ilişkiyi tanımlamak için kullanılır. Bu tip Regresyon Analizi, doğrusal analize en yakın olanıdır ve ölçülen değişkenler sürekli değilse doğrusal analize bir alternatif olarak düşünülebilir.
Ridge Regresyon
Veri kümelerinin çoklu bağlantı gibi birden çok problemle nasıl yüzleşebileceğini zaten görmüştük. Çoklu bağlantı durumunda, regresyon verileri yine de Ridge Regresyonu gibi özel analiz yöntemleriyle analiz edilebilir. Sırt regresyonunda formül, değişkenlerdeki standart hataları azaltır, böylece sonuçlar umarız daha güvenilir olur.
Kement Regresyonu
Kement Regresyonu, küçültmeyi kullanan bir Regresyon Analizi türüdür. Gerileme katsayıları küçültüldüğünde ve ortalama veya sıfır gibi merkezi bir noktaya getirildiğinde küçülme meydana gelir. Bu tür regresyon analizi, yüksek düzeyde çoklu bağlantıya sahip veri kümeleri için uygundur. LASSO kısaltması, En Az Mutlak Karides ve Seçim Operatörü anlamına gelir.
Uygulamada Regresyon Analizi
Veriler arasındaki ilişkileri bulmakta yardıma ihtiyacı olan herkes tarafından bir analiz yapılabilir. Aynı zamanda, analizin iş kararları için etkili bir araç olduğu da kanıtlanmıştır. Örneğin, Regresyon Analizi, bir yöneticinin kısa vadeli veya uzun vadeli satışları veya gelecekte envanter seviyelerinin nasıl görüneceğini tahmin etmesine yardımcı olabilecek verileri analiz ederken ve ilişkileri görüntülerken faydalı olabilir. Bu analiz aracı, belirli bir sektörden bir ürün veya hizmet için talep ve arzın daha iyi anlaşılması için de kullanılabilir. Daha fazla veri, daha fazla farklı değişken bu faktörleri etkileyebilir.
Tahminler için, Regresyon Analizi iki farklı değişken, bağımlı ve bağımsız değişkenler arasındaki ilişkiyi göstermek için kullanılır. Örneğin, bir işletmenin GSYİH (gayri safi yurtiçi hasıla) ile cirosu arasında bir ilişki kurulabilir. Ardından şu soru cevaplanabilir: GSYİH %3 artarsa cirom ne kadar artabilir?
Ne düşünüyorsunuz?
Regresyon Analizinin açıklamasına aşina mısınız? Hiç bu tür bir veri analizi uyguladınız mı veya gelecekte çalışma ortamınızda uygulanabileceğini düşünüyor musunuz? Herhangi bir ipucunuz veya ek yorumunuz var mı?
Düşüncelerinizi ve bilginizi aşağıdaki yorum kutusunda paylaşabilirsiniz.
Bu makaleyi beğendiyseniz, modeller ve yöntemler hakkındaki en son gönderiler için bültenimize kaydolabilirsiniz.
Yorumunuzu bırakın