Teknoloji

Yeni Başlayanlar İçin Ayrıntılı Regresyon Analizi – 2023

Regresyon analizi en çok kullanılan istatistik analizleri arasındadır. Peki regresyon nedir ? Regresyon, bir bağımlı değişkenle bağımsız değişkenler arasındaki ilişkinin belirlenmesine yarayan bir istatistiki terimdir. Birden fazla esneklik sağlar, bu da birçok alanda kullanışlı olduğunu ispatlar. Regresyon analizi, birbirine karışmış birçok problemi çözebilir.

Regresyon analizi, aşağıdakiler gibi birçok şeyi işleyebilir:

  • Çoklu bağımsız değişkenlerin modellenmesi
  • Sürekli ve kategorik değişkenlerin dahil edilebilmesi
  • Eğriliği modellemek için polinom terimlerini kullanılması

Regresyon Analizi Nedir?

Regresyon Analizi ise bağımlı bir değişken ile birden fazla öngörülebilen değişken arasındaki ilişkiyi tahmin etmenizi sağlayan istatiksel bir yöntemdir. Regresyon Analizi, hangi faktörlerin göz ardı edilebileceği hangi faktörlerin daha önemli olduğunu anlamanıza yardımcı olur. Bağımlı değişken, gelecek ayın satış rakamları gibi tahmin etmeye çalıştığınız değişkendir. Bağımsız bir değişken, bağımlı değişkeniniz üzerinde etkisi olduğundan şüphelendiğiniz bir değişkendir; örneğin hava koşulları, aynı ürünü tanıtan rakipler gibi etkenlerdir.

Regresyon Analizi Nasıl Çalışır?

Regresyon analizi yapmak için, regresyon analizi yöntemiyle çalışmanızda kullanabileceğiniz çok yönlü bir veri seti oluşturmanız gerekmektedir. Verilerinizi oluşturmak, ilgi duyduğunuz tüm bağımsız değişkenleri ele alan soruları içeren, ilgilendiğiniz alanlara yönelik anketler oluşturabilirsiniz.

  1. Verileri Grafik Üzerinde Çizme

Veri setlerinizi oluşturduktan sonra, veri noktalarını bir grafiğe dökmeniz gerekecektir. Verilerinizi grafik üzerinde çizmek iki değişken arasında ilişki olup olmadığını anlamanın birinci adımıdır.

  1. Regresyon Modeli Oluşturma

Bağımlı değişken ile bağımsız değişken arasındaki bağlantıyı bulmak için, tablo boyunca tüm veri noktalarının ortasından geçen bir çizgi çekmelisiniz. Bu çizgi X ve Y arasındaki ilişkiyi özetlemektedir.

Bir regresyon çizgisinin formülü şöyle görünür:

Y = 100 + 4X + hata terimi

Hata terimi, regresyonun kesin olmadığını gösterir. Formül, X (bağımsız değişken) yoksa Y’nin 100 olduğunu açıklıyor.

Bir regresyon çizgisinde bir hata terimi vardır çünkü bağımsız değişkenler hiçbir zaman bağımlı değişkenlerin tam olarak mükemmel öngörücüleri değildir. Çizgi, regresyon analizi için kullandığınız verilerin yalnızca bir izlenimidir.

Regresyon Analiz Tekniklerinin Türleri

Regresyon analiz teknikleri üç başlıktır; bağımsız değişkenlerin sayısı, bağımlı değişken türleri ve regresyon çizgisinin şekli. Yaygın olarak kullanılan regresyon analizi tekniklerini listeleyelim.

  • Lojistik Regresyon

Doğru/yanlış gibi birbirini dışlayan olayların olasılığının tahmin edilmesinde kullanılır.

  • Polinom Regresyon

Bağımlı ve bağımsız değişkenlerin arasındaki ilişkiyi doğrusal olmayan şekilde modeller.

  • Kademeli Regresyon

3 yöntem kullanılır. Birden fazla bağımsız değişken olduğunda kullanılır.

  • Ridge Regresyon

Çoklu regresyonda elde edilen verilerde kullanılır. Modellerin karmaşıklığını azaltmak için kullanılır.

  • Lasso Regresyon

Ridge gibi modellerin karmaşıklığını azaltmak için kullanılan bir modeldir. Gerekli özellikler kullanıldığı için kalanlar sıfır olarak ayarlanır ve fazla uydurmalar önlenir.

 Linear Regresyon Nedir?

Diğer adı ile doğrusal regresyon, istatistik ve makine öğreniminde yaygın olarak kullanılan bir tahmine dayalı analiz türüdür. Bu, bağımlı değişkenin sürekli olduğunu ve bağımlı ve bağımsız değişkenler arasındaki ilişkinin doğrusal olduğunu varsayan bir tekniktir. Doğrusal regresyon, denetimli öğrenmeye dayalı makine öğrenimi algoritmalarından biridir ve diğer makine öğrenimi algoritmalarını oluşturmak ve eğitmek için temel görevi görür. Makine öğreniminde, bir veri kümesinin bağımlı değişkeni ile bir veya daha fazla bağımsız değişken arasındaki ilişkiye dayalı olarak bir olayın sonucunu tahmin etmek için kullanılır.

Çoklu doğrusal regresyon, bağımlı değişkenin sonucunu daha iyi tahmin etmek için birden fazla değişken kullanan sıradan en küçük kareler (OLS) regresyon analizinin bir uzantısıdır.

Lineer regresyona derinlemesine girmeden önce anlaşılması gereken iki önemli faktör vardır.

  • Maliyet işlevi

Ortalama Hata Karesi (MSE) işlevi olarak da bilinir. Ardından, a_0 ve a_1 değerlerini, MSE değeri minimumda kalacak şekilde değiştireceğiz.

  • Gradyan iniş

MSE değeri minimumda tutulacak şekilde a_0 ve a_1 değerlerini güncelleyen bir yaklaşımdır. Gradyan inişini bulmak için a_0 ve a_1’in kısmi türevlerini alın. Bu, a_0 ve a_1’i güncellemek için kullanılır. Fikir, a_0 ve a_1 için rastgele değerlerle başlamak ve minimum maliyet elde etmek için değerleri yinelemeli olarak güncellemektir. Lineer regresyon ile tahmin Linear regresyon ile tahmin yapmak bir denklemi çözmek kadar kolaydır. Örneğin bir kişinin kilosunu boyuna göre tahmin etmek istediğinizi varsayalım. Burada ağırlık (Y) bağımlı değişken veya belirleyicidir ve boyut (X) bağımsız değişkendir. Denklem şöyle görünür:

Y = B0 + B1*X1

Ağırlık = B0 + B1 * Boy

Yukarıdaki formülde B0 sapma faktörüdür ve B1 yükseklik sütunu faktörüdür.

B0 = 0,1, B1 = 0,5 ve yükseklik = 182 cm kabul edin. Şimdi bir kişinin kilosunu hesaplamak için bu değerleri yukarıdaki denklemde yerine koyalım.

Ağırlık = 0,1 + 0,5 * 182

Veya ağırlık = 91.1

Yukarıdaki denklem iki boyutlu bir regresyon çizgisi olarak çizilebilir. 100 ile 250 santimetre arasında değişen birden fazla boy değeri alıp yukarıdaki denkleme takarak kilo değerinizi elde edebilirsiniz. Regresyon çizgisini bu şekilde elde ederiz.

Bu yazımızda regresyon nedir ve regresyon analiz türleri nedir sorularına yanıt verdik. Diğer blog içeriklerimize bu bağlantıdan ulaşabilirsiniz.