Karşılaştırma Tablosu
Karşılaştırma için temel | sınıflandırma | gerileme |
---|---|---|
Temel | Nesnelerin haritalanmasının önceden tanımlanmış sınıflara yapıldığı model veya işlevlerin keşfi. | Nesnelerin haritalanmasının değerlere dönüştürüldüğü özel bir model. |
Tahminini içerir | Ayrık değerler | Sürekli değerler |
Algoritmalar | Karar ağacı, lojistik regresyon vb. | Regresyon ağacı (Rastgele orman), Doğrusal regresyon, vb. |
Tahmini verinin niteliği | sırasız | düzenli |
Hesaplama yöntemi | Ölçüm hassasiyeti | Kök ortalama kare hatasının ölçülmesi |
Sınıflandırmanın Tanımı
Sınıflandırma, verileri birden fazla kategorik sınıfa ayırmada yardımcı olan bir model (işlev) bulma veya keşfetme işlemidir. Sınıflandırmada, sorunun grup üyeliği tanımlanır, yani veriler bazı parametrelere göre farklı etiketler altında kategorize edilir ve ardından veriler için etiketler tahmin edilir.
Elde edilen modeller “IF-THEN” kuralları, karar ağaçları veya sinir ağları, vb. Şeklinde gösterilebilir. Karar ağacı temel olarak her iç düğümün bir nitelik üzerinde bir test gösterdiği bir ağaç yapısına benzeyen bir akış şemasıdır. ve şubeleri testin sonucunu gösterir. Sınıflandırma işlemi, verinin iki veya daha fazla ayrı etikete, diğer bir deyişle iki veya daha fazla ayrık kümeye bölünebileceği problemlerle ilgilidir.
Bir örnek verelim, bazı bölgelerdeki yağmur olasılığını bazı parametrelere dayanarak tahmin etmek istediğimizi varsayalım. Sonra iki etiket yağmuru olur ve altında farklı bölgelerin sınıflandırılabileceği bir yağmur olmaz.
Regresyonun Tanımı
Regresyon, verileri sınıfları kullanmak yerine sürekli gerçek değerlere ayırmak için bir model veya işlev bulma sürecidir. Matematiksel olarak, bir regresyon problemi ile, fonksiyon yaklaşımını minimum hata sapması ile bulmaya çalışıyor. Regresyonda, veri sayısal bağımlılığının onu ayırt etmesi beklenmektedir.
Regresyon analizi, etiket yerine sayısal verileri tahmin etmek için kullanılan istatistiksel modeldir. Ayrıca mevcut verilere veya geçmiş verilere bağlı olarak dağıtım hareketini tanımlayabilir.
Aynı örneği, bazı parametrelerin de yardımıyla bazı bölgelerde yağmur olasılığını bulduğumuz regresyonda da ele alalım. Bu durumda, yağmurla ilişkili bir olasılık var. Burada, yağmurlu bölgeleri sınıflandırmıyoruz ve yağmur etiketi bulunmuyor, bunun yerine onları muhtemel olasılıklarıyla sınıflandırıyoruz.
Sınıflandırma ve Regresyon Arasındaki Temel Farklılıklar
- Sınıflandırma işlemi, verilerin ayrı sınıf etiketlerinde tahmin edildiği bir işlevi modellemektedir. Diğer taraftan, regresyon, sürekli miktarı öngören bir model oluşturma sürecidir.
- Sınıflandırma algoritmaları karar ağacı, lojistik regresyon vb. İçerir. Buna karşılık, regresyon ağacı (örn. Rastgele orman) ve doğrusal regresyon, regresyon algoritmalarına örnektir.
- Sınıflandırma sırasız veriyi öngörürken, regresyon sıralı veriyi öngörür.
- Regresyon kök ortalama kare hatası kullanılarak değerlendirilebilir. Aksine, sınıflandırma doğruluk ölçülerek değerlendirilir.
Sonuç
Sınıflandırma tekniği, tarihsel verilerle ayrık kategorilerde veya etiketlerde yeni verileri öngören yordayıcı modeli veya işlevi sağlar. Tersine, regresyon yöntemi sürekli değerli fonksiyonları modellemektedir, bu da sürekli sayısal verilerdeki verileri öngördüğü anlamına gelir.