Gözetimli öğrenme
Makine öğrenmesi ve veri madenciliği |
---|
Gözetimli öğrenme ya da denetimli öğrenme (İngilizce: supervised learning), bilinen etiketler ve özellikler kullanarak bir fonksiyon öğrendiğimiz, makine öğreniminin önemli bir alt dalıdır. Bu yöntem, eğitim veri seti kullanılarak öğrenilen modelin, yeni ve bilinmeyen veri noktalarını doğru bir şekilde tahmin etmesini amaçlar.[1][2]
Bilgisayar mühendisliğinin, makine öğrenmesi alanının bir konusu olan gözetimli öğrenme, verilen girdi kümesinden istenen çıktı kümesinin elde edilmesi için bir fonksiyon öğrenilmesidir.[3]
Gözetimli öğrenmede, öğrenilmek istenen kavram ile ilgili toplanan gözlemler bir eğitim kümesi olarak öğreniciye verilir. Eğitim kümesinde her örnek için istenen çıktı değerleri de verilir. Bu bilgiler kullanılarak giriş ve çıkış arasında bir ilişki oluşturulur. Oluşturulan ilişki kullanılarak gelecekte karşılaşılacak gözlemlerinin karşılık geldiği çıktıları tahmin edilebilir.
Tarihçe ve Gelişim
[değiştir | kaynağı değiştir]Gözetimli öğrenme, 1950'lerde istatistiksel sınıflandırma ve regresyon analizinin gelişimi ile ortaya çıkmıştır. Alan, yapay sinir ağlarının ve destek vektör makinelerinin geliştirilmesi ile önemli ilerlemeler kaydetmiştir. 1990'larda büyük veri kümelerinin ve hesaplama gücünün artmasıyla, gözetimli öğrenme algoritmaları daha sofistike hale gelmiştir.[4][5]
Uygulama Alanları
[değiştir | kaynağı değiştir]Gözetimli öğrenme, çeşitli alanlarda başarılı bir şekilde uygulanmaktadır:
Tıp: Hastalık teşhisi ve tedavi önerileri.
Finans: Kredi risk analizi ve piyasa tahminleri.
Pazarlama: Müşteri segmentasyonu ve hedefli pazarlama.
Görüntü İşleme: Nesne tanıma ve yüz tanıma.[6][7][8]
Avantaj ve Dezavantajlar
[değiştir | kaynağı değiştir]Gözetimli öğrenme yöntemlerinin avantajları ve dezavantajları şunlardır:
Avantajlar:
Yüksek doğruluk: Etiketlenmiş veri setleri kullanarak yüksek doğrulukta modeller oluşturabilir.
Uygulama çeşitliliği: Birçok farklı problem türünde uygulanabilir.
Dezavantajlar:
Veri bağımlılığı: Etiketlenmiş veri gereksinimi yüksek ve maliyetlidir.
Aşırı öğrenme riski: Model, eğitim verisine aşırı uyum sağlayarak genelleme yeteneğini kaybedebilir.[9][10]
Kaynakça
[değiştir | kaynağı değiştir]- ^ Mitchell, T. (1997). Machine Learning. McGraw Hill. ISBN 0-07-042807-7.
- ^ Russell, S., & Norvig, P. (2010). Artificial Intelligence: A Modern Approach. Prentice Hall. ISBN 0-13-604259-7.
- ^ Bkz. Alpaydın, Ethem (2010). Introduction to Machine Learning. Londra: The MIT Press. s. 8. ISBN 978-0-262-01243-0. 2 Mart 2017 tarihinde kaynağından arşivlendi. Erişim tarihi: 21 Temmuz 2016.
- ^ McCarthy, J., Minsky, M. L., Rochester, N., & Shannon, C. E. (1955). A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence. August 31, 1955.
- ^ Vapnik, V. (1995). The Nature of Statistical Learning Theory. Springer.
- ^ Esteva, A., Kuprel, B., Novoa, R. A., Ko, J., Swetter, S. M., Blau, H. M., & Thrun, S. (2017). Dermatologist-level classification of skin cancer with deep neural networks. Nature, 542(7639), 115-118.
- ^ Ng, A. Y., & Jordan, M. I. (2002). On Discriminative vs. Generative Classifiers: A comparison of logistic regression and naive Bayes. Advances in Neural Information Processing Systems, 14, 841-848.
- ^ Viola, P., & Jones, M. (2001). Rapid object detection using a boosted cascade of simple features. Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 1, 511-518.
- ^ Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.
- ^ Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.