TF IDF Nedir?
TF IDF yani Term Frequency – Inverse Document Frequency kavramı terim frekansı, ters belge frekansı manasını taşımaktadır. Metinleri anlam yükü sayılar olarak göstermenin farklı bir yoludur. Ayrıca vektör gösterimi olarak da bilinmektedir.
TF Hans Peter Luhn tarafından 1957 yılında ters belge frekansı ise Karen Sparck tarafından 1975 yılında yapılan çalışmalar sonucunda ortaya çıkan metriklerdir. 1970’li yılların başında bilgi erişim sorunlarını çözümlemek için kullanılan TF IDF, o günlerden bugüne, belge sınıflandırma, konu modelleme, durdurma, kelime filtreleme gibi birçok durumda kullanılan birçok NLP algoritmasında rol almıştır. Metinlerin vektörleştirilmesine ve sayılara dönüştürülmesine olanak sağlayan TF IDF sayesinde arama motoru algoritmaları makaleleri ilgi ve alakalı düzeyline göre sıralayabilmektedir.
TF IDF’nin ortaya çıkması ve incelenmiş bütün belgeler hakkında birçok bilgi verir. Bu yüzden bu algoritma arama motorları tarafından içerik kalite değerlendirme yöntemi olarak tercih edilmektedir. Herhangi bir belgenin puan almış cümle ve sözcükleri belgeyle alakalı olanlar olduğu için TF IDF, metinlerdeki anahtar kelimelerin bulunmasına yardımcı olur. TF IDF otomatik bir şekilde metin analizi yapar. Makine öğrenim algoritmalarındaki kelimelerin puanlanması için oldukça kullanılabilirdir.
Sizlere bu yazımızda TF IDF hakkında bilgiler verdik. Daha fazla bilgi için www.medyaweb.net/blog adresini ziyaret edebilirsiniz. Ayrıca Medya Web Tasarım hizmetlerinden yararlanmak için bizimle iletişime geçebilirsiniz.
23 Temmuz 2021 Tarihinde İçerik Ekibi Tarafından Eklenmiştir.