Doküman dili tanıma için yeni bir öznitelik çıkarım yaklaşımı: İkili desenler

dc.contributor.authorKaya, Yılmaz
dc.contributor.authorErtuğrul, Ömer Faruk
dc.date.accessioned2024-12-24T19:18:46Z
dc.date.available2024-12-24T19:18:46Z
dc.date.issued2016
dc.departmentSiirt Üniversitesi
dc.description.abstractDoğal dil işlemenin önemli alt konularından biri olan dil tanıma (DT) bir dokümanın içeriğine göre yazıldığı dili belirleme işlemidir. Bu çalışmada, karakterlerin UTF-8 değerlerini birbirleri ile karşılaştırması sonucu elde edilen ikili desenler kullanarak yeni bir dil tanıma yaklaşımı önerilmiştir. Önerilen bu yöntemin başarısını test etmek amacıyla farklı sayıda dillerden oluşan metinler içeren dört veri kümesi kullanılmıştır. Önerilen yöntemde bir (1) boyutlu yerel ikili örüntüler (1B-YİD) ile dokümanlardan elde edilen öznitelikler farklı makine öğrenme yöntemleri ile sınıflandırılarak metinlerde DT işlemi gerçekleştirilmiştir. Dört farklı veri kümesi için elde edilen DT başarı oranları sırası ile %86,20, %92,75, %100 ve %89,77 olarak gözlenmiştir. Elde edilen sonuçlara göre önerilen öznitelik çıkarım yönteminin dil tanıma için önemli örüntüler sağladığı görülmüştür.
dc.identifier.endpage1094
dc.identifier.issn1300-1884
dc.identifier.issn1304-4915
dc.identifier.issue4
dc.identifier.startpage1085
dc.identifier.trdizinid218041
dc.identifier.urihttps://search.trdizin.gov.tr/tr/yayin/detay/218041
dc.identifier.urihttps://hdl.handle.net/20.500.12604/5309
dc.identifier.volume31
dc.indekslendigikaynakTR-Dizin
dc.language.isotr
dc.relation.ispartofGazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanı
dc.rightsinfo:eu-repo/semantics/openAccess
dc.snmzKA_20241222
dc.subjectBilgisayar Bilimleri
dc.subjectYazılım Mühendisliği,Dil ve Dil Bilim
dc.titleDoküman dili tanıma için yeni bir öznitelik çıkarım yaklaşımı: İkili desenler
dc.typeArticle

Dosyalar