Kaya, YılmazErtuğrul, Ömer2017-05-082017-05-082016https://hdl.handle.net/20.500.12604/551Doğal dil işlemenin önemli alt konularından biri olan dil tanıma (DT), bir dokümanın içeriğine göre yazıldığı dili belirleme işlemidir. Bu çalışmada, karakterlerin UTF-8 değerlerini birbirleri ile karşılaştırmalar sonucu elde edilen ikili desenler kullanarak yeni bir dil tanıma yaklaşımı, bir boyutlu yerel ikili örüntüler (1B-YİÖ) önerilmiştir. Önerilen yöntem farklı sayıda dillerden oluşan metinler içeren dört veri kümesi ile test edilmiştir. 1B-YİÖ ile dokümanlardan elde edilen öznitelikler kullanılarak farklı makine öğrenmesi yöntemleri ile sınıflandırma işlemi gerçekleştirilmiştir. Dört veri kümesi için sınıflandırma başarıları sırası ile %86.20, %92.75, %100 ve %89.77 olarak gözlenmiştir. Elde edilen sonuçlara göre önerilen öznitelik çıkarım yönteminin dil tanıma için önemli örüntüler sağladığı görülmüştür.eninfo:eu-repo/semantics/openAccessmetin tabanlı dil tanıma, yerel ikili örüntüler, doğal dil işlemeDoküman dili tanıma için yeni bir öznitelik çıkarım yaklaşımı: İkili Desenler,Journal of the Faculty of Engineering and Architecture ofGazi University, 31(4): 1085-1094, 2016Article