Yıl: 2006 Cilt: 12 Sayı: 2 Sayfa Aralığı: 279 - 284 Metin Dili: Türkçe İndeks Tarihi: 29-07-2022

Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması

Öz:
Bu çalışmada konuşma işaretinin incelenmesi ve son günlerde en popüler tanıma yöntemi olan Yapay Sinir Ağlarını (YSA) kullanarak Türkçe sesli harflerden kimlik tanıma uygulaması yapılmıştır. Tanıma işlemi genellikle, işaretin işlenmesi, belirgin özelliklerinin çıkarılması ve bunların karşılaştırılması safhalarından oluşmaktadır. Alman ses örnekleri ses kartının özelliğine göre örnekleme yapılarak sayısal veri şekline dönüştürülmüştür. Ses analizi aşamasında, tüm ses verilerindeki tekrar eden periyotlar ve gürültüler hamming pencereleme metodu kullanılarak kırpılmış ve sesin özniteliğini temsil eden kısmı elde edilmiştir. Analiz edilen ses verilerinin özniteliğinin bulunması için LPC (doğrusal öngörü analizi) ve DFT (ayrık fourier dönüşümü) metodları kullanılmıştır. Kimlik tanıma işlemi için kullanılan 28 parametrenin 12 si LPC, 16 sı da DFT metodu ile elde edilmiştir. Yapay Sinir Ağlarında eğitme ve test için konuşmacının sesini temsil eden bu 28 parametre kullanılmaktadır. YSA yapısı için çok katmanlı algılayıcı modeli, eğitim için de genelleştirilmiş delta kurallı hatanın geriye yayılması algoritması kullanılmıştır. 7 farklı kişiden alınan 'a' sesli harfinin öznitelikleri bulunmuş ve bunlar sesli harfin alındığı kişiyi bulacak şekilde oluşturulan YSA mimarisi eğitilmiştir. Daha sonra eğitim setinde olmayan verilerle YSA nın başarısı test edilmiş, kabul edilebilir bir hata ile iyi sonuçlar elde edilmiştir.
Anahtar Kelime:

Konular: Mühendislik, Elektrik ve Elektronik Bilgisayar Bilimleri, Donanım ve Mimari

An application of speaker recognition using artificial neural networks

Öz:
In this study an artificial neural network (ANN) is implemented, which has been used frequently as an implementation model in recent years, to recognize speaker identification. Generally, recognition is consist of three stages that, processing of signal, obtaining attributes and comparing them. Speech samples are transformed into digital data according to voice card of PC. In the analysis of voice stage, recurrent periods and white noise of voice data are trimmed by hamming window method and voice attribute part of the digital data is obtained. For obtaining attribute of voice data LPC (linear predictive coding) and DFT (discrete fourier transform) methods are used. Of those 28 coefficents, that is used for speaker recognition, 16 were obtained by the analysis of DFT and 12 were obtained by the analysis of LPC. The parameters that represent speaker voice, is used for training and test of ANN. Multilayer perceptron model is used as an architecture of ANN and backpropagation algorithm is used for training method. Voices of "a" is taken from 7 different person and their attributes are found. ANN is trained with these features to find the speaker who is the owner of the sample voice. And then using the test data that is not used for training part, recognition achievement of ANN is tested. As a result, good results were obtained with low failure rate.
Anahtar Kelime:

Konular: Mühendislik, Elektrik ve Elektronik Bilgisayar Bilimleri, Donanım ve Mimari
Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • Akgül, M. 2001. Adli Uygulamalarda Konuşmacı Tanıma, Y.Lisans Tezi, Ankara Ünv., F.B.E.
  • Altınçay, H. 2000. Konuşmacı Tanıma Sistemlerinin Başarımının Sınıflandırıcı Birleştirme Yöntemleri ile İyileştirilmesi, Doktora Tezi, ODTÜ, F.B.E.
  • Cansız, M. 1997. Yapay Sinir Ağları ile Kişilerin Ses Örneklerinden Kimliklerinin Tanınması, Y.Lisans Tezi, AKÜ, F.B.E.
  • Farrell, K. R. and etc. 1994. Speaker Recognition Using Neural Networks and Conventional Classifiers, Speech and Audio Processing, IEEE Transactions on, Jan 1994, Volume: 2, Issue : 1, pp.194-205.
  • İkizler, N. 2002. Türkçe'de Konuşmacıdan Bağımsız Hece Tanıma Sistemi, KTÜ, F. B. E., Doktora Tezi.
  • Pandya, A. S. and Macy, R. B. 1995. Pattern Recognition with Neural Networks in C++, IEEE Pres.
  • Rabiner, L. and Juang, B. H. 1993. Fundamentals of Speech Recognition. Prentice-Hall.
  • Seven, A. 1997. Yapay Sinir Ağları Kullanılarak Sözcük ve Konuşmacı Tanıma, Boğaziçi Ünv., F. B. E., Y.Lisans Tezi.
  • Üstün, S. V. 1997. Yapay Sinir Ağları Kullanılarak Türkçe'deki Sesli Harflerin Tanınması, YTÜ, F. B. E., Y. Lisans Tezi.
  • Yıldırım, S. 1995. Ses Analizi ve Ses sıkıştırma ve Kodlama Algoritmaları, İ.T.Ü., F. B. E., Y. Lisans Tezi.
APA CANER M, ÜSTÜN S (2006). Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması. , 279 - 284.
Chicago CANER MURAT,ÜSTÜN Seydi Vakkas Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması. (2006): 279 - 284.
MLA CANER MURAT,ÜSTÜN Seydi Vakkas Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması. , 2006, ss.279 - 284.
AMA CANER M,ÜSTÜN S Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması. . 2006; 279 - 284.
Vancouver CANER M,ÜSTÜN S Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması. . 2006; 279 - 284.
IEEE CANER M,ÜSTÜN S "Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması." , ss.279 - 284, 2006.
ISNAD CANER, MURAT - ÜSTÜN, Seydi Vakkas. "Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması". (2006), 279-284.
APA CANER M, ÜSTÜN S (2006). Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması. Mühendislik Bilimleri Dergisi, 12(2), 279 - 284.
Chicago CANER MURAT,ÜSTÜN Seydi Vakkas Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması. Mühendislik Bilimleri Dergisi 12, no.2 (2006): 279 - 284.
MLA CANER MURAT,ÜSTÜN Seydi Vakkas Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması. Mühendislik Bilimleri Dergisi, vol.12, no.2, 2006, ss.279 - 284.
AMA CANER M,ÜSTÜN S Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması. Mühendislik Bilimleri Dergisi. 2006; 12(2): 279 - 284.
Vancouver CANER M,ÜSTÜN S Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması. Mühendislik Bilimleri Dergisi. 2006; 12(2): 279 - 284.
IEEE CANER M,ÜSTÜN S "Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması." Mühendislik Bilimleri Dergisi, 12, ss.279 - 284, 2006.
ISNAD CANER, MURAT - ÜSTÜN, Seydi Vakkas. "Yapay sinir ağları ile konuşmacı kimliğini tanıma uygulaması". Mühendislik Bilimleri Dergisi 12/2 (2006), 279-284.