Yıl: 2017 Cilt: 32 Sayı: 2 Sayfa Aralığı: 385 - 392 Metin Dili: Türkçe İndeks Tarihi: 29-07-2022

Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma

Öz:
Sekans etiketleme bir giriş dizisine karşılık bir çıkış dizisinin üretimidir. Giriş ve çıkış dizisinin içeriklerinegöre doğal dil işlemenin birçok konusu (varlık isim tanıma, makine çevirisi, morfolojik analiz, cümleleri öğelerine ayırma vb.) sekans etiketleme olarak tanımlanabilir. Bağlılık ayrıştırması, bir cümle içerisindekisözcükler arasındaki ilişkilerin ve ilişki türlerinin belirlenmesidir ve bir cümlenin anlamsal analizininyapılabilmesi için şarttır. Bağlılık ayrıştırması sekans etiketleme problemi olarak tanımlandığında iki çıkışdizisinin (ilişki türü, ilişkili kelime) birden üretilmesi gerekmektedir. Bizim önerimiz, özellikle Sekansetiketleme problemlerinin çözümünde sıklıkla kullanılan Şartlı Rastgele Alanların bağlılık ayrıştırmasıproblemi içinde kullanılabilir olduğudur. Ancak Şartlı Rastgele Alanlar tek çıkış üreten bir yöntemdir. Buzorluğu aşabilmek için iki çıkışlı (Bağlılık Türü ve Bağlanılan Kelime) bir problem olan Bağlılık Ayrıştırması iki parçaya bölünerek çözülmüştür. Ardından elde edilen sonuçlar birleştirilerek sistemin çıktısıolarak verilmiştir. Gerçekleştirilen bu çalışma ile Türkçe için en yüksek bağlılık ayrıştırması sonuçlarınaulaşılmıştır.
Anahtar Kelime:

Dependency parsing with stacked conditional random fields for Turkish

Öz:
In the most general form Sequence Labelling is the production of an output sequence in response to an inputsequence. Many of natural language processing problems such as (entity name recognition, machinetranslation, morphological analysis, separation of the elements of sentence etc.) can be defined as a sequencelabelling. Dependency parsing is to determine the relationship and the type of the relationship between wordswithin a sentence and it is essential to perform semantic analysis of a sentence. When dependency parsing is defined as a sequence labelling problem, production of two outputs (relationship type, related words) isrequired. Our recommendation is to use the Conditional Random Fields (CRF) which is commonly used insequence labelling problems. However CRF is a method that produces a single output. To overcome thisdifficulty we propose to divide Dependency Parsing which is a problem with two outputs into two parts. Theoverall solution is provided by combining the results of these parts. With the performed operation we reached the best dependency parsing results for Turkish language.
Anahtar Kelime:

Belge Türü: Makale Makale Türü: Araştırma Makalesi Erişim Türü: Erişime Açık
  • 1. Tesnière L., Introduction A la Syntaxe Structurale, Klincksieck, Paris, 1959.
  • 2. Graham N., NLP Programming Tutorial-Dependency Parsing. http://www.phontron.com/slides/nlpprogramming-en-11-depend.pdf. Erişim Tarihi Kasım 25, 2013.
  • 3. Bilgin M., Ardışık Şartlı Rastgele Alanlarla Sekans Etiketleme, Doktora Tezi, Yıldız Teknik Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul, 2015.
  • 4. Buchholz S., Marsi, E., CoNLL-X Shared Task on Multilingual Dependency Parsing, Computational Natural Language Learning (CoNLL), New YorkAmerika Birleşik Devletleri, 149-164, 8-9 Haziran, 2006.
  • 5. Chen W., Zhang Y., Isahara H., A Two-Stage Parser for Multilingual Dependency Parsing, Computational Natural Language Learning (CoNLL), Prague-Çek Cumhuriyeti, 1129-1133,28-30 Haziran, 2007.
  • 6. Ambati B.R., Samar H., Sambhav J., Sharma D.M., Sangal R., Two Methods to Incorporate Local Morphosyntactic Features in Hindi Dependency Parsing, Statistical Parsing of Morphologically Rich Languages (SPMRL),Los Angeles-Amerika Birleşik Devletleri, 22-30, 5 Haziran, 2010.
  • 7. Cer D., Marneffe M.C., Jurafsky D., Manning C.D., Parsing to Stanford Dependencies: Trade-offs Between Speed and Accuracy, Language Resources and Evaluation (LREC), Valletta-Malta, 1628-1632, 17-23 Mayıs, 2010.
  • 8. Eryiğit G., İlbay T., Can O.A., Multiword Expressions in Statistical Dependency Parsing, Statistical Parsing of Morphologically Rich Languages (SPMRL), Dublin- İrlanda, 45-55, 6 Ekim, 2011.
  • 9. Lafferty J., McCallum A., Pereira F., Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data, International Conference on Machine Learning (ICML), Massachusetts-Amerika Birleşik Devletleri, 282-289, 28 Haziran - 1 Temmuz, 2001.
  • 10. Kazkılınç S., Türkçe Metinlerin Etiketlenmesi, Yüksek Lisans Tezi, İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, İstanbul, 2012.
  • 11. Eryiğit G., Adalı E., Oflazer K., Türkçe cümlelerin kural tabanlı bağlılık analizi, 15th Turkish Symposium on Artificial Intelligence and Neural Networks, MuğlaTürkiye, 17-24, 21-24 Haziran, 2006.
  • 12. Vapnik V., The Nature of Statistical Learning Theory, Second Edition, Springer, New York, 1995.
  • 13. Weizhen L., Wenjian W., Huiyuan F., Air Pollutant Parameter Forecasting Using Support Vector Machines, International Joint Conference on Neural Networks (IJCNN), Honolulu-Hawaii, 630-635, 12-17 Mayıs, 2002.
  • 14. Shen J., Pei Z.J., Lee E.S., Support Vector Regression in the Analysis of Soft-Pad Grinding of Wire-Sawn Silicon Wafers, Cybernetics and Information Technologies Systems and Applications (CITSA), Orlando-Amerika Birleşik Devletleri, 19-24, 21-25 Temmuz, 2004.
  • 15. Burbidge R., Buxton B. An Introduction to Support Vector Machines for Data Mining Technical Report. http://www.cs.ucl.ac.uk /staff/r.burbidge/pubs/ yor12- svm-intro.html. Erişim Tarihi Eylül 18, 2014.
  • 16. Kim H., Pang S., Je H., Kim D., Bang S.Y., Constructing Support Vector Machine Ensemble, Pattern Recognition, 36, 2757-2767, 2003.
  • 17. Goh K.S., Chang E., Cheng K.T., SVM Binary Classifier Ensembles for Image Classification, Information and Knowledge Management (CIKM), Atlanta-Amerika Birleşik Devletleri, 395-402, 5-10 Kasım, 2001.
  • 18. Daş B., Türkoğlu İ., Classification of DNA sequences using numerical mapping techniques and fourier transformation, Journal of the Faculty of Engineering and Architecture of Gazi University, 31 (4), 921-932, 2016.
  • 19. Yücesoy E., Nabiyev V.V., Determination of a speaker's age and gender with an SVM classifier based on GMM supervectors, Journal of the Faculty of Engineering and Architecture of Gazi University, 31 (3), 501-509, 2016.
  • 20. Takcı H., Diagnosis of breast cancer by the help of centroid based classifiers, Journal of the Faculty of Engineering and Architecture of Gazi University, 31 (2), 323-330, 2016.
  • 21. Eryiğit G., Adalı E., Oflazer K., Türkçe'nin Olasılık Tabanlı Bağlılık Ayrıştırması, İstanbul Teknik Üniversitesitesi Mühendislik Dergisi, 7 (4), 106-117, 2008.
APA Bilgin M, Amasyali F (2017). Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma. , 385 - 392.
Chicago Bilgin Metin,Amasyali Fatih Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma. (2017): 385 - 392.
MLA Bilgin Metin,Amasyali Fatih Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma. , 2017, ss.385 - 392.
AMA Bilgin M,Amasyali F Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma. . 2017; 385 - 392.
Vancouver Bilgin M,Amasyali F Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma. . 2017; 385 - 392.
IEEE Bilgin M,Amasyali F "Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma." , ss.385 - 392, 2017.
ISNAD Bilgin, Metin - Amasyali, Fatih. "Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma". (2017), 385-392.
APA Bilgin M, Amasyali F (2017). Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 32(2), 385 - 392.
Chicago Bilgin Metin,Amasyali Fatih Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 32, no.2 (2017): 385 - 392.
MLA Bilgin Metin,Amasyali Fatih Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, vol.32, no.2, 2017, ss.385 - 392.
AMA Bilgin M,Amasyali F Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi. 2017; 32(2): 385 - 392.
Vancouver Bilgin M,Amasyali F Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi. 2017; 32(2): 385 - 392.
IEEE Bilgin M,Amasyali F "Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma." Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi, 32, ss.385 - 392, 2017.
ISNAD Bilgin, Metin - Amasyali, Fatih. "Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma". Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi 32/2 (2017), 385-392.