Enfeksiyon hastalıklarını önleme ve tedavi etmek için, B-hücresi epitoplarının belirlenmesi önemlidir. B hücresi epitopu tanımlaması, epitop bazlı ası gelistirme, immünodiagnostik testler, antikor üretimi, hastalık teshisi ve tedavisindeki en önemli adımlardan biridir. Bununla birlikte, epitop haritalamada deneysel yöntemlerin kullanılması çok zaman alıcı ve maliyetli olup yogun çalısma gerektirmektedir. Antijenik epitop bölgelerinin in silico analizler ile tespit edilerek deneysel olarak dogrulanması gereken epitop sayısının azaltılması, SARS-CoV-2 gibi pandemiye neden olan bir hastalıga, hızlı tedavi gelistirmek bakımından kritik bir öneme sahiptir. Bununla birlikte, hesaplamalı yöntemler ile epitop bölgesi belirlemek için sınırlı sayıda çalısma bulundugu görülmektedir. Proje kapsamında, genetik benzerliginden dolayı SARS-CoV virüsü ve B hücresi için deneysel yollarla belirlenmis epitop verisi kullanılarak, SARS-CoV-2 için aday epitop bölgelerinin belirlenmesi amaçlanmıstır. Bu amaç dogrultusunda iki yeni yöntem gelistirilmistir. Bunlardan birincisi bulanık mantık tabanlı kollektif bir ögrenme yöntemi, ikincisi ise hibrit bir makine ögrenmesi (SMOTE-RF-SVM) yöntemidir. Gelistirilen bulanık mantık tabanlı kollektif ögrenme yöntemi ile egitilen model, SARS-CoV, B hücresi epitop verilerini %0,083 hata ile sınıflandırılmıstır. SARS-CoV için basarılı olan bu model ile SARS-CoV-2 için epitop tahmini yapılmıstır. Tahmin edilen epitoplar, BepiPred sunucusu tarafından tahmin edilen ve immünoinformatik çalısmaları tarafından belirlenen epitop dizileri ile karsılastırılarak sunulmustur. Gelistirilen hibrit makine ögrenmesi yaklasımı ise Rastgele Orman ve Destek Vektör Makinesi yöntemi tabanlı olup, gelistirilen model SARS-CoV ve B hücresi verileri ile egitilmistir. Veri setlerinde sınıf dagılımının dengesiz olması nedeniyle sentetik azınlık asırı örnekleme teknigi (synthetic minority oversampling technique -SMOTE) kullanılarak veri setleri dengeli hale getirilmistir (yani epitop ve non-epitop örnek sayıları esitlenmistir). Dengeli hale getirilen veri setlerinde, SARS-CoV veri seti için epitop tahmin performansı %94 AUC ve B hücresi veri seti için ise epitop tahmini %95,6 AUC olarak olarak elde edilmistir. Gelistirilen hibrit yöntem ile SARS-CoV ve B hücresi verisinde egitilen model kullanılarak, SARS-CoV-2 spike protein için mevcut 20312 peptidden 252 tanesi aday epitop olarak belirlenmistir. Belirlenen epitoplar AllerTOP 2.0, VaxiJen 2.0 ve ToxinPred araçları ile analiz edilerek alerjik, antijen olmayan ve toksik epitoplar elimine edilmistir. Sonuç olarak protein bazlı COVID-19 ası tasarımında kullanılabilecek alerjik olmayan, antijenitesi yüksek ve toksik olmayan 11 epitop adayı önerilmistir. Gelistirilen epitop tahmin yöntemlerinin, basta SARS-CoV-2 ve olası mutasyonları olmak üzere koronavirüs ailesinin gelecekteki salgınlarına karsı etkili asılar ve ilaçlar tasarlamaya yardımcı olacagı öngörülmektedir.