SUBMISSIONS

SUBMISSION DETAIL

Ceren AKMAN, Volkan ALTUNTAÞ
 


Keywords:



SEKANS ANALÝZÝ ÜZERÝNDEN PROTEÝN FONKSÝYONU TAHMÝNÝNDE KULLANILAN YÖNTEMLERÝN VE SETLERÝN PERFORMANSLARININ DEÐERLENDÝRÝLMESÝ
 
Proteinler, amino asitlerin belirli türde, sayýda ve diziliþ sýrasýnda karakteristik düz zincirde birbirlerine kovalent baðlanmasýyla oluþmuþ polipeptitlerdir. Canlýlarýn neredeyse bütün yaþamsal faaliyetleri proteinler ile saðlanmaktadýr. Bu nedenle canlý organizmasýnda bulunan en önemli makro molekül olarak sýnýflandýrýlmaktadýr. Bir canlý organizmasý için son derece önemli olan proteinin yapý ve fonksiyonlarýnýn tahmin edilebilmesi son derece karmaþýk ve önemli bir iþlemdir. Bilim dünyasý son zamanlarda özellikle makine öðrenmesinin de popülaritesinin artmasý ve saðladýðý kolaylýklar sayesinde zor ve önemli bir iþlem olan protein dizisi fonksiyon tahmin iþlemi üzerinde durmaktadýr. Bu tahmin iþleminin gerçekleþtirilmesi önemli hastalýk mekanizmalarýnýn anlaþýlmasýnda, ilaç keþfi ya da hedefinin bulunmasýnda gibi birçok önemli problemin çözümüne yardýmcý olduðu bilinmektedir. Bunun haricinde biyolojik verilerin analizinde kullanýlan multidisipliner çalýþma alaný olan biyoinformatik yaklaþýmda bu tahminin elde edilmesinde kullanýlabilmektedir. Bu yaklaþýmlar doðrultusunda kullanýlan yöntemlerin, algoritmalarýn ve istatistiki iþlemlerin performansý elde edilen sonuçlarýn verimliliðini doðrudan etkilediði gibi geliþtirilen modellerin eðitimi için kullanýlan veri setlerinin kalitesi de elde edilen sonucu deðiþtirebilmektedir. Bu bilgiler ýþýðýnda fonksiyon tahmin iþleminin gerçekleþtirilebilmesi için son zamanlarda adýndan sýkça söz ettiren evriþimli, tekrarlayan, yapay sinir aðlarý ve denetimli ya da denetimsiz modeller gibi yaklaþýmlar kullanýlmaktadýr. Kullanýlan bu yaklaþýmlarla yapýlan tahmin iþlemlerinin performanslarý da verilerin doðru, tutarlý ve hýzlý bir þekilde elde edilmesi açýsýndan büyük öneme sahiptir. Kullanýlan derin öðrenme modellerinin doðru ve güvenli veri elde etme aþamasýnda iyi olduðu ancak yapýlan iþlemlerin uzun, karmaþýk ve zor olduðu bilinmektedir. Bu nedenle bu çalýþma kapsamýnda bahsedilen güncel yaklaþýmlarýn kullanýlma þekilleri ve melez birleþimlerinin derin öðrenme modelleriyle ayný zamanda tercih edilen veri setlerinin birbirleriyle karþýlaþtýrýlmasý yapýlmaktadýr.

Anahtar Kelimeler: Protein dizisi analizi, protein dizi fonksiyon tahmini, Biyoinformatik, Makine öðrenmesi, Derin öðrenme