BİLDİRİLER

BİLDİRİ DETAY

Ceren AKMAN, Volkan ALTUNTAŞ
SEKANS ANALİZİ ÜZERİNDEN PROTEİN FONKSİYONU TAHMİNİNDE KULLANILAN YÖNTEMLERİN VE SETLERİN PERFORMANSLARININ DEĞERLENDİRİLMESİ
 
Proteinler, amino asitlerin belirli türde, sayıda ve diziliş sırasında karakteristik düz zincirde birbirlerine kovalent bağlanmasıyla oluşmuş polipeptitlerdir. Canlıların neredeyse bütün yaşamsal faaliyetleri proteinler ile sağlanmaktadır. Bu nedenle canlı organizmasında bulunan en önemli makro molekül olarak sınıflandırılmaktadır. Bir canlı organizması için son derece önemli olan proteinin yapı ve fonksiyonlarının tahmin edilebilmesi son derece karmaşık ve önemli bir işlemdir. Bilim dünyası son zamanlarda özellikle makine öğrenmesinin de popülaritesinin artması ve sağladığı kolaylıklar sayesinde zor ve önemli bir işlem olan protein dizisi fonksiyon tahmin işlemi üzerinde durmaktadır. Bu tahmin işleminin gerçekleştirilmesi önemli hastalık mekanizmalarının anlaşılmasında, ilaç keşfi ya da hedefinin bulunmasında gibi birçok önemli problemin çözümüne yardımcı olduğu bilinmektedir. Bunun haricinde biyolojik verilerin analizinde kullanılan multidisipliner çalışma alanı olan biyoinformatik yaklaşımda bu tahminin elde edilmesinde kullanılabilmektedir. Bu yaklaşımlar doğrultusunda kullanılan yöntemlerin, algoritmaların ve istatistiki işlemlerin performansı elde edilen sonuçların verimliliğini doğrudan etkilediği gibi geliştirilen modellerin eğitimi için kullanılan veri setlerinin kalitesi de elde edilen sonucu değiştirebilmektedir. Bu bilgiler ışığında fonksiyon tahmin işleminin gerçekleştirilebilmesi için son zamanlarda adından sıkça söz ettiren evrişimli, tekrarlayan, yapay sinir ağları ve denetimli ya da denetimsiz modeller gibi yaklaşımlar kullanılmaktadır. Kullanılan bu yaklaşımlarla yapılan tahmin işlemlerinin performansları da verilerin doğru, tutarlı ve hızlı bir şekilde elde edilmesi açısından büyük öneme sahiptir. Kullanılan derin öğrenme modellerinin doğru ve güvenli veri elde etme aşamasında iyi olduğu ancak yapılan işlemlerin uzun, karmaşık ve zor olduğu bilinmektedir. Bu nedenle bu çalışma kapsamında bahsedilen güncel yaklaşımların kullanılma şekilleri ve melez birleşimlerinin derin öğrenme modelleriyle aynı zamanda tercih edilen veri setlerinin birbirleriyle karşılaştırılması yapılmaktadır.

Anahtar Kelimeler: Protein dizisi analizi, protein dizi fonksiyon tahmini, Biyoinformatik, Makine öğrenmesi, Derin öğrenme



 


Keywords: