پیشبینی پپتیدهای ضدمیکروبی به کمک شبکههای یادگیری عمیق پیشرفته - دانشکده فنی و مهندسی
پیشبینی پپتیدهای ضدمیکروبی به کمک شبکههای یادگیری عمیق پیشرفته
نوع: Type: پایان نامه
مقطع: Segment: کارشناسی ارشد
عنوان: Title: پیشبینی پپتیدهای ضدمیکروبی به کمک شبکههای یادگیری عمیق پیشرفته
ارائه دهنده: Provider: عرفان صفری برزیده - مهندسی کامپیوتر
اساتید راهنما: Supervisors: دکتر حسن ختنلو
اساتید مشاور: Advisory Professors:
اساتید ممتحن یا داور: Examining professors or referees: دکتر محرم منصوری زاده، دکتر مهلقا افراسیابی
زمان و تاریخ ارائه: Time and date of presentation: ساعت 15 - 1404/11/25
مکان ارائه: Place of presentation: آمفی تئاتر
چکیده: Abstract: چكيده: پپتیدها زنجیرههای کوتاهی از اسیدهای آمینه هستند که بهدلیل تنوع در طول توالی، ترکیب اسیدآمینهای، بار خالص، آبگریزی، آمفیپاتیک بودن و ویژگیهای ساختاری، میتوانند عملکردهای زیستی بسیار متفاوتی از خود نشان دهند. پپتیدهای ضدمیکروبی بهعنوان یکی از مهمترین گروههای پپتیدهای درمانی، غالباً دارای طول کوتاه، بار مثبت و الگوی خاصی از توزیع نواحی آبدوست/آبگریز هستند که امکان برهمکنش مؤثر با غشای میکروارگانیسمها را فراهم میکند؛ با این حال، همین تنوع بالا و شباهتهای توالی میان پپتیدهای با عملکردهای متفاوت، شناسایی دقیق آنها را به مسئلهای چالشبرانگیز تبدیل کرده است. با وجود پیشرفتهای قابل توجه در کاربرد یادگیری عمیق برای پیشبینی پپتیدهای ضدمیکروبی، این حوزه همچنان با چالشهای اساسی متعددی روبهرو است. از مهمترین این چالشها میتوان به محدود بودن و ناهمگن بودن مجموعهدادههای پپتیدی، عدم تعادل شدید میان کلاسهای فعال و غیرفعال، و تنوع بالای ساختاری و عملکردی پپتیدها اشاره کرد که فرآیند یادگیری مدلها را با دشواری مواجه میسازد. علاوه بر این، کوتاهی توالیهای پپتیدی و شباهت توالی میان پپتیدهای دارای عملکردهای زیستی متفاوت، باعث کاهش قدرت تمایز مدلها میشود. مسئله بیشبرازش در مدلهای عمیق، تفسیرپذیری محدود خروجیها، و ناتوانی برخی معماریها در استخراج همزمان وابستگیهای موضعی، سراسری و روابط ساختاری نیز از دیگر موانع مهم به شمار میآیند. این چالشها ضرورت طراحی چارچوبهای یادگیری عمیق پیشرفته، چندوجهی و مبتنی بر توجه و یادگیری انتقالی را برجسته میسازند تا بتوان با دقت و پایداری بالاتر، پپتیدهای ضدمیکروبی مؤثر را شناسایی و پیشبینی کرد. در این پژوهش، بهمنظور غلبه بر چالشهای مذکور، یک معماری یادگیری عمیق چندوجهی و همجوشیمحور ارائه شده است که ماهیت دوگانه پپتیدها را بهعنوان توالیهای زبانی و موجودیتهای زیستی ساختارمند بهصورت همزمان مدلسازی میکند. این چارچوب شامل سه شاخه پردازشی موازی است که بهترتیب از یک مدل زبانی مبتنی بر ترنسفورمر (PeptideBERT) برای استخراج بازنماییهای معنایی توالی، یک رمزگذار گرافی مبتنی بر ترنسفورمر برای مدلسازی روابط ترتیبی و توپولوژیک اسیدهای آمینه بدون نیاز به ساختار سهبعدی صریح، و یک شاخه ویژگیهای بیوشیمیایی و تکاملی مبتنی بر وانهات، BLOSUM62 و Z-scale استفاده میکند. بازنماییهای حاصل از این شاخهها از طریق راهبردهای ادغام تطبیقی شامل الحاق، ادغام دروازهای و توجه متقابل ترکیب شده و بردار همجوشی نهایی برای پیشبینی کلاس پپتید به طبقهبند عصبی ارسال میشود. نتایج نشان میدهد که ادغام همزمان اطلاعات توالی، گرافی و ویژگیهای صریح زیستی منجر به بازنمایی غنیتر و بهبود معنادار دقت و پایداری پیشبینی خواص پپتیدهای درمانی نسبت به رویکردهای تکمنبعی میگردد.