پیش‌بینی پپتید‌های ضد‌میکروبی به کمک شبکه‌های یادگیری عمیق پیشرفته

نوع: Type: پایان نامه

مقطع: Segment: کارشناسی ارشد

عنوان: Title: پیش‌بینی پپتید‌های ضد‌میکروبی به کمک شبکه‌های یادگیری عمیق پیشرفته

ارائه دهنده: Provider: عرفان صفری برزیده - مهندسی کامپیوتر

اساتید راهنما: Supervisors: دکتر حسن ختن‌لو

اساتید مشاور: Advisory Professors:

اساتید ممتحن یا داور: Examining professors or referees: دکتر محرم منصوری زاده، دکتر مه‌لقا افراسیابی

زمان و تاریخ ارائه: Time and date of presentation: ساعت 15 - 1404/11/25

مکان ارائه: Place of presentation: آمفی تئاتر

چکیده: Abstract: چكيده: پپتیدها زنجیره‌های کوتاهی از اسیدهای آمینه هستند که به‌دلیل تنوع در طول توالی، ترکیب اسیدآمینه‌ای، بار خالص، آب‌گریزی، آمفی‌پاتیک بودن و ویژگی‌های ساختاری، می‌توانند عملکردهای زیستی بسیار متفاوتی از خود نشان دهند. پپتیدهای ضد‌میکروبی به‌عنوان یکی از مهم‌ترین گروه‌های پپتیدهای درمانی، غالباً دارای طول کوتاه، بار مثبت و الگوی خاصی از توزیع نواحی آب‌دوست/آب‌گریز هستند که امکان برهم‌کنش مؤثر با غشای میکروارگانیسم‌ها را فراهم می‌کند؛ با این حال، همین تنوع بالا و شباهت‌های توالی میان پپتیدهای با عملکردهای متفاوت، شناسایی دقیق آن‌ها را به مسئله‌ای چالش‌برانگیز تبدیل کرده است. با وجود پیشرفت‌های قابل توجه در کاربرد یادگیری عمیق برای پیش‌بینی پپتیدهای ضد‌میکروبی، این حوزه همچنان با چالش‌های اساسی متعددی روبه‌رو است. از مهم‌ترین این چالش‌ها می‌توان به محدود بودن و ناهمگن بودن مجموعه‌داده‌های پپتیدی، عدم تعادل شدید میان کلاس‌های فعال و غیرفعال، و تنوع بالای ساختاری و عملکردی پپتیدها اشاره کرد که فرآیند یادگیری مدل‌ها را با دشواری مواجه می‌سازد. علاوه بر این، کوتاهی توالی‌های پپتیدی و شباهت توالی میان پپتیدهای دارای عملکردهای زیستی متفاوت، باعث کاهش قدرت تمایز مدل‌ها می‌شود. مسئله بیش‌برازش در مدل‌های عمیق، تفسیرپذیری محدود خروجی‌ها، و ناتوانی برخی معماری‌ها در استخراج هم‌زمان وابستگی‌های موضعی، سراسری و روابط ساختاری نیز از دیگر موانع مهم به شمار می‌آیند. این چالش‌ها ضرورت طراحی چارچوب‌های یادگیری عمیق پیشرفته، چندوجهی و مبتنی بر توجه و یادگیری انتقالی را برجسته می‌سازند تا بتوان با دقت و پایداری بالاتر، پپتیدهای ضد‌میکروبی مؤثر را شناسایی و پیش‌بینی کرد. در این پژوهش، به‌منظور غلبه بر چالش‌های مذکور، یک معماری یادگیری عمیق چندوجهی و همجوشی‌محور ارائه شده است که ماهیت دوگانه پپتیدها را به‌عنوان توالی‌های زبانی و موجودیت‌های زیستی ساختارمند به‌صورت هم‌زمان مدل‌سازی می‌کند. این چارچوب شامل سه شاخه پردازشی موازی است که به‌ترتیب از یک مدل زبانی مبتنی بر ترنسفورمر (PeptideBERT) برای استخراج بازنمایی‌های معنایی توالی، یک رمزگذار گرافی مبتنی بر ترنسفورمر برای مدل‌سازی روابط ترتیبی و توپولوژیک اسیدهای آمینه بدون نیاز به ساختار سه‌بعدی صریح، و یک شاخه ویژگی‌های بیوشیمیایی و تکاملی مبتنی بر وان‌هات، BLOSUM62 و Z-scale استفاده می‌کند. بازنمایی‌های حاصل از این شاخه‌ها از طریق راهبردهای ادغام تطبیقی شامل الحاق، ادغام دروازه‌ای و توجه متقابل ترکیب شده و بردار همجوشی نهایی برای پیش‌بینی کلاس پپتید به طبقه‌بند عصبی ارسال می‌شود. نتایج نشان می‌دهد که ادغام هم‌زمان اطلاعات توالی، گرافی و ویژگی‌های صریح زیستی منجر به بازنمایی غنی‌تر و بهبود معنادار دقت و پایداری پیش‌بینی خواص پپتیدهای درمانی نسبت به رویکردهای تک‌منبعی می‌گردد.