پیش بینی اثربخشی درمان مبتالیان به سرطان کولورکتال با استفاده از الگوریتم های هوش محاسباتی در داده های بیان ژن

پیش بینی اثربخشی درمان مبتالیان به سرطان کولورکتال با استفاده از الگوریتم های هوش محاسباتی در داده های بیان ژن


پیش بینی اثربخشی درمان مبتالیان به سرطان کولورکتال با استفاده از الگوریتم های هوش محاسباتی در داده های بیان ژن

نوع: Type: پایان نامه

مقطع: Segment: کارشناسی ارشد

عنوان: Title: پیش بینی اثربخشی درمان مبتالیان به سرطان کولورکتال با استفاده از الگوریتم های هوش محاسباتی در داده های بیان ژن

ارائه دهنده: Provider: نیما محسنی

اساتید راهنما: Supervisors: دکتر سید منوچهر حسینی، دکتر مجید غنیئی

اساتید مشاور: Advisory Professors: دکتر سعید افشار

اساتید ممتحن یا داور: Examining professors or referees: دکتر حسن ختن لو، دکتر علی مهدوی نژاد

زمان و تاریخ ارائه: Time and date of presentation: چهارشنبه 17 آذرماه 1400، ساعت 16:00

مکان ارائه: Place of presentation: http://vc.basu.ac.ir/eng-thesis01

چکیده: Abstract: چکیده: زمینه: با بیش از یک میلیون و چهارصد هزار مورد ابتلای جدید سالانه و بیش از هفتصد هزار مورد منجر به فوت، سرطان روده بزرگ (کولورکتال- CRC) در رده سوم سرطان¬های شایع قرار می¬گیرد. سرطان کولورکتال شامل سرطان کولون و راست¬روده، به علت رشد غیر طبیعی سلول¬های سرطانی با قدرت تهاجم و تکثیر در سایر بافت¬های بدن در موضع کولون یا راست¬روده پدیدار می¬شود. با توجه به مرحله، درجه و محل این سرطان استراتژی¬های درمانی مختلفی به کار بسته می¬شود. حدود 10 تا 20 درصد موارد ابتلا به سرطان کولورکتال را بیماران مبتلا به سرطان راست روده پیشرفته موضعی (LARC) تشکیل می¬دهند. روش درمان استاندارد در این سرطان شیمی-پرتو¬درمانی قبل از عمل جراحی (PCRT) است. این استراتژی درمانی برخی اثرات جانبی در دراز¬مدت به همراه دارد؛ ضمن آن که قسمت قابل توجهی از بیماران نیز (حدود 60 درصد) به این درمان پاسخ نمی¬دهند. لذا، بررسی بیومارکرهایی که در پیش¬بینی پاسخ بیماران این سرطان به این درمان به کار آیند، اهمیت به¬سزایی دارد. طی سالیان اخیر توانایی بیومارکرهای مختلف ژنتیکی در شناسایی و پیش¬آگهی در انواع مختلفی از سرطان از جمله سرطان کولورکتال بررسی و اثبات شده است. معمولا مدل¬های ساخته شده با استفاده از این بیومارکر¬ها مدل¬های بسیار ساده¬ای هستند. یکی از چالش¬های موجود در این زمینه محدودیت عملکرد این مدل¬ها در پیش¬بینی پاسخ به درمان بیماران مبتلا به این سرطان است؛ معمولا سطح زیر نمودار ROC زیر 0.8 برای آن¬ها گزارش می¬شود. علاوه بر آن، در اکثر قریب به اتفاق پژوهش¬ها برای انتخاب بیومارکر¬های بیان ژن مناسب، به صرف استفاده از معیار بیان متمایز ژنی اکتفا می¬شود. هدف و روش¬ها: با پیشرفت روزافزون توان محاسباتی سخت¬افزار¬های موجود، تمرکز پژوهشگران از علوم مختلفی نظیر آمار، مهندسی کنترل، مهندسی مخابرات، مهندسی نرم افزار، علوم کامپیوتر، بیوانفورماتیک و غیره به سوی علوم داده سوق داده شده¬است. لذا، به استفاده از روش¬های هوش محاسباتی و باصطلاح یادگیری ماشینی در بسیاری از علوم از جمله علوم پزشکی اقبال گسترده¬ای شده است. از این روش¬ها عموما برای طبقه¬بندی، خوشه¬بندی، تحلیل سری¬های زمانی، رگرسیون و کاربرد-های دیگر در علوم پزشکی استفاده می¬شود. در این مطالعه با استفاده از داده‌های بیان ژن بیماران مبتلا به سرطان راست¬روده پیشرفته موضعی، سعی در شناسایی ژن¬هایی شده است سطح بیان آن¬ها نشان¬گر خوبی از وضعیت پاسخ به درمان بیماران باشد؛ تا با استفاده از یک مجموعه ژن مناسب درکنار یک مدل یادگیری کارآمد بتوان پاسخ بیماران این سرطان به درمان استاندارد را پیش¬بینی کرد. در داده¬های بیان ژن استفاده از روش¬های انتخاب ژن، که خود به طور کلی زیر مجموعه¬ای از روش¬های انتخاب ویژگی هستند، به دلایل مختلف ضرورت می¬یابد؛ این داده¬ها معمولا شامل تعداد زیادی ژن و تعداد به نسبت بسیار کمی نمونه هستند و انتخاب ژن علاوه بر کمک به پیداکردن ژن¬های موثر و مهم، برای افزایش کارآیی مدل ساخته شده نیز ضرورت دارد. لذا سعی شده است تا با به¬کارگیری روش¬های انتخاب ویژگی مختلف بر روی این داده¬ها، ضمن بررسی و مقایسه عملکرد این روش¬ها، بهینه¬ترین مجموعه¬های ژن¬ها انتخاب شود. از آن¬جایی که نهایتاً برای پیش¬بینی پاسخ به درمان بیماران با استفاده از داده¬های ژنتیکی، یک الگوریتم طبقه¬بندی¬کننده نقش اساسی را ایفا خواهد کرد، یکی از محور¬های تمرکز این پژوهش بر روی بررسی و مقایسه عملکرد طبقه¬بندی¬کننده¬های مختلف اعم از طبقه¬بندی¬کننده¬های کلاسیک و طبقه¬بندی-کننده¬های مبتنی بر شبکه¬های عصبی مصنوعی در کنار پروفایل¬های ژنتیکی به دست آمده از روش¬های انتخاب ژن بوده است. نتایج: بهینه¬ترین نتایج این پژوهش حاصل استفاده از الگوریتم ژنتیک به عنوان روش انتخاب ژن برای طبقه¬بندی¬کننده رگرسیون لجستیک بوده است. با استفاده از این روش، دو مجموعه یکی شامل 44 ژن و دیگری شامل پنج ژن معرفی شده-است. در انتخاب مجموعه اول هدف به دست آوردن بالاترین دقت طبقه¬بندی¬کننده با کمترین تعداد ژن¬های ممکن بوده¬است؛ در مجموعه دوم نیز هدف انتخاب کمترین تعداد ممکن ژن، ضمن حفظ دقت طبقه¬بندی¬کننده در حد قابل قبول بوده¬است. هر دو مجموعه معرفی شده توان چشم¬گیری در جدا کردن پاسخ¬دهندگان به درمان از گروهی که به درمان پاسخ نمی¬دهند، دارند. عملکرد این مجموعه¬ها با توجه به معیار¬های مختلف، از عملکرد ژن¬های معرفی شده در مطالعات قبلی بهتر است (دقت = 97/0 81/0، حساسیت = 96/0 و 77/0، ویژگی = 96/0 و 83/0 و سطح زیر نمودار ROC = 99/0 و 85/0 به ترتیب برای مجموعه اول و دوم با استفاده از رگرسیون لجستیک). بررسی مسیرهای KEGG مرتبط با مجموعه اول و ژن¬های مجموعه دوم نشان داد که ژن¬های انتخاب شده در هر دو مجموعه کاملا معنادار هستند. در نهایت سعی شد تا بررسی بایاس و واریانس خطای مدل رگرسیون لجستیک و خوشه¬بندی داده¬ها بر حسب بایاس مدل، مسیر¬های احتمالی دخیل در پاسخ به درمان در این سرطان، بیشتر بررسی شود. از دید مهندسی سیستم می‌توان فرم کلی این مسئله را در قالب یک سیستم که دچار عیب شده است بررسی نمود. به بیان ترمینولوژی مهندسی سیستم، هدف شناسایی و انتخاب سیگنال¬های مناسبی است که با توجه به اندازه این سیگنال¬ها، بتوان تعیین کرد آیا اعمال کنترل متداول به این سیستم، آن را روی مسیر پیش¬بینی شده به حالت مطلوب نهایی خواهد رساند. در غیر این صورت پزشک معالج می‌تواند با پیش¬آگهی به دست آمده، سعی در اعمال ورودی دیگری داشته باشد و از فوت وقت ارزشمند جلوگیری نماید. نتیجه¬گیری: استفاده از روش¬های انتخاب ویژگی مناسب در داده¬های بیان ژن می¬تواند منجر به انتخاب مجموعه¬های کارآمدی شود که به خوبی بتوانند در کنار الگوریتم¬های یادگیری به عنوان بیومارکر¬های پیش¬بینی پاسخ به درمان عمل کنند. علاوه بر آن، با بررسی مجموعه¬های انتخاب شده از منظر معیار¬های مختلف مورد استفاده در علم داده می¬توان دید بهتری از دینامیک¬های دخیل در مسئله مورد نظر به دست آورد. پیشنهادات: علاوه بر کمک به پژوهش¬های آتی که بررسی مسیرهای موثر در پاسخ به درمان در سرطان کولورکتال پیش¬رفته موضعی را هدف گرفته‌اند، مدل معرفی شده در این مطالعه می¬تواند پس از گذراندن استانداردهای لازم، نقش قابل توجهی به عنوان یک ابزار کاربردی در پیش¬بینی نتیجه درمان بیماران مبتلا به این سرطان داشته باشد.

فایل: ّFile: